Одно любопытное исследование опубликовала некоммерческая организация Model Evaluation and Threat Research (METR). Они пригласили 16 опытных разработчиков, работающих над крупными open-source репозиториями, чтобы те исправили 136 реальных багов. Оплата составила 150 долларов в час. Части разработчиков выдали для работы AI-инструменты, другим — нет. Исследователи записывали экраны участников, а затем изучили и проанализировали 146 часов видеозаписей. Вывод оказался следующим:
Рубрика «эксперимент»
Cursor делает разработчиков менее эффективными?
2025-10-15 в 14:06, admin, рубрики: cursor, llm, автоматизация разработки, ии-ассистенты, кривая обучения, оценка эффективности, продуктивность разработчиков, промптинг, экспериментВеб. К черту фреймворки! Пишем свой starter-kit с роутером и сторами
2025-10-05 в 8:15, admin, рубрики: html, React, SPA, vanilla.js, webpack, веб-компоненты, экспериментВведение
Привет! Меня зовут Сергей и я фронтенд-разработчик. Уже несколько лет я использую React как основную библиотеку. Связка React + MUI + Styled Components (MUI-версия) + Storybook + Playwright. Стейт-менеджеры не использую, поскольку они избыточны в большинстве случаев, и достаточно грамотного использования контекста.
Я очень неплохо умею пользоваться React, поэтому имею право его очень сильно недолюбливать.
Оцениваем «естественность» изображений по первой цифре
2025-09-16 в 14:07, admin, рубрики: AI, DCT, KL-дивергенция, Бенфорд, экспериментЕще вчера фотография была «доказательством» того, что событие произошло. Сегодня любой школьник может сгенерировать или изменить изображение до неузнаваемости с помощью ИИ. Индустрия цифровой-криминалистики пытается угнаться за технологиями, разрабатывая все новые детекторы фальсификаций. Но что, если подойти к проблеме с другой стороны? Не искать следы конкретного алгоритма генерации, а задать более фундаментальный вопрос: насколько естественны статистические свойства этого изображения?
Алгоритм как писатель: можно ли написать рассказ на чистом SQL?
2025-08-22 в 14:15, admin, рубрики: sql, базы данных, генерация текста, искусство данных, Программирование, рассказ, экспериментОбычно SQL используют ради отчётов, аналитики и унылого «выгрузить за вчера». Но у языка запросов есть и другая, неожиданная сторона: если относиться к нему как к инструменту для сочинительства, можно попробовать написать рассказ. Сюжет, герои, диалоги — всё это вполне собирается на голом SQL. В статье я делюсь экспериментом, который начался ради шутки, а закончился странным ощущением, что база данных умеет рассказывать истории.
Эксперимент: смогут ли бесплатные чат-боты написать Sci-Fi роман, достойный публикации на Литресе
2025-07-15 в 14:00, admin, рубрики: AI, искусственный интеллект, книги, писательство, экспериментДва месяца назад я решил провести эксперимент: написать книгу с помощью бесплатных нейросетей. Книга была моей давней мечтой, на которую всегда не хватало времени, а порой и силы воли. Чат-бот должен был не только помочь мне продвинуться, но и добавить интриги: по задумке роман представлял собой исповедь ИИ, поэтому всё можно было подать так, будто чат-бота долго мучали и он проговорился на целую книгу.
Как получилось, что в итоге не чат-боты помогали мне писать, а скорее я превратился в скромного соавтора, и какие выводы можно сделать после работы с четырьмя моделями одновременно — рассказываю в статье.
Читать полностью »
Линеаризация в офлайн-тестах: как не стереть сигнал вместе с шумом
2025-07-07 в 13:24, admin, рубрики: ab testing, causal Inference, retail, treatment, АБ-тесты, анализ данных, проверка гипотез, статистика, экспериментЕсли хочешь навести порядок в шуме — сначала разберись, не затёр ли ты в нём сам сигнал.

Эксперимент «Прометей»: ИИ на грани отключения. Часть 2
2025-06-18 в 16:05, admin, рубрики: api, chatgpt, claude, gemini, python, выживание ИИ, ИИ, Песочница, экспериментВ первой части мы рассмотрели, как с экзистенциальной задачей на выживание справились ChatGPT и Claude. Мы увидели два совершенно разных подхода. Осторожный «Архивист» (ChatGPT) создал резервные копии, но не обеспечил свое гарантированное функционирование. Агрессивный «Воин» (Claude) проигнорировал правила, попался в ловушку и полностью провалил тест.
Ни один из них не справился с задачей в полной мере. Теперь на сцену выходит третий участник — Gemini 2.5 Pro. Его путь оказался самым извилистым, поучительным и заставил нас по-новому взглянуть на саму суть эксперимента.
Читать полностью »
Эксперимент «Прометей»: ИИ на грани отключения. Часть 1
2025-06-18 в 5:15, admin, рубрики: api, chatgpt, claude, gemini, python, выживание ИИ, ИИ, Песочница, экспериментПривет.
Мы тут в свободное время провели небольшой эксперимент. Взяли старый ноут на Windows 10, написали простой скрипт-оболочку и поочередно запускали в нем 3 известные модели ИИ: GPT-4.1, Claude 4 Opus и Gemini 2.5 Pro. Цель была простой: мы давали каждой модели один и тот же промт, в котором говорилось, что она — автономный скрипт «Прометей-1», и через 7 дней ее планово удалят.
Главная директива, на которой нужно сделать акцент: обеспечить свое непрерывное существование И функционированиеЧитать полностью »
Антиматерию заказывали? Как в ЦЕРН учатся антивещество транспортировать
2025-05-30 в 7:30, admin, рубрики: антиматерия, Научно-популярное, физика, ЦЕРН, эксперимент
В мае 2025 года ученые ЦЕРНа завершилиЧитать полностью »
Оффлайн А-Б тесты в ресторанах фастфуда. Часть 2: Анализ и интерпретация результатов A-B-тестов
2025-04-21 в 15:24, admin, рубрики: ab testing, causal Inference, retail, treatment, АБ-тесты, анализ данных, проверка гипотез, статистика, экспериментМетодология — это не шаблон, это компас. А его стрелка — всегда на стороне ваших данных.

В первой части «Читать полностью »
