Рубрика «llm»

Модель находит баг в криптографии, а криптограф узнаёт от неё новую математику - 1

Эта статья — ответ на критику: «перестаньте рассказывать сказки, как AI помогает в науке, покажите примеры!». Действительно, без примеров, рассказы об успешном успехе AI выглядят как сектантский бред.

Читать полностью »

«Когда OpenAI обанкротятся, на Сен-Бартелеми будут пить меньше шампанского. Ну а мы — мы хорошо заработаем» ©

Есть характерный момент в каждом технологическом пузыре.

Когда лопнет пузырь AI? - 1

Читать полностью »

Запретный плод уже сорван - 1

Астрофизик Дэвид Киппинг попал на закрытую встречу в Институте перспективных исследований Принстона. Вернулся потрясённым и записал часовой подкаст. Я послушал его весь, чтобы вам не пришлось.

Читать полностью »

На написание этой статьи меня побудили сразу несколько факторов. Это книга Рика Рубина «Творческий Акт как способ существования». И свежая новость: «искусственный интеллект преодолел новый рубеж, показав лучшие результаты в креативности, чем среднестатистический человек». Поэтому, в материале речь пойдет о природе креативности, и о том, чем же на самом деле оказались нейросети!

Читать полностью »

Малоизвестный среди обычных людей факт: у нейросетей нет никаких "разговоров". Ты смотришь в веб-интерфейсе на "диалог" - но это обман, красивый фокус.

Каждый раз, когда ты пишешь новое сообщение, все старые сообщения обрабатываются заново. У нейросетей по-настоящему многоразовых задач не существует. Если результат немного поменялся — тебе просто не покажут в веб-интерфейсе изменившиеся сообщения.

Читать полностью »

Когда нейросеть решит то, что не решил никто? - 1

В середине 2024 года GPT-4 спотыкался на школьных задачах, а к концу 2025-го модели щёлкали олимпиадные как орехи. Полтора года, и мы преодалели дистанцию от «найди икс» до «докажи теорему». Epoch AI решили заглянуть еще дальшеЧитать полностью »

Или как я потратил неделю, чтобы доказать: ИИ сегодня — это красноречивые лжецы в костюмах экспертов.

В конце 2025 года я устал читать маркетинг в стиле «наша модель умнее ChatGPT на 15%». Умнее по какому бенчмарку? MMLU? Это всё равно что мерить интеллект человека по результатам ЕГЭ.

Я решил проверить одну простую вещь: способна ли нейросеть сказать «я не знаю»?

Потому что в реальном мире — в медицине, праве, финансах — ответ «я не уверен» стоит дороже любой красивой, но выдуманной истории.

Ниже — результаты слепого тестирования 14 топовых LLM (включая Claude 4.5, GPT-5.2, Gemini 3, Qwen, YandexGPT и Читать полностью »

maneto solver

maneto solver

Мечта об идеальном двигателе

Мне кажется, я знаю, как должен быть устроен идеальный электродвигатель. Но чтобы это доказать, нужен инструмент.
Существующий софт убивал все желание творить:


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js