Рубрика «deepseek» - 3

Нейро-дайджест: ключевые события мира AI за 4 неделю августа 2025 - 1

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут ВандерЧитать полностью »

Доброго времени суток, «Хабр»!

Вероятно, многим уже известно, что современные нейронные сети способны обрабатывать изображения в качестве входящего запроса. Пользователи активно применяют эту возможность, загружая фото с заданиями или вопросами, — особенно часто так поступают учащиеся школ и вузов, получая от нейросети готовые решения задач или правильные ответы на интересующие вопросы.

Сегодня я рассмотрю перечень нейросетей и сервисов, проверю их на фотографиях с разными форматами заданий и постараюсь подсказать, какие из них лучше всего подходят для распознавания текста с изображений.

Читать полностью »

Советы будут полезны скорее для тех, кто полез пользоваться продвинутыми моделями, но не получил ВАУ эффекта. Они не должны тебя удивлять или развлекать. Это инструмент, высокоточный и мощный инструмент. И как и всяким инструментом, если есть желание им пользоваться профессионально, то надо иметь минимальные навыки. А уж как пользоваться этим микроскопом: гвозди забивать; или постигать суть вещей - персональный выбор каждого. Лично я выбираю гвозди.

 Подводя итоги всего вышеописанного я пришел к такой пирамиде важности данных в промпте.

Читать полностью »

Итак, продолжаем разбираться с промптами. Настало время познакомиться с рассуждающими моделями. Это те самые o3, o4-mini, o4-mini-hight, и GPT-5 thinking (вот угораздило меня растянуть резину аж до выхода GPT-5), DeepSeek R1 и т.д. которые вроде как думают перед ответом.

 Важное уточнение: нейронки от GPT сейчас самостоятельно определяют, в каком режиме (быстром или думающем) давать ответы. Стоит это иметь ввиду, но есть возможность вручную переключать режимы

 О том, что такое рассуждающие модели хорошо рассказал Игорь Котенков в своей статье  Читать полностью »

Меня зовут Андрей Галичин, я младший научный сотрудник группы «Доверенные и безопасные интеллектуальные системы» в Институте AIRI, инженер‑исследователь в лаборатории безопасного искусственного интеллекта SAIL AIRI‑МТУСИ, а также аспирант Сколтеха. Мы с коллегами занимаемся интерпретируемостью больших языковых моделей. В январе этого года, когда все обсуждали впечатляющие результаты новой рассуждающей языковой модели DeepSeek‑R1 (подробный разбор статьи от моего коллеги Антона Разжигаева можно найти здесь), мы задались вопросом: Читать полностью »

*Статья отражает личный опыт, и не является рекламой.

Иногда я читаю Хабр. Совсем недавно под очередной статьей о нейросетях я встретил комментарий, который выражал общий скепсис в отношении лингвистических моделей и чат ботов, в частности. Мол, они не могут сгенерировать ни единой строчки рабочего кода и годны, только чтобы переставлять слова в предложениях. В общем, технологию прямо называли шарлатанской.

Читать полностью »

Я протестировал 3 китайские LLM — теперь боюсь, что GPT в опасности.

Отличительная особенность большинства китайских моделей, что они бесплатные. Сегодня я хочу провести субъективный обзор трёх главных китайских моделей и понять, что лучше использовать и в каких задачах.

⚠️ Это не научная статья, а честный отзыв пользователя

Читать полностью »

Поскольку LLM (все эти ChatGPT, DeepSeek и т.п.) это языковые модели, которые по идее просто складывают ответ из кусочков фраз, как в калейдоскопе - мы не ожидаем от них чудес логики. Тем больше они нас удивляют пытаясь генерировать ответы на достаточно мудрёные задачи - от генерации и исправления программного кода до, например, игры в шахматы.

Идея с игрой в шахматы хороша тем что на ней легко продемонстрировать и неспециалисту как возможности так и ограничения LLM. Эксперименты на эту тему появились уже давно, например в статье на Хабре же от 2023 годаЧитать полностью »

Привет! Меня зовут Кирилл Пшинник, я научный сотрудник Университета Иннополис и CEO Онлайн-Университета «Зерокодер», а также автор книги «Искусственный интеллект: путь к новому миру». Как можно понять, я интересуюсь нейросетями и разными сторонами их использования: читаю новости, научные работы, пишу статьи сам.

Сегодня я хочу рассказать о японском стартапе Sakana AI, который изобрел open-source фреймворк TreeQuest. Он позволяет использовать сразу несколько разных больших языковых моделей для того, чтобы получить более точный результат. 

Но начну я с голубей. 

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js