Рубрика «языковые модели»
Введение
Эта статья про мои эксперименты с языковыми моделями, в которых не используется машинное обучение и аппаратное ускорение. Чтобы избежать недопонимания поясню, что я имею ввиду под языковой моделью (ЯМ).
Слова, которых нет
2026-05-10 в 17:22, admin, рубрики: llm, время, искусственный интеллект, когнитивистика, машинное обучение, нейросети, темпоральность, Философия ИИ, человек и машина, языковые моделиВведение к циклу из четырёх статей о совместном мышлении человека и LLM
Несколько недель назад моя коллега переводила интерфейс одной программы на иностранный язык. Задача была обычная: LLM в помощь, проверить вручную, отдать в локализацию. В одном месте у LLM не нашлось подходящего слова в целевом языке, и вместо того чтобы выбрать ближайший вариант или оставить кальку, она придумала новое слово. Оно состояло из существующих корней языка, было фонетически естественным, и точнее передавало смысл оригинала, чем любое из реальных слов этого языка.
Ваш любимый ИИ не умеет считать. Что ещё скрывает текстовая модель?
2026-04-17 в 9:15, admin, рубрики: function calling, llm, rag, RLHF, агенты, искусственный интеллект, нейросети, цифровой двойник, языковые моделиТехнократический разбор для инженеров и бизнес-аналитиков. Без преувеличений и продающих лозунгов.
Данная статья представляет собой результат кабинетного исследования об основных особенностях работы ИИ (LLM, модель). Здесь в систематизированном виде относительно простым языком описано, как реализуется вся та “магия” про ИИ, с которой мы сталкиваемся сами или слышим в восторженно-продающих материалах.
Сразу уточню, что под ИИ тут понимается именно публичная Большая языковая (текстовая) модель (LLM), вроде ЧатаГПТ, ГигаЧата, Дипсика и др.
В этой статье мы:
Искусственный Интеллект незаметно меняет твою позицию
2026-03-13 в 12:07, admin, рубрики: they live, генеративный интеллект, искажение восприятия, искусственный интеллект, манипуляции, нейросети, постмодернизм, пропаганда, сознание, языковые моделиОдин из распространенных инструментов на основе ИИ – автозаполнение с подсказкой. В идеале, он должен ускорить набор текста. Однако, такие инструменты незаметно меняют наше мировоззрение. Масштабное исследование показало, что подсказки автозаполнения с заранее заложенным паттерном смыслов, меняют позицию пользователя в отношении к смертной казни и добыче сланцевого газа методом гидроразрыва. И это только то, что нам известно.
Как я делал свою языковую модель: история эксперимента
2026-01-15 в 11:04, admin, рубрики: AI, llm, llm-архитектура, llm-модели, искусственный интеллект, языковые моделиУже больше года назад у меня зародилась идея создать свою архитектуру языковой модели. Традиционные модели, "думающие" на уровне токенов мне решительно не нравились. Колоссальный вычислительный бюджет на то, чтобы просто предсказать один токен. Логичным мне казалось оторвать мышление модели от токенов, перенеся его в латентное пространство. Примерно полгода назад я начал первые практические эксперименты и сейчас получил первые практические результаты. Поскольку уровень подготовки читателей очень сильно различается, в статье не будет глубоких технических разборов, а скорее история эксперимента.
Анатомия Prompt Injection: Как я вошел в топ-10 глобального рейтинга Lakera Agent Breaker
2025-12-22 в 18:12, admin, рубрики: AI, bughunting, ctf, cybersecurity, leaderboard, llm, информационная безопасность, искусственный интеллект, хакатон, языковые моделиПривет. На связи Артем Бакрадзе, Head of Research в лаборатории RedVector.
В декабре 2025 я принял участие в челлендже Agent Breaker от Lakera. На данный момент я занимаю 7-ю строчку в мировом рейтинге, состоящем из около 7500 участников, и 1-е место в своей лиге (куда участники распределяются случайным образом в зависимости от назначенной LLM)
Галлюцинации ИИ — это не баг, а фича разработчика. Почему вайб-кодинг не заменит программистов
2025-12-08 в 7:05, admin, рубрики: IT-образование, llm-модели, вайб-кодинг, вайб-программирование, галлюцинации ИИ, конвейер, Программирование, программирование для начинающих, экономика, языковые моделиПривет!
Знаете, что общего у ChatGPT, моего студенческого кода в три часа ночи и выступлений некоторых экспертов? Все они периодически галлюцинируют. Разница только в том, что от ИИ мы почему-то ждём идеальной точности, а от людей — нет.
Недавно провели стрим, где собрались специалисты, у которых ИИ не в презентациях, а в production: Сергей Спиренков (KODE), Александр Константинов (Cloud.ru), Михаил Ларкин (Сбер, ВТБ, S7), Иван Будник (ИИ-стартапы, e-commerce) и Константин Чуйков (Vibe Coding Community). Провели разговор про галлюцинации моделей и про будущее разработки с ИИ.
Как некачественные данные подтачивают способности нейросетей и что с этим делать
2025-11-06 в 13:00, admin, рубрики: llm, языковые моделиЯзыковые модели помогают кодить, писать тексты, отвечают на вопросы и даже подсказывают идеи. Но все, чему они учатся, берется из интернета, а там хватает и полезного, и откровенного мусора. Ученые из Texas A&M и Purdue University выяснили, что если в обучающие наборы попадает слишком много поверхностного или ошибочного контента, модели начинают работать хуже. Этот эффект исследователи описали как «размягчение мозга» (brain rot) — по аналогии с тем, как у человека притупляется внимание после длительного погружения в поток однотипной информации.
Как оценить качество машинного перевода
2025-10-14 в 10:46, admin, рубрики: bleu, comet, llm, machine translation, машинный перевод, метрики качества, оценка качества, переводчик, переводчики, языковые моделиРаботая в области машинного перевода в компании Lingvanex, я постоянно читаю статьи в которых сравнивается качество разных переводчиков. Иногда отличие между ними составляет от 0.3 до 1% по какой-либо из метрик, но и это уже повод заявить, что их переводчик - лучший.
При оценке качества машинного перевода важно не только сравнить результаты различных систем перевода, но и проверить, являются ли обнаруженные различия статистически значимыми. Это позволяет оценить, насколько полученные результаты достоверны и могут ли они быть применимы к другим наборам данных.

