Рубрика «llm» - 31

Скилы системного аналитика для разработки LLM-агентов

2025-11-07 в 12:05, admin, рубрики: llm, Агент, проектирование, системный аналитик

На сентябрьском Flow 2025 проводилось огромное количество активностей вне докладов. Одной из таких активностей была coffee tables: в промежутке между докладами можно было обсудить горячую тему.

Скилы — вечно горячая тема. LLM-агенты — горячая тема в моменте (впрочем, возможно тоже надолго). В результате организовался стол, на котором кофе был самым холодным предметом.

Мы старались не спорить, что нужно, а что нет, но просто собрать все идеи.
Читать полностью »

Как некачественные данные подтачивают способности нейросетей и что с этим делать

2025-11-06 в 13:00, admin, рубрики: llm, языковые модели

Языковые модели помогают кодить, писать тексты, отвечают на вопросы и даже подсказывают идеи. Но все, чему они учатся, берется из интернета, а там хватает и полезного, и откровенного мусора. Ученые из Texas A&M и Purdue University выяснили, что если в обучающие наборы попадает слишком много поверхностного или ошибочного контента, модели начинают работать хуже. Этот эффект исследователи описали как «размягчение мозга» (brain rot) — по аналогии с тем, как у человека притупляется внимание после длительного погружения в поток однотипной информации.

Читать полностью »

Маршрутизация LLM: оптимизация путей обработки языка

2025-11-06 в 11:30, admin, рубрики: AI, artificial intelligence, data augmentation, latency, llm, llm-модели, MTBench, маршрутизация запросов

Повышение эффективности и производительности через инновационные стратегии маршрутизации.

Что такое LLM Routing?

В стремительно развивающемся мире искусственного интеллекта большие языковые модели (LLM)Читать полностью »

Нейро-дайджест: ключевые события мира AI за 1-ю неделю ноября 2025

2025-11-06 в 11:05, admin, рубрики: AI-инструменты, llm, timeweb_дайджест, генеративные модели, дайджест, искусственный интеллект, машинное обучение, нейро-дайджест, нейросети, роботы

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер Читать полностью »

Сама не разберётся: мои 7 принципов генерации кода с LLM

2025-11-06 в 10:16, admin, рубрики: llm, генерация кода, ИИ, ИИ и машинное обучение, качество кода, промпт-инжиниринг

Читать полностью »

ADSM: видеочат на WebRTC через Codex-агента

2025-11-04 в 16:02, admin, рубрики: adsm, codex, llm, OpenAI, pwa, WebRTC, мессенджеры, связь

Мои родители и вся моя семья живут в Риге, а большинство наших родственников - в России и Украине. Когда привычные мессенджеры начинают работать с перебоями, хочется иметь простой и независимый способ связи. Самый простой способ из мне известных - WebRTC.

В рамках развития собственного понимания тонкостей парной разработки программ с участием LLM-агентов я решил создать PWA для видеочата на базе WebRTC при помощи Codex-агента.

Считаю, что эксперимент завершился успешно, хотя и не очень хорошо. Я использовал все лимиты Plus-подписки на Codex, но при этом получил работающий прототип.

Читать полностью »

Как ИИ-браузер ChatGPT Atlas разгадал судоку за пару минут, но проиграл в Flappy Bird

2025-11-04 в 15:09, admin, рубрики: llm, агенты, ИИ

Читать полностью »

Тело AI-агентов: технический обзор робота 1X Neo

2025-11-04 в 11:39, admin, рубрики: 1x neo, AI, ai-агенты, llm, ml, NEO, robotics, vlm, гуманоидные роботы, роботы

На днях по AI пабликам завирусился робот 1X Neo, который заявляется разработчиками как человекоподобный робот для помощи по дому. Мне стало жутко интересно покопаться в устройстве и начинке этого робота, потому что скрещивание VLM и механизмов может привести к огромному прорыву в индустрии и новым большим изменениям.

Поговорим про устройство робота, железо и софт на борту, прикладные задачи и ближайшее будущее.

Читать полностью »

Meta и исследователи из OpenAI: новые подходы к защите LLM от prompt injection

2025-11-03 в 13:50, admin, рубрики: ai-агенты, Anthropic, DeepMind, llm, meta, OpenAI, prompt injection, RuleOfTwo, адаптивные атаки, безопасность

Команда AI for Devs подготовила перевод краткой выжимки свежих статей о безопасности LLM. Meta предлагает «Правило двух» — архитектурный принцип, ограничивающий права AI-агентов, чтобы защитить их от prompt injection. А исследователи из OpenAI, Anthropic и Google DeepMind показывают: все существующие защиты легко обходятся адаптивными атаками.

На этих выходных мне попались две интересные работы о безопасности LLM и атаках через prompt injection.

Agents Rule of Two: Практический подход к безопасности AI-агентов

Первая статья — Agents Rule of Two: A Practical Approach to AI Agent SecurityЧитать полностью »

GDPval: измерение производительности AI-моделей на реальных задачах

2025-11-03 в 11:00, admin, рубрики: AI, benchmark, chatgpt, genai, gpt, llm, open AI, OpenAI

Мы представляем GDPval — новую метрику, которая оценивает производительность моделей на экономически значимых, прикладных задачах из 44 профессиональных областей.

Статья | evals.openai.com

Наша миссия — обеспечить то, чтобы искусственный общий интеллект (AGI) приносил пользу всему человечеству. В рамках этой миссии мы стремимся максимально прозрачно освещать прогресс того, как AI-модели учатся помогать людям в реальной жизни. Именно поэтому мы представляем GDPvalЧитать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «llm» - 31

Скилы системного аналитика для разработки LLM-агентов

Как некачественные данные подтачивают способности нейросетей и что с этим делать

Маршрутизация LLM: оптимизация путей обработки языка

Что такое LLM Routing?

Нейро-дайджест: ключевые события мира AI за 1-ю неделю ноября 2025

Сама не разберётся: мои 7 принципов генерации кода с LLM

ADSM: видеочат на WebRTC через Codex-агента

Как ИИ-браузер ChatGPT Atlas разгадал судоку за пару минут, но проиграл в Flappy Bird

Тело AI-агентов: технический обзор робота 1X Neo

Meta и исследователи из OpenAI: новые подходы к защите LLM от prompt injection

Agents Rule of Two: Практический подход к безопасности AI-агентов

GDPval: измерение производительности AI-моделей на реальных задачах