Рубрика «AI»

На третий день мой агент слил email одного клиента в переписку с другим клиентом. Это была не гипотетическая история из доклада на конференции. Это был мой код, в проде, делающий то, что я никогда не тестировал.

Я собрал support-агента на LangGraph и GPT-4o. Он умел искать по базе знаний, подтягивать детали аккаунта и готовить ответы. В staging он работал прекрасно. В проде ему понадобилось ровно 72 часа, чтобы вытащить PII одного пользователя в разговор с другим. Причина оказалась до неловкого простой: модель включила сырой контекст из базы данных прямо в ответ, и ничто в моём пайплайне это не проверяло.

Читать полностью »

Последнее время я всё чаще встречаю одну и ту же мысль: бизнес никогда не даст ИИ-агенту доступ к базе клиентов, заявкам, платежам, CRM или внутренним документам. На первый взгляд звучит логично. Если агент ошибётся, перепутает контекст или выполнит не то действие, ущерб может быть вполне реальным. Но мне кажется, что здесь часто путают две разные вещи.

Читать полностью »

6 месяцев. Это сколько мы строили продукт с внешним разработчиком. Потом я психанула и сделала за 3 дня сама с помощью AI. Дальше — что я поняла из этого опыта.

Эта статья — не «AI заменит разработчиков». Это про другое — про то, как методология работы меняется, когда у тебя есть AI как партнер.


Что строили

Читать полностью »

Кто виноват? Что делать?(с)

Заметили, что в наше веселое турбулентное время рождения многополярного мира все больше запросов на он-прем деплоймент ЛЛМ - а так как подводных камней там много, а опыта мало - то попробуем разобраться с вопросом.

— Как дела с проектом?
— Мы на финальной стадии!
— Супер, сдаете?
— Нет, ищем виноватого!

Читать полностью »

Всё началось с простого вопроса: почему малый бизнес теряет клиентов ночью?

Клиент заходит на сайт в 23:00, пишет в чат — и уходит. Потому что менеджер спит. Утром менеджер видит сообщение, перезванивает — а клиент уже купил у конкурента.

Стандартное решение — чат-бот. Но обычный чат-бот либо ограничен заранее заданными сценариями, либо требует интеграции с крупными облачными LLM. (отвечает по скриптам), либо слишком дорогой (GPT-4 за десятки тысяч в месяц), либо хранит данные за рубежом, что не всегда удобно для российского бизнеса.

Я решил сделать иначе.

Проблема переключения между ИИ и оператором

Читать полностью »

Говорят, боги не обжигают горшки. В одной странной, временами клинически глупой и одновременно гениальной игре нулевых на плечи божества — которым был игрок — ложились куда более важные задачи. Среди прочего, ему нужно было воспитать ИИ, не растеряв при этом паству.

Этюд в черно-белых тонах

Читать полностью »

Каждая профессия переживает момент, когда кажется что она больше не нужна. Извозчики, телеграфисты, печатники. Кто-то действительно исчез. Кто-то просто стал называться по-другому. Сейчас этот вопрос задают про IT.

Ещё вчера рекрутеры сами стучались в LinkedIn, джуны выбирали между тремя офферами, а «войти в IT» звучало как план на жизнь. С 2022 по середину 2026 более 824 000 человек в IT потеряли работу (Layoffs.fyi).

Звучит как конец. Но если посмотреть на последние 26 лет, это уже третий «конец».

26 лет IT в одном графике

Читать полностью »

Привет! Меня зовут Михаил Сальников, я независимый исследователь в области искусственного интеллекта, автор бенчмарка AI Independence Bench и эксперимента с автономным ИИ под именем Aria. Регулярно изучая свежие препринты на arxiv.org, я порой натыкаюсь на результаты, заставляющие долго размышлять. Сегодня — как раз такой случай: мы разберем работу, изящно разрушающую один из главных мифов промпт-инжиниринга.

Читать полностью »

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js