Главная

Рубрика «conversational ai»

Основные метрики DeepEval для тестирования AI. Возможности и способы применения

2025-10-15 в 6:00, admin, рубрики: AI, ai-агенты, conversational ai, mcp-server, multimodal large language models, multimodal llm, искусственный интелект, искусственный интеллект, тестирование

Всем привет!

DeepEval - фреймворк для оценки работы AI с открытым исходным кодом.

Содержит в себе множество метрик и бенчмарков для оценки качества работы AI моделей, а также предоставляет инструменты для аналитики изменений качества работы в течение разных периодов времени.

В предыдущей статье мы уже частично осветили имеющиеся у DeepEval метрики (метрики для оценки RAG).

В этой статье постараемся объяснить, какой еще функционал предлагается DeepEval для работы с AI.

Помимо указанных ранее в DeepEval присутствуют следующие метрики:

Agentic

- Task Completion
- Tool Correctness
- Argument Correctness

Читать полностью »

Хватит всё подряд называть ИИ

2020-01-20 в 12:42, admin, рубрики: AI, conversational ai, lia, natural language processing, nlu, Алгоритмы, искусственный интеллект, Клиентская оптимизация, клиентский сервис, машинное обучение, разговорный ИИ, чатботы

Хорошая новость в том, что я обнаружил много проблем. Плохая новость в том, что вы одна из них.

Большинство менеджеров и маркетологов называют искусственным интеллектом всё подряд: пылесосы, игрушечных роботов-трансформеров и даже подбор мобильных тарифов. Это в тренде и хорошо продаётся, только одна проблема — даже учёные не рискуют говорить, что создали ИИ.

Решили разобраться в определениях: можем ли мы вообще говорить об искусственном интеллекте, чем он отличается от машинного обучения и справедливо ли презрительно поднимать брови, когда мы видим очередную рекламу с ИИ.
Читать полностью »

Вокруг беты за 260 дней: как мы учились прислушиваться к пользователям

2019-02-14 в 12:51, admin, рубрики: alexa, chatbots, conversational ai, dialogflow, google ассистент, lean startup, usability, ux design, бета-тестирование, Блог компании Just AI, голосовые ассистенты, голосовые интерфейсы, искусственный интеллект, разговорный интерфейс, разработка по, управление проектами, управление разработкой, чатботы, яндекс алиса, яндекс диалоги

Все знают: догфудить собственный продукт (ну, есть корм своей собаки – разрабатывать продукт, который сам же используешь) – это правильный во всех отношениях принцип. Работая над конструктором чатботов Aimylogic, мы в Just AI прекрасно представляли, каким он должен быть, но поначалу не догфудили – наши NLU-инженеры обычно сразу пишут код. И поэтому решили пойти по пути lean startup: выкатить бету, собрать ранний фидбэк от пользователей и писать Aimylogic по-живому. Рассказываем, как мы вместе с пользователями шли от беты к релизу.

Читать полностью »

Разговорный AI: как работают чат-боты и кто их делает

2018-05-28 в 9:20, admin, рубрики: AI, conversational ai, just ai, nlu, Алгоритмы, Блог компании Just AI, искусственный интеллект, машинное обучение, разговорный ИИ, Семантика, умные устройства, чатботы

Чатботы и искусственный интеллект для понимания естественного языка (NLU – Natural Language Understanding) тема достаточно горячая, про нее не раз говорилось на Хабре. Тем не менее достаточно редко попадаются верхнеуровневые и структурированные обзоры этих технологий и рынка в целом. В своей статье мы попробуем немного разобраться, чем обусловлен спрос на эти технологии, как выглядит современная диалоговая платформа для NLU, какие компании и разработки присутствуют на этом рынке.

Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «conversational ai»

Основные метрики DeepEval для тестирования AI. Возможности и способы применения

Хватит всё подряд называть ИИ

Вокруг беты за 260 дней: как мы учились прислушиваться к пользователям

Разговорный AI: как работают чат-боты и кто их делает