Главная

Рубрика «рассуждающие модели»

CURE-Bench: готовы ли «рассуждающие» модели стать терапевтическими ассистентами?

2025-12-09 в 9:28, admin, рубрики: CURE-Bench, neurips, искусственный интеллект, рассуждающие модели

В 2025 году на NeurIPS — главной мировой конференции по ИИ — прошло соревнование CURE‑Bench, организованное исследователями из Гарварда и Массачусетского Технологического Института. Целью соревнования являлась масштабная проверка способностей агентов и рассуждающих моделей в области терапевтических рекомендаций. CURE‑Bench пытается ответить на вопрос, возможно ли уже сегодня построить качественного медицинского ассистента?

Команда AIRI под названием VIM (Владимир Мануйлов (iMak AI Lab) и Илья Макаров (iMak AI Lab, AIRI)) заняла призовое место в треке Internal Model Reasoning. Подробнее о их решении — в данной статье.

Читать полностью »

CognitiveOS: операционная система с модульной архитектурой для интеграции LLM в роботов

2025-07-31 в 9:38, admin, рубрики: CognitiveOS, llm, SMCA, vla, воплощенный ии, искусственный интеллект, Когнитивная робототехника, модульная архитектура, рассуждающие модели, роботы

Читать полностью »

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

2025-06-30 в 9:01, admin, рубрики: Chain-of-Thought, claude 3.7 sonnet, llm, lrm, ruvds_статьи, антропоморфизация, галлюцинации, дезинформация, рассуждающие модели, функция рассуждения, языковые модели

В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда. Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем

Рубрика «рассуждающие модели»

CURE-Bench: готовы ли «рассуждающие» модели стать терапевтическими ассистентами?

CognitiveOS: операционная система с модульной архитектурой для интеграции LLM в роботов

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций