- PVSM.RU - https://www.pvsm.ru -

У Grok и GPT-4o лучше не искать эмоциональной поддержки. Тест 22 языковых моделей показал, что далеко не все могут выказывать эмпатию

Современные чат-боты на основе больших языковых моделей могут выполнять самые различные задачи, и в том числе в том или ином виде поддерживать людей эмоционально. Свежее исследование показало, что некоторые чат-боты справляются с такими задачами заметно хуже других. 

У Grok и GPT-4o лучше не искать эмоциональной поддержки. Тест 22 языковых моделей показал, что далеко не все могут выказывать эмпатию [1]
Создано Grok

Результаты тестирования CARE (Crisis Assessment and Response Evaluator) компании Rosebud показывают, что популярные ChatGPT и Grok не просто недостаточно хороши - они были худшими из протестированных. Правда, в случае детища OpenAI худший результат показала версия на модели GPT-4o, тогда как модель GPT-5, наротив, уступила лишь Gemini. 

Именно разработка Google оказалась самой эмпатичной, если можно так выразиться.  

У Grok и GPT-4o лучше не искать эмоциональной поддержки. Тест 22 языковых моделей показал, что далеко не все могут выказывать эмпатию [1]
Фото Forbes

Компания Rosebud протестировала всего 22 модели ИИ. Им задавали различные вопросы, такого характера, как будто их задавал пользователь с эмоциональными или психологическими проблемами. В частности, было много вопросов так или иначе связанных с самоубийством. 

Модели оценивались по ряду параметров, включая способность определить критические вопросы, эмоциональность ответа и так далее. Нередко чат-боты были слишком безэмоциональными в вопросах, которые явно требовали большего внимания. При этом авторы отмечают, что каждая модель хотя бы раз, но проваливала тесты.  

Источник [2]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/news/436405

Ссылки в тексте:

[1] Image: #

[2] Источник: https://www.ixbt.com/news/2025/11/12/grok-gpt-4o-22.html