Эта модель обошла DeepSeek-V3.1 и GPT-5 в рейтинге Text Arena: представлена Qwen3-Max с 1 трлн параметров

в 4:41, , рубрики: Новости

Китайская Alibaba Cloud представила крупнейшую в своей истории языковую модель Qwen3-Max, насчитывающую 1 трлн параметров.

Модель Qwen3-Max обучена на наборе данных из почти 36 трлн токенов. Для понимания масштаба: миллион токенов сопоставим с 750 млн слов. 

Эта модель обошла DeepSeek-V3.1 и GPT-5 в рейтинге Text Arena: представлена Qwen3-Max с 1 трлн параметров
Изображение Midjourney

По данным платформы Text Arena, тестовая версия Qwen3-Max-Instruct уже успела показать высокие результаты. В рейтинге языковых моделей она превзошла не только DeepSeek-V3.1, но и GPT-5, что делает её одним из самых мощных решений на рынке. 

Рынок искусственного интеллекта в Китае развивается стремительно. Помимо Alibaba, в число ведущих игроков входят Baidu, Tencent, DeepSeek, Moonshot AI и Zhipu AI. 

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js