Новые тесты показали, что одна Nvidia RTX PRO 6000 Blackwell демонстрирует в задачах ИИ примерно такой же уровень производительности, как и четыре GeForce RTX 5090, при этом потребляя заметно меньше энергии. Сравнение опубликовал пользователь Steveibe в соцсети X. Он протестировал запуск большой модели MiniMax M2.7 с 230 миллиардами параметров на четырех конфигурациях Nvidia.
Для теста использовалась квантизация (сжатие) IQ3_XXS, подходящая для сценариев с ограниченным объемом видеопамяти, но при этом достаточно тяжелая, чтобы задействовать почти весь доступный объем памяти у RTX PRO 6000 Blackwell с 96 ГБ. Также в тесте использовались контекст 32K и максимальная длина ответа 4096 токенов.
По результатам четыре GeForce RTX 5090 показали скорость генерации 120,54 токена в секунду при времени первого токена 725 мс. Почти такой же результат выдала и одна RTX PRO 6000 Blackwell — 118,74 токена в секунду и 765 мс до первого токена. Для сравнения, конфигурация из четырех GeForce RTX 4090 заметно отстала с результатом 71,52 токена в секунду, а DGX Spark показал лишь 24,41 токена в секунду.
Но главное — не скорость работы, а эффективность. Четыре GeForce RTX 5090 в пике потребляют около 2300 Вт, четыре RTX 4090 — около 1800 Вт, тогда как RTX PRO 6000 Blackwell укладывается примерно в 600 Вт.
С точки зрения стоимости тоже есть нюансы. Одна RTX PRO 6000 Blackwell стоит примерно 9500 долларов, а цена четырех GeForce RTX 5090 — примерно 14 000 долларов. DGX Spark продается за 4700 долларов, но его производительность в этом сравнении оказалась значительно ниже.

