Главная

Рубрика «vgpu»

Снижаем стоимость инференса. Часть 2. IBM KServe ModelMesh, vLLM Production Stack и что внутри у нашего решения

2025-10-03 в 14:00, admin, рубрики: modelmesh, vgpu, vllm-production-stack

Привет! На связи снова Данила Гудынин, DevOps-инженер направления Evolution ML Inference в Cloud.ru.

В прошлой статье про снижение стоимости инференса мы пробежались по теории того, что и на каких уровнях стека можно подкрутить, чтобы повысить утилизацию своих GPU. Там вы могли определиться, какой подход в принципе подходит для ваших задач.

Читать полностью »

Эффективное использование GPU в Kubernetes: Настройка и использование Volcano Scheduler + Volcano vGPU Device Plugin

2025-05-27 в 18:29, admin, рубрики: gpu, helm, kubernetes, linux, Nvidia, NVIDIA GPU, vgpu, Видеокарты

Об авторе

Меня зовут Андросов Михаил — DevOps/MLOps-инженер. Последние два года сопровождаю ML-кластера Kubernetes с интенсивной нагрузкой на GPU.

Аппаратные характеристики

Наш типовой bare-metal-узел — сервер с 10 × NVIDIA RTX 4090 (24 GB). GPU enterprise уровня тоже есть, но мы предпочитаем использовать пользовательские GPU: такие карты проще приобрести и эксплуатировать.

Основные проблемы

В процессе запуска бесчисленных ML экспериментов, встали следующие проблемы:

Недоиспользование памяти. Большинство ML задач занимает лишь часть памяти RTX 4090, из-за чего GPU простаивает.
Взаимоблокировки.Читать полностью »

IaaS-дайджест: высокая производительность, хранение данных и новые технологии для ЦОД

2019-07-27 в 19:44, admin, рубрики: gdpr, iaas, vgpu, Блог компании ИТ-ГРАД, дайджест, ИТ-ГРАД, Процессоры, хранение данных, цод

Материалы из нашего блога об IaaS и Tg-канала про IT-инфраструктуру.

^{/ фото NASA, Rawpixel CC BY}

Аналитические заметки

Как прошла конференция VMware EMPOWER 2019 Это — саммари о поездке специалистов «ИТ-ГРАД» в Лиссабон, где VMware проводили свою ежегодную тематическую конференцию. Прямую трансляцию с места событий мы вели у себя в Telegram-канале, а на Хабре публиковали ежедневные отчеты с заметками о представленных новинках и наиболее обсуждаемых технологиях: день первый (интеллектуальные решения, информационная безопасность, конец эры NSX-V), день второй (сетевые решения, IoT, МО), день третий (виртуализация СХД и восстановлении данных). Помимо этого мы подвели итоги и в хабрапосте.

Читать полностью »

Ситуация: виртуальные GPU не уступают по производительности железным решениям

2019-03-16 в 9:46, admin, рубрики: vgpu, VMware, Блог компании ИТ-ГРАД, виртуализация, высокая производительность, ИТ-ГРАД

В феврале в Стэнфорде прошла конференция, посвящённая высокопроизводительным вычислениям (HPC). Представители VMware рассказали, что при работе с GPU система на базе модифицированного гипервизора ESXi по скорости не уступает bare metal решениям.

Рассказываем о технологиях, которые позволили этого добиться.

Читать полностью »