- PVSM.RU - https://www.pvsm.ru -

Виртуальный суперкомпьютер по требованию

КДПВ

Виртуальный суперкомпьютер (vSC) — это современная альтернатива для наукоемкого бизнеса и научных групп при решении ресурсоемких задач. В процессе бурного развития облачных технологий клаудизация все активнее проникает в наиболее консервативные и сложные IT-сферы, например, суперкомпьютинг и распределенные вычисления. Один из таких подходов в области клаудизации HPC реализован компанией HPC HUB.

Введение

Высокопроизводительные вычислительные кластера (ВВК) применяются в различных областях современной науки, инженерного дела, IT, связи и многих других. ВВК начали интенсивно развиваться в конце 90х как коммодити-альтернатива большим суперкомпьютерам, поставляемых ведущими фирмами IT рынка, такими как IBM, SGI, DEC, Sun, HP, Cray, NEC, Hitachi, Siemens, Bull и т.д.

admin

Несмотря на относительную дешевизну ВВК по сравнению с традиционными суперкомпьютерами, эти системы являются очень дорогими в использовании.

  • Они требуют профессионального обслуживания целой командой специалистов, специальной площадки с охлаждением, бесперебойным питанием, высокоскоростным сетевым подключением.
  • Программное обеспечение для ВВК, как правило, требует тщательной настройки и сопровождения.
  • Стоимость лицензий коммерческого кластерного ПО может многократно превышать стоимость и без того недешевых аппаратных средств кластеров.

Таким образом, относительно небольшие ВВК с десятком-другим счетных узлов, сетью малой латентности и системой хранения данных являются крайне дорогими инструментами и доступны компаниям с солидными IT бюджетами. Однако даже в случае больших IT бюджетов покупка и запуск кластера занимают месяцы. На ВВК общего пользования возникает проблемы настройки ПО и организации доступа к нему.

Современные облачные провайдеры ориентированы, как правило, на продажу одиночных виртуальных серверов, либо на небольшие их группы, но никак не на сдачу в аренду времени на ВВК или им подобных систем. В результате сложившихся тенденций, самые динамичные развивающиеся малые и средние компании практически лишены возможности краткосрочной аренды ВВК для каких-либо своих нужд, для апробации и пилотного внедрения вычислительных технологий, систем моделирования в свой бизнес.

logo

Виртуальный ВВК от HPC HUB

Компания HPC HUB решила направить свои усилия как раз для нишевого потребителя, которому нужен в краткосрочную аренду (сутки, недели, месяцы) в монопольном режиме небольшой ВВК на 10-20 узлов с сетью малой латентности и с системой хранения данных терабайтного класса. Основной услугой компании является сдача в аренду виртуального ВВК (второе название: виртуальный суперкомпьютер — vSC). С точки зрения пользователя vSC представляет собой обычный кластер, состоящий из головного управляющего узла, нескольких оснащенных сетью малой латентности вычислительных узлов и хранилищем объемом от 50ГБ до 10ТБ, реализованным на GFS2. Узлы имеют доступ в Интернет через NAT, доступ на управляющий узел извне открыт по 22 порту, который перенаправляется на порт тунельной виртуальной машины.

Различные vSC изолированы друг от друга, таким образом пользователь имеет полный контроль над установленным ПО в vSС, т.е. может его настраивать и модифицировать по своему усмотрению. Базовые образы vSC построены на CentOS 7.1, используют драйвера IB OFED 3.3 и систему управления заданиями SGE 8.1.3. По окончании работы пользователь может сделать снапшот состояния управляющего узла и одного из вычислительных узлов. Данный снапшот может быть использован для запуска следующего экземпляра vSC пользователя. При этом снапшот vSC может масштабироваться на любое количество вычислительных узлов.

Реализация vSC построена на базе облачного ПО OpenStack и системы хранения данных Ceph. Виртуальные машины пользовательских узлов управляются гипервизором KVM. Для виртуализации сети малой латентности используется технология SR-IOV. В виртуальные машины счетных узлов импортируется одна из виртуальных функций Infiniband адаптера.

time Такой подход позволяет добиться минимального роста латентности виртуализированного Infiniband – 1.09 мкс латентность IB VF против 0.85 мкс у Infiniband без виртуализации. Топология и характеристики процессоров виртуальных счетных узлов сделаны как можно более похожими на физические узлы, поддерживаются NUMA расширения. Типичные агрегированные для всех узлов экземпляра vSC скорости обмена c GFS2 составляют 1.5-2 Гб/сек для чтения, 350-450 Мб/сек на запись, 10000-12000 IOPS.

Аренда и развертывание vSC может быть осуществлена в течение нескольких минут с сайта hpchub.net [1]. Минимальный период времени аренды на данный момент составляет одни сутки, но технически ничего не мешает перейти на более мелкие периоды тарификации. Таким образом снимается еще одно неприятное ограничение – большое время организации доступа к суперкомпьютерным мощностям.

Выводы

Виртуальный вычислительный кластер HPC HUB предоставляет пользователям возможность доступа к ВВК терафлопного класса без существенных временных и финансовых затрат. При этом пользователь может настраивать ПО данного ВВК исключительно под свои задачи, что гораздо проще аналогичных процедур на системах общего пользования. Помимо своего прямого назначения – выполнения вычислений, виртуализированный ВВК открывает для своих пользователей ряд существенных, ранее отсутствовавших на рынке возможностей:

  • использование виртуализированного ВВК для разработки и тестирования приложений
  • использования ВВК как быстрой и легко масштабируемой демо площадки
  • использования ВВК для продажи кластерного ПО «в розницу» (краткосрочная аренда ПО)

Виртуальный суперкомпьютер может быть особенно полезен для распространения и продаж кластерного ПО его производителям. Такие возможности как гибкость, легкое масштабирование, предустановленное сложные кластерное ПО с возможностью аренды лицензий на данное ПО с малым квантом времени помогут охватить производителям кластерного ПО не только пользователей с большими ИТ бюджетами в пиковых нагрузках, но и различных пользователей с разовыми проектами, включая стартапы, венчурные предприятия и даже пользователей из академической среды и государственных учреждений.

Автор: HPCHub

Источник [2]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/cloud/189217

Ссылки в тексте:

[1] hpchub.net: http://hpchub.net

[2] Источник: https://habrahabr.ru/post/309134/?utm_source=habrahabr&utm_medium=rss&utm_campaign=best