- PVSM.RU - https://www.pvsm.ru -

В Национальной лаборатории Ок-Ридж запустили самый быстрый в мире суперкомпьютер Summit

В Национальной лаборатории Ок-Ридж запустили самый быстрый в мире суперкомпьютер Summit - 1 [1]
Узел суперкомпьютера Summit. Фото: Национальная лаборатория Ок-Ридж (США)

Скорее всего, США вернут себе лидерство в рейтинге суперкомпьютеров TOP500 [2]. 8 июня 2018 года объявлено о запуске «самого мощного в мире» суперкомпьютера Summit [3] мощностью 200 петафлопс. И если Китай не преподнесёт никаких сюрпризов, то в июньском TOP500 произойдёт смена лидера [4]. Заявленных 200+ петафлопс с лихвой хватит, чтобы обогнать по результату теста Linpack нынешнего чемпиона Sunway TaihuLight (93 PFLOPS).

В Национальной лаборатории Ок-Ридж запустили самый быстрый в мире суперкомпьютер Summit - 2
Суперкомпьютер Summit весит 340 тонн и занимает комнату площадью 860 м². На его охлаждение расходуется 150 тонн воды в минуту. Фото: Национальная лаборатория Ок-Ридж

Суперкомпьютер Summit состоит из 4608 узлов, на каждом из которых установлено по два 22-ядерных процессора IBM Power9 и шесть графических процессоров Nvidia Tesla V100. Узлы соединены сетью Mellanox dual-rail EDR InfiniBand с пропускной способностью 200 Гбит/с на каждый сервер. Для IBM это презентация серверов Power9-GPU AC922, которую можно предлагать другим заказчикам.

При полном оборудовании всех узлов одни только графические процессоры обеспечат пиковую производительность 215 петафлопс с двойной точностью. Кроме того, каждый V100 выдаёт ещё 125 терафлопс со смешанной точностью — это основной тип операций тензорного ядра V100. Таким образом, в приложениях глубокого обучения пиковая производительность может составить порядка 125×27648 = 3,46 эксафлопс. Если реально, то в районе 3,3 эксафлопс, считают эксперты.

Это не просто теоретические расчёты. По словам директора Национальной лаборатории Ок-Ридж Томаса Захария (Thomas Zacharia), ещё до завершения строительства системы исследователи запустили на тензорных ядрах GPU вычисления по сравнению геномов [5] — и зафиксировали производительность 1,88 эксафлопс. Приложение обрабатывало геномы в поисках образцов, соответствующих определённым условиям. Это первый случай в истории компьютерной техники, когда был де-факто преодолён барьер в 1 эксафлопс, то есть 1018 операций с плавающей запятой в секунду. В серверной комнате этого монстра такой шум, что там невозможно работать без наушников (видео [6]).

В Национальной лаборатории Ок-Ридж запустили самый быстрый в мире суперкомпьютер Summit - 3 [7]
Узел Summit. Для суперкомпьютера в комнате проложено около 300 километров оптоволоконного кабеля. Фото: Национальная лаборатория Ок-Ридж (США)

Разумеется, кроме глубокого обучения Summit поддерживает вычисления в стандартном наборе приложений, который интересует Министерство энергетики США, в том числе вычисления, связанные с термоядерной энергией, альтернативной энергетикой, материаловедением, климатическим моделированием, вычислительной химией и космологией. В то же время Summit остаётся открытой системой, так что клиенты будут запускать на нём все виды расчётов, какие пожелают, даже совершенно не связанные с энергетикой. Предполагается, что Summit будут использовать для приложений в сфере здравоохранения в таких областях, как поиск новых лекарств. Как сказал на пресс-конференции Томас Захария, их исследовательский центр должен стать чем-то вроде CERN для медицинского дата-майнинга и аналитики.

В Национальной лаборатории Ок-Ридж запустили самый быстрый в мире суперкомпьютер Summit - 4
Суперкомпьютер Summit. Фото: Национальная лаборатория Ок-Ридж

Когда в 2014 году заключался контракт с IBM на строительство этого суперкомпьютера, в его состав включили GPU. В то время у Министерство энергетики были весьма смутные представления, что делать с возможностями глубокого обучения, но компания Nvidia приняла решение внедрить в V100 тензорные ядра — и в результате Summit внезапно превратился в монстра приложений ИИ. Так что можно предположить, что систему нагрузят множеством передовых исследований ИИ, в дополнение к её основным обязанностям. Пока что проекты для Summit отбирают по заявкам, но в 2019 году система станет более широко доступной по программе Innovative and Novel Computational Impact on Theory and Experiment (INCITE).

В Национальной лаборатории Ок-Ридж запустили самый быстрый в мире суперкомпьютер Summit - 5
Многоядерный микропроцессор китайского суперкомпьютера Sunway TaihuLight. До 8 июня 2018 года этот суперкомпьютер считался самым мощным в мире

После запуска Summit власти, наверное, примут решение о выводе из эксплуатации его предшественника, суперкомпьютера Titan, который в момент своего запуска в 2012 году был признан самым мощным в мире и до сих пор остаётся самым быстрым суперкомпьютером в США. Но сейчас поддерживать его работу мало смысла, потому что он в 8 раз уступает по скорости Summit, при этом потребляет в 5 раз больше энергии.

В Titan установлены графические процессоры K20X, у которых производительность в вычислениях с одинарной точностью для машинного обучения ограничена скромными четырьмя терафлопсами на устройство. Тем более все программы для Titan легко перенести на Summit.

Автор: alizar

Источник [8]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/vy-sokaya-proizvoditel-nost/282492

Ссылки в тексте:

[1] Image: https://www.flickr.com/photos/olcf/26037021428/in/album-72157697679727475/

[2] TOP500: https://www.top500.org/

[3] Summit: https://www.ornl.gov/news/ornl-launches-summit-supercomputer

[4] произойдёт смена лидера: https://www.top500.org/news/summit-up-and-running-at-oak-ridge-claims-first-exascale-application/

[5] сравнению геномов: https://en.wikipedia.org/wiki/Comparative_genomics

[6] видео: https://www.dropbox.com/sh/fy76ppz7cvjblia/AAC0m93xBWk4poM-rRwJbiZza?dl=0

[7] Image: https://www.flickr.com/photos/olcf/27790977897/in/album-72157697679727475/

[8] Источник: https://habr.com/post/413769/?utm_campaign=413769