Neurostream — новый чип для глубокого обучения

Высокопроизводительные вычислительные системы уже находят применение для памяти с высокой пропускной способностью (HBM) и технологии Hybrid Memory Cube (HMC). В этом направлении активно ведутся разработки.

Ученые из Болонского университета в конце января представили архитектуру для вычислений в памяти (PIM), способную эффективно работать с глубокими свёрточными нейронными сетями. Она получила название Neurostream.

^[1]/ фото Ryan McMinds ^[2] CC ^[3]

Дизайн базируется на перспективном типе компьютерной оперативной памяти HMC (Hybrid Memory Cube), который в рамках проекта получил название Smart Memory Cube, или SMC. Решение дополняется многоядерной PIM-платформой NeuroCluster.

NeuroCluster имеет модульный дизайн, основанный на сопроцессорах для вычислений с плавающей точкой NeuroStream и RISC-V. Интересно то, что только 8% кристаллов HMC используются для достижения производительности 240 гигафлопс при энергопотреблении ^[4] в 2,5 ватта.

«Кубы памяти» обладают очень маленьким энергопотреблением, но способны справляться с задачами для свёрточных сетей, — говорится ^[5] в статье ученых из университета. — Это позволяет высвободить ресурсы компьютерной логики для обработки другой нагрузки».

Небольшое увеличение энергопотребления системы и незначительный рост занимаемого пространства при масштабировании делают эту PIM-систему затрато- и энергоэффективной, которая может быть легко расширена до 955 гигафлопс при включении четырех SMC.

Ученые сравнили возможности нового решения с вычислительными мощностями GPU Nvidia Tesla K40. Tesla K40 оказался способен реализовать 1092 гигафлопс при энергопотреблении 235 ватт. Технология NeuroGrid достигла 955 гигафлопс при мощности 42,8 ватта — энергоэффективность в 4,8 раза выше, чем у GPU.

Neurostream — новый чип для глубокого обучения - 2

Изображение ^[4]: SMC-сеть и блок-схема одного из «кубов»

Более того, создатели Neurostream ожидают, что энергоэффективность может быть повышена с помощью программных решений, а также выполнения арифметических операций пониженной точности. По уверениям ученых, это может снизить энергопотребление на 70%. Подробнее о решении можно прочитать в статье ^[4] сотрудников Болонского университета.

Далее, в своей работе исследователи планируют изучить возможности реализации системы с четырьмя блоками NeuroCluster, которые будут использоваться для мониторинга процесса обучения сетей.

P.S. А вот о чем еще мы пишем в блоге нашего проекта 1cloud:

Автор: 1cloud.ru

Источник ^[12]

Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/mashinnoe-obuchenie/241167

Ссылки в тексте:

[1] Image: https://habrahabr.ru/company/1cloud/blog/321304/

[2] Ryan McMinds: https://www.flickr.com/photos/131967103@N02/16835536592/

[3] CC: https://creativecommons.org/licenses/by/2.0/

[4] энергопотреблении: https://arxiv.org/pdf/1701.06420v1.pdf

[5] говорится: https://www.nextplatform.com/2017/02/02/memory-core-new-deep-learning-research-chip/

[6] Как сейчас используют нейросети: от научных проектов до развлекательных сервисов: https://habrahabr.ru/company/1cloud/blog/312806/

[7] Немного о VPN: Краткий обзор программных реализаций: https://1cloud.ru/blog/vpn-compare

[8] Как обезопасить Linux-систему: 10 советов: https://1cloud.ru/blog/linux-server-security-advices

[9] Подборка материалов об облаках, дата-центрах и разработке сервисов: https://1cloud.ru/blog/cloud-digest

[10] Как узнать, из чего состоит SSL-сертификат?: https://1cloud.ru/blog/chto-takoe-ssl

[11] Тренды облачной безопасности: https://1cloud.ru/blog/cloud-safety-trends

[12] Источник: https://habrahabr.ru/post/321304/?utm_source=habrahabr&utm_medium=rss&utm_campaign=best

Нажмите здесь для печати.