- PVSM.RU - https://www.pvsm.ru -

8-битная аналоговая память для работы с нейросетями

В конце года на Хабре появилась статья [1] о том, что компании IBM удалось создать первый 8-битный чип, основанный на памяти с изменением фазового состояния (phase-change memory).

Сегодня мы расскажем, как работает устройство, представленное ИТ-гигантом.

8-битная аналоговая память для работы с нейросетями - 1 [2]
/ фото IBM Research [3] CC BY-ND [4]

С какой целью разрабатывается чип

Современные системы машинного обучения в основном работают на базе графических процессоров (GPU). Они требуют активного охлаждения, так как GPU могут нагреваться [5] в два раза быстрее центральных процессоров (CPU). Это выливается в большие счета за электроэнергию для дата-центров, в которых такие вычислительные кластеры располагаются.

Вопрос снижения энергопотребления важен для ЦОД. По оценкам аналитиков [6], к 2025 году дата-центры будут потреблять 20% всего генерируемого электричества. С целью сокращения расходов ЦОД и ведутся разработки новых технологий для МО. В их числе 8-битная аналоговая память с изменением фазового состояния (PCM-память) от IBM. По оценке разработчиков, новые чипы окажутся в сто раз производительнее классических GPU и потребуют в 280 раз меньше энергии.

Преимущества PCM-памяти объясняются тем, что обработка и хранение данных происходят [7] на одном устройстве. В традиционных системах эти процессы разделены — данные приходится переносить с устройства на устройство, и из-за этого скорость вычислений и их энергоэффективность снижается.

Чип работает с 8-битными числами с плавающей точкой. Обычно в машинном обучении используют числа с большей точностью, однако, по словам исследователей из IBM, в «повседневных» задачах этого оказывается достаточно.

Создателям технологии удалось [8] применить её в переводе текстов и распознавании речи и изображений. Вице-президент по исследованиям IBM Джефф Уэлсер (Jeff Welser) сравнил [9] работу нейронной сети в чипе с человеком, который видит расплывчатую фигуру в запотевшем окне, но все равно узнает в этом «пятне» своего родственника или друга.

IBM уже показала первые результаты работы PCM-памяти с технологиями машинного обучения. На чипе запустили простую однослойную нейронную сеть, которая распознавала написанные от руки числа 1, 0 и 4. Алгоритм различил изображения со 100-процентной точностью.

Как работает аналоговая память IBM

Чип изготовлен из сплава германия, теллура и сурьмы, размещенного между двумя электродами. Когда через материал пропускают ток, он меняет состояние с кристаллического на аморфное. Эти состояния означают ноль или единицу.

Из-за того, что фаза меняется не во всем объеме сплава, а лишь в его части, в ячейке можно сохранять промежуточные значения между 0 и 1. При записи в память числа не «округляются», и это помогает добиться большей точности алгоритмов, работающих на чипе. Считается [10], что такой метод хранения данных более достоверно передает поведение нейронов в мозге [11] человека.

При чтении данных через ячейку пропускают небольшой ток и измеряют сопротивление. В аморфном состоянии сопротивление сплава оказывается более высоким, чем в кристаллическом — по этому показателю и определяют, какое число хранится в ячейке.

Хотя напряжение тока при чтении ниже требуемого для изменения фазового состояния материала, оно приводит к небольшому сдвигу частиц и искажению данных. Поэтому в IBM усовершенствовали PCM-память и добавили в устройство дополнительный слой из нитрида титана, который «оборачивает [12]» сплав — его назвали отражателем.

8-битная аналоговая память для работы с нейросетями - 2
/ Koelmans, W.W. et al. Projected phase-change memory devices [12] / СС BY [13]

При записи данных отражатель никак не влияет на прохождение тока через сплав, так как сопротивление нитрида титана в этом случае выше, чем сопротивление материала ячейки. При чтении данных, сопротивление материала ячейки становится выше, чем у отражателя, и поэтому ток проходит по внешнему слою, минуя сплав. Такой тип памяти в IBM назвали Proj-PCM, или projected PCM — «PCM с отражателем».

Перспективы технологии

В ИТ-индустрии к новому чипу отнеслись положительно. По словам [10] научного редактора издания Ars Technica, у устройства большой потенциал — с развитием технологии и сокращением размера ячейки памяти IBM может увеличить производительность устройства минимум в сто раз. Однако ИТ-гиганту ещё предстоит решить несколько сложностей.

Первая — массовое производство PCM-памяти. По словам [14] аналитика рынка процессоров Линли Гвеннапа (Linley Gwennap), характеристики чипов, например, рабочее напряжение и сопротивление электронных схем, меняются от устройства к устройству. Гвеннап считает, что IBM ещё предстоит разработать подходящий производственный процесс, поэтому аналоговый чип не скоро станет коммерческим продуктом.

Ещё одна сложность — устойчивость [15] к изменениям температуры. Сейчас под воздействием тепла или холода сплав меняет свою фазу. Поэтому создателям устройства предстоит придумать способ защиты чипа от температурных колебаний. Вероятно, выходом станет уменьшение размера устройства — исследования показывают [16], что материал менее подвержен влиянию температуры при толщине слоя в несколько нанометров.

8-битная аналоговая память для работы с нейросетями - 3
/ фото IBM Research [17] CC BY-ND [4]

Кто еще занимается разработкой чипов для МО

Похожую технологию разрабатывает стартап Mythic. В основе устройства компании — многоуровневая [18] флеш-память (MLC). Ячейка чипа может хранить [19] не два или четыре уровня заряда, как в более распространенных устройствах флэш-памяти, а 256. Это значительно повышает её емкость. Ожидается, что такая память будет использоваться [20] для реализации алгоритмов машинного обучения в устройствах интернета вещей: смартфонах, дронах, умных колонках и слуховых аппаратах [21].

Другой похожий чип создает [22] компания Syntiant. Вычисления в устройстве также производятся в MLC-памяти. Главное преимущество технологии — низкое энергопотребление. Представители компании говорят, что их устройство потребляет в 50 раз меньше электричества, чем цифровые процессоры. Syntiant также будут использовать в гаджетах, которые питаются от батареи: смартфонах, носимых устройствах, датчиках и камерах наблюдения. Стартап уже работает [23] над первой коммерческой реализацией технологии — «умным» микрофоном.

В целом аналоговые PCM-чипы пока не предназначены для проведения высокоточных вычислений. Поэтому их используют в комбинации с центральными и графическими процессорами. В IBM считают, что гибридная архитектура может создать равновесие между производительностью и точностью. Но в будущем ожидается, что аналоговая память сможет заменить [24] классические чипы в дата-центрах.


Первый блог о корпоративном IaaS:

Наш IaaS-блог в Telegram:

Автор: ИТ-ГРАДовец

Источник [30]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/ibm/304160

Ссылки в тексте:

[1] появилась статья: https://habr.com/post/434430/

[2] Image: https://habr.com/company/it-grad/blog/435072/

[3] IBM Research: https://www.flickr.com/photos/ibm_research_zurich/21106838985

[4] CC BY-ND: https://creativecommons.org/licenses/by-nd/2.0/

[5] могут нагреваться: https://www.datacenterdynamics.com/opinions/data-center-predictions-2019/

[6] оценкам аналитиков: https://data-economy.com/data-centres-world-will-consume-1-5-earths-power-2025/

[7] происходят: https://habr.com/company/it-grad/blog/341568/

[8] удалось: https://www.ibm.com/blogs/research/2018/12/8-bit-precision-training/

[9] сравнил: https://spectrum.ieee.org/tech-talk/computing/hardware/ibm-reveals-8bit-analog-chip-with-phasechange-memory

[10] Считается: https://arstechnica.com/science/2018/06/training-a-neural-network-in-phase-change-memory-beats-gpus/

[11] мозге: http://www.braintools.ru

[12] оборачивает: https://www.nature.com/articles/ncomms9181

[13] СС BY: https://creativecommons.org/licenses/by/4.0/

[14] словам: https://www.eetimes.com/document.asp?doc_id=1334029&page_number=3

[15] устойчивость: https://www.eetimes.com/document.asp?doc_id=1334029&page_number=2

[16] показывают: http://poplab.stanford.edu/pdfs/Raoux-PCMreview-mrsbull14.pdf

[17] IBM Research: https://www.flickr.com/photos/ibm_research_zurich/21114532851

[18] многоуровневая: https://ru.wikipedia.org/wiki/%D0%A4%D0%BB%D0%B5%D1%88-%D0%BF%D0%B0%D0%BC%D1%8F%D1%82%D1%8C#SLC_%D0%B8_MLC

[19] может хранить: https://www.mythic-ai.com/wp-content/uploads/2018/08/Mythic-Multiplies-In-A-Flash.pdf

[20] использоваться: https://www.mythic-ai.com/use-cases/

[21] слуховых аппаратах: https://www.wired.com/story/an-old-technique-could-put-artificial-intelligence-in-your-hearing-aid/

[22] создает: https://spectrum.ieee.org/tech-talk/computing/embedded-systems/two-startups-use-processing-in-flash-memory-for-ai-at-the-edge

[23] работает: https://semiengineering.com/syntiant-analog-deep-learning-chips/

[24] сможет заменить: https://www.zdnet.com/article/ibm-our-in-memory-computing-breakthrough-will-cut-cost-of-training-ai/

[25] VMworld Europe 2018 – главные анонсы прошедшей конференции: https://iaas-blog.it-grad.ru/tendencii/vmworld-europe-2018/

[26] Почему корпоративные заказчики используют виртуальные машины, а не контейнеры: https://iaas-blog.it-grad.ru/tendencii/pochemu-korporativnye-zakazchiki-ispolzuyut-virtualnye-mashiny-a-ne-kontejnery/

[27] GDPR… GDPR everywhere: https://t.me/iaasblog/183

[28] GDPR и ИТ-сектор: краткие итоги года: https://t.me/iaasblog/182

[29] Необычные ЦОДы — какими они бывают: https://t.me/iaasblog/184

[30] Источник: https://habr.com/post/435072/?utm_source=habrahabr&utm_medium=rss&utm_campaign=435072