- PVSM.RU - https://www.pvsm.ru -

Поиск Bing оптимизировали с помощью нейросети на FPGA

Поиск Bing оптимизировали с помощью нейросети на FPGA - 1

В проектировании серверной инфраструктуры для обработки поисковых запросов у каждой компании есть свои ноу-хау. Например, Microsoft в последние годы активно экспериментирует с использованием FPGA (Field-Programmable Gate Array, программируемые пользователем вентильные матрицы).

Для поисковой системы Bing инфраструктура ранжирования разделена на три части: выделение признаков (feature extraction), обработка выражений в свободной форме (free-form expressions) и вычисление результата системой машинного обучения (machine learning scoring).

Поиск Bing оптимизировали с помощью нейросети на FPGA - 2

С 2011 года в рамках проекта Catapult [1] начался процесс миграции этих систем на FPGA. Процесс шёл непросто, за эти годы Microsoft экспериментировала с тремя моделями FPGA, для каждой из которых приходилось конструировать специальные материнские платы.

В июне 2014 года Microsoft рассказывала [2], что удалось перевести на платформу Catapult (то есть на FPGA) 1632 сервера в одном из дата-центров. Это позволило сохранить производительность поисковой подсистемы на том же уровне, снизив количество серверов вдвое.

Работа продолжилась в том же направлении, и сейчас Microsoft рассказала о последних модификациях [3], сделанных в подсистеме машинного обучения Bing.

Во-первых, Microsoft перешла на новые высокопроизводительные FPGA Altera Arria 10 [4]. В них увеличена производительность в операциях с плавающей запятой (трёхкратная выгода по энергоэффективности, по сравнению с GPU).

Поиск Bing оптимизировали с помощью нейросети на FPGA - 3

Во-вторых, разработан новый оригинальный дизайн свёрточной нейросети на матрицах Stratix-V FPGA от Altera. Эту нейросеть сейчас используют в задачах компьютерного зрения, распознавании образов и классификации изображений, в том числе для поисковой системы Bing.

Поиск Bing оптимизировали с помощью нейросети на FPGA - 4

Если верить результатам, опубликованным в научной работе [5], то в стандартных тестах по классификации изображений ImageNet 1K и ImageNet 22K нейросеть от Microsoft превосходит предыдущие варианты дизайна на FPGA примерно в три раза. В этих двух тестах Catapult Server + Stratix V D5 осуществляет классификацию со скоростью 134 и 91 изображение в секунду, соответственно.

Поиск Bing оптимизировали с помощью нейросети на FPGA - 5

В то же время, существенно улучшены показатели в затратах джоулей на картинку, по сравнению с разными GPU, оптимизированными для этой задачи. Таким образом, серверы Microsoft смогут работать эффективнее и дешевле, чем серверы на стандартных GPU.

Автор: alizar

Источник [6]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/zhelezo/84230

Ссылки в тексте:

[1] Catapult: http://research.microsoft.com/en-us/projects/catapult/

[2] рассказывала: http://blogs.technet.com/b/inside_microsoft_research/archive/2014/06/16/catapult-moving-beyond-cpus-in-the-cloud.aspx

[3] рассказала о последних модификациях: http://blogs.technet.com/b/inside_microsoft_research/archive/2015/02/23/machine-learning-gets-big-boost-from-ultra-efficient-convolutional-neural-network-accelerator.aspx

[4] Altera Arria 10: http://www.marketwatch.com/story/altera-fpgas-achieve-compelling-performance-per-watt-in-cloud-data-center-acceleration-using-cnn-algorithms-2015-02-23-8183520?reflink=MW_news_stmp

[5] научной работе: http://research.microsoft.com/pubs/240715/CNN%20Whitepaper.pdf

[6] Источник: http://geektimes.ru/post/246512/