Intel Vision Accelerator — Deep Learning в каждый дом

в 7:17, , рубрики: Intel Vision Accelerator, Блог компании Intel, Интернет вещей, машинное обучение, обработка изображений

Intel Vision Accelerator — Deep Learning в каждый дом - 1

Отвлечемся ненадолго от темы новых процессоров Intel (это совсем ненадолго) и поговорим о машинном зрении и Deep Learning. Вообще, тема AI стала общей при обсуждении перспектив развития компьютерной техники, и многие, я думаю, заметили следующую особенность. Постепенно, по мере совершенствования специализированных аппаратных и программных средств, элементы AI выходят из дата-центров с супер-серверами «в поля», становятся все более доступными технически и финансово. В Intel также видят эту тенденцию, и, чтобы упростить внедрение передовых технологий в повседневную жизнь, предлагают вендорам воспользоваться их новым решением — Intel Vision Accelerator.

Что такое Intel Vision Accelerator? Это набор референсных дизайнов для плат-ускорителей, на основе которых любой производитель электроники может создать свой продукт с нужным набором особенностей. Однако, естественно, просто дизайна еще недостаточно — нужна элементная база. У Intel она уже есть — это специализированный сопроцессор Movidius и FPGA Arria. В чем преимущества такого подхода?

  • возможность инференса нейронных сетей «на месте»;
  • высокая производительность на специализированных задачах;
  • высокая эффективность в пересчете на энергозатраты, стоимость и т.д.;
  • полная совместимость с Open Visual Inference & Neural Network Optimization (OpenVINO) toolkit — набором библиотек, средств оптимизации и информационных ресурсов для разработки софта, использующего машинное зрение и Deep Learning.

Давайте сравним эти две платформы применительно к Deep Learning.

Intel Vision Accelerator с Intel Movidius Intel Vision Accelerator c Intel Arria
Особенность Высокая эффективность в пересчете на потребление и стоимость Производительное интегрированное решение
Область применения Классические нейронные сети Дополнительная оптимизация при deep learning с использованием высоконагруженных сетей
Варианты использования Устройства, имеющие ограничения по размерам и потреблению, классические топологии сетей, которые могут быть оптимизированы под ASIC Сервера среднего и начального уровней, среды, хорошо поддающиеся программной оптимизации
Интерфейсы подключения PCIe, mini-PCIe, M2 PCIe
Количество видеопотоков От 1 до 16 на устройство От 3 до 32
Batch size 1-4 1-144
Энергопотребление ~2 Вт ~35 Вт

В настоящее время Intel Vision Accelerator поддерживает следующие топологии сетей и алгоритмы:

Топологии Алгоритмы
GoogleNet
ResNet–18
ResNet–50
ResNet–101
SqueezeNet
SqueezeNext
VGG-16
Faster RCNN
MobileNet
Tiny Yolo
Определение/распознавание лица
Классификация атрибутов лица
Слежение за руками
Определение пола и возраста
Определение предмета/слежение за предметом
Распознавание поведения и жестов
Определение брошенных предметов
Многоцелевое слежение
Определение буквы/слова
и т.д.

Вы спросите: зачем нам знать о предложениях Intel для вендоров? Вручную ведь ускорители делать не предлагается. Ответ такой: это пост о классе устройств (или двух классах), которые в скором времени появятся на рынке. А вы сможете их найти для своих нужд — если знаете, что нужно искать.

Автор: saul

Источник

* - обязательные к заполнению поля