- PVSM.RU - https://www.pvsm.ru -

Нейросеть Microsoft победила Google и Intel в конкурсе на распознавание изображений

Нейросеть Microsoft победила Google и Intel в конкурсе на распознавание изображений - 1

Программа Microsoft Research первенствовала в нескольких категориях на шестом ежегодном конкурсе по распознаванию изображений ImageNet. Ей удалось превзойти конкурентные системы от Google, Intel, Qualcomm и Tencent, а также от ряда стартапов и научно-исследовательских лабораторий (результаты [1]).

Система-чемпион носит название "Deep Residual Learning for Image Recognition", и к конкурсу в свободном доступе опубликована статья [2] с описанием технических принципов её работы.

«Мы обучали нейросеть с глубиной более 150 слоёв, — описывают метод исследователи. — При этом использовался фреймворк глубокого остаточного обучения (deep residual learning), который облегчает оптимизацию и сближение крайне глубоких нейросетей. Метод глубокого остаточного обучения позволяет получить дополнительную точность, когда нейросети значительно глубже, чем использовавшиеся ранее. Такое преимущество в точности не наблюдается во многих обычных нейросетях при их углублении».

На иллюстрации нейросеть с остаточным обучением показана в правой колонке.

Нейросеть Microsoft победила Google и Intel в конкурсе на распознавание изображений - 2

Технологии глубокого обучения сейчас активно изучаются многими крупными корпорациями. С помощью нейросетей повышают эффективность внутренних систем и повышают качество пользовательских продуктов. В юмористическом стиле Microsoft демонстрировала возможности своих разработок в недавних приложениях по определению возраста и оценке усов. Коммерциализация технологии распознавания изображений происходит через API в рамках проекта «Оксфорд» (Project Oxford [3]), бета-тестирование которого началось месяц назад.

Нейросеть Microsoft победила Google и Intel в конкурсе на распознавание изображений - 3

По условиям конкурса ImageNet, программа должна корректно обнаружить и классифицировать объекты на 100 000 фотографиях с Flickr и из различных поисковых систем, выбрав из тысячи тематических категорий [4] (муравей, банан, яблоко и т.д.).

Разработка Microsoft показала уровень ошибок классификации всего 3,5%, а ошибок локализации — 9%.

В предыдущие годы победителями соревнования по уровню классификации объектов выступали Google, стартап Clarifai и NEC.

«Мы даже не предполагали, что одна эта идея [глубокое остаточное обучение] может быть настолько важной», — сказал Цзянь Сан (Jian Sun), один из авторов программы, в официальном блоге [5].

Автор: alizar

Источник [6]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/microsoft/106175

Ссылки в тексте:

[1] результаты: http://image-net.org/challenges/LSVRC/2015/results

[2] статья: http://arxiv.org/abs/1512.03385

[3] Project Oxford: http://blogs.technet.com/b/machinelearning/archive/2015/10/26/microsoft-expands-availability-of-project-oxford-intelligent-services.aspx

[4] тысячи тематических категорий: http://image-net.org/challenges/LSVRC/2015/ui/det.html

[5] официальном блоге: http://blogs.microsoft.com/next/2015/12/10/microsoft-researchers-win-imagenet-computer-vision-challenge/

[6] Источник: http://geektimes.ru/post/267652/