- PVSM.RU - https://www.pvsm.ru -
Команда инженеров Google, возглавляемая парнем с дружелюбной фамилией Гудфеллоу (Ian Goodfellow [1], закончил университет по CS в 2009 году и может похвастаться солидным списком [2] научных публикаций), опубликовала на arxiv.org работу, в которой отчитались о своих успехах в сборе информации, которым располагает база проекта Google Street View — в частности, об автоматическом распознавании номеров домов с таким же качеством, как бы это делал человек. Красноречивый факт — Google может получить все номера домов во Франции (точнее, там где проехал гугломобиль) за время, менее часа.
Работа называется Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks [3] и в ней речь идёт о использовании нейронных сетей для целей распознавания. Как очевидно, дело сильно осложняется множеством факторов: разные места расположения номера дома, цвет таблички, её всевозможные наклоны, качество как самой таблички, так и её фотографии, и целый ряд других.
В итоге задачу переложили на модификацию нейронной сети DistBelief с 11-ю уровнями нейронов (это та же сеть, которую Google использует [4] для «deep learning» для выявления семантического смысла понятий), которую требовалось обучить при некоторых упрощающих предположениях. Прежде всего на изображении номер должен точно присутствовать, и изображение должно быть подготовлено таким образом, чтобы искомый номер занимал примерно одну треть его. Также в команде вполне резонно допустили, что длина номера дома может быть ограничена пятью цифрами, что приемлемо для большинства систем городской нумерации в мире.
Вот так выглядит raw source для нейронной сети:
Тренировка сети заняла около шести дней и осуществлялась на материалах общедоступной базы Street View House Numbers, которая уже содержит примерно 200 000 таких же номеров. В итоге после обучения точность распознавания системы Google составила 96%, что сравнимо с человеческим показателем аналогичной работы в 98% — эта цифра и будет целью для дальнейших исследований.
[Источник [5]]
Автор: jeston
Источник [6]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/google/52223
Ссылки в тексте:
[1] Ian Goodfellow: http://www-etud.iro.umontreal.ca/~goodfeli/
[2] списком: http://scholar.google.ca/citations?user=iYN86KEAAAAJ&hl=en
[3] Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks: http://arxiv.org/abs/1312.6082
[4] использует: http://www.fastcolabs.com/3022314/how-googles-deep-learning-is-outsmarting-its-human-employees
[5] Источник: http://www.technologyreview.com/view/523326/how-google-cracked-house-number-identification-in-street-view/
[6] Источник: http://habrahabr.ru/post/208330/
Нажмите здесь для печати.