Рубрика «распознавание изображений»

Как мы научили нейросеть определять документы - 1

Этим летом мы научили нейронную сеть определять, присутствует ли на изображении документ, и если да — то какой именно.

Для чего это понадобилось

Чтобы разгрузить сотрудников и обезопасить людей от мошенников. Мы применяем новую нейросеть в двух сферах: когда пользователь восстанавливает доступ к странице и для скрытия личных документов из общего поиска.

Читать полностью »

Машинное обучение: схватка с комнатным слоном - 1

Один — ноль в пользу человеческого мозга. В новом исследовании ученые-информатики выяснили, что системам искусственного интеллекта не удается пройти тест на зрительное распознавание объектов, с которым легко справится любой ребенок.

«Это качественное и важное исследование напоминает нам, что „глубокое обучение" на самом не может похвастаться той глубиной, которая ему приписывается», — говорит Гэри Маркус, нейробиолог из Нью-Йоркского университета, не связанный с этой работой.

Результаты исследования касаются сферы компьютерного зрения, когда системы искусственного интеллекта пытаются обнаружить и категоризировать объекты. Например, их могут попросить найти всех пешеходов в уличной сцене или просто отличить птицу от велосипеда — задание, которое уже успело прославиться своей сложностью.

Ставки высоки: компьютеры постепенно начинают выполнять за людей важные операции, такие как автоматическое видеонаблюдение и автономное вождение. И для успешной работы необходимо, чтобы способности ИИ к зрительной обработке как минимум не уступали человеческим.

Задача не из легких.Читать полностью »

QIWI-терминалы. Как взять максимум из простых технологий - 1 В начале 2017 года мы, команда разработки ПО для QIWI Терминалов, собирали пожелания подразделений компании — узнавали, какие глобальные задачи коллеги хотели бы решить с нашей помощью, чтобы жизнь стала проще.

Больше всего порадовал запрос клиентского сервиса, работающего со звонками и претензионкой от плательщиков:

“Есть проблема: клиент совершает платеж на терминале, но до процессинга он так и не доходит — или терминал мог зависнуть, или интернет, работающий через gsm-модем, отвалился. И получается, что чек у клиента есть, а платежа в системе нет. Хорошо было бы в таких случаях научиться доставлять платежи в QIWI.

Есть также группа тревожных клиентов, которые сразу после совершения платежа набирают номер колл-центра с целью удостовериться, все ли с ним хорошо. Было бы здорово срезать косты на такие звонки.”

Так у нас появилась комплексная задача: научиться создавать платеж в случае сбоя связи с терминалом и снизить количество входящих звонков от клиентов, придумав инструмент самообслуживания для проверки статуса платежа. Кейс понятен. Стали искать решение, удобное для клиента и без рисков для безопасности.
Читать полностью »

image

Автоматическое распознавание спутниковых или аэро-снимков — это наиболее перспективный способ получения информации о расположении различных объектов на местности. Отказ от ручной сегментации снимков особенно актуален, когда речь заходит о обработке больших участков земной поверхности в сжатые сроки.

Недавно у меня появилась возможность применить теоретические навыки и попробовать себя в области машинного обучения на реальном проекте сегментации изображений. Цель проекта — распознавание лесных насаждений, а именно крон деревьев на спутниковых снимках высокого разрешения. Под катом я поделюсь полученным опытом и результатами.
Читать полностью »

image

Если вы достаточно долго увлекаетесь нейросетевыми технологиями, то наверняка встречались с мнением, кратко заключенным в риторическом вопросе: «Как ты объяснишь человеку, когда нейросеть считает, что у него рак?». И если в лучшем случае такие мысли заставят тебя сомневаться в использовании нейросетей в достаточно ответственных сферах, то в худшем случае ты можешь и потерять весь свой интерес.

Читать полностью »

Новая система распознавания лиц, установленная полицией Лондона, не может никого узнать - 1

В некоторых крупнейших городах мира (Нью-Йорк, Париж, Лондон, Пекин) полиция тестирует системы распознавания лиц. Делается это, в частности, для того, чтобы иметь возможность «выхватывать» из толпы лица преступников и подозреваемых в совершении различных преступлений, проверять человека и если подозрения подтвердятся, арестовывать. Обычно анализ идет в режиме реального времени и, если есть совпадение по базе изображений, полицейские получают уведомление об обнаружении человека, которого необходимо задержать.

В Китае благодаря такой системе в апреле этого года поймали подозреваемого в совершении экономических преступлений на концерте с 50 тысячами зрителей. Он отправился туда за 90 км от города, в котором скрывался. После ареста китаец сознался, что если бы знал что-то о текущих возможностях полиции, никогда не поехал бы на концерт. Он рассчитывал на то, что сможет скрыться среди огромного количества людей. Но не получилось — система его все же обнаружила, правоохранители вовремя среагировали и задержали этого человека. Что касается систем обнаружения лиц, которые используются в других странах, то с ними, похоже, проблемы.
Читать полностью »

В статье мы расскажем о применении свёрточных нейронных сетей для решения практической бизнес-задачи восстановления реалограммы по фотографии полок с товарами. С помощью Tensorflow Object Detection API мы натренируем модель поиска/локализации. Улучшим качество поиска мелких товаров на фотографиях с большим разрешением с помощью плавающего окна и алгоритма подавления немаксимумов. На Keras реализуем классификатор товаров по брендам. Параллельно будем сравнивать подходы и результаты с решениями 4 летней давности. Все данные, использованные в статье, доступны для скачивания, а полностью рабочий код есть на GitHub и оформлен в виде tutorial.
 
Распознавание товаров на полках с помощью нейронных сетей на технологиях Keras и Tensorflow Object Detection API - 1
Читать полностью »

Машинное зрение – очень актуальная тема в наши дни. Для решения задачи по распознаванию магазинных ценников с использованием нейронных сетей мы выбрали фреймворк TensorFlow.

В статье пойдет речь именно о том, как с его помощью локализовать и идентифицировать несколько объектов на одном магазинном ценнике, а также распознать его содержимое. Похожая задача распознавания ценников IKEA уже решалась на Хабре с применением классических инструментов обработки изображений, доступных в библиотеке OpenCV.

Отдельно хотелось бы отметить, что решение может работать как на платформе SAP HANA в связке с Tensorflow Serving, так и на SAP Cloud Platform.

Задача распознавания цены товара актуальна и для покупателей, которые хотят «шарить» цены друг с другом и выбирать магазин для покупок, и для ритейлеров — они хотят узнавать про цены конкурентов в режиме реального времени.

Хватит лирики – гоу в технику!
Читать полностью »

Система распознавания лиц от полиции Уэльса работает с эффективностью в 8% - 1

Правоохранители разных стран используют современные технологии, которые поставлены на службу закону. В числе прочих методов работы современных полицейских — анализ ДНК преступников, подозреваемых и жертв, цифровые базы данных лиц и отпечатков пальцев десятков миллионов человек, анализ шумового фона городов и прочие хитрости.

Конечно же, в число инструментов полиции входит видеонаблюдение — в больших и малых городах разных стран камер становится все больше. В некоторых локациях их просто огромное количество — как внутри зданий, так и снаружи, на улицах. Но камеры — еще не все, помогают ловить преступников не они, а анализ передаваемых ими данных. Полиция Уэльса во время Лиги Чемпионов 2017 года решила использовать цифровую систему анализа лиц преступников, которая работала почти что в режиме реального времени.
Читать полностью »

Если вы пользуетесь интернетом, вы наверняка взаимодействовали с нейросетями. Это разновидность алгоритма машинного обучения, используемая во многих областях, от перевода языков до финансового моделирования. Одна из специальностей этого подхода – распознавание изображений. Несколько компаний – включая Google, Microsoft, IBM и Facebook – разработали свои алгоритмы разметки фотографий. Но пока эти алгоритмы могут совершать очень странные ошибки.

Мечтают ли нейросети об электроовцах? - 1

API для компьютерного зрения Microsoft Azure добавило к этому изображению следующую подпись: «стадо овец пасётся на покрытом буйной растительностью склоне холма», и тэги: «пастись, овцы, гора, скот, лошадь». Но на фото нет никаких овец. Вообще. Я каждое пятнышко изучила.
Читать полностью »