Рубрика «распознавание изображений» - 5

Совсем не нейронные сети - 1

Недавно ZlodeiBaal писал о достижениях в сверточных нейронных сетях (CNN) (и, кстати, тут же успешно настроил и обучил сеть для поиска области автомобильного номера).
А я хочу рассказать про принципиально иную и, наверное, более сложную модель, которую сейчас развивает Алексей Редозубов (
AlexeyR), и про то, как мы, конечно проигнорировав некоторые важные элементы, и ее применили для распознавания автомобильных регистрационных знаков!

В статье несколько упрощенно напомню о некоторых моментах этой концепции и покажу, как оно сработало в нашей задаче.
Читать полностью »

image

Похоже на то, что анонимности в Сети действительно больше нет. Об этом говорят уже давно, и это утверждение становится все более правдивым. Не так давно на Geektimes публиковалась информация о проекте фотографа из Санкт-Петербурге, который фотографировал людей в метро и сравнивал людей с их профилем во «Вконтакте». Фотосессия получила название Your Face Is Big Data.

Название оказалось пророческим. Узнав о проекте, поборники морали начали кампанию по борьбе с актрисами и актерами фильмов и роликов категории «ХХХ». Инициаторами «проекта» являются пользователи сообщества «Двач.ру», которые берут фото актера/актрисы или просто человека, который ведет себя «неподобающе», по мнению пользователей. Фото загружают в FindFace, и находят реальных людей в социальных сетях. Об их «деятельности» затем рассказывается друзьям и родственникам, пишет Lenta. На данный момент число тех, кого идентифицировали, превысило сотню.
Читать полностью »

На этот раз корпорация обезопасила своего бота от проделок троллей

Новый бот Microsoft умеет распознавать картинки, но игнорирует нацистов и нацистскую символику - 1
С некоторыми другими изображениями бот тоже не справляется. Правда, описать это фото действительно сложно

Пару недель назад корпорация Microsoft представила миру бота Tay, который пытался общаться с пользователями Twitter. Но те быстро научили бота плохим вещам, тот стал расистом всего за один день. Поэтому Microsoft отключила бота. Через несколько дней бота снова ввели в строй, но тот признался в курении наркотических веществ рядом с полицией, и его снова отправили «спать».

Сейчас разработчики компании создали нового бота, CaptionBot. Его специализация — идентификация изображений. Со многими картинками CaptionBot справляется отлично, он узнает знаменитостей, распознает людей и объекты на фото. Но на этот раз компания ввела «систему безопасности» — нацистов и соответствующую символику бот не распознает. Сообщает просто, что «описать картинку не могу» и все. Кроме того, некоторые картинки бот описывает не слишком верно. На фото с Рипли и Чужим дается описание следующего вида: «Я не слишком уверен, но я думаю, что это мужчина чистит зубы».
Читать полностью »

Паспортный сканер своими руками - 1

Привет! В предыдущих статьях мы уже рассказывали вам про то, как нам удалось превратить ввод паспортных данных на мобильных устройствах из рутины в простую и быструю процедуру. Следующим закономерным шагом мы превратили наш Smart PassportReader SDK в серверную компоненту, облегчив тем самым крупным финансовым организациям работу с документами в бэк-офисах. Наконец, проявив изобретательскую смекалку и инженерный подход, нам удалось разработать программно-аппаратный комплекс (забегая вперед, представим его название — Smart PassportBox), позволяющий оптимизировать работу фронт-офисов и СКУД-решения. Поэтому, если вам интересно сколько директоров, программистов, паяльников, лобзиков и отверток требуется для создания полноценного ПАК, добро пожаловать под кат.
Читать полностью »

Недавно я ехал на автобусе из Торонто в Нью-Йорк, снаружи автобуса было темно, внутри меня было немного хорошего алкоголя, спать совершенно не хотелось, и я решил поразбираться с Deep Learning. Скачал Caffe, скормил ему пару картинкок, на которых правильно распознались мяч и банан. Захотелось распознать что-то более интересное, и я вспомнил, что где-то на жёстком диске у меня есть дамп хабрахабра, который я делал, когда проходил курс информационного поиска в ШАДе Яндекса.

На написание скрипта, который распознаёт, что изображено на аватарке хабропользователя и грепает всех кошачьих, ушло несколько минут, на обновление дампа до актуального и распознавание картинок ушло несколько дней, и теперь я могу утверждать, что на хабрахабре по меньшей мере 748 котов.

Под хаброкатом можно прочитать чуть больше подробностей и посмотреть на всех котов.

Сколько котов на хабре? - 1

Читать полностью »

Drawn Story: распознавание изображений как основа игровой механики - 1

О чем игра?

Кратко игру Drawn Story можно описать как квест, в котором вместо того, чтобы искать необходимые для продвижения по сюжету предметы, нужно эти предметы рисовать самому.

Это игра о мире, нарисованном на листе бумаги. Вы управляете двумя персонажами: одним из человечков, живущих в этом мире, и художником, который смотрит на лист бумаги откуда-то сверху. В роли художника Вы рисуете предметы, которые затем могут подобрать и использовать жители этого мира.

Например, можно нарисовать пилу и спилить с её помощью дерево для строительства плота. Или нарисовать сразу лодку, и тогда необходимость в плоте отпадёт. Можно нарисовать ключ, чтобы открыть запертую дверь, или нарисовать топор, чтобы сломать дверь. Прелесть в том, что в роли художника вы сами выбираете, каким способом взаимодействовать с миром. Вот как это выглядит:

Читать полностью »

Сервис от Корнеллского университета определяет вид птиц по фотографии - 1

Помните сервис от Microsoft, который пытается определить возраст человека по загруженной фотографии? Работает этот сервис корректно далеко не всегда, да и его практическая ценность (в текущем состоянии) равна нулю. Тем не менее, есть и более полезные ресурсы, которые способны приносить пользу посетителям.

Одним из таких сайтов является сервис, созданный командой Корнеллского университета и Visipedia. Merlin Bird Photo ID определяет видовую принадлежность птицы по загруженной фотографии, на которой хорошо видно птицу. В настоящее время сервис может определять виды, распространенные в США и Канаде.
Читать полностью »

Использование классических нейронных сетей для распознавания изображений затруднено, как правило, большой размерностью вектора входных значений нейронной сети, большим количеством нейронов в промежуточных слоях и, как следствие, большими затратами вычислительных ресурсов на обучение и вычисление сети. Сверточным нейронным сетям в меньшей степени присущи описанные выше недостатки.

Свёрточная нейронная сеть (англ. convolutional neural network, CNN) — специальная архитектура искусственных нейронных сетей, предложенная Яном Лекуном и нацеленная на эффективное распознавание изображений, входит в состав технологий глубокого обучения (англ. deep leaning). Эта технология построена по аналогии с принципами работы зрительной коры головного мозга, в которой были открыты так называемые простые клетки, реагирующие на прямые линии под разными углами, и сложные клетки, реакция которых связана с активацией определённого набора простых клеток. Таким образом, идея сверточных нейронных сетей заключается в чередовании сверточных слоев (англ. convolution layers) и субдискретизирующих слоев (англ. subsampling layers, слоёв подвыборки).[6]

image
Рис 1. Архитектура сверточной нейронной сети

Ключевым моментом в понимании сверточных нейронных сетей является понятие так называемых «разделяемых» весов, т.е. часть нейронов некоторого рассматриваемого слоя нейронной сети может использовать одни и те же весовые коэффициенты. Нейроны, использующие одни и те же веса, объединяются в карты признаков (feature maps), а каждый нейрон карты признаков связан с частью нейронов предыдущего слоя. При вычислении сети получается, что каждый нейрон выполняет свертку (операцию конволюции) некоторой области предыдущего слоя (определяемой множеством нейронов, связанных с данным нейроном). Слои нейронной сети, построенные описанным образом, называются сверточными слоями. Помимо, сверточных слоев в сверточной нейронной сети могут быть слои субдискретизации (выполняющие функции уменьшения размерности пространства карт признаков) и полносвязные слои (выходной слой, как правило, всегда полносвязный). Все три вида слоев могут чередоваться в произвольном порядке, что позволяет составлять карты признаков из карт признаков, а это на практике означает способность распознавания сложных иерархий признаков [3].

Что же именно влияет на качество распознавания образов при обучении сверточных нейронных сетей? Озадачившись данным вопросом, наткнулись на статью Мэттью Зайлера (Matthew Zeiler).Читать полностью »

Полиция Нью-Йорка сможет искать автомобили, находящиеся в угоне или принадлежащие нарушителям закона, с помощью сети камер и базы данных от Vigilant Solutions. Решение Vigilant способно в режиме реального времени считывать автомобильные номера, а в базе данных содержатся 2,2 миллиарда записей о передвижении американцев.

Считыватель автомобильных номеров, установленной на полицейской машине. Фото New York Daily.
image
Читать полностью »

Аннотация
Люди — это самые важные объекты слежения в системах видеонаблюдения. Тем не менее, слежение за человеком само по себе не дает достаточной информации об его мотивах, намерениях, желаниях и т.п. В этой работе мы представляем новую и надежную систему для автоматической оценки возраста с помощью технологий компьютерного зрения. Она использует глобальные особенности лица, полученные на основе комбинирования вейвлетов Габора и сохранение ортогональности локальных проекций Orthogonal Locality Preserving Projections, OLPP). Кроме того, система способна оценивать возраст по изображениям в реальном времени. Это означает, что предлагаемая система имеет больший потенциал по сравнению с другими полуавтоматическими системами. Результаты, полученные в процессе применения предлагаемого подхода, могут позволить получить более ясное понимание алгоритмов в области оценки возраста, необходимых для разработки приложений, актуальных для реального применения.
Ключевые слова: вейвлеты Габора, изображение лица, оценка возраста, метод опорных векторов (Support Vector Machine, SVM).
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js