Рубрика «машинное зрение»

image

Внезапная лошадь из работы «Spatial Memory for Context Reasoning in Object Detection» (представлена на ICCV 2017)

У нас есть несколько новостей, но скучно писать просто о конкурсе, в котором можно выиграть камеру для дома или о вакансии нашей облачной команды. Поэтому начнем мы с информации, которая будет интересна всем (ок, почти всем – речь пойдет о видеоаналитике).

Недавно завершилась крупнейшая конференция по технологиям компьютерного зрения – International Conference on Computer Vision 2017. На ней команды ученых и представители исследовательских подразделений различных корпораций представили разработки по улучшению фото, генерации изображений по описанию, заглядыванию за угол с помощью анализа света, etc. Мы расскажем о нескольких интересных решениях, которые могут найти применение в области видеонаблюдения.
Читать полностью »

Первые состязательные 3D-примеры для обмана нейросетей - 1
Напечатанная на 3D-принтере черепаха распознаётся нейросетью как черепаха (зеленый контур), винтовка (красный контур) или как другой объект (чёрный контур)

Давно известно, что небольшие целенаправленные изменения в картинке «ломают» систему машинного обучения, так что она классифицирует совершенно другое изображение. Такие «троянские» картинки называются «состязательными примерами» (adversarial examples) и представляют собой одно из известных ограничений глубинного обучения.

Работают они просто: нужно сделать градиентное восхождение в пространстве входных данных для генерации образцов, которые максимизируют предсказание класса для заданного класса. Например, если взять фотографию панды и добавить градиент «гиббон», мы заставим нейросеть классифицировать эту панду как гиббона. Черепаху можно выдать как винтовку (см. иллюстрацию вверху). Кот превращается в холодную закуску гуакамоле (см. под катом) — неважно. Любой объект превращается в любой другой для в глазах машинного интеллекта, потому что у ИИ особая система «зрения», отличная от человеческой.
Читать полностью »

Автоиндустрия считается «первопроходцем» в области применения технологий машинного зрения и самым крупным их потребителем. По данным аналитиков, автомобильная индустрия формирует 23% рынка продуктов компьютерного зрения в Германии. А по данным VDMA, для Европы эта цифра составляет 21%.

Поэтому не удивительно, что алгоритмы машинного зрения постепенно начали использоваться в самих автомобилях, а не только на этапах их производства. В настоящее время они применяются в технологиях автопилотирования и распознавания полос.

В сегодняшнем материале мы начнем говорить о том, что «видят» автомобили и как они это делают, используя базовые алгоритмы и методы в качестве отправной точки цикла рассказов.

«Машинное» зрение: Что и как видят автомобили - 1
Читать полностью »

В предлагаемой статье хочу рассказать о современных микроволновых системах персонального досмотра, а также о результатах выполняемого нами проекта, в котором разрабатывается новая перспективная микроволновая система досмотра, основанная на комбинированном использовании радиолокации и машинного зрения. Ожидается, что разрабатываемая система досмотра будет использоваться на наземном транспорте с большим пассажиропотоком. Достигаться это будет за счет превосходящих аналоги технических характеристик: предельно высокой пропускной способности, возможности досмотра в плотной верхней одежде, значительно меньших массогабаритных характеристик, стоимости и энергопотребления. В статье приводится описание созданной в проекте установки и методики эксперимента для имитационного моделирования описанной микроволновой системы досмотра, а также результат эксперимента с манекеном со скрытыми под одеждой предметами.

Досмотреть каждого, кто входит в метро - 1

Читать полностью »

PornHub внедряет систему машинного зрения для автоматического распознавания лиц, поз и других атрибутов видео - 1
Классификация изображения по признакам и распознавание личности актрисы по лицу на кадре из видеоролика. Иллюстрация: PornHub

Порноиндустрия всегда была двигателем технологического прогресса. Продолжает такой оставаться и сейчас. Например, один из самых посещаемых в мире сайтов PornHub (суточная аудитория 80 млн человек) готовится внедрить систему машинного зрения, пишет TechCrunch. Система автоматически обрабатывает и распределяет по рубликам миллионы видеороликов.

Для удобной навигации по сайту все видеоролики классифицированы по различным признакам, в том числе по имени актрисы, типу происходящего сюжета, тематике видеоролика и так далее. Раньше всю работу по классификации выполняли люди — модераторы. Но количество любительских и профессиональных видеороликов быстро увеличивается. И вот PornHub вместо того, чтобы нанять новых модераторов и платить им за просмотр NSFW, запускает работу систему машинного зрения, которая будет работать круглосуточно и не требует зарплату.
Читать полностью »

Компьютерное зрение. Задайте вопрос эксперту Intel - 1Далеко не все ответы можно найти в Интернет. Особенно если вопрос ваш относится к достаточно узкой или новой области — тут необходима консультация гуру, Владельца Тайного Знания. В традициях блога Intel — проведение блого-семинаров, построенных на вопросах читателей. На эти вопросы отвечают эксперты Intel, принимавшие непосредственное участие в создании технологий и продуктов — кому, как не им знать все детали?
В этом месяце место на трибуне предоставлено создателям библиотеки компьютерного зрения OpenCV (Open Source Computer Vision Library), бывшим сотрудникам компании Itseez, вошедшей в состав Intel — Вадиму Писаревскому и Анатолию Бакшееву. Итак, если у вас назрел вопрос об OpenCV, машинном зрении, распознавании образов и других смежных темах, но вы не знали, кому его задать — приглашаем вас в комментарии и личку. Вопросы принимаются до 24 сентября. Автор лучшего вопроса получит приз от Intel — набор фирменных принадлежностей для уютного отдыха.
Под катом — краткая информация о наших экспертах.
Читать полностью »

Атака на модели машинного обучения сбивает робоавтомобили - 1
Набор экспериментальных изображений с художественными стикерами на разных расстояниях и под разными углами: (а) 5 футов, 0 градусов; (b) 5' 15°; (с) 10' 0°; (d) 10' 30°; (e) 40' 0°. Обман работает на любом расстоянии и под любым углом: вместо знака «Стоп» система машинного обучения видит знак «Ограничение скорости 45 миль»

В то время как одни учёные совершенствуют системы машинного обучения, другие учёные совершенствуют методы обмана этих систем.

Как известно, небольшие целенаправленные изменения в картинке способны «сломать» систему машинного обучения, так что она распознает совершенно другое изображение. Такие «троянские» картинки называются «состязательными примерами» (adversarial examples) и представляют собой одно из известных ограничений глубинного обучения.
Читать полностью »

Сегментация изображений является задачей разбиения цифрового изображения на одну или несколько областей, представляющих интерес. Это фундаментальная проблема в области компьютерного зрения, которая решается многими различными способами, каждый из которых обладает своими преимуществами и недостатками.

В этой статье я кратко рассмотрю понятие метода фиксации уровня и неявно заданных динамических поверхностей (level set method). Также рассмотрю роль этого метода в бинарной сегментации с введением и определением математических конструкций, таких как SDT (Signed Distance Transforms), маркированной карты расстояний.

Бинарная сегментация изображений методом фиксации уровня (Level set method) - 1 Слева — исходное изображение, справа — сегментированное
Читать полностью »

Фильтр анизотропной диффузии Перона и Малика — это сглаживающий цифровые изображения фильтр, ключевая особенность которого состоит в том, что при сглаживании он сохраняет и «усиливает» границы областей на изображении.

В статье я кратко рассмотрю зачем нужен этот фильтр, теорию по нему и как его реализовать алгоритмически, приведу код на языке Fortran и примеры сглаженных изображений.

Сглаживание изображений фильтром анизотропной диффузии Перона и Малика - 1
Крайнее левое изображение — оригинальное, справа от оригинального — фильтрованные с различными параметрами.
Читать полностью »

Создана бионическая рука с нейросетью, которая мгновенно распознаёт и хватает предметы - 1

Бионические протезы прошлого поколения обычно контролируются с помощью миоэлектрических сигналов, которые возникают в результате мышечных сокращений руки человека. Управлять таким протезом непросто: это требует определённой концентрации, да и эффективность успешных действий оставляет желать лучшего. Непросто с первого раза сделать то, что хочется. По точности действий таким протезам далеко до «интуитивных» действий живой настоящей руки.

В последние годы исследователи концентрировались преимущественно на точности распознавании миоэлектрических сигналов, а точность распознавания движений отдельных пальцев достигла 90%. Но в силу ряда технических причин массовое использование таких «умных» протезов сильно ограничено. Новая разработка инженеров из Университета Ньюкасла (Великобритания) предлагает принципиально иной подход. Оснащённая видеокамерой рука распознаёт предмет перед ней — и сама определяет, каким образом эффективнее всего его схватить. Она действует автоматически и практически мгновенно, без дополнительных усилий со стороны человека. Фактически, у бионической руки появляется собственное зрение.
Читать полностью »