Рубрика «машинное зрение» - 4

Здравствуй, Сообщество!

Статья — классический «велосипед», но для начинающих в электронике и робототехнике может быть интересна.

Как известно, самую мелкую и простую робототехнику собирают сейчас на микроконтроллерах типа Atmega или STM. Здесь в статье я принципиально не беру уровень мини-компьютеров типа Raspberry.

В робототехнике, кроме движений, бывает необходимо делать хотя бы оценку окружающего пространства. Так вот — оптического растрового датчика для простых МК мне не попадалось. Популярный «датчик линии» — это не то. Поиск по Гиктаймсу и аналогичным ресурсам дал ссылки на видеокамеры, но они слишком быстрые для простых МК и одну статью про использование 8 шт. светодиодов в качестве фотодиодов.

image
Поэтому родилась идея сделать примитивный растровый датчик — протоглаз, по аналогии с первыми живыми организмами. Всё, что написано далее, мной делалось только для собственного развлечения, с минимальными затратами и практического применения не предполагалось. Пусть и снова велосипед, но с уважением к Нипкову и отцам механического телевидения.
Подробности под катом…
Читать полностью »

Google помогает Пентагону распознавать изображения с военных дронов - 1

Изданию Gizmodo стало известно от анонимных источников в Google, что среди рядовых сотрудников компании развернулось жаркое обсуждение одного совместного проекта, который Google запускает с Министерством обороны США. Речь идёт о проекте Maven, который Пентагон запустил в апреле 2017 года.

В рамках Project Maven до конца 2017 года планировалось «внедрить продвинутые компьютерные алгоритмы в правительственные платформы для распознавания объектов в большом количестве движущихся или неподвижных изображений».

Всем известно, что Google давно разрабатывает системы машинного зрения, и её нейросети неоднократно побеждали в соревнованиях на точность распознавания объектов. Есть подозрение, что сейчас этими передовыми разработками может воспользоваться американская армия.
Читать полностью »

image

Внезапная лошадь из работы «Spatial Memory for Context Reasoning in Object Detection» (представлена на ICCV 2017)

У нас есть несколько новостей, но скучно писать просто о конкурсе, в котором можно выиграть камеру для дома или о вакансии нашей облачной команды. Поэтому начнем мы с информации, которая будет интересна всем (ок, почти всем – речь пойдет о видеоаналитике).

Недавно завершилась крупнейшая конференция по технологиям компьютерного зрения – International Conference on Computer Vision 2017. На ней команды ученых и представители исследовательских подразделений различных корпораций представили разработки по улучшению фото, генерации изображений по описанию, заглядыванию за угол с помощью анализа света, etc. Мы расскажем о нескольких интересных решениях, которые могут найти применение в области видеонаблюдения.
Читать полностью »

Первые состязательные 3D-примеры для обмана нейросетей - 1
Напечатанная на 3D-принтере черепаха распознаётся нейросетью как черепаха (зеленый контур), винтовка (красный контур) или как другой объект (чёрный контур)

Давно известно, что небольшие целенаправленные изменения в картинке «ломают» систему машинного обучения, так что она классифицирует совершенно другое изображение. Такие «троянские» картинки называются «состязательными примерами» (adversarial examples) и представляют собой одно из известных ограничений глубинного обучения.

Работают они просто: нужно сделать градиентное восхождение в пространстве входных данных для генерации образцов, которые максимизируют предсказание класса для заданного класса. Например, если взять фотографию панды и добавить градиент «гиббон», мы заставим нейросеть классифицировать эту панду как гиббона. Черепаху можно выдать как винтовку (см. иллюстрацию вверху). Кот превращается в холодную закуску гуакамоле (см. под катом) — неважно. Любой объект превращается в любой другой для в глазах машинного интеллекта, потому что у ИИ особая система «зрения», отличная от человеческой.
Читать полностью »

Автоиндустрия считается «первопроходцем» в области применения технологий машинного зрения и самым крупным их потребителем. По данным аналитиков, автомобильная индустрия формирует 23% рынка продуктов компьютерного зрения в Германии. А по данным VDMA, для Европы эта цифра составляет 21%.

Поэтому не удивительно, что алгоритмы машинного зрения постепенно начали использоваться в самих автомобилях, а не только на этапах их производства. В настоящее время они применяются в технологиях автопилотирования и распознавания полос.

В сегодняшнем материале мы начнем говорить о том, что «видят» автомобили и как они это делают, используя базовые алгоритмы и методы в качестве отправной точки цикла рассказов.

«Машинное» зрение: Что и как видят автомобили - 1
Читать полностью »

В предлагаемой статье хочу рассказать о современных микроволновых системах персонального досмотра, а также о результатах выполняемого нами проекта, в котором разрабатывается новая перспективная микроволновая система досмотра, основанная на комбинированном использовании радиолокации и машинного зрения. Ожидается, что разрабатываемая система досмотра будет использоваться на наземном транспорте с большим пассажиропотоком. Достигаться это будет за счет превосходящих аналоги технических характеристик: предельно высокой пропускной способности, возможности досмотра в плотной верхней одежде, значительно меньших массогабаритных характеристик, стоимости и энергопотребления. В статье приводится описание созданной в проекте установки и методики эксперимента для имитационного моделирования описанной микроволновой системы досмотра, а также результат эксперимента с манекеном со скрытыми под одеждой предметами.

Досмотреть каждого, кто входит в метро - 1

Читать полностью »

PornHub внедряет систему машинного зрения для автоматического распознавания лиц, поз и других атрибутов видео - 1
Классификация изображения по признакам и распознавание личности актрисы по лицу на кадре из видеоролика. Иллюстрация: PornHub

Порноиндустрия всегда была двигателем технологического прогресса. Продолжает такой оставаться и сейчас. Например, один из самых посещаемых в мире сайтов PornHub (суточная аудитория 80 млн человек) готовится внедрить систему машинного зрения, пишет TechCrunch. Система автоматически обрабатывает и распределяет по рубликам миллионы видеороликов.

Для удобной навигации по сайту все видеоролики классифицированы по различным признакам, в том числе по имени актрисы, типу происходящего сюжета, тематике видеоролика и так далее. Раньше всю работу по классификации выполняли люди — модераторы. Но количество любительских и профессиональных видеороликов быстро увеличивается. И вот PornHub вместо того, чтобы нанять новых модераторов и платить им за просмотр NSFW, запускает работу систему машинного зрения, которая будет работать круглосуточно и не требует зарплату.
Читать полностью »

Компьютерное зрение. Задайте вопрос эксперту Intel - 1Далеко не все ответы можно найти в Интернет. Особенно если вопрос ваш относится к достаточно узкой или новой области — тут необходима консультация гуру, Владельца Тайного Знания. В традициях блога Intel — проведение блого-семинаров, построенных на вопросах читателей. На эти вопросы отвечают эксперты Intel, принимавшие непосредственное участие в создании технологий и продуктов — кому, как не им знать все детали?
В этом месяце место на трибуне предоставлено создателям библиотеки компьютерного зрения OpenCV (Open Source Computer Vision Library), бывшим сотрудникам компании Itseez, вошедшей в состав Intel — Вадиму Писаревскому и Анатолию Бакшееву. Итак, если у вас назрел вопрос об OpenCV, машинном зрении, распознавании образов и других смежных темах, но вы не знали, кому его задать — приглашаем вас в комментарии и личку. Вопросы принимаются до 24 сентября. Автор лучшего вопроса получит приз от Intel — набор фирменных принадлежностей для уютного отдыха.
Под катом — краткая информация о наших экспертах.
Читать полностью »

Атака на модели машинного обучения сбивает робоавтомобили - 1
Набор экспериментальных изображений с художественными стикерами на разных расстояниях и под разными углами: (а) 5 футов, 0 градусов; (b) 5' 15°; (с) 10' 0°; (d) 10' 30°; (e) 40' 0°. Обман работает на любом расстоянии и под любым углом: вместо знака «Стоп» система машинного обучения видит знак «Ограничение скорости 45 миль»

В то время как одни учёные совершенствуют системы машинного обучения, другие учёные совершенствуют методы обмана этих систем.

Как известно, небольшие целенаправленные изменения в картинке способны «сломать» систему машинного обучения, так что она распознает совершенно другое изображение. Такие «троянские» картинки называются «состязательными примерами» (adversarial examples) и представляют собой одно из известных ограничений глубинного обучения.
Читать полностью »

Сегментация изображений является задачей разбиения цифрового изображения на одну или несколько областей, представляющих интерес. Это фундаментальная проблема в области компьютерного зрения, которая решается многими различными способами, каждый из которых обладает своими преимуществами и недостатками.

В этой статье я кратко рассмотрю понятие метода фиксации уровня и неявно заданных динамических поверхностей (level set method). Также рассмотрю роль этого метода в бинарной сегментации с введением и определением математических конструкций, таких как SDT (Signed Distance Transforms), маркированной карты расстояний.

Бинарная сегментация изображений методом фиксации уровня (Level set method) - 1 Слева — исходное изображение, справа — сегментированное
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js