Рубрика «машинное зрение»

В Office 365 и другие продукты MS добавят режим голосового ввода-вывода для дислексиков - 1

Вчера в блоге Microsoft Education Team была опубликована обширная запись, которая презентует голосового ассистента для пакета продуктов Office 365, а также ряд обновлений других продуктов. В первую очередь речь идет о добавлении функций Dictation for Office 365 Desktop Apps в веб-версии продуктов Office 365 для учащихся, а также выход продукта Office Lens на платформе Android, который ранее был доступен только пользователям iOS. И это не полный список всех «вкусностей» от Microsoft. Все эти активности проходят совместно с организацией Made Dyslexia, в рамках которых технологический гигант планирует создавать учебные материалы и пособия для учеников и студентов, страдающих дислексией.

Важность публикации MS Education Team еще и в том, что она явно показывает один из приоритетных, а главное потенциально конкурентных направлений деятельности компании — развитие систем голосового ввода и распознавания текстов на пользовательских устройствах для всех существующих экосистем, подробнее о которых под катом. Там мы кратко расскажем о новинках от Microsoft без маркетинговых восторгов и обсудим, что вообще происходит и почему когда-то «главная корпорация зла» внезапно оказалась на передовой в области обучения подрастающего поколения.
Читать полностью »

Машинное обучение продолжает проникать в индустрии за пределами интернет-отрасли. На конференции Data&Science «Мир глазами роботов» Александр Белугин из компании «Цифра» рассказал об успехах, сложностях и актуальных задачах на этом пути. Внедрение таких технологий, как компьютерное зрение, требует серийности и продуктового подхода, позволяющего снизить стоимость единичных внедрений. Дело в том, что видов задач на производстве очень много. Из доклада можно узнать о продуктах, мировых трендах и опыте команды Александра в сферах промышленной безопасности и автоматизации процессов.

— Доброе утро. Рад, что все пришли на эту интересную конференцию. Я сначала кратко расскажу про компанию «Цифра», затем — немного о задачах, которые стоят в промышленности, и о типовых способах решения таких задач. Это задачи без роботов, не сборочные, а разные процессные производства. В конце немного рассмотрим наш опыт.
Читать полностью »

Система машинного зрения по трейлеру фильма предсказывает, кто придёт в кинотеатр - 1
Схема гибридной модели рекомендаций Merlin Video для определения аудитории фильмов. Слой логической регрессии сочетает модель коллективной фильтрации с информацией о частоте и сроке посещения кинотеатра, чтобы вычислить вероятность желания посмотреть этот кинофильм. Модель обучена от начала до конца (end-to-end), а потеря функции логической регрессии обратно распространяется по всем обучаемым компонентам

Выход трейлера — самый важный элемент в подготовке кинопремьеры. Зрелищный трейлер повышает рейтинг зрительских ожиданий, знакомит зрителей с сюжетом, представляет главных героев, передаёт общее настроение картины. В то же время по отзывам на трейлер создатели кинокартины получают возможность понять, какие аспекты фильма нравятся или не нравятся зрителям — эта информация обычно становится основой для дальнейшей маркетинговой кампании. Трейлер напрямую коррелирует со сборами в первые дни показа. Затем уже цифра больших сборов в первые дни привлекает внимание массовой аудитории и СМИ, что во многом обеспечивает общий коммерческий успех картины.
Читать полностью »

Машинное зрение – очень актуальная тема в наши дни. Для решения задачи по распознаванию магазинных ценников с использованием нейронных сетей мы выбрали фреймворк TensorFlow.

В статье пойдет речь именно о том, как с его помощью локализовать и идентифицировать несколько объектов на одном магазинном ценнике, а также распознать его содержимое. Похожая задача распознавания ценников IKEA уже решалась на Хабре с применением классических инструментов обработки изображений, доступных в библиотеке OpenCV.

Отдельно хотелось бы отметить, что решение может работать как на платформе SAP HANA в связке с Tensorflow Serving, так и на SAP Cloud Platform.

Задача распознавания цены товара актуальна и для покупателей, которые хотят «шарить» цены друг с другом и выбирать магазин для покупок, и для ритейлеров — они хотят узнавать про цены конкурентов в режиме реального времени.

Хватит лирики – гоу в технику!
Читать полностью »

Введение

Я хочу представить вам результат своих экспериментов с алгоритмами распознавания образов с обучением с первого раза (так называемый One-Shot Learning). В результате экспериментов выработались определённые подходы к структуризации изображения и в итоге они воплотились в несколько взаимосвязанных алгоритмов и тестовое приложение на Android, которым можно проверить качество и работоспособность алгоритмов.

Моя цель была создать алгоритм с понятным принципом работы который может найти абстрактные зависимости в картинке с первого раза (обучиться) и показать приемлемое качество распознавания (поиска подобных абстрактных зависимостей) на последующих циклах распознавания. При этом логика принятия решения должна быть прозрачной, поддающейся анализу, ближе к линейному алгоритму. На условной шкале где на одном конце мозг а на другом станок с ЧПУ он гораздо ближе к станку чем нейросети.

Читать полностью »

Введение

Современный мир трудно представить без видеокамер. Они настолько плотно обосновались в нашей жизни, что стали ее неотъемлемой частью, хотим мы того или нет. Смартфоны, компьютеры, охранные системы и т.д. Список сфер применения можно продолжать долго, но в конечном счете цель преследуется одна — построение изображения исходя из световой информации, поступающей от окружающего мира на фоточувствительный датчик.
Читать полностью »

Привет!

Сегодня я расскажу вам про один из методов решения задачи pose estimation. Задача состоит в детектировании частей тела на фотографиях, а метод называется DeepPose. Этот алгоритм был предложен ребятами из гугла еще в 2014 году. Казалось бы, не так давно, но не для области глубокого обучения. С тех пор появилось много новых и более продвинутых решений, но для полного понимания необходимо знакомство с истоками.

Детектирование частей тела с помощью глубоких нейронных сетей - 1

Читать полностью »

Привет! Меня зовут Владимир, я студент 4го курса КубГТУ.

Некоторое время назад я наткнулся на статью о разработке CV-системы для обнаружения рабочего персонала без касок, и решил поделиться собственным опытом в данной области, полученным в ходе стажировки в одной промышленной компании летом 2017 года. Теория и практика OpenCV и TensorFlow в контексте задачи обнаружения людей и касок — сразу под катом.

Еще одна статья о распознавании рабочих без касок нейросетями - 1

КДПВ, снятая в реальном времени с камеры видеонаблюденияЧитать полностью »

Сотрудники призывают Google прекратить разработку машинного зрения для военных дронов Пентагона - 1

«Мы считаем, что Google не следует становится частью военного бизнеса. Поэтому мы просим компанию отменить проект Maven, а также опубликовать и применять политику, которая чётко заявляет, что ни Google, ни её подрядчики никогда не будут строить военные технологии», — так начинается текст коллективного письма к работодателю, которое сейчас массово подписывают сотрудники Google. Документ подписали уже более 3100 человек, сообщает NY Times. Редакция заполучила текст (pdf).

Как стало известно месяц назад, поисковый гигант заключил контракт с Министерством обороны США. В рамках проекта Maven до конца 2017 года планировалось «внедрить продвинутые компьютерные алгоритмы в правительственные платформы для распознавания объектов на большом количестве движущихся или неподвижных изображений». По сути, это система машинного зрения для военных БПЛА.
Читать полностью »

Здравствуй, Сообщество!

Статья — классический «велосипед», но для начинающих в электронике и робототехнике может быть интересна.

Как известно, самую мелкую и простую робототехнику собирают сейчас на микроконтроллерах типа Atmega или STM. Здесь в статье я принципиально не беру уровень мини-компьютеров типа Raspberry.

В робототехнике, кроме движений, бывает необходимо делать хотя бы оценку окружающего пространства. Так вот — оптического растрового датчика для простых МК мне не попадалось. Популярный «датчик линии» — это не то. Поиск по Гиктаймсу и аналогичным ресурсам дал ссылки на видеокамеры, но они слишком быстрые для простых МК и одну статью про использование 8 шт. светодиодов в качестве фотодиодов.

image
Поэтому родилась идея сделать примитивный растровый датчик — протоглаз, по аналогии с первыми живыми организмами. Всё, что написано далее, мной делалось только для собственного развлечения, с минимальными затратами и практического применения не предполагалось. Пусть и снова велосипед, но с уважением к Нипкову и отцам механического телевидения.
Подробности под катом…
Читать полностью »