Ура! Организаторы Google Summer of Code приняли проект OpenCV для участия в Google Summer of Code 2014! С 10 марта начался приём заявок от студентов-участников. Давайте разберёмся, что это такое – GSoC, что за проект OpenCV и при чём здесь Itseez. А для начала – мотивирующее видео с результатами прошлого лета.
Читать полностью »
Рубрика «Компьютерное зрение» - 20
OpenCV участвует в Google Summer of Code 2014
2014-03-15 в 8:11, admin, рубрики: gsoc 2014, opencv, Блог компании «Itseez», Компьютерное зрение, обработка изображений, Программирование, метки: gsoc 2014, opencv, Компьютерное зрение, обработка изображенийProject Tango от Google: смартфон c 3D-сканером пространства
2014-02-20 в 21:06, admin, рубрики: 3d-сканер, Анимация и 3D графика, дополненная реальность, Компьютерное зрение, Смартфоны и коммуникаторы, метки: 3d-сканер, дополненная реальность, Компьютерное зрение 
Небольшая группа инженеров ATAP (Advanced Technology and Projects) в компании Google занимается разработкой перспективных технологий. Сегодня она представила свой новый проект Tango. Это очень красивая технология построения 3D-модели окружающего пространства с помощью смартфона.
Читать полностью »
20-граммовый орнитоптер с системой стереоскопического зрения самостоятельно огибает препятствия
2014-02-01 в 17:41, admin, рубрики: Paparazzi, автопилот, Блог компании Нордавинд, Делфтский университет, искусственный интеллект, Компьютерное зрение, орнитоптер, робототехника, метки: Paparazzi, автопилот, Делфтский университет, Компьютерное зрение, орнитоптерВ лаборатории миниатюрных летательных аппаратов Делфтского технического университета (Нидерланды) создан самый маленький в мире полностью автономный летающий робот, который способен избегать столкновений с препятствиями без какого-либо внешнего вмешательства. Он делает это с помощью системы стереоскопического зрения, которая весит всего четыре грамма. Общий вес аппарата — двадцать граммов. Орнитоптер, названный DelFly Explorer, способен продержаться в воздухе до девяти минут.
Вычисление фрактальной размерности Минковского для плоского изображения
2014-01-08 в 15:23, admin, рубрики: Алгоритмы, Компьютерное зрение, математика, машинное обучение, фрактал, метки: Компьютерное зрение, машинное обучение, фрактал
Доброго времени суток читатель. Сегодняшний пост будет посвящен вычислению приближенного значения фрактальной размерности плоского изображения, которая тесно связано с размерности Минковского. Это интересно как минимум по двум причинам. Во-первых оказывается, что размерность ограниченного множества в метрическом пространстве может быть не только целым числом, но и любым не отрицательным. Во-вторых значение размерности контура изображения (а это ограниченное множество в метрическом пространстве) является хорошим признаком. В рамках сегодняшнего поста не предусмотрено исследование робастности этого признака, но давайте рассмотрим показательный пример. Множество различных характеристик клеток опухолей молочной железы, полученное в результате анализа снимков тонкоигольной пункционной биопсии. Множество данных состоит из 30 признаков (поля таблицы) с пометкой злокачественная или доброкачественная опухоль, и одним из признаков является как раз фрактальная размерность ядер клеток опухоли. Под катом вас ждет объяснение смысла фрактальной размерности множества, по возможности доступным языком, алгоритм вычисления приближенного значения этой размерности, его реализация на c# и ряд примеров с картинками. Возможно вы открыли этот пост только из-за картинки справа, это изображение я позаимствовал из инстаграмма Jennifer Selter, и в конце мы вычислим фрактальную размерность, так сказать филейной части Дженифер. Хочется кстати вас попросить ответить на пару вопросов в конце поста.
Raspberry Pi: Кодируем H.264 видео в реальном времени
2013-12-25 в 9:16, admin, рубрики: computer vision, ffmpeg, itseez, Raspberry Pi, Блог компании «Itseez», Компьютерное зрение, Нижний Новгород, обработка видео, Работа с видео, метки: computer vision, ffmpeg, itseez, Raspberry Pi, Компьютерное зрение, Нижний Новгород, обработка видео В одном из проектов компании Itseez, связанных с компьютерным зрением, мы используем Raspberry Pi для обработки видео потока с веб-камеры, и недавно столкнулись с проблемой записи видео на флеш-карту. Трудность состояла в том, что ресурсы ЦП съедались другими более важными задачами, однако сохранять видео все же было нужно. Причем предпочтений, каким кодеком сжимать и какой формат использовать, не было, лишь бы это никак не сказывалось на fps (количестве кадров в секунду). Перепробовав большое число программных кодеков от RAW до H.264 (использовалась обертка OpenCV над FFmpeg), пришли к выводу, что ничего из этого не выйдет, т.к. при высокой нагрузке fps проседал с 20 до 5 кадров в секунду, при том что картинка – черно-белая с разрешением 320x240. Немного погуглив, выяснили, что в процессоре Raspberry Pi есть аппаратный кодер с поддержкой стандарта H.264 (насколько мне известно, лицензия приобретена только для него). Плюсом ко всему было то, что взаимодействие с кодером реализовано по стандарту OpenMAX, поэтому было решено взяться за написание кода с использованием OpenMAX, и посмотреть, что из этого получится. Получилось, кстати, очень даже недурно!
Читать полностью »
OpenVX: стандарт компьютерного зрения
2013-11-29 в 18:16, admin, рубрики: itseez, opencl, opencv, Блог компании «Itseez», Компьютерное зрение, Нижний Новгород, обработка изображений, Работа с видео, метки: itseez, opencl, opencv, Компьютерное зрение, Нижний НовгородАвтор: Виктор Ерухимов, исполнительный директор Itseez, председатель рабочей группы OpenVX
The Khronos Group 18 ноября 2013 года представила предварительную спецификацию стандарта OpenVX 1.0 для компьютерного зрения. Поскольку Itseez был одним из инициаторов этой деятельности и активно участвовал в создании спецификации, мы решили рассказать про этот стандарт аудитории Хабрахабра.
Компьютерное зрение. Лекция для Малого ШАДа Яндекса
2013-11-21 в 15:03, admin, рубрики: Блог компании Яндекс, дополненная реальность, Компьютерное зрение, лекции, Малый ШАД, обработка изображений, ШАД, метки: Компьютерное зрение, лекции, Малый ШАД, шадОбласть применения компьютерного зрения очень широка: от считывателей штрихкодов в супермаркетах до дополненной реальности. Из этой лекции вы узнаете, где используется и как работает компьютерное зрение, как выглядят изображения в цифрах, какие задачи в этой области решаются относительно легко, какие трудно, и почему.
Лекция рассчитана на старшеклассников – студентов Малого ШАДа, но и взрослые смогут почерпнуть из нее много полезного.
Возможность видеть и распознавать объекты – естественная и привычная возможность для человека. Однако для компьютера пока что – это чрезвычайно сложная задача. Сейчас предпринимаются попытки научить компьютер хотя бы толике того, что человек использует каждый день, даже не замечая того.
Наверное, чаще всего обычный человек встречается с компьютерным зрением на кассе в супермаркете. Конечно, речь идет о считывании штрихкодов. Они были разработаны специально именно таким образом, чтобы максимально упростить компьютеру процесс считывания. Но есть и более сложные задачи: считывание номеров автомобилей, анализ медицинских снимков, дефектоскопия на производстве, распознавание лиц и т.д. Активно развивается применение компьютерного зрения для создания систем дополненной реальности.
Как работает автоматическое выделение документа на изображении в программе ABBYY FineScanner?
2013-11-06 в 10:18, admin, рубрики: анализ изображений, Блог компании ABBYY, искусственный интеллект, Компьютерное зрение, обработка изображений, распознавание образов, метки: анализ изображений, искусственный интеллект, Компьютерное зрение, обработка изображений, распознавание образов 
Фотографии документов, получаемые на мобильных устройствах, обладают различными искажениями по сравнению с изображениями, получаемыми из обычного сканнера. К таким искажениям относятся: цифровой шум, геометрические искажения, вызванные поворотом документа или наличием перспективы, неравномерность в освещенности, расфокусировка, смаз. Далее мы опишем алгоритм, который позволяет автоматически устранить геометрические искажения документа на изображении.
Весь процесс можно разделить на несколько основных этапов:
1) Уменьшение исходного изображения
2) Выбор наиболее информативного канала
3) Предобработка изображения, выделение контуров
4) Детектирование границ и определение углов документа
5) Проверка полученных гипотез
6) Уточнение координат углов документа
Рассмотрим каждый из этапов подробнее.
Читать полностью »
Яндекс, роботы и Сибирь — как мы сделали систему поиска по загруженному изображению
2013-09-09 в 9:05, admin, рубрики: Блог компании Яндекс, Компьютерное зрение, обработка изображений, поиск по изображению, поиск по изображениям, Поисковые машины и технологии, яндекс, метки: Компьютерное зрение, поиск по изображению, поиск по изображениям, яндексСегодня Яндекс запустил поиск картинки по загруженному изображению. В этом посте мы хотим рассказать о технологии, которая стоит за этим сервисом, и о том, как её делали.
Технология внутри Яндекса получила название «Сибирь». От CBIR — Content-Based Image Retrieval.
Конечно, сама по себе задача не нова, и ей посвящено множество исследований. Но сделать прототип, работающий на академической коллекции, и построить промышленную систему, которая работает с миллиардами изображений и большим потоком запросов — очень разные истории.
Для чего всё это нужно?
Есть три сценария, при которых нужен поиск по загруженной картинке и которые нам и нужно было научиться обрабатывать.
Читать полностью »
Google Research: Быстрое, точное выявление 100 000 категорий объектов на одной машине
2013-08-18 в 8:53, admin, рубрики: Google, Алгоритмы, искусственный интеллект, Компьютерное зрение, машинное обучение, обработка изображений, распознавание образовЛюди могут различать примерно 10 000 визуальных категорий высокого уровня, но мы можем различать гораздо больший спектр визуальных импульсов, называемых особыми признаками. Эти признаки могут соответствовать частям объекта, конечностям животного, архитектурным деталям, Читать полностью »

