Среди всего многообразия задач Computer Vision есть одна, которая стоит особняком. К ней обычно стараются лишний раз не притрагиваться. И, если не дай бог работает, — не ворошить.
У неё нет общего решения. Практически для каждого применения существующие алгоритмы надо тюнинговать, переобучать, или судорожно копаться в куче матриц и дебрях логики.
Статья о том как делать трекинг. Где он используется, какие есть разновидности. Как сделать стабильное решение.
Читать полностью »
Рубрика «computer vision» - 3
Самая сложная задача в Computer Vision
2020-06-15 в 8:03, admin, рубрики: computer vision, CoW, DeepSORT, fish, machine learning, MOT, python, ReID, Reindentification, sort, ssd, Tracking, yolo, YOLOv4, YOLOv5, Блог компании Recognitor, искусственный интеллект, машинное обучение, обработка изображенийКомпьютерное зрение на WebRTC-сервере с аппаратным ускорением от Intel OWT
2020-05-20 в 10:00, admin, рубрики: computer vision, open cv, WebRTC, webrtc server, Блог компании Voximplant, искусственный интеллект, Компьютерное зрение, машинное обучение, Программирование, распознавание лиц
WebRTC упростил (в большинстве своем) получение и отправку видеопотоков в реальном времени. А значит, можно немного поразвлекаться с ними при помощи машинного обучения. В прошлом месяце я показал, как запустить компьютерное зрение (Computer Vision – CV) локально в браузере. Как я уже упоминал, локально – это, конечно, хорошо, но иногда требуется более высокая производительность, и для этого нам понадобится удаленный сервер. В данном посте я расскажу о том, как запускать серверные модели OpenCV с аппаратным ускорением на чипсетах Intel с помощью Open WebRTC Toolkit (OWT) с открытым исходным кодом.
Читать полностью »
Видео с облачным детектором объектов на Raspberry Pi
2020-02-10 в 3:37, admin, рубрики: computer vision, docker, object detection, opencv, python, Raspberry Pi, искусственный интеллект, облачные сервисы, обработка изображений, Разработка на Raspberry PiПролог
По сети сейчас гуляет видео — как автопилот Теслы видит дорогу.
У меня давно чесались руки транслировать видео, обогащенное детектором, да и в реальном времени.
Проблема в том, что транслировать видео я хочу с Raspberry, а производительность нейросетевого детектора на ней оставляет желать лучшего.
Читать полностью »
Как подружить PyTorch и C++. Используем TorchScript
2019-12-17 в 11:02, admin, рубрики: c++, computer vision, data science, deep learning, machine learning, python, pytorch, TorchScript, Блог компании Open Data Science, машинное обучение, обработка изображений, ПрограммированиеОколо года назад разработчики PyTorch представили сообществу TorchScript — инструмент, который позволяет с помощью пары строк кода и нескольких щелчков мыши сделать из пайплайна на питоне отчуждаемое решение, которое можно встроить в систему на C++. Ниже я делюсь опытом его использования и постараюсь описать встречающиеся на этом пути подводные камни. Особенное внимание уделю реализации проекта на Windows, поскольку, хотя исследования в ML обычно делаются на Ubuntu, конечное решение часто (внезапно!) требуется под "окошками".
Примеры кода для экспорта модели и проекта на C++, использующего модель, можно найти в репозиториии на GitHub.
Машинное зрение и медицина
2019-11-06 в 22:03, admin, рубрики: computer vision, Биотехнологии, Блог компании Recognitor, искусственный интеллект, КТ, мамограммы, машинное зрение, машинное обучение, медицина, МРТ, обработка изображений, флюорограммыПрошло лет пять с того момента как нейронные сетки начали втыкать в каждую дырку. Есть масса примеров где всё работает почти идеально — биометрия, распознавание технической информации (номера, коды), классификация и поиск в массиве данных.
Есть области где всё хуже, но сейчас идёт большой прогресс — речь/распознавание текстов, переводы.
Но есть области загадочные. Вроде как и прогресс есть. И статьи регулярно выходят. Только вот до практического применения как-то особо и не доходит.
Давайте разберём то, как нейронные сеточки и машинное зрение работает в медицине.
Читать полностью »
Компьютерное зрение как альтернатива офисным пропускам
2019-10-31 в 8:45, admin, рубрики: computer vision, DIY, diy или сделай сам, Блог компании Mail.Ru Group, Лайфхаки для гиков, Разработка на Raspberry Pi
Сегодня я расскажу, как мы делали в офисе пропускную систему на основе сервиса распознавания лиц Vision. Сначала небольшая предыстория. Как в любом почтовом сервисе, мы создали систему антиспама. Такие системы сейчас делаются на основе машинного обучения, у нас им занимается мощная команда. А где машинное обучение, там и компьютерное зрение. Поэтому сервис Vision возник вполне органично и естественно.
Параллельно с этим несколько лет назад мы запустили Облако — надёжное хранилище файлов с геораспределением по дата-центрам, которым могут пользоваться как частные лица, так и компании. Со временем у нас появилось «Облако для бизнеса», которое не только хранит файлы, но и позволяет заказывать виртуальные машины. Постепенно это превратилось в MCS — Mail.ru Cloud Solutions, куда в качестве одного из сервисов очень органично вписался Vision.
Читать полностью »
Стажировка в ABBYY: компания, с которой можно на «ты»
2019-10-16 в 12:07, admin, рубрики: ABBYY, computer vision, deep learning, neural architecture search, Блог компании ABBYY, искусственный интеллект, машинное обучение, МФТИ, нейронные сети, стажировкаВсем привет! В этом посте я хочу рассказать вам о моей летней стажировке в ABBYY. Постараюсь осветить все моменты, которые обычно интересны студентам и начинающим разработчикам при выборе компании. Надеюсь, что кому-то данный пост поможет определиться с планами на следующее лето. В общем, поехали!
Для начала расскажу немного о себе. Меня зовут Женя, на момент подачи заявки на стажировку я заканчивал 3 курс МФТИ, Факультет инноваций и высоких технологий (сейчас может быть известен как Физтех-школа прикладной математики и информатики). Мне хотелось выбрать компанию, в которой можно получить опыт работы в области компьютерного зрения: картинки, нейронные сети и вот это вот все. Собственно, с выбором я не прогадал – ABBYY действительно для этого отлично подходит, но об этом позже.
Читать полностью »
Создаем датасет для распознавания счетчиков на Яндекс.Толоке
2019-10-11 в 11:00, admin, рубрики: big data, computer vision, data collection, data mining, Блог компании Open Data Science, краудсорсинг, машинное обучение, обработка изображений, разметка данных, толока
Как-то два года назад, случайно включив телевизор, я увидел интересный сюжет в программе "Вести". В нём рассказывали о том, что департамент информационных технологий Москвы создает нейросеть, которая будет считывать показания счетчиков воды по фотографиям. В сюжете телеведущий попросил горожан помочь проекту и прислать снимки своих счетчиков на портал mos.ru, чтобы на них обучить нейронную сеть.
Если Вы — департамент Москвы, то выпустить ролик на федеральном канале и попросить людей прислать изображения счетчиков — не очень большая проблема. Но что делать, если Вы — маленький стартап, и сделать рекламу на телеканале не можете? Как получить 50000 изображений счетчиков в таком случае?Читать полностью »
Робот-танк на Raspberry Pi с Intel Neural Computer Stick 2
2019-09-24 в 1:51, admin, рубрики: artificial intelligence, computer vision, Movidus Neural Compute Stick, opencv, OpenVINO Toolkit, python, Raspberry Pi, robotics, искусственный интеллект, машинное обучение, обработка изображений, Разработка на Raspberry PiВот и наступил новый этап в развии Raspberry-танка.
В предыдущей серии оказалось, что семантическая сегментация из коробки не по зубам Raspberry.
Мозговой штурм и комментарии позволили определить следующие направления развития:
- обучить собственную E-net сеть под нужный размер картинок
- передать запуск нейросети с самой Raspberry на специальную железку, из которых наиболее часто упоминался Intel Movidius (он же Neural Compute Stick aka NCS).
Приделать к роботу новую железку — это же самое интересное в роботехнике, поэтому кропотливая работа по обучению нейросети оказалась отложенной до лучших времен.
Несколько дней — и интеловская чудо-железка у меня в руках.
Она довольно большая, и в нижний USB разъем малинки ее не воткнешь. Учитывая, что правые USB порты были заслонены штативом камеры, а верхний левый занят GPS модулем, вариантов оставалось не то, чтобы много.
В итоге, GPS был посажен на кабель, переведен вниз, и кабель обернут вокруг штатива, а на его место зашел NCS.
На этом hardware часть была завершена.
How we made landmark recognition in Cloud Mail.ru, and why
2019-09-18 в 14:22, admin, рубрики: computer vision, deep learning, landmark recognition, machine learning, Блог компании Mail.Ru Group, искусственный интеллект, машинное обучение, обработка изображений
With the advent of mobile phones with high-quality cameras, we started making more and more pictures and videos of bright and memorable moments in our lives. Many of us have photo archives that extend back over decades and comprise thousands of pictures which makes them increasingly difficult to navigate through. Just remember how long it took to find a picture of interest just a few years ago.
One of Mail.ru Cloud’s objectives is to provide the handiest means for accessing and searching your own photo and video archives. For this purpose, we at Mail.ru Computer Vision Team have created and implemented systems for smart image processing: search by object, by scene, by face, etc. Another spectacular technology is landmark recognition. Today, I am going to tell you how we made this a reality using Deep Learning.
Читать полностью »