Рубрика «computer vision»

Как мы оцифровали футбольные матчи с помощью CV

2024-02-27 в 7:09, admin, рубрики: computer vision, sportech, Алгоритмы, анализ данных, обработка видео, спорт, стриминг, яндекс

Привет! Меня зовут Владимир Цуканов, я СТО спортивного направления в Яндекс Плюсе. Мы занимаемся съёмкой, обработкой и стримингом спортивных событий. В этом посте я расскажу о работе с технической съёмкой и анализом футбольных матчей.

Читать полностью »

«Пора ли гнать на мороз Computer Vision — scientist’ов ?» (Fondation Models и вокруг)

2024-01-18 в 0:50, admin, рубрики: CLIP, computer vision, dinov2, Fondation Models, I-Jepa, InternImages, InternVideo, машинное зрениее, мультимодальные модели, нейронные сети

Прошлый год в Computer Vision запомнился тем, что появилось множество больших претрейненных сетей (Fondation Models). Самая известная - GPT4v (ChatGPT с обработкой изображений).
В статье я попробую простым языком объяснить что это такое (для тех кто пропустил), как меняет индустрию. И когда можно будет выгнать на мороз лишних "ресерчеров".

Поговорим о следующем:

Что вообще такое "предтрейненные сети"
Где они используются?
Можно ли заменить ими обучение/разработчиков?
Какие есть ограничения?
Что будет дальше?

Читать полностью »

Как ИИ работает даже в зоне взрывных работ

2023-03-09 в 7:32, admin, рубрики: computer vision, Блог компании Группа НЛМК, добыча руды, машинное зрение, машинное обучение, производство, руда

Чтобы добыть железную руду, породу в карьере нужно рызрыхлить. В карьере СГОКа (Стойленского горно-обогатительного комбината) делается это с помощью буровзрывных работ. Полученную после взрыва горную массу нужно погрузить в карьерный самосвал, а потом в вагон-думпкар и отправить на обогатительную фабрику.

Как ИИ работает даже в зоне взрывных работ - 1

Читать полностью »

Распознавание поднятых пальцев на Python+OpenCV

2022-08-06 в 8:00, admin, рубрики: computer vision, finger, gesture control, github, opencv, python, будущее здесь, Компьютерное зрение, пальцы, Программирование, управление жестами

В данной статье хочу рассмотреть банальный и несложный проект, а именно подсчет количества поднятых пальцев.

Все исходники можно найти на моем Github.

Код будем рассматривать с самого начала, но лучше всего ознакомиться с моими предыдущими статьями.

Подготавливаем среду и устанавливаем следующие библиотеки:

pip install mediapipe
pip install opencv-python
pip install math

Создаем файл HandTrackingModule.py с привычным для моих читателей классом handDetector:

Читать полностью »

Разбираемся с устройством свёрток на примере объединения двух свёрток в одну в pytorch

2022-06-12 в 15:09, admin, рубрики: computer vision, convolution, deep learning, python, pytorch, математика, машинное обучение

Неинтересная цель этой статьи — показать, как можно смержить две свертки пайторча в одну. Если интересна лишь реализация — прошу в конец статьи.

А интересная цель — потыкать непосредственно в веса моделей на примере объединения свёрток. Узнать, как они хранятся и используются конкретно в pytorch, не вдаваясь в хардкорные интересности по типу im2col.
Но перед тем, как показывать реализацию, давайте немного вспомним, с чем работаем.

Читать полностью »

Визуальный SLAM: делаем HD-карты при помощи смартфона

2022-03-02 в 9:35, admin, рубрики: computer vision, Direct-SLAM, g2o, HD-maps, machine learning, ORB-SLAM, SLAM, Блог компании Город Иннополис, машинное зрение, машинное обучение, обработка изображений, Разработка робототехники

Привет! Меня зовут Александр Гращенков, я iOS-разработчик в компании RoadAR. С 2016 года живу и работаю в Иннополисе, занимаюсь компьютерным зрением и интеграцией нейросетей в мобильные платформы.

Читать полностью »

Проблемы современного машинного обучения

2022-02-14 в 10:30, admin, рубрики: artificial intelligence, computer vision, natural language processing, natural language understanding, Блог компании Open Data Science, искусственный интеллект, машинное обучение, Научно-популярное

Во многих популярных курсах машинного и глубокого обучения вас научат классифицировать собак и кошек, предсказывать цены на недвижимость, покажут еще десятки задач, в которых машинное обучение, вроде как, отлично работает. Но вам расскажут намного меньше (или вообще ничего) о тех случаях, когда ML-модели не работают так, как ожидалось.

Частой проблемой в машинном обучении является неспособность ML-моделей корректно работать на большем разнообразии примеров, чем те, что встречались при обучении. Здесь идет речь не просто о других примерах (например, тестовых), а о других типахЧитать полностью »

Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов

2022-01-28 в 7:59, admin, рубрики: computer vision, data mining, deep learning, machine learning, natural language processing, nlp (natural language processing), ozon tech, Блог компании Ozon Tech, машинное обучение, обработка изображений

Привет! Меня зовут Александр, я работаю в команде матчинга Ozon. Ежедневно мы имеем дело с десятками миллионов товаров, и наша задача — поиск и сопоставление одинаковых предложений (нахождение матчей) на нашей площадке, чтобы вы не видели бесконечную ленту одинаковых товаров.
На странице любого товара на Ozon есть картинки, заголовок, описание и дополнительные атрибуты. Всю эту информацию мы хотим извлекать и обрабатывать для решения разных задач. И особенно она важна для команды матчинга.
Чтобы извлекать признаки из товара, мы строим его векторные представления (эмбеддинги), используя различные текстовые модели (fastText, трансформеры) для описаний и заголовков и целый набор архитектур свёрточных сетей (ResNet, Effnet, NFNet) — для картинок. Далее эти векторы используются для генерации фичей и товарного сопоставления.
На Ozon ежедневно появляются миллионы обновлений — и считать эмбеддинги для всех моделей становится проблематично. А что, если вместо этого (где каждый вектор описывает отдельную часть товара) мы получим один вектор для всего товара сразу? Звучит неплохо, только как бы это грамотно реализовать…

Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов - 1
Читать полностью »

Рождение Albumentations

2021-12-09 в 12:59, admin, рубрики: Albumentations, computer vision, deep learning, open source, python, Алгоритмы, Блог компании Open Data Science, машинное обучение, обработка изображений

В этом посте я расскажу историю появления Open Source библиотеки Albumentations как я ее запомнил. В технические детали углубляться не буду. Основная задача текста - логирование, то есть надо написать историю, которую мне будет интересно прочитать через 20 лет.

Читать полностью »

Чем рука робота лучше вашей, или Автоматизация контроля качества на производстве

2021-09-07 в 7:01, admin, рубрики: computer vision, data science, deep learning, image recognition, machine learning, Анализ и проектирование систем, Блог компании ГК ЛАНИТ, Компьютерное зрение, Ланит, машинное обучение, норбит

Закройте глаза и представьте себя в цехах большого завода. Пусть это будет производство вакцин в ампулах. А вы, как и еще 70 человек, заняты тем, что целыми днями просматриваете ампулы, чтобы отобрать дефектные. И так весь день… Сколько ампул с малейшими отклонениями от нормы вы бы не заметили? Задачу усложняет то, что дефектом считается не только неправильная запайка, но и едва заметная точка на дне ампулы. Можете ли вы быть на 100% уверены, что не пропустили ни одного дефекта? А ведь вас еще будут выборочно перепроверять.

Устают глаза, притупляется внимание.

Читать полностью »

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «computer vision»

Как мы оцифровали футбольные матчи с помощью CV

«Пора ли гнать на мороз Computer Vision — scientist’ов ?» (Fondation Models и вокруг)

Как ИИ работает даже в зоне взрывных работ

Распознавание поднятых пальцев на Python+OpenCV

Разбираемся с устройством свёрток на примере объединения двух свёрток в одну в pytorch

Визуальный SLAM: делаем HD-карты при помощи смартфона

Проблемы современного машинного обучения

Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов

Рождение Albumentations

Чем рука робота лучше вашей, или Автоматизация контроля качества на производстве

Архив

Информация

Статьи из архивов

Обсуждаемое

Рекомендуем

Рубрика «computer vision»

Новости

Актуальные темы

Архив