Рубрика «Компьютерное зрение»

В 2012 году команда из Торонто потрясла мир компьютерного зрения: их нейросеть AlexNet распознавала объекты на фотографиях лучше любого алгоритма, написанного вручную. Код занимал тысячи строк, требовал двух видеокарт и недель обучения. Сегодня вы можете превзойти AlexNet одной строкой кода, а модель загрузится за секунды.

Читать полностью »

Привет! Пару лет назад мы с коллегами из Центра искусственного интеллекта СФУ искали способы набраться практического опыта в задачах компьютерного зрения. Одним из таких форматов оказались хакатоны — соревнования по решению ML-задач на реальных кейсах с жесткими дедлайнами.

За эти пару лет мы успели поучаствовать примерно в десяти хакатонах (Цифровой прорыв, Атомик Хак) и в половине из них доходили до призовых местЧитать полностью »

Сила оттенков серого: компьютерное зрение с нуля - 1

В обсуждениях компьютерного зрения обычно речь идёт об OpenCV или нейронных сетях глубокого обучения наподобие YOLOЧитать полностью »

В Варшаве судьбу водопровода решают восемь моллюсков. Не инженеры, не лаборанты с пробирками, не автоматические анализаторы за миллионы злотых, а обычные речные беззубки размером с ладонь, выловленные в чистых водоемах. Они сидят в проточных резервуарах на главной насосной станции, фильтруют воду и... всё. Пока створки раковин открыты - два миллиона человек получают воду из кранов. Стоит моллюскам почуять что-то неладное и захлопнуться - подача автоматически блокируется по всему городу.

Читать полностью »

«Нормально», — ответила мне нейросеть, когда я просил помочь с YOLO, а она вместо этого нарисовала помятый телефон (контекст был перегружен).

Я улыбнулся. В тот момент я и сам чувствовал себя таким помятым. Станки простаивали уже четвёртый месяц. Зарплата в простое была символической. Пришлось искать дополнительные источники финансирования — в ход пошли даже старые запасы «железа».

Я тогда продал последний монитор — просто чтобы дожить до пятницы.

И в этих условиях я решил: не ждать заказов, а создавать ценность самому. Так родился мой модуль компьютерного зрения для контроля брака.


Читать полностью »

Ловим «взрослые» сцены на видео: как ИИ помогает редакторам - 1

Поводом для написания этой заметки стало обсуждение на недавнем отраслевом мероприятии задач Читать полностью »

Недавно вышла коллекция моделей от Alibaba - Qwen3-VL:

https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

Эта модель не только "языковая", но ещё и "глазастая"

Эта модель не только "языковая", но ещё и "глазастая"

В своём блоге они Читать полностью »

Когда у вас несколько десятков моделей компьютерного зрения, тысячи камер на заводах по всей стране и только несколько секунд, чтобы успеть оповестить оператора — важна каждая миллисекунда.

Но что делать, если вы работаете не в IT-гиганте с дата-центрами и парком GPU, а в промышленной компании с изолированными сетями, ограниченными ресурсами и жёсткими требованиями к отказоустойчивости? Расскажу:

  • почему разработка видеоаналитики в промышленности отличается от БигТеха;

  • какие ограничения приходится учитывать: отсутствие GPU, изолированные сети и жёсткие требования к отказоустойчивости;

  • Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js