Рубрика «обработка изображений»

Где находился Ваш дом миллионы лет назад - 1

Виртуальный геохронологический глобус, на котором можно увидеть, как выглядела поверхность нашей планеты в разные эры (Нео-протерозой, Палеозой, Мезозой, Кайнозой), начиная от временного промежутка в 750 миллионов лет назад.
Читать полностью »

Недавно вышла статья которая неплохо показывает тенденцию в машинном обучении последних лет. Если коротко: число стартапов в области машинного обучения в последние два года резко упало.
image
Ну что. Разберём “лопнул ли пузырь”, “как дальше жить” и поговорим откуда вообще такая загогулина.
Читать полностью »

Статьи про компьютерное зрение, интерпретируемость, NLP – мы побывали на конференции AISTATS в Японии и хотим поделиться обзором статей. Это крупная конференция по статистике и машинному обучению, и в этом году она проходит на Окинаве – острове недалеко от Тайваня. В этом посте Юлия Антохина (Yulia_chan) подготовила описание ярких статей из основной секции, в следующем вместе с Анной Папета расскажет про доклады приглашенных лекторов и теоретические исследования. Немного расскажем и про то, как проходила сама конференция и про “неяпонскую” Японию.

imageЧитать полностью »

Microsoft удалила крупнейшую в мире базу лиц MS Celeb, но та уже разошлась по интернету - 1

Microsoft убрала из интернета свою базу данных на 10 миллионов лиц MS Celeb, пишет Financial Times. Фотографии под лицензией Creative Commons использовались для обучения систем распознавания лиц учёными со всего мира. К сожалению, среди них оказались военные подразделения и китайские фирмы SenseTime и Megvii, которые специализируются на разработке систем видеонаблюдения. Вероятно, это могло вызвать недовольство в высших эшелонах власти и породить обвинения в адрес IT-компании, которая якобы оказывает техническое содействие потенциальному врагу.

База данных MS Celeb вышла в 2016 году. Microsoft описывает её как крупнейший общедоступный набор данных распознавания лиц в мире, содержащий более 10 млн изображений почти 100 000 человек.
Читать полностью »

Нейросеть NTechLab заняла второе место на конкурсе NIST по распознаванию действий на видео - 1
Примеры видеороликов из тестового набора

Российская компания NtechLab заняла второе место на конкурсе нейросетей ActEV: Activities in Extended Video среди алгоритмов, способных распознавать действия на видео. В конкурсе принимали участие 39 алгоритмов, в финальном этапе ActEV-PC Independent Evaluation остались семь участников.

Такие системы могут широко применяться в коммерческих системах. Например, это позволяет автоматизировать поиск неправильно припаркованных автомобилей, оставленных предметов, а также курящих в неположенных местах граждан — и оперативно оповещать об этих действиях полицию. Система автоматического распознавания действий для правоохранительных органов особенно эффективна в сочетании с обширной системой видеонаблюдения, которая работает в связке с системой распознавания лиц.
Читать полностью »

В последнее время мы в группе распознавания компании ABBYY всё больше применяем нейронные сети в различных задачах. Очень хорошо они зарекомендовали себя в первую очередь для сложных видов письменности. В прошлых постах мы рассказывали о том, как мы используем нейронные сети для распознавания японской, китайской и корейской письменности.

image Пост про распознавания японских и китайских иероглифов
image Пост про распознавание корейских символов

В обоих случаях мы использовали нейронные сети с целью полной замены метода классификации отдельного символа. Во всех подходах фигурировало множество различных сетей, и в задачи некоторых из них входила необходимость адекватно работать на изображениях, которые не являются символами. Модель в этих ситуациях должна как-то сигнализировать о том, что перед нами не символ. Сегодня мы как раз расскажем о том, зачем это в принципе может быть нужно, и о подходах, с помощью которых можно добиться желаемого эффекта.

Мотивация

А в чём вообще проблема? Зачем нужно работать на изображениях, которые не являются отдельными символами? Казалось бы, можно разделить фрагмент строки на символы, классифицировать их все и собрать из этого результат, как, например, на картинке ниже.

Отличаем символы от мусора: как построить устойчивые нейросетевые модели в задачах OCR - 3

Да, конкретно в данном случае так действительно можно сделать. Но, увы, реальный мир устроен куда более сложно, и на практике при распознавании приходится иметь дело с геометрическими искажениями, смазом, пятнами кофе и прочими трудностями.
Читать полностью »

Изображения формата JPEG встречаются повсюду в нашей цифровой жизни, но за этим покровом осведомлённости скрываются алгоритмы, устраняющие детали, не воспринимаемые человеческим глазом. В итоге получается высочайшее визуальное качество при наименьшем размере файла – но как конкретно всё это работает? Давайте посмотрим, чего именно не видят наши глаза!

Как устроен формат JPEG - 1

Легко принять, как само собой разумеющееся, возможность отправить фотку другу, и не волноваться по поводу того, какое устройство, браузер или операционную систему он использует – однако так было не всегда. К началу 1980-х компьютеры умели хранить и показывать цифровые изображения, однако по поводу наилучшего способа для этого существовало множество конкурирующих идей. Нельзя было просто отправить изображение с одного компьютера на другой и надеяться, что всё заработает.
Читать полностью »

Вы пока не разбираетесь, почему ReLU лучше сигмоиды, чем отличается Rprop от RMSprop, чем нормализованный сигнал лучше ненормализованного и почему сигналы вообще стоит пробрасывать? И зачем нейронной сети нужен граф, и какую он совершил ошибку, что она распространяется обратно? У вас есть проект, в котором требуется компьютерное зрение, но вы хотите его реализовать при помощи OpenCV? Вы делаете межгалактического робота для борьбы с грязными тарелками, и хотите, чтобы он мог сам решать, отмывать или и так сойдет? Или вы видели предложения по зарплатам для специалистов ML на hh.ru и все еще под впечатлением?

Мы запускаем открытый курс «Нейронные сети и компьютерное зрение», который адресован тем, кто в этой области делает первые шаги. В чем преимущества нашего курса?

  • авторы курса знают, о чем говорят: это инженеры московского Центра искусственного интеллекта Samsung, Михаил Романов и Игорь Слинько;
  • есть как теория (с опциональными математическими задачами для улучшения понимания), так и практика на PyTorch
  • приступаем к практике сразу после освоения минимальных теоретических знаний.
  • есть котейки
  • и самое главное: лучшие студенты будут приглашены на собеседование в Samsung Research Russia!

Samsung открывает бесплатный онлайн-курс по нейросетям в задачах компьютерного зрения - 1
Читать полностью »

Наверняка вы неоднократно видели в интернете такие картинки:
image
Я решил написать универсальный скрипт для создания подобных изображений.Читать полностью »

В этом году власти Москвы планируют объявит тендер на создание масштабной системы распознавания лиц, которая, по словам чиновников, охватит более 200 тысяч камер видеонаблюдения в столице. Мэр Москвы Сергей Собянин рассказал об этом на совещании у президента РФ Владимира Путина по вопросам развития технологий в области искусственного интеллекта.

Он также напомнил, что система распознавания лиц уже тестировалась Москве, запуск в пробном режиме был выполнен во время чемпионата мира по футболу 2018 года.
Читать полностью »