- PVSM.RU - https://www.pvsm.ru -

Кластеризация дубликатов в Яндекс.Картинках

Сегодня в клубе Яндекс.Субботник [1] появилось интересное видео о том, как Яндекс обрабатывает изображения для исключения дубликатов. Рассказывает Александр Крайнов: он с 2000 года занимается проектами, связанными с обработкой медиаданных. В Яндексе отвечает за проекты, в которых задействовано компьютерное «зрение».

О докладе

Легко найти дубликаты среди тысяч картинок. Сложнее – среди миллионов. И совсем трудно – среди миллиардов. Чем выше полнота работы алгоритма, тем больше проблем. Но в то же время полнота кластеризации дубликатов – это основа качества поиска изображений.

Думаю, многие не следят за этим клубом и мне кажется, что после этого видео есть над чем поразмыслить.
Всем кому интересно — прошу под кат.

Ссылка на презентацию [2] в формате pdf.

Автор: Progrik


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/yandeks/7336

Ссылки в тексте:

[1] Яндекс.Субботник: http://clubs.ya.ru/yasubbotnik/

[2] презентацию: http://download.yandex.ru/company/experience/subbotnik/chel_krainov.pdf