Яндекс.Диск научился читать текст с картинок

в 14:31, , рубрики: ocr, яндекс, Яндекс.Диск, метки:

image

Яндекс в своём блоге объявил о новой возможности файлохранилища Яндекс.Диск. Теперь файловый поиск может находить картинки JPEG, GIF и PNG, содержащие текст поискового запроса, Система научилась распознавать текст на изображениях.

Яндекс утверждает, что они сумели создать универсальную OCR, которая может распознавать текст на совершенно разных картинках. Для этого классификатор картинок, работающий на принципе нейронной сети, отбирает из всех файлов изображения, содержащие текст. Текст разбивается на линии, линии – на отдельные буквы, и затем система распознаёт их, учитывая особенности языка.

Для разных типов картинок ЯД обещает разную точность распознавания. Для отсканированных документов на русском языке — 80%, для фотографий с надписями — 63,2%, а для скриншотов — почти100%. Помимо русского языка, система также распознаёт английский, украинский и турецкий. Средняя точность распознавания текстов находится в районе 70%.

Автор: SLY_G

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js