Как камерой смартфона сделать фотографии, пригодные для OCR, или кое-что об ABBYY Mobile Imaging SDK

в 13:48, , рубрики: ABBYY, ECM/СЭД, ERP-системы, mobile imaging, Блог компании ABBYY, обработка изображений

Как камерой смартфона сделать фотографии, пригодные для OCR, или кое-что об ABBYY Mobile Imaging SDK - 1Количество программ — мобильных клиентов, привязанных к различным системам автоматизации деятельности предприятий, постоянно растёт. Согласно исследованию компании IDC, к 2016 году оно увеличится в 4 раза (по сравнению с 2014 годом). Конечно, ABBYY не могла остаться в стороне от этих тенденций, и у нас есть мобильные продукты, ориентированные на корпоративных пользователей. Об одном из них – ABBYY Mobile Imaging SDK (MI SDK) – мы ещё ни разу не рассказывали в блоге, исправляемся.

Наши пользователи привыкли, что мобильные продукты ABBYY – это либо про словари, либо про распознавание. Сразу оговоримся – в ABBYY Mobile Imaging SDK нет ни того, ни другого. Спрашивается, почему нам понадобилось выпускать такое приложение? Ответ – конечно, чтобы продать OCR ещё большему числу клиентов :). Ведь ABBYY Mobile Imaging SDK обычно используется в связке с нашими «корпоративными» решениями для распознавания данных (например, ABBYY Recognition Server) или извлечения данных (например, ABBYY FlexiCapture). Этот небольшой продукт призван помочь нашим «большим» решениям работать лучше, распознавать точнее.

Жизнь изменилась, и если раньше основным устройством, с которого мы получали изображение для распознавания, был сканер, то теперь его всё чаще заменяет мобильный телефон. Чем он отличается от сканера? Конечно, тем, что получить с него изображение хорошего качества гораздо сложнее (разумеется, в данном случае хорошее качество = достаточное для того, чтобы наши OCR-технологии могли распознать текст на фото).

ABBYY Mobile Imaging SDK позволяет приложениям, в которые он встроен, проверять качество изображения прямо на смартфоне, и просить пользователя сфотографировать документ ещё раз, если качество изображения плохое. Что означает «плохое» для оптического распознавания?

1. На изображении могут быть яркие пятна от вспышки:

Как камерой смартфона сделать фотографии, пригодные для OCR, или кое-что об ABBYY Mobile Imaging SDK - 2

2. Изображение может быть тёмным, не контрастным:

Как камерой смартфона сделать фотографии, пригодные для OCR, или кое-что об ABBYY Mobile Imaging SDK - 3

3. Изображение может быть размытым:

Как камерой смартфона сделать фотографии, пригодные для OCR, или кое-что об ABBYY Mobile Imaging SDK - 4

MI SDK также может быть использован для сжатия качественных изображений, чтобы их можно было быстрее передать на сервер с телефона. При этом продукт не просто сжимает изображение, но и обрезает фотографию так, чтобы на ней остался только сам документ.

image

Теперь – немного о проектах, в которых используется этот продукт.

Проект в компании из «большой четверки» аудиторов

Одна из аудиторской компаний «большой четверки» столкнулась со специфической проблемой на российском рынке: законодательство нашей страны обязывает аудиторов хранить копии всех документов, на основе которых создается аудиторский отчет. Делать копии бумажных документов в офисе клиента не так сложно, но в большинстве случаев документов очень много, возить туда-сюда их неудобно, да и потом всё равно придётся сканировать – иметь электронный архив с возможностью поиска удобнее, чем два ангара с макулатурой. Получается, лучше сразу делать электронные копии, и здесь возможны варианты:

1) Отсканировать документы на сканере клиента и отправить их в офис. Копии при этом получаются хорошего качества, но нужно найти сканер, подключить его к своему ноутбуку и занимать этот сканер достаточно долго, что может быть неудобно клиенту.
2) Привозить в офис клиента собственный сканер. Вряд ли кому-то придет в голову возить с собой МФУ, тем более что в потоковом режиме отсканировать документы все равно не получится – многие из них сшиты, поэтому надо сканировать каждую страницу отдельно. Остаются планшетные сканеры, но даже ими оснащать каждого аудитора – довольно дорого.

Самым дешевым и удобным оказывается третий вариант:

3) Сфотографировать документы на смартфон и отправить в офис при помощи мобильного приложения. Мобильный интернет есть практически везде, фотографировать камерой смартфона быстро и удобно. Оставалось решить проблему качества снимков – чтобы оно было достаточным для дальнейшего распознавания. Для этого используется Mobile Imaging SDK.

Решение:

1. На смартфоны сотрудников аудиторской компании установлено приложение-клиент, связанное с программой обработки документов, которая развернута на сервере в компании. Находясь в офисе у клиента, сотрудники фотографируют документы.

2. Приложение использует функциональность ABBYY Mobile Imaging SDK для:

A. Сжатия изображений
B. Проверки качества изображений

3. Изображения отправляются на сервер компании, где они конвертируются в формат PDF/A с текстовым слоем для последующего поиска, индексирования и извлечения данных. В данном случае используется ABBYY Recognition Server, но для этих целей также подходит ABBYY FineReader Engine.

4. Конвертированные файлы отправляются в существующее файловое хранилище компании.

Как камерой смартфона сделать фотографии, пригодные для OCR, или кое-что об ABBYY Mobile Imaging SDK - 6

Проект для Одного Большого Банка (тм)

В банке есть менеджеры, которые ездят на встречи с представителями мелкого бизнеса и предлагают услуги банка (ведение счёта, кредитные продукты и т.п.). Работа этих менеджеров с клиентами организована следующим образом: они приезжают в офис компании, если компания проявляет заинтересованность в продуктах банка, менеджеры делают копии документов, нужные для заявки (например, на открытие счёта), потом везут эти копии в офис банка. Там их сканируют, загружают в систему, извлекают данные при помощи ABBYY FlexiCapture, данные передаются сотрудникам, ответственным за принятие решения. Если решение положительное, менеджер распечатывает договор и опять едет к клиенту. Весь процесс занимает несколько дней, за это время клиент может запросто переметнуться к конкуренту, поэтому банк заинтересован в том, чтобы ускорять обслуживание.

Цели проекта:

1. Сократить время, которое уходит на открытие счета, с 2-3 дней до 40 минут.
2. Повысить эффективность работы менеджеров, которые непосредственно контактируют с клиентами.

Решение, разработанное для банка:

Было создано приложение-клиент, которое устанавливается на смартфоны сотрудников банка и связано с программой обработки документов, развернутой на сервере в банке – ABBYY FlexiCapture. В программе на смартфоне менеджер может выбрать тип юридического лица, для которого подаётся заявка, программа выдаёт список документов, необходимых для проверки клиента и оформления договора. После этого можно выбрать вид документа и сразу же сделать фотографию этого документа.

Программа проверяет комплектность пакета документов (все ли предложенные виды документов сфотографированы), а также (при помощи ABBYY Mobile Imaging SDK) определяет, достаточно ли качество фотографии для дальнейшего извлечения данных. После этого документы сразу отправляются на сервер банка, где проходят целый ряд проверок (комплектность пакета – ещё раз, соответствие фотографий типам документов и др.). Если допущены ошибки, менеджеру возвращается отчёт об ошибке.

Если всё в порядке, из документов извлекаются данные, которые потом очень быстро верифицируются операторами и поступают к сотрудникам, ответственным за принятие решения. Весь этот процесс происходит очень быстро – за время, пока менеджер беседует с потенциальным клиентом. Если банком принято положительное решение, программа-клиент умеет возвращать менеджеру договор с подставленными реквизитами клиента. Таким образом не только может быть ускорено само обслуживание, но значительно уменьшается время и усилия, которое менеджер тратит на одного клиента.

image

Вот, собственно, и всё. В описанных проектах ABBYY Mobile Imaging SDK работает на платформах iOS и Android. Если у вас есть вопросы – задавайте.

Алсу Иовкова,
департамент продуктов для разработчиков

Автор: ABBYY

Источник

Поделиться новостью

* - обязательные к заполнению поля