Распознавание гильоширных элементов на примере паспорта РФ

в 12:00, , рубрики: Алгоритмы, архивация, Блог компании Cognitive Technologies, оцифровка, распознование текста, сжатие данных, метки: , , , ,

Гильош – это специальная технология защиты банкнот, документов, ценных бумаг и других видов полиграфической продукции (билетов, акцизных марок, сертификатов и многих других документов государственного масштаба).

Защита документов обеспечивается путем нанесения на бланки сложных композиций различных гильоширных элементов. Гильоширный элемент представляет собой замысловатый рисунок из множества многократно пересекающихся тончайших кружевных линий (рисунок 1). Обычно такие элементы представлены разного рода защитными сетками, розеттами, бордюрами, виньетками и уголками. Гильош может быть как симметричным, так и асимметричным по своему дизайну.

Согласно существующим нормативам, гильоширные элементы должны занимать не менее 70% площади ценных бумаг.
Причем из этой площади большая часть должна содержать многоцветные гильоширные композиции.

Распознавание гильоширных элементов на примере паспорта РФ

Рисунок 1

Примеры документов, содержащих гильоширные элементы:
а) банкнота номиналом 5 рублей образца 1997 года б) изображение страницы паспорта гражданина РФ
Оригинал изображения

(3 158,74 КБ, PNG-24)

При распознавании изображений документов часто приходится иметь дело с различными гильоширными элементами. При этом, являясь обычно частью фона, гильош только усложняет тем самым процесс распознавания значимой информации (усложняя алгоритм «подавления» фона, что является неотъемлемой частью любой системы распознавания). Однако в ряде задач гильоширные элементы сами по себе являются значимыми объектами и должны быть распознаны.

Например, такая ситуация возникает при распознавании страниц паспорта гражданина РФ (рисунок 1б). Для обеспечения дополнительной защиты номер страниц паспорта печатается в виде гильоширной розетты (рисунок 1б). Однако при настройке алгоритмов распознавания такого рода графики возникает ряд трудностей. При попытке построить вектор признаков распознаваемого объекта по изображению высокого разрешения, в силу особенности гильоширных элементов (которые, напомним, представляют собой рисунок из тончайших линий), значение его будет существенно изменяться при незначительных геометрических искажениях (таких как, например, сдвиг или поворот).

С другой стороны, попытка построить вектор признаков по изображению с пониженным разрешением оказывается неудачной из-за недостаточной контрастности распознаваемого объекта. Кроме того, дополнительные трудности для распознавания создают возможные дополнительные помехи. Например, номера страниц паспорта, и без того слабо поддающиеся распознаванию, часто перекрываются различными штампами и печатями.

В этой статье мы расскажем читателям про технику распознавания гильоширных элементов на примере номеров страниц паспорта гражданина РФ. Описанная ниже техника после незначительных модификаций может быть использована для обработки и распознавания гильоша, наносимого на другие документы (рисунок 2).

Распознавание гильоширных элементов на примере паспорта РФ

Рисунок 2

Примеры документов, содержащих гильоширные элементы:
а) заграничный паспорт гражданина РФ б) Удостоверение личности военнослужащего РФ
Оригинал изображения

(3 638,15 КБ, PNG-24)

Алгоритм распознавания страницы паспорта

Итак, на изображении страницы паспорта требуется определить номер. При этом точная ориентация страницы неизвестна, а также возможно наличие помех в виде штампов и печатей (рисунок 3а).

Непосредственно перед распознаванием необходимо «подготовить» исходное изображение: подавить помехи и определить правильную ориентацию изображения. Заметим, что как распознаваемые объекты (номера страниц паспорта), так и возможные помехи преимущественно представимы в виде композиции линий, геометрические характеристики которых известны (в нашем случае важна только толщина). При работе с такими объектами часто используют морфологическую фильтрацию.

Морфология (математическая морфология) – это инструмент для выделения и анализа на изображении графических элементов с известной геометрической структурой. Основными морфологическими операциями являются дилатация и эрозия. Дилатация изображения f(x,y) по прямоугольному структурному элементу e={(x,y):|x|≤a,|y|≤b} обозначается f⊕e и определяется следующим образом:

(f⊕e)(x,y) = max {f(x+s,y+t)}
                 |s|≤a,|t|≤b

Аналогично, эрозия изображения f(x,y) по структурному элементу e обозначается f⊖e и определяется следующим образом:

(f⊕e)(x,y) = min {f(x+s,y+t)}
                 |s|≤a,|t|≤b

Рассмотрим ещё две важные морфологические операции: размыкание и замыкание. Размыкание изображения f(x,y) по структурному элементу e обозначается f⊚e и определяется равенством f⊚e=(f⊖e)⊕e. Аналогично, замыкание изображения f(x,y) по примитиву e обозначается f⊙e и определяется как f⊚e=(f⊕e)⊖e. Замыкание сглаживает контуры объекта, «обрывает» узкие перешейки и ликвидирует выступы небольшой ширины. Размыкание также проявляет тенденцию к сглаживанию участков контуров, но, в отличие от размыкания, «заливает» узкие разрывы и длинные углубления малой ширины, а также заполняет промежутки контура.

Пусть характерная толщена кружевных линий гильоша tg, характерное расстояние между двумя линиями гильоша dg, а толщина линий штампов ts. Заметим, что для страниц паспорта справедливо соотношение:

tg < dg < ts

Шаг 1. С помощью операции opening «сольем» друг с другом линии образующие гильош. Это позволит увеличить контраст распознаваемых объектов, при этом практически не изменит вид помех (так как dg<ts). Введем структурный элемент e1={(x,y):|x|≤dg,|y|≤dg }. Тогда контрастирование задается следующим образом (рисунок 3б):

f1 (x,y)=(f⊚e1 )(x,y)

Шаг 2. Зная толщину линий штампов, с помощью замыкания подавим возможные помехи. Введем структурные элементы для «снятия» горизонтальных и вертикальных линий штампов как e2h={(x,y):|x|≤0,|y|≤ts } и e2v={(x,y):|x|≤ts,|y|≤0} соответственно. Тогда изображение фона (то есть изображение страницы паспорта «без помех») получается следующим образом (рисунок 3в):

f2h (x,y)=(f1⨀e2h )(x,y)
f2v (x,y)=(f1⨀e2v )(x,y)
f2 (x,y)=max{f2h (x,y),f2v (x,y)}

Шаг 2*. После получения фонового изображения в качестве бонуса легко получить изображение f2*(x,y), содержащее только помехи (рисунок 3в). Оно получается путем вычитания фона из исходного изображения и может быть полезно для анализа заполнения страницы (есть ли какие-либо штампы на текущей странице паспорта).

После снятия помех изображение считается подготовленным к определению ориентации и номера страницы. Заметим, что преимущественная ориентация страницы может быть найдена путем детектирования и анализа расположения углового метки страницы (рисунок 3е), которая для паспорта РФ должна быть всегда снизу. Отметим, что алгоритм детектирования должен быть устойчив к незначительным искажениям объекта и шуму.

Кроме того, настройка алгоритма должна проводиться на небольшом обучающем наборе. Пожалуй, одним из самых известных алгоритмом, удовлетворявших указанным требованиям, является метод Виолы и Джонса.

Распознавание гильоширных элементов на примере паспорта РФ

Рисунок 3

Распознавания страницы паспорта гражданина РФ:
а) исходное изображение (в перевернутом виде); б) морфологическая фильтрация типа «размыкание»; в) выделенное изображение фона; г) выделенное изображение печатей; д) определение ориентации страницы; е) распознавание номера страницы


Алгоритм детектирования объектов Виолы и Джонса изначально разрабатывался для поиска лиц на изображениях в режиме реального времени. Он рассматривает задачу детектирования как задачу бинарной классификации в каждой точке, то есть для каждого возможного сдвига на изображении при помощи предварительно обученного распознавателя (классификатора) проверяется гипотеза о присутствии искомого объекта в данном положении. Ключевыми особенностями алгоритма являются:

  • Использование прямоугольных признаков Хаара в качестве базовых признаков при построении классификатора.
  • Использование так называемого интеграла изображения, позволяющего быстро вычислять элементарные признаки.
  • Использование эффективного алгоритма машинного обучения AdaBoost для обучения классификаторов.
  • Использование каскадной структуры классификаторов с целью уменьшения суммарного времени обработки изображения.

Этот же алгоритм используется и для распознавания номера страницы паспорта путем предварительного обучения индивидуальных классификаторов для каждой гильоширной розетты, соответствующей номерам страниц.

Шаг 3. Используя предварительно обученный классификатор, определим возможное расположение угловых меток на изображении фона f2(x,y). Если найденная метка расположена сверху, то повернем изображение на 180 градусов вокруг центра (рисунок 3д).

Шаг 4. Определив ориентацию страницы и довернув при необходимости изображение, применим каждый из обученных классификаторов гильоширных розетт-номеров к изображению фона f2(x,y). Классификатор, обеспечивающий большее число срабатываний в центральной области изображения, определят искомый номер страницы (рисунок 3е).

Экспериментальные результаты

Для тестирования изложенного алгоритма было подготовлено два набора данных. Первый использовался для обучения распознавателей угловых элементов номеров страниц паспорта (состоял их 333 изображений, то есть по 37 различных изображений каждой страницы паспорта). Второй набор данных использовался для проверки работоспособности и оценки качества детектирования и состоял из 616 различных изображений (распределение по типам страниц неравномерное, точная информация приведена в таблице 1).

Таблица 1. Статистика распознавания.

  Количество изображений Качество детектирования
Стр. 4 34 88.86%
Стр. 5 129 89.15%
Стр. 6 90 91.11%
Стр. 7 88 97.73%
Стр. 8 58 91.38%
Стр. 9 59 94.92%
Стр. 10 57 91.23%
Стр. 11 53 100.00%
Стр. 12 48 91.67%
Итого 616 92.86%

В результате среднее качество детектирования составило 92.86%. Заметим, что много ошибок было получено при распознавании страницы №5 (несмотря на бо́льшую по сравнению с другими страницами обучающую выборку). Это связано в первую очередь с плотным заполнением. Некоторые из нераспознанных страниц к тому же с большим трудом могут быть распознаны даже человеком (рисунок 4).

Распознавание гильоширных элементов на примере паспорта РФ

Рисунок 4

Примеры нераспознаваемых изображений страниц паспорта:
а) исходное изображение; б) изображение фона


Полный текст статьи опубликован в сборнике трудов Института системного анализа РАН. Обработка информационных и графических ресурсов. 2013. Том 63, Выпуск 3. С. 106–110. «Распознавание гильоширных элементов: определение страниц паспорта РФ //Усилин С.А., Николаев Д.П., Шоломов Д.Л., Арлазаров В.В.

Рекомендуемая литература

  1. ГОСТ Р 54109-2010. Защитные технологии. Продукция полиграфическая защищенная. Общие технические требования. 2010.
  2. Гонсалес Р., Вудс Р. Цифровая обработка изображений. 2006. С. 1072.
  3. Soille P. Morphological Image Analysis: Principles and Applications // Morphological Image Analysis Principles and Applications. Springer-Verlag, 1999. P. 391.
  4. Viola P., Jones M. Robust Real-time Object Detection // International Journal of Computer Vision. 2002.
  5. Freund Y., Schapire R.E. A decision-theoretic generalization of on-line learning and an application to boosting // Journal of Computer and System Sciences. 1997. Vol. 55, № 1. P. 119–139.

Автор: Angelina54

Источник


* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js