- PVSM.RU - https://www.pvsm.ru -
Гильош – это специальная технология защиты банкнот, документов, ценных бумаг и других видов полиграфической продукции (билетов, акцизных марок, сертификатов и многих других документов государственного масштаба).
Защита документов обеспечивается путем нанесения на бланки сложных композиций различных гильоширных элементов. Гильоширный элемент представляет собой замысловатый рисунок из множества многократно пересекающихся тончайших кружевных линий (рисунок 1 [1]). Обычно такие элементы представлены разного рода защитными сетками, розеттами, бордюрами, виньетками и уголками. Гильош может быть как симметричным, так и асимметричным по своему дизайну.
Согласно существующим нормативам, гильоширные элементы должны занимать не менее 70% площади ценных бумаг.
Причем из этой площади большая часть должна содержать многоцветные гильоширные композиции.
Примеры документов, содержащих гильоширные элементы:
а) банкнота номиналом 5 рублей образца 1997 года б) изображение страницы паспорта гражданина РФ
Оригинал изображения [2]
Например, такая ситуация возникает при распознавании страниц паспорта гражданина РФ (рисунок 1б [1]). Для обеспечения дополнительной защиты номер страниц паспорта печатается в виде гильоширной розетты (рисунок 1б [1]). Однако при настройке алгоритмов распознавания такого рода графики возникает ряд трудностей. При попытке построить вектор признаков распознаваемого объекта по изображению высокого разрешения, в силу особенности гильоширных элементов (которые, напомним, представляют собой рисунок из тончайших линий), значение его будет существенно изменяться при незначительных геометрических искажениях (таких как, например, сдвиг или поворот).
С другой стороны, попытка построить вектор признаков по изображению с пониженным разрешением оказывается неудачной из-за недостаточной контрастности распознаваемого объекта. Кроме того, дополнительные трудности для распознавания создают возможные дополнительные помехи. Например, номера страниц паспорта, и без того слабо поддающиеся распознаванию, часто перекрываются различными штампами и печатями.
В этой статье мы расскажем читателям про технику распознавания гильоширных элементов на примере номеров страниц паспорта гражданина РФ. Описанная ниже техника после незначительных модификаций может быть использована для обработки и распознавания гильоша, наносимого на другие документы (рисунок 2 [3]).
Примеры документов, содержащих гильоширные элементы:
а) заграничный паспорт гражданина РФ б) Удостоверение личности военнослужащего РФ
Оригинал изображения [4]
Итак, на изображении страницы паспорта требуется определить номер. При этом точная ориентация страницы неизвестна, а также возможно наличие помех в виде штампов и печатей (рисунок 3а [5]).
Непосредственно перед распознаванием необходимо «подготовить» исходное изображение: подавить помехи и определить правильную ориентацию изображения. Заметим, что как распознаваемые объекты (номера страниц паспорта), так и возможные помехи преимущественно представимы в виде композиции линий, геометрические характеристики которых известны (в нашем случае важна только толщина). При работе с такими объектами часто используют морфологическую фильтрацию.
Морфология (математическая морфология) – это инструмент для выделения и анализа на изображении графических элементов с известной геометрической структурой. Основными морфологическими операциями являются дилатация и эрозия. Дилатация изображения f(x,y) по прямоугольному структурному элементу e={(x,y):|x|≤a,|y|≤b} обозначается f⊕e и определяется следующим образом:
(f⊕e)(x,y) = max {f(x+s,y+t)}
|s|≤a,|t|≤b
Аналогично, эрозия изображения f(x,y) по структурному элементу e обозначается f⊖e и определяется следующим образом:
(f⊕e)(x,y) = min {f(x+s,y+t)}
|s|≤a,|t|≤b
Рассмотрим ещё две важные морфологические операции: размыкание и замыкание. Размыкание изображения f(x,y) по структурному элементу e обозначается f⊚e и определяется равенством f⊚e=(f⊖e)⊕e. Аналогично, замыкание изображения f(x,y) по примитиву e обозначается f⊙e и определяется как f⊚e=(f⊕e)⊖e. Замыкание сглаживает контуры объекта, «обрывает» узкие перешейки и ликвидирует выступы небольшой ширины. Размыкание также проявляет тенденцию к сглаживанию участков контуров, но, в отличие от размыкания, «заливает» узкие разрывы и длинные углубления малой ширины, а также заполняет промежутки контура.
Пусть характерная толщена кружевных линий гильоша tg, характерное расстояние между двумя линиями гильоша dg, а толщина линий штампов ts. Заметим, что для страниц паспорта справедливо соотношение:
tg < dg < ts
Шаг 1. С помощью операции opening «сольем» друг с другом линии образующие гильош. Это позволит увеличить контраст распознаваемых объектов, при этом практически не изменит вид помех (так как dg<ts). Введем структурный элемент e1={(x,y):|x|≤dg,|y|≤dg }. Тогда контрастирование задается следующим образом (рисунок 3б [5]):
f1 (x,y)=(f⊚e1 )(x,y)
Шаг 2. Зная толщину линий штампов, с помощью замыкания подавим возможные помехи. Введем структурные элементы для «снятия» горизонтальных и вертикальных линий штампов как e2h={(x,y):|x|≤0,|y|≤ts } и e2v={(x,y):|x|≤ts,|y|≤0} соответственно. Тогда изображение фона (то есть изображение страницы паспорта «без помех») получается следующим образом (рисунок 3в [5]):
f2h (x,y)=(f1⨀e2h )(x,y)
f2v (x,y)=(f1⨀e2v )(x,y)
f2 (x,y)=max{f2h (x,y),f2v (x,y)}
Шаг 2*. После получения фонового изображения в качестве бонуса легко получить изображение f2*(x,y), содержащее только помехи (рисунок 3в [5]). Оно получается путем вычитания фона из исходного изображения и может быть полезно для анализа заполнения страницы (есть ли какие-либо штампы на текущей странице паспорта).
После снятия помех изображение считается подготовленным к определению ориентации и номера страницы. Заметим, что преимущественная ориентация страницы может быть найдена путем детектирования и анализа расположения углового метки страницы (рисунок 3е [5]), которая для паспорта РФ должна быть всегда снизу. Отметим, что алгоритм детектирования должен быть устойчив к незначительным искажениям объекта и шуму.
Кроме того, настройка алгоритма должна проводиться на небольшом обучающем наборе. Пожалуй, одним из самых известных алгоритмом, удовлетворявших указанным требованиям, является метод Виолы и Джонса.
Распознавания страницы паспорта гражданина РФ:
а) исходное изображение (в перевернутом виде); б) морфологическая фильтрация типа «размыкание»; в) выделенное изображение фона; г) выделенное изображение печатей; д) определение ориентации страницы; е) распознавание номера страницы
Этот же алгоритм используется и для распознавания номера страницы паспорта путем предварительного обучения индивидуальных классификаторов для каждой гильоширной розетты, соответствующей номерам страниц.
Шаг 3. Используя предварительно обученный классификатор, определим возможное расположение угловых меток на изображении фона f2(x,y). Если найденная метка расположена сверху, то повернем изображение на 180 градусов вокруг центра (рисунок 3д [5]).
Шаг 4. Определив ориентацию страницы и довернув при необходимости изображение, применим каждый из обученных классификаторов гильоширных розетт-номеров к изображению фона f2(x,y). Классификатор, обеспечивающий большее число срабатываний в центральной области изображения, определят искомый номер страницы (рисунок 3е [5]).
Для тестирования изложенного алгоритма было подготовлено два набора данных. Первый использовался для обучения распознавателей угловых элементов номеров страниц паспорта (состоял их 333 изображений, то есть по 37 различных изображений каждой страницы паспорта). Второй набор данных использовался для проверки работоспособности и оценки качества детектирования и состоял из 616 различных изображений (распределение по типам страниц неравномерное, точная информация приведена в таблице 1 [6]).
Количество изображений | Качество детектирования | |
---|---|---|
Стр. 4 | 34 | 88.86% |
Стр. 5 | 129 | 89.15% |
Стр. 6 | 90 | 91.11% |
Стр. 7 | 88 | 97.73% |
Стр. 8 | 58 | 91.38% |
Стр. 9 | 59 | 94.92% |
Стр. 10 | 57 | 91.23% |
Стр. 11 | 53 | 100.00% |
Стр. 12 | 48 | 91.67% |
Итого | 616 | 92.86% |
В результате среднее качество детектирования составило 92.86%. Заметим, что много ошибок было получено при распознавании страницы №5 (несмотря на бо́льшую по сравнению с другими страницами обучающую выборку). Это связано в первую очередь с плотным заполнением. Некоторые из нераспознанных страниц к тому же с большим трудом могут быть распознаны даже человеком (рисунок 4 [7]).
Примеры нераспознаваемых изображений страниц паспорта:
а) исходное изображение; б) изображение фона
Автор: Angelina54
Источник [8]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/algoritmy/49878
Ссылки в тексте:
[1] рисунок 1: #img1
[2] Оригинал изображения: http://habrastorage.org/storage3/fa3/f67/235/fa3f672357c47b53990e7c3667c73504.png
[3] рисунок 2: #img2
[4] Оригинал изображения: http://habrastorage.org/storage3/c0a/af8/006/c0aaf8006e50abe9b56f7adfd1c4f8cc.png
[5] рисунок 3а: #img3
[6] таблице 1: #table1
[7] рисунок 4: #img4
[8] Источник: http://habrahabr.ru/post/204658/
Нажмите здесь для печати.