Исследование метода главных компонент и линейного дискриминантного анализа на изменение ракурса и условий освещенности лица как объект распознавания

в 11:02, , рубрики: Алгоритмы, Исследования и прогнозы в IT, распознавание образов, метки:

Всем добрый день. Я являюсь аспирантом. Тема моей диссертации «Разработка методов идентификации по изображению для предоставления индивидуального доступа в реальном масштабе времени».
В моем первом посту я написал, не с самого начала. Вот начинаю с самого начала.

Распознавание человека по изображению лица выделяется среди биометрических систем тем что во-первых, не требуется специальное или дорогостоящее оборудование, во-вторых, не нужен физический контакт с устройствами. Однако распознавание человека по изображению лица не обеспечивает 100%-ой надёжности идентификации.

Особенность состоит в том, чтобы распознать человека по изображению лица независимо от изменения ракурса и условий освещённости при съёмке.

Такие задачи не имеют точного аналитического решения. При этом требуется выделение ключевых признаков, характеризующих зрительный образ, определение относительной важности признаков путём выбора их весовых коэффициентов и учёт взаимосвязей между признаками. Изначально эти задачи выполнялись человеком-экспертом, что занимало много времени и не гарантировало качества. В новых методах выделение ключевых признаков осуществляется путём автоматического анализа обучающей выборки, но тем не менее большинство информации о признаках задаётся вручную. Для автоматического применения таких анализаторов выборка должна быть достаточно большой и охватывать все возможные ситуации.

Нейросетевые методы предлагают иной подход к решению задачи распознавания образов. Веса в нейронной сети не вычисляются путём решения аналитических уравнений, а подстраиваются различными методами при обучении. Обучаются нейронные сети на наборе обучающих примеров. Обученная НС может успешно применяться для распознования человека при различных условиях. Т.О. применение нейронных сетей для задачи распознавания человека по изображению лица, является перспективным направлением.

Методы идентификации человека по изображению лица

При всём многообразии различных алгоритмов и методов распознавания изображений, типичный метод распознавания состоит из трёх компонент (рис. 1):

1.​ преобразование исходного изображения в начальное представление (может включать в себя как предобработку, так и математические преобразования, например вычисление главных компонент);

2.​ выделение ключевых характеристик (например, берётся первые n главных компонент или коэффициентов дискретного косинусного преобразования);

3.​ механизм классификации (моделирования): кластерная модель, метрика, нейронная сеть и т.п.

image
Рис.1. Схема взаимосвязи структурных элементов типичного метода распознавания изображений

Сложившиеся подходы к идентификации персон по изображениям челове​ческих лиц практически устоялись. Необходимо совершенствование сущест​вующих алгоритмов с целью оптимизации обеспечиваемых ими временных и точностных характеристик поиска за счет использования ключевых признаков, извлекаемых автоматически из изображения персоны (например, пол, наличие бороды, очков, ракурс лица и др.), и, таким образом, повысить скорость и точность поиска.

Метод главных компонент

Метод главных компонент (Principal Component Analysis, PCA) применяется для сжатия информации без существенных потерь информативности. Он состоит в линейном ортогональном преобразовании входного вектора X размерности N в выходной вектор Y размерности M, где N >M.

Преимущества:

-​ при наличии в наборе изображений лиц вариаций, таких как раса, пол, эмоции, освещение, будут появляться компоненты, величина которых в основном определяется этими факторами. Поэтому по значениям соответствующих главных компонент можно определить, например, расу или пол человека;

— хранение и поиск изображений в больших базах данных, реконструкция изображений.

Основаная трудность состоит в высоких требованиях к условиям съёмки изображений. Изображения должны быть получены в близких условиях освещённости, одинаковом ракурсе (решается добавлением в обучающую выборку изображений в различных ракурсах) и должна быть проведена качественная предварительная обработка, приводящая изображения к стандартным условиям.

Метод линейного дискриминантного анализа

При помощи метода линейного дискриминантного анализа (Linear Discriminant Analysis, LDA), выбирают проекцию пространства изображений на пространство признаков таким образом, чтобы минимизировать внутриклассовое и максимизировать межклассовое расстояние в пространстве признаков. В этих методах предполагается, что классы линейно разделимы.

Преимущества:

-​ отмечена высокая точность распознавания (около 94%) для широкого диапазона условий освещённости, различных выражений лица и наличия или отсутствия очков.

Проблемы метода:

-​ однако остаются невыясненными вопросы, применим ли этот метод для поиска в больших базах данных, может ли метод работать, когда в тренировочной выборке для некоторых лиц имеется изображение только в одних условиях освещённости;

-​ так же не производилось изменения ракурса, а эксперименты с изменением освещения проводились без изменения других факторов. Будет ли данный метод работоспособен при таких сочетаниях тоже неизвестно. Как и в методе собственных лиц, здесь тоже нужна качественная предварительная обработка, приводящая изображения к стандартным условиям.

Основной целью настоящей работы является разработка методов распо​знавания и построение информационно-поисковых систем специального при​менени (ИПС СП), обеспечивающих автоматическую иден​тификацию личности человека в реальном масштабе времени по изображению его лица.

Достижение поставленной в работе цели диктует необходимость решения ряда следующих основных задач:

-​ разработка «быстрых» алгоритмов распознавания и выделения основ​ных характеристик изображения человеческого лица, обеспечивающих высокую достоверность идентификации объекта поиска;

-​ разработка алгоритма хранения и кодирования вспомогательной ин​формации, характеризующей объект поиска, обеспечивающего прием​лемые объемно-временные показатели функционирования ИПС СП;

-​ разработка алгоритма надежной идентификации лиц на основе храня​щейся в базе данных ИПС СП информации;

— разработка опытного образца ИПС СП, реализующего перечисленные выше алгоритмы с целью проверки на практике правильности сделан​ных в настоящей работе теоретических выводов, выдачи по результатам опытной эксплуатации ИПС СП рекомендаций по ее дальнейшему со​вершенствованию.
Была поставлена задача, сравнить метод главных компонент и метод линейного дискриминантного анализа (ЛДА). Необходимо проверить метод главных компонент и метод ЛДА.

Для проведения исследований были разработаны программы на языке C++ Builder, реализующие метод главных компонент и метод ЛДА. Экспериментальные исследования проводились с использованием базы ORL, базы FERET и собственной базы из 15 человек. Во всех базах содержались изображения различных ракурсов регистрации, с произвольной мимикой, различным масштабом и условиями регистрации. Цель настоящего эксперимента заключалась в оценке эффективности метода распознавания для различного количества К классов в базе данных (К = 4, 15, 40, 100, 200 и 395). Оценка эффективности распознавания для малого числа классов (К = 4, 15) показала, что минимальное число образов в каждом классе не должно быть меньше 5, поскольку матрицы ковариации, используемые в методах PCA и LDA, в этом случае становятся особенными и в таком случае нельзя гарантировать стабильность редукции исходного признакового пространства.

Первая и вторая компоненты редуцированных признаков Ĺ (vxvy) «отвечают» за поворот и позу головы, а третья — собственно за выражение лица. При этом влияние компоненты в процессе распознавания (в результате выбора близкого образа) тем выше, чем ниже порядковый номер компоненты.

Была проведена проверка методов PCA и LDA для случая, когда исходная база данных сложена из двух или более разнородных баз. Для этого к 40 классам базы данных ORL было добавлено 355 классов из базы FERET. Следует отметить, что добавленные изображения имели более низкое разрешение, темный фон, разное освещение и размеры, а также значительные вариации поворотов лица.

Вследствие такого отличия исходных данных в пространстве редуцированных признаков появились новые признаки, сгруппированные в отдельной области относительно признаков базы ORL.

Результаты исследований приведены в таблице 1.

Таблица 1.

Кол-во распознаваемых людей Кол-во изображений каждого человека Кол-во изображений, используемых для обучения Ошибка второго рода (FRR) при использовании коэффициента корреляции
PCA LDA
4 10 5 0,000 0,000
15 15 5 0.333 0.063
10 0.230 0.133
40 10 3 0.330 0.122
5 0.250 0.155
7 0.184 0.033
100 20 5 0.197 0.056
7 0.176 0.104
200 20 5 0.173 0.102
7 0.104 0.083
395 20 5 0.083 0.064
7 0.080 0.046

Вывод

Из приведенного анализа следует что для повышения вероятности распознавания целесообразно использовать сочетание обоих методов. Для этого необходимо проведение дальнейших исследований.

Литература
1.​ Головко В.А. Нейроинтеллект: Теория и применения. Книга 1. Организация и обучение нейронных сетей с прямыми и обратными связями — Брест: БПИ, 1999, — 260с.
2.​ Самаль Д.И., Старовойтов В.В. — Подходы и методы распознавания людей по фотопортретам. — Минск, ИТК НАНБ, 1998. — 54с.
3.​ Самаль Д.И., Старовойтов В.В. Методика автоматизированного распознавания людей по фотопортретам // Цифровая обработка изображений. — Минск: ИТК, 1999.-С.81-85.
4.​ Вороновский Г.К., Махотило К.В., Петрашев С.Н., Сергеев С.А. – Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности. – Харьков: Основа, 1997.

Ждите следующих статей:)

Автор: tibult

Источник

Поделиться

* - обязательные к заполнению поля