Биометрия. Изображение лица

Материал из OSZone.net wiki.

Перейти к: навигация, поиск

Содержание

Введение

     Материал этой статьи и все рисунки взяты из кмонографии: 
     Кухарев Г. А. Биометрические системы: Методы и средства идентифика-ции личности человека. – СПб.: Политехника, 2001. – 240 с.

Для идентификации личности лучше всего подходят технологии распознавания по лицу. Они ненавязчивы (распознавание человека происходит на расстояние, без задержек и отвлечения внимания), как правило, пассивны (не требуют каких-либо действий со стороны человека), не ограничивают пользователя в свободе перемещений и относительно недороги. Кроме того, люди обычно легко узнают друг друга по лицам, а значит и автоматизированные системы не должны испытывать затруднений (на практике всё иначе).

По лицу человека можно узнать его историю, симпатии и антипатии, болезни, эмоциональное состояние, чувства и намерения по отношению к окружающим. Всё это представляет особый интерес для автоматического распознавания лиц (например, для выявления потенциальных преступников).

Информационные знаки лица

  1. Форма лица (круглая, квадратная, треугольная...).
  2. Соотношение частей лица между собой (лоб, средняя и нижняя части лица).
  3. Форма лба, скул и подбородка.
  4. Форма и размер уха, способ его прикрепления, форма частей уха (мочки, козелок, противокозелок - смотрите справочник по анатомии).
  5. Симметрия / асимметрия лица.
  6. Форма, величина, (количество) и расположение глаз, рта, носа.
  7. Линии морщин.
  8. и т.д.

В зависимости от того, какой портрет используется (в фас, профиль или оба), эти методы комбинируются. В коммерческих системах обычно используют образы лиц в фас (с поворотом в сторону до 15 градусов), а значит, не используют информационные знаки ушей и профиль лица (однако, некоторая информация о профиле может быть получена из изображения в фас - по градиентам яркости).

Глаза и уши используются всё же в отдельных направлениях биометрики.

Принципы организации базы данных

Качество базы данных определяется на основе следующих признаков:

  1. Репрезентартивность.
  2. Способ структурирования данных.
  3. Качество образа:
    • Размер каждого образа в пикселях.
    • Контраст и прорисовка деталей лица.
    • Фон, на котором находится лицо.
    • Отсутствие помех на лице.

Желательно, чтобы в базе данных были образы с различным поворотом головы, присутствием или отсутствием дополнительных предметов (очки, серьги и т.д.) и с различными выражениями.

Для оценки системы распознавания обычно используется специальная база данных ORL Database of Faces. Она отвечает всем этим признакам и доступна многим разработчикам. Эта БД содержит 400 образов по 10 в каждом классе (т.е. всего 40 различных людей). Каждый образ имеет разрешение 112х92 пикселя и 256 уровней яркости. Все лица представлены на тёмном фоне . Репрезентативность данных обеспечивается некоторыми изменениями масштаба лица, угла наблюдения и условий освещения.

Методы распознавания

Чаще всего в технической литературе упоминаются три метода:

  1. Корреляционный (метод согласованной фильтрации).
  2. Метод на основе преобразований Карунена-Лоэва и понятии "собственных лиц" ("EigenFace").
  3. Метод на основе линейного дискриминантного анализа и понятия "Fisherface" (от имени учёного Роберта Фишера).

Развиваются сейчас методы, ориентированные на:

  • репрезентативный характер исходных данных - обучение системы в разных условиях;
  • уменьшение размерности исходных данных;
  • распознавание в сокращённом пространстве признаков.

Корреляционный метод

Самый простой из вышеперечисленных методов. Если условия получения новых образов соответствуют условиям получения эталона (освещение, пункт наблюдения лица, наклон, поворот, масштаб, фон и т.д.), то корреляция (соответствие) между ними близка к единице. Уровень распознавания доходит до 96%. Однако, если условия меняются, то линейная корреляция становится бесполезной.

Развитием этого метода является переход от исходных признаков к инвариантам Фурье-Меллина (заменяющих поворот на циклический сдвиг), что позволяет достичь высокой корреляции между образами. Проблемой остаётся высокая размерность пространства признаков (большой размер эталона). Кроме того, преобразование Фурье-Меллина существенно усложняет вычислительный процесс.

Метод на основе преобразований Карунена-Лоэва (ПКЛ)

Этот метод позволяет значительно сократить размер эталона, оставляя только те признаки, которые имеют принципиальное значение для конкретного образа. При этом влияние условий получения образа не так заметно, а сравнение образов упрощается. Уровень правильного распознавания стабильно достигает 80% даже при сильных изменениях условий.

Цель анализа главных компонент - выявить основные изменчивости в изображениях лиц (использующихся при обучении системы) и описать эти изменчивости несколькими векторами (шаги 3-5). Основные изменичивости представляются в матрице ковариации, порядок которой соответствует размерности вектора исходных признаков. Основная изменчивость матрицы описывается собственными числами, число которых не больше размерности матрицы. Таким образом, ПКЛ позволяет преобразовать N-мерное пространство признаков в p-мерное (p<=N).

Обратное преобразование Карунена-Лоэва приводит к представлению образов в виде "эластичных моделей лиц".

В редуцированном пространстве признаков значительно проще отделить один образ от другого. Однако, кластеризация здесь не всегда возможна. Может получиться следующее пространство образов:

Отображение редуцированного пространства признаков в форме 3D: а - редукция для первых 20 классов образов базы; b - образ 10-го класса. Редукция выполена для 20 классов образов базы и первых семи образов в классе.
Увеличить
Отображение редуцированного пространства признаков в форме 3D: а - редукция для первых 20 классов образов базы; b - образ 10-го класса. Редукция выполена для 20 классов образов базы и первых семи образов в классе.

В правой части рисунка выделен образ 10-го класса (класс - массив образов лица одного человека). Вертикальной линией представляется средний образ в классе (центр класса), а отдельные образы - семь точек. Линиями показан разброс образов относительно центра.

Как можно увидеть, различение образов в таком виде не является простой задачей: расстояния между классами не максимизированы, а расстояния внутри класса не минимизированы. Некоторые образы перекрывают чужие классы.

Метод на основе линейного дискриминантного анализа (ЛДА)

Данный метод как и предыдущий позволяет сократить количество признаков, при этом существенно улучшает кластеризацию образов (отделение друг от друга). Это позволяет увеличить уровень распознавания до 99% даже в сильно разнящихся условиях.

Если взять результат после преобразований Карунена-Лоэва в качестве исходных данных и применить метод ЛДА, можно дополнительно сократить пространство признаков.

Не буду забивать чужие головы методом (потому что сам не разобрался толком). Кому надо - почитает специальную литературу.

В результате преобразований получается следующее пространство признаков:

Нужный эффект получен: отдельные образы в классе стали ближе к центру и практически не перекрывают чужую территорию, сами центры отдалены друг от друга ещё больше.

Отбор признаков

Выбор и выделение признаков играют в распознавании образов ключевую роль.

Категории признаков

Есть три категории признаков: физические, структурные и математические.

Физические и структурные признаки выражаются через формы лица (овал лица, геометрия его основных частей), его цвет, а также цвет волос и т.д. Наиболее часто используемый признак - яркость. К физическим и структурным признакам можно отнести также координаты точек лица в местах, соответствующих смене контраста (брови, глаза, нос, уши, рот и овал).

К математическим признакам относятся спектры исходных образов, статистические характеристики, градиенты изменения яркости и др., полученные в результате математического преобразования исходных признаков.

Способы выделения признаков

Способы выделения различаются, в зависимости от используемого способа представления и способа его редукции (сокращения).

Яркостные признаки собираются в вектор простым перечислением значений яркости каждого пикселя. Для образа 112х92 пикселя получается матрица порядка 10304. В таком пространстве поиск практически невозможен, поэтому изображение предварительно уменьшается до приемлемых размеров.

Другой способ. Исходный образ рассматривается как набор столбцов и строк, являющихся самостоятельными векторами признаков. Процедура преобразования применяется отдельно для строк и отдельно для столбцов. В результате получается матрица, имеющая значительно меньший порядок. Кроме того, это повышает и точность распознавания (до 85%), увеличивает стойковть к изменению яркости, циклическому сдвигу и шумам.

Для ещё большей редукции признаков можно применить далее линейный дискриминантный анализ. В результате, распознавание доходит до 100% в больших базах данных.

Среди математических признаков чаще всего используются спектральные признаки, полученные в результате преобразования Фурье. Размер исходного пространства признаков может составить до 200 элементов. При этом для более высокого уровня распознавания преобразования Фурье применяются не для усреднённого образа, а для каждого в отдельности.

Другой способ - сканирование образа поочерёдно каждой из 25 масок 3х3, 5х5 и т.д. пикселей и составление 25-компонентного вектора признаков. Кластеризация выполняется методом ЛДА.

Маски для отбора признаков.
Увеличить
Маски для отбора признаков.

Однако, для этого способа должны выполняться некоторые требования: от 50 до 100 образов на класс и не менее 100 классов (другими словами, при регистрации каждого из минимум 100 людей, нужно сделать до 100 снимков - довольно много уйдёт времени), образы должны быть определённого масштаба, должен быть чёрный фон, а на людях должна быть одинаковая одежда. Таким образом, эту систему можно применять только в учреждениях, где принята официальная форма одежды.

Анализ локальных признаков

На образе выделяются координаты лица и локальных признаков (например, уголки рта, нос, глаза и т.д.) Координаты признаков и расстояния между ними позволяют описать лицо с помощью точек и параметров, которые затем будут использоваться при распознавании.

Эластичные модели форм лица

Образы из базы данных представляются в виде набора точек, описывающих нижние 2/3 лица (без лба). Точки ставятся в местах смены контраста (яркости).

Эти модели формы лица используются при регистрации, идентификации, распознавании род/пол, распознавании выражения лица, для виртуальной реконструкции.

После редукции признаков вычисляется усреднённая форма лица ("эластичная" - известно, в каких пределах она может изменяться). Дополнительными средствами при распознавании являются градиенты яркости.

По эластичной модели можно определить наличие усов, бороды, очков. Утверждается, что уровень распознавания лежит в пределах 86-97%, определение положения лица 77-100%, выражения лица с точностью до 83%.

Эластичные модели формы лица можно представить, например, по программе Poser, различным программам составления фотороботов, (технологическим демкам nVidia Dawn, Nalu), либо по следующей картинке:

Коммерческие системы

  • Компания "Visionic". Система "Faceit". Распознавание по алгоритмам анализа локальных признаков (главные из них - координаты центров глаз). Данная система применяется для идентификации преступников по видеоданным, получаемым со 144 камер из центра Лондона. Возможно, конечно, и другое применение.
  • Компания "Visage". Система "Photobook". Используются методы, основанные на "собственных лицах" и реконструкции образов на их основе. Система ориентирована на поиск образов лиц в больших базах данных, для упорядочивания БД и для аутентификации человека на основе образа лица, полученного с камеры, либо фотографии с документа.
  • Компания "Miros". Система "TrueFace". Распознавание на основе нейронных сетей. Выделяются неизменяемые части лица.
  • Компания "DCS AG". Система "BioID". Используются три характеристики человека: изображение лица, голос и движение губ.

Применение систем

Шериф разыскивал преступника по фотороботу. Для этого применил систему распознавания лиц "FaceID" компании "ImageWare", благодаря которой быстро нашёл человека.

Слева представлен фоторобот, справа - человек. Нельзя сказать, тот ли это человек, но то, что система позволяет значительно ускорить поиск нужных людей очевидно.

Системы идентификации по лицу часто используются в аэропортах при прохождении паспортного контроля. Также камеры расставляют в людных местах для поиска преступников.

Также, эти системы используются в казино для выявления мошенников и на фейс-контроле для недопуска лиц из "чёрного списка".

Идентификация человека на основе термограммы лица

Системы, описанные выше используют двухмерное представление лица. Они просты в эксплуатации, практически не требуют специального оборудования (достаточно веб-камеры), обладают высоким быстродействием. Однако, их можно обмануть плоскими изображениями лиц (фотомуляжами).

Однако, если использовать термографический образ лица, то вероятность несанкционированного доступа резко снижается (практически до нуля).

Информационными признаками являются рисунки вен и артерий, которые повторить в муляже практически невозможно. Для получения термографического образа используются камеры, улавливающие инфракрасное излучение. Они могут работать в полной темноте. Информационные признаки же не зависят ни от температуры лица, ни от пластических операций, ни от старения человека. Инфракрасная камера позволяет получать образ даже на значительном удалении от человека. Однако цена таких камер на 1-2 порядка выше, чем у камер на обычных матрицах.

Такие системы можно использовать в системах контроля доступа с высокой степенью ответственности и надёжности. Они обеспечивают близкую к 100% точность распознавания. Исследования показывают, что однояйцевые близнецы имеют свои уникальные термограммы.

К недостаткам можно отнести необходимость положения лица строго в фас (в камеру).

Оценка метода идентификации

Достоинства

  • Низкая цена устройств получения видеообраза.
  • Неназойливость системы.
  • Бесконтактность.
  • Незаметность.

Недостатки

  • Сложность реализации системы.
  • Высокая цена устройств получения термографического образа.
  • Зависимость видеообраза от помех (например, чулка на голове=^_^=)

Другие статьи по биометрии:

Личные инструменты