Автор работы: Пользователь скрыл имя, 24 Марта 2013 в 23:39, курсовая работа
Целью данной работы является изучение темы обнаружения и распознавания образов на изображениях. Распознавание образов (а часто говорят - объектов, ситуаций, явлений или процессов) - самая распространенная задача, которую человеку приходится решать практически ежесекундно. Поэтому мы ознакомимся с понятием распознавания и обнаружения изображения, а также локализации объектов, рассмотрим некоторые существующие методы для решения проблемы нахождения образов. Так как теории и методы распознавания образов по своему характеру являются математическими дисциплинами, то необходимо остановиться на уровне математической строгости, принятом в нашем изложении материала.
Введение…………………………………………………………………………………………………..3
Глава 1. Распознавание изображений……………………………………………………………………4
1.1 Вероятностный критерий качества классификации………………………….…….……..4
1.2 Оптимальные стратегии статистической классификации………………………….…….5
1.3 Основные группы признаков, используемых при распознавании изображений……………………………………………………………………………………………….6
Глава 2. Обнаружение и распознавание объектов на изображениях……………………….…….……7
2.1 Задачи распознавания на изображениях…………………………………………….……..7
2.2 Формирование признаков по изображению…………………………………...…….…….9
2.3 Обнаружение и локализация объектов на изображении……………………..…….…….12
2.3.1 Критерии локализации объектов……………………………………….…….…....13
2.3.2 Совместное обнаружение и локализация объектов…………………..…….…….14
Глава 3. Простая модель распознавания образов………………………………………………….……17
Приложение. Пример программы по распознаванию объекта на изображении и нахождению некоторых его геометрических характеристик…………………………………….…….…….…….…19
Заключение……………………………………..……………………………………………...…….……21
Список литературы…………………
Получаем окончательно
2.3 Обнаружение и локализация объектов на изображении
Обнаружение и локализация объектов на изображении — один из важнейших этапов при решении задачи поиска и распознавания объектов на изображениях.
В настоящее время известно огромное число алгоритмов построения классификаторов для решения задачи обнаружения. В данной работе рассмотрена линейная модель.
При поиске объекта на изображении задача не исчерпывается построением классификатора. Дополнительно к классификации возникает необходимость локализации объекта — то есть определения координат его местоположения. Обоснование этому:
Локализация позволяет обойти недостатки процесса обнаружения и распознавания. Но для локализации должен быть выбран критерий, по которому одно из возможных положений считается предпочтительнее другого положения. Конкретные координаты играют для многих задач ключевую роль. Например, алгоритмы, использующие описание одной и той же картины (сцены) в виде нескольких изображений, применяют процедуру согласования изображений. Похожие процедуры используются и в задачах калибровки видеокамер, задачах стереозрения, построения рельефа местности, привязки изображений к реальным или существующим картам и т.д..
Комплексный подход к рассмотрению задачи обнаружения и локализации определяет качество измерения координат объектов ошибками двух видов.
Ошибки первого рода возникают вследствие неверных отождествлений искомых объектов с отдельными деталями на наблюдаемом изображении. Они дают большие различия результатов измерения координат и настоящего значения. Такие ошибки называют аномальными. Аномальные ошибки характеризуются вероятностями ложного обнаружения и пропуска объекта.
Ошибки второго рода, или нормальные ошибки, имеют величину меньше некоторого наперед заданного значения (или меньше линейных размеров объекта). Нормальные ошибки характеризуются своими среднеквадратичными значениями отклонения в определении координат.
Для построения локализатора с минимальным числом аномальных ошибок используется подход, принятый в обработке изображений (использование частотной характеристики фильтра, гистограммы, спектра изображения и т.д.). Но этот подход невозможно применить для задачи локализации, где отсчеты входного изображения не используются в качестве признаков, и классификатор не является линейным.
Так можно придти к выводу об актуальности проблемы разработки и реализации критериев и алгоритмов локализации, согласованных с показателями качества процесса обнаружения (нормальные ошибки в данном случае не рассматриваются).
2.3.1 Критерии локализации объектов
1) Локализация, согласованная с критерием качества обнаружения и распознавания. Качество процедуры обнаружения и распознавания может характеризоваться величиной общего риска. При этом оптимальный в смысле минимума общего риска классификатор Байеса строится таким образом, чтобы при рассмотрении каждого конкретного вектора y выбирать тот класс Ωl , (l = 0…L-1), для которого значение условного среднего риска по этому классу,
Rt(y) = rli P(Ωi /y), l = 0…L-1
Здесь P(Ωi /y) - апостериорная вероятность отнесения данного конкретного вектора y к классу Ωi . Пусть класс Ω0, соответствующий фоновой составляющей изображения.
Поскольку процедуру локализации объектов на изображении можно рассматривать как частный случай процедуры обнаружения или распознавания, то удобно производить локализацию объекта по тому же критерию, по которому производится и классификация, то есть по минимуму общего риска.
Пусть n1 и n2 - отсчеты в плоскости изображения. Пусть область локализации (то есть область предполагаемого размещения объекта j-го класса на изображении) обозначена Dj.
Пусть y = y(n1,n1) - вектор признаков для фрагмента изображения с координатами n1 и n2. Тогда критерий локализации выглядит следующим образом:
(n1,n2): Rj (y(n1,n2)) = min Rj (y (n1-m1,n2-m2)).
(m1,m2)Î Dj
Обычно Dj принимаются одинаковыми и равными некоторой наперед заданной области D, размеры которой согласуют с размером искомого объекта. Тогда существует возможность упрощения процесса обнаружения и локализации, если классификация производится на основе анализа значения среднего риска. Пусть выбор класса l для анализируемого фрагмента происходит по критерию:
l(n1,n2): Rl (y(n1,n2)) = min Rj (y (n1,n2)).
j=0…L-1
В этом случае общий критерий обнаружения (распознавания) и локализации запишется в следующем виде:
(n1,n2): Rl (y(n1,n2)) = min Rj (y (n1-m1,n2-m2)).
j=0…K-1
(m1,m2)Î D
Процесс обнаружения и локализации, основанный на этом критерии реализуется следующим образом: область D занимает все возможные положения на плоскости изображения, и если при очередном положении (n1,n2).
2) Локализация при обнаружении объекта. Пусть класс объектов — Ω1, класс фона (шума) — Ω0. Риск за принятие решения об отнесении текущего фрагмента к каждому из классов равен
Rl (n1,n2) = , l=
Здесь Λ – отношение правдоподобия.
Λ(n1, n2) =
Классификация производится путем сравнения величины Λ с порогом λ :
λ =
При Λ>λ принимается решение о наличие объекта и производится его локализация.
Критерий обнаружения и локализации:
(n1,n2): Λ (y(n1,n2)) = max Λ (y (n1-m1, n2-m2))
{(m1,m2)Î D&Λ (y(n1-m1,n2-m2)) > λ }
Процесс обнаружения и локализации, основанный на приведенном критерии реализуется следующим образом: область D занимает все возможные положения на плоскости изображения, и если при очередном положении (n1, n2) координаты оптимума критерия совпадают с текущими, то оно и рассматривается как искомое положение объекта.
Критерий обнаружения и локализации
Î&
Здесь «&» — операция логической конъюнкции (логическое «и»).
Процесс обнаружения и локализации, основанный на приведенном критерии реализуется следующим образом: область D занимает все возможные положения на плоскости изображения, и если при очередном положении (n1, n2) координаты критерия совпадают с текущими, то оно рассматривается как искомое положение объекта.
2.3.2 Совместное обнаружение и локализация объектов
Вначале разберемся в понятии «локализатора-обнаружителя» объектов. Он должен наследовать свойства классификатора для обнаружения объектов, и следовательно содержать некоторую функцию d, которая задается на пространстве признаков и имеет некоторое заранее выбранное пороговое значение, на основе которого определяется, нужно ли относить данную точку на изображении к области локализации. Можно считать порог равным нулю, а в случае, если он не равен нулю, всегда можно сделать линейное преобразование функции d так, чтобы пороговое значение обратилось в нуль. С помощью функции d для каждого положения (n1,n2) окна обработки вычисляется один отсчет изображения дискриминантной функции η(n1,n2). Кроме того, «локализатор-обнаружитель» должен содержать правило, по которому из нескольких точек области локализации выбирается какая-то одна. Для этого удобно использовать пиковый фильтр. Алгоритм его работы таков:
Î
Величина D — заранее выбранная область локализации, — некоторое постоянное значение, не превышающее ни одно из значений яркости изображения , — изображение, полученное в результате пиковой фильтрации изображения . Обычно область локализации выбирается симметричной относительно нулевого отсчета, который принимается за выходной отсчет фильтра:
´
(2M1 +1), (2M2 +1) - размеры пикового фильтра по вертикали и горизонтали.
Принимая описанную модель локализатора-обнаружителя, схема процесса
обнаружения и локализации становится такой:
Порядок следования локализации и классификации (процедур пиковой фильтрации и порогового отбора) не влияет на результат работы, потому что одни и те же значения изображения η(n1, n2) используются и для локализации, и для порогового отбора. То есть возможно построение процедуры, осуществляющей обнаружение или локализацию за один проход по изображению: выделенное процедурой локализации экстремальное значение g(n1, n2) просто сравнивается с некоторым порогом.
Пусть отсчеты в окне пикового фильтра упорядочены по мере удаления от выбранного выходного отсчета фильтра, а их нумерация производится в диапазоне [0, N-1], где N – число отчетов в области локализации. Для определения ошибок процедуры совместного обнаружения и локализации зададим событие Q, состоящее в принятии решении о том, что некоторый фрагмент изображения содержит образ. В соответствии с данной схемой обнаружения это событие запишется таким образом:
Q = {η0(Y) ≥ 0}∙{η0(Y) ≥ η1(Y)}∙…∙{η0(Y) ≥ ηN-1(Y)}.
Здесь первое из событий {η0(Y)≥0} отвечает за процедуру обнаружения, а все остальные события — за пиковую фильтрацию. Таким образом вероятности ошибок классификации для процедуры совместного обнаружения и локализации запишутся в следующем виде:
p0 = P(Q/Ω0), p1 = P(/Ω1)
Критерием качества процесса обнаружения и локализации является критерий минимума суммарной ошибки обнаружения в виде
R = r0p0 + r1p1 → min
В качестве параметров оптимизации выступают параметры функции d(...).
При таком критерии процедура обнаружения и локализации будет оптимальна только с точки зрения величины ошибок: объект найден или не найден. То есть возле конкретного местоположения каждого из объектов однозначно должна быть задана некоторая область, для которой принимается допущение, что для любой ее точки образ присутствует. Вне такой области объект считается отсутствующим. Размеры области необходимо задавать, учитывая размер используемого при локализации пикового фильтра. Они должны быть такими, чтобы в пределах области каждого конкретного объекта процедура совместного обнаружения и локализации выделяла не более одного объекта. Такое возможно, если эта область имеет линейные размеры не больше половины соответствующих линейных размеров пикового фильтра.
Один из приводимых ниже алгоритмов построения локализатора-обнаружителя основывается на моделях функции правдоподобия в признаковом пространстве и на предположении линейности функции d(∙) и фиксированном окне локализации. Процесс построения функции d(∙) в такой ситуации возможен, если имеет место независимость значений отсчетов изображения дискриминантной функции в окне локализации.
Другой алгоритм не использует никаких априорных предположений, но требует для настройки локализатора-обнаружителя исходные данные в виде обучающей выборки. Этот алгоритм является итерационным.
Обнаружение
и локализация объекта:
(1), область локализации
(3), выходной отсчет пикового
ГЛАВА 3. ПРОСТАЯ МОДЕЛЬ РАСПОЗНАВАНИЯ ОБРАЗОВ
Опишем простую математическую модель автоматического распознавания образов.
Простая схема содержит 2 основных блока: датчик и классификатор. Датчик – устройство, преобразующее физические характеристики объекта, подлежащего распознаванию, в набор признаков x = (x1, x2, … xn)’, характеризующих данный объект. Классификатор, как рассматривалось и ранее, – устройство, относящее каждый поступающий на его вход допустимый набор значений к одному из конечного числа классов, вычислив множество значений решающих функций.
Система допускает ошибку в том случае, когда она относит к классу ωj объект, на самом деле принадлежащий отличному от ωj классу.
Система распознавания R1 лучше системы R2, если вероятность совершить ошибку для системы R1 меньше, чем для системы R2. Датчик выдает информацию в виде вектора
x = (x1, x2, … xn)’, где n - число измеренных характеристик каждого физического объекта. Вектор x принадлежит одному из M классов образов ω1, ω2, …, ωM.
Пусть априорные вероятности появления объектов одного класса одинаковы. Это значит, что вектор x может с равной вероятностью относиться как к одному, так и к другому классу. Пусть p(x|ωi) = pi(x) – плотность распределения для x при условии, что он принадлежит классу ωi. В таком случае вероятность того, что на самом деле вектор x принадлежит ωi, определяется выражением
Вероятность того, что x не принадлежит классу определяется выражением, задающим вероятность ошибки