Распознавание объектов на изображении

Автор работы: Пользователь скрыл имя, 24 Марта 2013 в 23:39, курсовая работа

Описание работы

Целью данной работы является изучение темы обнаружения и распознавания образов на изображениях. Распознавание образов (а часто говорят - объектов, ситуаций, явлений или процессов) - самая распространенная задача, которую человеку приходится решать практически ежесекундно. Поэтому мы ознакомимся с понятием распознавания и обнаружения изображения, а также локализации объектов, рассмотрим некоторые существующие методы для решения проблемы нахождения образов. Так как теории и методы распознавания образов по своему характеру являются математическими дисциплинами, то необходимо остановиться на уровне математической строгости, принятом в нашем изложении материала.

Содержание работы

Введение…………………………………………………………………………………………………..3
Глава 1. Распознавание изображений……………………………………………………………………4
1.1 Вероятностный критерий качества классификации………………………….…….……..4
1.2 Оптимальные стратегии статистической классификации………………………….…….5
1.3 Основные группы признаков, используемых при распознавании изображений……………………………………………………………………………………………….6
Глава 2. Обнаружение и распознавание объектов на изображениях……………………….…….……7
2.1 Задачи распознавания на изображениях…………………………………………….……..7
2.2 Формирование признаков по изображению…………………………………...…….…….9
2.3 Обнаружение и локализация объектов на изображении……………………..…….…….12
2.3.1 Критерии локализации объектов……………………………………….…….…....13
2.3.2 Совместное обнаружение и локализация объектов…………………..…….…….14
Глава 3. Простая модель распознавания образов………………………………………………….……17
Приложение. Пример программы по распознаванию объекта на изображении и нахождению некоторых его геометрических характеристик…………………………………….…….…….…….…19
Заключение……………………………………..……………………………………………...…….……21
Список литературы…………………

Файлы: 1 файл

распознавание 2год.docx

— 853.65 Кб (Скачать файл)

СОДЕРЖАНИЕ

 

Введение…………………………………………………………………………………………………..3

Глава 1. Распознавание изображений……………………………………………………………………4

   1.1 Вероятностный критерий качества классификации………………………….…….……..4

   1.2 Оптимальные стратегии статистической классификации………………………….…….5

   1.3 Основные группы признаков, используемых при распознавании        изображений……………………………………………………………………………………………….6

Глава 2. Обнаружение и распознавание объектов на изображениях……………………….…….……7

   2.1 Задачи распознавания на изображениях…………………………………………….……..7

   2.2 Формирование признаков по изображению…………………………………...…….…….9

   2.3 Обнаружение и локализация объектов на изображении……………………..…….…….12

2.3.1 Критерии локализации объектов……………………………………….…….…....13

2.3.2 Совместное обнаружение и локализация объектов…………………..…….…….14

Глава 3. Простая модель распознавания  образов………………………………………………….……17

Приложение. Пример программы по распознаванию объекта на изображении и нахождению некоторых его геометрических характеристик…………………………………….…….…….…….…19

Заключение……………………………………..……………………………………………...…….……21

Список литературы……………………………………..……………………………………..…….……22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ВВЕДЕНИЕ

    Целью данной работы является изучение темы обнаружения и распознавания образов на изображениях. Распознавание образов (а часто говорят - объектов, ситуаций, явлений или процессов) - самая распространенная задача, которую человеку приходится решать практически ежесекундно. Поэтому мы ознакомимся с понятием распознавания и обнаружения  изображения, а также локализации объектов, рассмотрим некоторые существующие методы для решения проблемы нахождения образов. Так как теории и методы распознавания образов по своему характеру являются математическими дисциплинами, то необходимо остановиться на уровне математической строгости, принятом в нашем изложении материала.

     В своей практике люди решают разнообразные задачи по классификации и распознаванию объектов, явлений и ситуаций (мгновенно узнают друг друга, с большой скоростью читают печатные и рукописные тексты, безошибочно водят автомобили в сложном потоке уличного движения, осуществляют отбраковку деталей на конвейере и т.д.). Распознавание образов можно определить как отнесение исходных данных к определённому классу с помощью выделения существенных признаков или свойств, характеризующих эти данные, из общей массы несущественных деталей.

    Под классом образов понимается некоторая категория, определяющаяся рядом свойств общих для всех ее элементов. Образ - это описание любого элемента как представителя соответствующего класса образов.

    Автоматическое распознавание образов имеет большое практическое значение. Впервые оно было использовано для машинного считывания рукописных цифр. В настоящее время область его применения существенно расширилась: начиная от измерений, контроля, сортировки и сборки в производственных процессах и кончая анализом изображений, считываемых на расстоянии, диагностикой по медицинским снимкам, качественной оценкой экспериментальных данных, идентификацией человека, автоматическим проектированием, пониманием изображений как функции технического зрения роботов и т.д. Распознавание образов традиционно относят к задачам искусственного интеллекта.

    Первые попытки изучения возможностей автоматизации процесса распознавания образов относятся к началу 50-х годов, когда цифровые вычислительные машины постепенно стали общедоступным средством обработки информации. В конце 50-х годов Розенблатт предложил персептронный алгоритм, который представлял собой одну из первых моделей процессов запоминания и организации информации, реализуемых мозгом. Базой для решения задач отнесения объектов к тому или иному классу послужили результаты классической теории статистических решений. В её рамках строились алгоритмы, обеспечивающие на основе экспериментальных измерений параметров, характеризующих этот объект, а также некоторых априорных данных, описывающих классы, определение конкретного класса, к которому может быть отнесен распознаваемый объект.  К середине 70-х годов определился облик распознавания как самостоятельного научного направления, появилась возможность создания нормальной математической теории распознавания.  Cущественный вклад в дисциплину распознавания образов внесли Ф. Розенблатт, В.М. Глушков, В.С. Михалевич, В.С. Пугачев, Н.П. Бусленко, Ю.И. Журавлев, Я.З. Цыпкин, А.Г. Ивахненко, М.М. Бонгард, В.Н. Вапник, Г.П. Тартаковский, В.Г. Репин, Л.А. Растригин, А.Л. Горелик, В.Л. Матросов, Р. Гонсалес, У. Гренандер.

 

 

 

ГЛАВА 1.  РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ

Существует множество  задач, в которых изображение  рассматривается как источник информации, на основе которой необходимо найти  какое-либо решение. Основой для  решения таких задач является теория распознавания образов. В рассматриваемом нами случае образом является изображение.

Задачей распознавания образов  является классификация изображений  на основе определенных условий.  Подход в задаче заключается в классификации  по множеству признаков, вычисляемых  по данному изображению. Классификация  образов заключается в отображении  пространства признаков в пространство решений. Таким образом, распознавание  образов включает в себя 2 задачи:

  • отбор и упорядочивание признаков (критерием является степень важности признаков для характеристики образов);
  • классификация (её задача – принятие решения о принадлежности образа тому или иному классу на основе анализа вычислительных признаков);

Для того, чтобы осуществить классификацию, необходимо отобрать признаки. Здесь возможны различные подходы:

  • Примитивный подход заключается в использовании в качестве признаков всего неупорядоченного набора пикселов.
  • Использование в качестве признаков модули коэффициентов ДПФ или другого дискретного ортоганального преобразования.
  • Разбиение изображения на несколько клеток и использование в качестве признаков степень заштрихованных клеток.
  • Работа со скелетизированными изображениями и выбор в качестве признаков расстояния, измеренного в заранее заданном направлении от края квадрата до края искомого изображения.

   При использовании любого из данных подходов мы получаем в качестве признаков упорядоченный набор числовых данных, обозначающих вектор признаков y = (yo, y1, … , yk-1)T, который можно рассматривать как точку в k-мерном пространстве признаков D.

С геометрической точки зрения задача классификации – разбиение  пространства признаков D на L взаимно непересекающихся областей Dl (l = 0,…, L-1), каждая из которых соответствует некоторому классу Ωl образов.

 

1.1 Вероятностный критерий качества классификации

Классификатор должен быть таким, чтобы области, выделяемые в  пространстве признаков, соответствовали  классам, то есть должно выполняться  условие: объект ω принадлежит классу Ωl тогда и только тогда, когда соответствующий объекту вектор признаков y(ω) принадлежит области Dl .

На практике данное условие  выполняется не всегда и существует вероятность неверно классифицировать объект, то есть допустить ошибку при  распознавании.

       Обозначим plj (  l, j = 0, … , L-1) вероятность того, что классификатор принимает решение об отнесении вектора признаков некоторого объекта к области Dj, в то время как сам объект принадлежит классу Ωl .

 При l ≠ j вероятности plj характеризуют ошибки распознавания и называются вероятностями неверной (ошибочной) классификации, а при l = j вероятности plj задают вероятности верной классификации представителей соответствующего класса.

 То есть основная  задача при построении классификатора  – уменьшение вероятностей ошибочной  классификации.

  Качество классификатора  характеризуется величиной, которая  называется условным средним риском. Она задаёт среднюю величину потерь, связанных с принятием классификатором решения об отнесении данного вектора признаков y к классу с номером j.

 

 

  В данной формуле:

  • P(Ωl) – априорная вероятность появления объектов из класса Ωl
  • p(y / Ωl) – условная плотность вероятностей случайного вектора признаков Y для объектов класса Ωl (или функция правдоподобия для класса)
  • p(y) – безусловная плотность вероятностей случайного вектора Y
  • c = (cij), (i,j = 0,..L-1) – элементы квадратной матрицы, характеризующие величины штрафов (потерь) за ошибки классификатора.

Интегральной величиной, характеризующей качество классификатора, является математическое ожидание потерь, или общий риск.

 

1.2 Оптимальные стратегии статистической классификации

 

Могут использоваться байесова, минимаксная стратегия и стратегия Неймана-Пирсона. Соответственно классификаторы называются классификаторами Байеса, минимаксным классификатором и классификатором Неймана-Пирсона.

1) Классификатор Байеса. Стратегия Байеса используется при наличии полной априорной информации о классах, то есть когда известны: функция правдоподобия для каждого из классов, матрица штрафов и априорные вероятности для каждого класса. Стратегия выбирается таким образом, чтобы обеспечить минимум общего риска (риск Байеса). Он будет обеспечен, если разбиение пространства признаков D будет осуществляться по правилу: вектор y принадлежит области Dl тогда и только тогда, когда соответствующий условный средний риск Rl(y) минимален. Классификатор Байеса также называется классификатором отношения правдоподобия.

2) Минимаксный классификатор.  Используется в случае двух классов, и если известны функции правдоподобия для каждого класса и матрица штрафов.

Предполагая возможность  произвольного изменения значений априорных вероятностей классов, можно  минимизировать максимально возможное  значение риска. Значение величины общего риска для минимаксного классификатора равно максимальному значению минимального риска Байеса. Пара априорных вероятностей, при которых риск Байеса принимает  максимальное значение, называется наименее благоприятным распределением априорных вероятностей. То есть минимаксный классификатор – это классификатор Байеса для пары наименее благоприятных априорных вероятностей.

3) Классификатор Неймана – Пирсона. Тоже используется в случае двух классов, если известны только функции правдоподобия для каждого из классов. Суть в следующем: задаётся допустимое значение вероятности ошибки первого рода p0, а затем классификатор строится так, чтобы обеспечить минимум вероятности ошибки второго рода p1. Классификатор Неймана-Пирсона – это классификатор отношения правдоподобия.

 

 

 

1.3  Основные  группы признаков, используемых  при распознавании изображений

 

     1)Геометрические признаки. Группа основана на использовании геометрических характеристик, представленных на изображении объектов.

    Примеры геометрических признаков: геометрические размеры, расстояние между точками на объекте, периметр, площадь, компактность, числовые характеристики вписанных и описанных в изображение объектов, а также признаки, связанные с представления геометрии контура объекта.

     Основные методы описания контура:

  • Цепные коды. Метод цепного кодирования предложен Фриманом. Он заключается в том, чтобы границу объекта, расположенного на дискретной сетке, представить в виде набора элементарных отрезков. В этом случае полной характеристикой границы в каждой точке является направление требуемого отрезка. Здесь предполагается, что точки на границе являются четырёхсвязными (отрезок складывается в четырёх направлениях). Достоинство представления границы объекта цепным кодом – простота реализации алгоритма его описания,  простота получения из описания других геометрических характеристик объекта, возможность достижения инвариантности описания к преобразованиям подобия (масштабирование изображения,  его перенос и поворот).  Недостаток – неустойчивость описаний к искажениям в изображениях.
  • Ортогональные представления функции кривизны. Угол наклона к касательной контура рассматривается как периодическая функцию некоторой переменной и получается представление контура в виде ряда Фурье, коэффициенты этого ряда называются фурье-дискрипторами данного контура. Такое описание обладает свойствами инвариантности к преобразованиям подобия, но для его использования необходимо получить промежуточное представление контура в виде функции. Это может быть сделано с помощью ѱ-кривых.
  • ѱ-кривые. Представление контура объекта с использованием ѱ-кривой основано на аппроксимации прямолинейных участков границы объекта в виде отрезков ломаных, а области изменения направления границы – в виде дуг окружностей. В этом случае периодическая функция оказывается представлена прямолинейными горизонтальными участками и короткими кривыми, соответствующими областям изменения границы. При правильном построении ѱ-кривых можно добиться инвариантности к преобразованиям подобия.
  • Сплайн-аппроксимация границы используется для практических приложений, в частности, для решения задачи описания границы. Суть метода – представление границы объекта в виде кусочно-полиномиальной функции. При использовании наиболее простого задания функции в виде горизонтальных прямых с разрывом в точках изменения направления границы, получаем представление контура в виде полилиний (соединяющихся между собой отрезков прямых).

Информация о работе Распознавание объектов на изображении