Автор работы: Пользователь скрыл имя, 24 Марта 2013 в 23:39, курсовая работа
Целью данной работы является изучение темы обнаружения и распознавания образов на изображениях. Распознавание образов (а часто говорят - объектов, ситуаций, явлений или процессов) - самая распространенная задача, которую человеку приходится решать практически ежесекундно. Поэтому мы ознакомимся с понятием распознавания и обнаружения изображения, а также локализации объектов, рассмотрим некоторые существующие методы для решения проблемы нахождения образов. Так как теории и методы распознавания образов по своему характеру являются математическими дисциплинами, то необходимо остановиться на уровне математической строгости, принятом в нашем изложении материала.
Введение…………………………………………………………………………………………………..3
Глава 1. Распознавание изображений……………………………………………………………………4
1.1 Вероятностный критерий качества классификации………………………….…….……..4
1.2 Оптимальные стратегии статистической классификации………………………….…….5
1.3 Основные группы признаков, используемых при распознавании изображений……………………………………………………………………………………………….6
Глава 2. Обнаружение и распознавание объектов на изображениях……………………….…….……7
2.1 Задачи распознавания на изображениях…………………………………………….……..7
2.2 Формирование признаков по изображению…………………………………...…….…….9
2.3 Обнаружение и локализация объектов на изображении……………………..…….…….12
2.3.1 Критерии локализации объектов……………………………………….…….…....13
2.3.2 Совместное обнаружение и локализация объектов…………………..…….…….14
Глава 3. Простая модель распознавания образов………………………………………………….……17
Приложение. Пример программы по распознаванию объекта на изображении и нахождению некоторых его геометрических характеристик…………………………………….…….…….…….…19
Заключение……………………………………..……………………………………………...…….……21
Список литературы…………………
В заключение рассмотрения группы геометрических признаков укажем основные свойства применительно к задаче распознавания:
Эти свойства говорят о том, что геометрические признаки могут использоваться в задачах распознавания, которые характеризуются объектами с ярко выраженной геометрической структурой и малым уровнем шумов и искажений.
2) Топологические признаки. К данной группе относятся признаки, характеризующие топологические свойства изображенного объекта, то есть те свойства, которые остаются инвариантными относительно топологических и гомеоморфных отображениях. Топологические признаки инвариантны к широкому кругу геометрических преобразований: преобразованиям подобия, аффинным преобразованиям и многим другим. Приведём некоторые из таких признаков: число связных компонентов объекта, число «дыр» в объекте, число Эйлера.
Топологические признаки могут быть применены в редких случаях и при малом уровне искажений, связанных с исчезновением или появлением частей объектов.
3) Вероятностные признаки используются для описания функции яркости на изображении. Функцию яркости используют как реализацию случайного процесса (процессов). В этом случае признаками изображения являются числовые характеристики случайного процесса. Наиболее часто используемые из них: яркостные характеристики, текстурные характеристики, энергетические характеристики и признаки стохастической геометрии.
ГЛАВА 2. ОБНАРУЖЕНИЕ И РАСПОЗНАВАНИЕ ОБРАЗОВ НА ИЗОБРАЖЕНИЯХ
2.1 Задачи распознавания образов на изображениях
Способность «распознавать» считается основным свойством человеческих существ и других живых организмов. Образ представляет собой описание объекта. Мы опознаем окружающие нас объекты и в соответствии с этим перемещаемся и совершаем определенные действия. Например, можно узнать знакомое лицо, голос друга, прочесть рукопись, отличить улыбку от злобной гримасы. Человеческое существо представляет собой сложную информационную систему – это определяется развитыми у человека способностями распознавать образы.
В соответствии с характером распознаваемых объектов акты распознавания можно разделить на два основных типа: распознавание конкретных объектов и распознавание абстрактных объектов. Мы распознаем символы, рисунки, музыку и объекты, которые нас окружают. Процесс, включающий распознавание зрительных и слуховых образов, можно определить как «сенсорное» распознавание. Но мы с состоянии и с закрытыми ушами и глазами опознать старый довод или найти решение задачи. Такие процессы обеспечивают распознавание абстрактных объектов и их можно определить как «понятийное» распознавание. Мы будем иметь дело с распознаванием первого типа. Примерами образов могут служить символы, отпечатки пальцев, карты, физические объекты, рисунки.
Распознавание человеком конкретных образов можно рассматривать как задачу, связанную с процессом взаимодействия индивида с определенным раздражителем. Когда индивид воспринимает образ, он реализует процесс индуктивного вывода и устанавливает ассоциативную связь между своим восприятием и определенным обобщенным понятием, установленным им в прошлом. Распознавание человеком образом можно свести к вопросу оценки относительных шансов на то, что исходные данные соответствуют тому или иному из известных множеств статистических совокупностей, определяющихся прошлым опытом человека и дающих ориентиры и априорную информацию для распознавания. Таким образом, задачу распознавания можно рассматривать как задачу установления различий между исходными данными, причем не посредством отождествления с отдельными образами, но с их совокупностями; последнее осуществляется при помощи поиска признаков на множестве объектов, образующих определенную совокупность.
В задачах распознавания образов можно выделить два основных направления.
1) Изучение способностей к распознаванию, которыми обладают живые организмы.
2) Развитие теории и методов построения устройств, предназначенных для решения проблемы распознавания образов в прикладных областях.
Мы будем говорить о втором направлении: о вычислительных машинах, информатике и технических аспектах построения автоматических систем распознавания образов.
Распознавание образов можно определить как отнесение исходных данных к определенному классу с помощью выделения существенных признаков и свойств, характеризующих именно эти данные, из общей массы деталей.
Перейдем теперь именно к вопросу о распознавании образа на изображении.
Круг задач можно разделить на две группы:
1) распознавание и классификация изображений;
2) поиск и распознавание объектов на изображениях.
К первой группе задач распознавание производится для всего изображения целиком, т.е. все изображение целиком относят к одному из нескольких классов. Решением задачи распознавания в этой группе является реализация отображения: изображение – номер класса. Данное отображение реализуется в виде следующих двух отображений: отображения изображение-признаки и отображения признаки-класс.
Примеры задач первой группы: распознавание лиц по фотографиям, распознавание отпечатков, диагностика заболеваний по снимку органа и многое другое.
В задачах второй группы процесс распознавания оказывается включенным в общую технологию обработки изображения, связанную с поиском распознаваемых геометрических объектов на всей области наблюдения. Объекты в данном случае представляют собой локальные области, появление которых может произойти в любой точке изображения.
Результатом решения задачи распознавания в данном случае является не только класс найденного изображения, но и его характеристики.
Примеры задач второй группы: дешифрование аэрокосмических снимков, автоматическое чтение текстов и другие.
Решение задач второй группы представлено в схеме ниже.
В соответствии с этой схемой анализу подвергается каждый фрагмент на изображении. По текущему фрагменту, выделенному окном обработки, производится формирование признаков и классификация. В зависимости от классификации происходит расчёт дополнительных параметров объекта.
В более широком понимании задачи второй группы относятся к группам задач высокого уровня – задачам анализа наблюдаемого изображения или сцены. Под анализом сцены понимается составление полного описания изображенных на снимке предметов с указанием их местоположения и взаимного расположения.
2.2 Формирование признаков по изображению
Формирование признаков — первый этап в любой системе распознавания образов. И качество всей системы оказывается зависимо от того, насколько хорошо подобраны признаки для описания объекта — в данном случае изображения. Задача формирования признаков сложна, потому что процесс описания изображения, или построения набора признаков, до настоящего времени остается процедурой, зависимой от опыта и квалификации разработчика. Поэтому при разработке каждой новой системы распознавания чаще всего даже специалистам в распознавании образов приходится решать ее заново, ориентируясь на специфику обрабатываемых изображений и изображенных на них объектов.
В рассматриваемой нами главе представлены математические методы и алгоритмы, используемые для формирования описания изображений и эффективно применяемые для решения целого ряда задач распознавания на изображениях, представлены основные требования, которые обычно предъявляются к формируемым признакам изображения и выделены методы и алгоритмы, используемые для удовлетворения этим требованиям.
Основным требованием к используемой системе признаков данного изображения является требование эффективности процесса распознавания. Это требование имеет ряд аспектов:
Требование инвариантности для ряда практических задач оказывается достаточно общим. Оно подразумевает все или некоторые из следующих требований:
Инвариантность к данным искажениям достигается за счёт предварительного преобразования исходного изображения. Первая группа искажений, связанная с шумовыми и динамическими изменениями изображения, устраняется за счёт использования методов и алгоритмов восстановления. Яркостные искажения, относящиеся ко второй группе, могут быть эффективно устранены за счёт приведения изображения к «нормализованному» виду.
1) Нормализация изображений при вычислении признаков.
Под нормализацией будем понимать такое преобразование изображение, которое позволяет привести его к виду, удобному для распознавания. В качестве стандарта для нормализованного изображения могут выступать средняя яркость, разброс или дисперсии яркости на изображении, ориентация изображенного объекта, его размеры и т.д.
В соответствии с подразделением задач распознавания на две группы наблюдается соответствующее разделение на группы для алгоритмов нормализации. Это связано с особенностями реализации вычислений при нормализации изображения в целом – глобальная нормализация, либо его фрагментов – локальная нормализация.
Математические же основы и методы оказываются одинаковыми. Они подразделяются в соответствие с требованиями инвариантности к признакам, представленным ранее. Основными являются следующие: яркостная нормализация, нормализация положения объекта, нормализация масштаба объекта, нормализация ориентации объекта.
2) Нормализация масштаба объекта. Изменение масштаба объекта приводит к тому, что доля относящихся к объекту отсчетов будет увеличена или уменьшена пропорционально квадрату величины изменения линейных размеров. Пусть K - доля площади изображения, занятая объектом на эталонном изображении, µ0 = A0 + A и µB = A – средние объекта и фона. При изменении масштаба средние изображения изменяются в соответствии с изменением доли k отсчетов, относящихся к объекту: µf = k µ0 + (1- k) µb, откуда
В результате линейное изменение масштаба
При реализации этого алгоритма для локальной нормализации масштаба, величина среднего с точностью до постоянного множителя может быть эффективно вычислена с использованием параллельно-рекурсивного алгоритма.
3) Нормализация ориентации объекта. Геометрический подход основан на использовании степенных моментов.
Выберем в качестве нормализованной ориентации положение центрированного изображения, при котором момент второго порядка µ11=0. Для симметричного объекта данное условие соответствует ситуации ,когда ось симметрии объекта расположена вдоль оси абсцисс или ординат.
Пусть изображение повёрнуто относительно своего нормализованного положения. Тогда соответствие между моментами первого и второго порядка запишется так:
-
Здесь µ11(0) = 0 – момент нормализованного изображения, φ – угол поворота изображения против часовой стрелки, относительно начального положения. Тогда
= ,
Это выражение определяет ориентацию неоднозначно, а с точностью до поворота на tπ/2. Для однозначного ориентирования изображения можно воспользоваться значениями моментов µ02, µ20, µ30 так: в выражении выше коэффициент t выбирается исходя из условий:
t =
В случае нормализации бинарного изображения можно использовать статистический подход. Тогда в качестве ориентации объекта выбирают направление собственного вектора xλ матрицы ковариации B координат отсчётов ненулевой яркости. При этом собственный вектор должен соответствовать максимальному собственному числу λmax матрицы ковариации.
К определению ориентации по собственному вектору матрицы ковариации: «- - >» - собственный вектор, соответствующий максимальному собственному числу, «- - - >» - собственный вектор, соответствующий минимальному собственному числу, «----- >» - оси координат изображения.
Пусть матрицы ковариации имеет вид B= , возможные собственные значения λ находятся из уравнения (B-λE) xλ =0, где Е – единичная матрица, xλ – собственный вектор, соответствующий числу λ. Из данного уравнения получим
Тогда собственный вектор, соответствующий λmax, равен
Cоответствует углу наклона φ такому, что
Для центрированного изображения , ,