Распознавание объектов на изображении

Автор работы: Пользователь скрыл имя, 24 Марта 2013 в 23:39, курсовая работа

Описание работы

Целью данной работы является изучение темы обнаружения и распознавания образов на изображениях. Распознавание образов (а часто говорят - объектов, ситуаций, явлений или процессов) - самая распространенная задача, которую человеку приходится решать практически ежесекундно. Поэтому мы ознакомимся с понятием распознавания и обнаружения изображения, а также локализации объектов, рассмотрим некоторые существующие методы для решения проблемы нахождения образов. Так как теории и методы распознавания образов по своему характеру являются математическими дисциплинами, то необходимо остановиться на уровне математической строгости, принятом в нашем изложении материала.

Содержание работы

Введение…………………………………………………………………………………………………..3
Глава 1. Распознавание изображений……………………………………………………………………4
1.1 Вероятностный критерий качества классификации………………………….…….……..4
1.2 Оптимальные стратегии статистической классификации………………………….…….5
1.3 Основные группы признаков, используемых при распознавании изображений……………………………………………………………………………………………….6
Глава 2. Обнаружение и распознавание объектов на изображениях……………………….…….……7
2.1 Задачи распознавания на изображениях…………………………………………….……..7
2.2 Формирование признаков по изображению…………………………………...…….…….9
2.3 Обнаружение и локализация объектов на изображении……………………..…….…….12
2.3.1 Критерии локализации объектов……………………………………….…….…....13
2.3.2 Совместное обнаружение и локализация объектов…………………..…….…….14
Глава 3. Простая модель распознавания образов………………………………………………….……17
Приложение. Пример программы по распознаванию объекта на изображении и нахождению некоторых его геометрических характеристик…………………………………….…….…….…….…19
Заключение……………………………………..……………………………………………...…….……21
Список литературы…………………

Файлы: 1 файл

распознавание 2год.docx

— 853.65 Кб (Скачать файл)

      В заключение рассмотрения группы геометрических признаков укажем основные свойства применительно к задаче распознавания:

  • возможность обеспечения инвариантности к преобразованиям подобия изображенного объекта;
  • низкая помехоустойчивость.

      Эти свойства говорят о том, что геометрические признаки могут использоваться в задачах распознавания, которые характеризуются объектами с ярко выраженной геометрической структурой и малым уровнем шумов и искажений.

 

   2) Топологические признаки. К данной группе относятся признаки, характеризующие топологические свойства изображенного объекта, то есть те свойства, которые остаются инвариантными относительно топологических и гомеоморфных отображениях. Топологические признаки инвариантны к широкому кругу геометрических преобразований: преобразованиям подобия, аффинным преобразованиям и многим другим. Приведём некоторые из таких признаков: число связных компонентов объекта, число «дыр» в объекте, число Эйлера.

  Топологические признаки  могут быть применены в редких  случаях и при малом уровне искажений, связанных с исчезновением или появлением частей объектов. 

  3) Вероятностные признаки используются для описания функции яркости на изображении. Функцию яркости используют как реализацию случайного процесса (процессов). В этом случае признаками изображения являются числовые характеристики случайного процесса. Наиболее часто используемые из них: яркостные характеристики, текстурные характеристики, энергетические характеристики и признаки стохастической геометрии.

 

ГЛАВА 2. ОБНАРУЖЕНИЕ И РАСПОЗНАВАНИЕ ОБРАЗОВ НА ИЗОБРАЖЕНИЯХ

 

2.1 Задачи распознавания образов на изображениях

 

      Способность «распознавать» считается основным свойством человеческих существ и других живых организмов. Образ представляет собой описание объекта. Мы опознаем окружающие нас объекты и в соответствии с этим перемещаемся и совершаем определенные действия. Например, можно узнать знакомое лицо, голос друга, прочесть рукопись, отличить улыбку от злобной гримасы. Человеческое существо представляет собой сложную информационную систему – это определяется развитыми у человека способностями распознавать образы.

       В соответствии  с характером распознаваемых объектов акты распознавания можно разделить на два основных типа: распознавание конкретных объектов и распознавание абстрактных объектов. Мы распознаем символы, рисунки, музыку и объекты, которые нас окружают. Процесс, включающий распознавание зрительных и слуховых образов, можно определить как «сенсорное» распознавание. Но мы с состоянии и с закрытыми ушами и глазами опознать старый довод или найти решение задачи. Такие процессы обеспечивают распознавание абстрактных объектов и их можно определить как «понятийное» распознавание. Мы будем иметь дело с распознаванием первого типа. Примерами образов могут служить символы, отпечатки пальцев, карты, физические объекты, рисунки.

        Распознавание человеком конкретных образов можно рассматривать как задачу, связанную с процессом взаимодействия индивида с определенным раздражителем. Когда индивид воспринимает образ, он реализует процесс индуктивного вывода и устанавливает ассоциативную связь между своим восприятием и определенным обобщенным понятием, установленным им в прошлом. Распознавание человеком образом можно свести к вопросу оценки относительных шансов на то, что исходные данные соответствуют тому или иному из известных множеств статистических совокупностей, определяющихся прошлым опытом человека и дающих ориентиры и априорную информацию для распознавания. Таким образом, задачу распознавания  можно рассматривать как задачу установления различий между исходными данными, причем не посредством отождествления с отдельными образами, но с их совокупностями; последнее осуществляется при помощи поиска признаков на множестве объектов, образующих определенную совокупность.

      В задачах распознавания образов можно выделить два основных направления.

       1) Изучение способностей к распознаванию, которыми обладают живые организмы.

       2) Развитие теории и методов построения устройств, предназначенных для решения проблемы распознавания образов в прикладных областях.

    Мы будем говорить о втором направлении: о вычислительных машинах, информатике и технических аспектах построения автоматических систем распознавания образов.

    Распознавание образов можно определить как отнесение исходных данных к определенному классу с помощью выделения существенных признаков и свойств, характеризующих именно эти данные, из общей массы деталей.

     Перейдем теперь именно к вопросу о распознавании образа на изображении.

     Круг задач можно разделить на две группы:

       1) распознавание и классификация изображений; 

       2) поиск и распознавание объектов на изображениях.

     К первой группе задач распознавание производится для всего изображения целиком, т.е. все изображение целиком относят к одному из нескольких классов. Решением задачи распознавания в этой группе является реализация отображения: изображение – номер класса. Данное отображение реализуется в виде следующих двух отображений: отображения изображение-признаки и отображения признаки-класс.

 

    Примеры задач первой группы: распознавание лиц по фотографиям, распознавание отпечатков, диагностика заболеваний по снимку органа и многое другое.

   В задачах второй группы процесс распознавания оказывается включенным в общую технологию обработки изображения, связанную с поиском распознаваемых геометрических объектов на всей области наблюдения. Объекты в данном случае представляют собой локальные области, появление которых может произойти в любой точке изображения.

    Результатом решения задачи распознавания в данном случае является не только класс найденного изображения, но и его характеристики.

    Примеры задач второй группы: дешифрование аэрокосмических снимков, автоматическое чтение текстов и другие.

    Решение задач второй группы представлено в схеме ниже.

 


   

 

 

 

 

 

 

 

 

 

 

    В соответствии с этой схемой анализу подвергается каждый фрагмент на изображении. По текущему фрагменту, выделенному окном обработки, производится формирование признаков и классификация. В зависимости от классификации происходит расчёт дополнительных параметров объекта.

   В более широком понимании задачи второй группы относятся к группам задач высокого уровня – задачам анализа наблюдаемого изображения или сцены. Под анализом сцены понимается составление полного описания изображенных на снимке предметов с указанием их местоположения и взаимного расположения.

 

2.2 Формирование признаков по изображению

 

    Формирование признаков — первый этап в любой системе распознавания образов. И качество всей системы оказывается зависимо от того, насколько хорошо подобраны признаки для описания объекта — в данном случае изображения. Задача формирования признаков сложна, потому что процесс описания изображения, или построения набора признаков, до настоящего времени остается процедурой, зависимой от опыта и квалификации разработчика. Поэтому при разработке каждой новой системы распознавания чаще всего даже специалистам в распознавании образов приходится решать ее заново, ориентируясь на специфику обрабатываемых изображений и изображенных на них объектов.

    В рассматриваемой нами главе представлены математические методы и алгоритмы, используемые для формирования описания изображений и эффективно применяемые для решения целого ряда задач распознавания на изображениях, представлены основные требования, которые обычно предъявляются к формируемым признакам изображения и выделены методы и алгоритмы, используемые для удовлетворения этим требованиям.

    Основным требованием к используемой системе признаков данного изображения является требование эффективности процесса распознавания. Это требование имеет ряд аспектов:

  • оно предъявляет к признакам требования вычислительного характера, которые заключаются в том, чтобы существовал алгоритм расчёта признаков, и этот алгоритм был вычислительно эффективен;
  • требование эффективности приводит к необходимости удовлетворения требования устойчивости или инвариантности образа к ряду искажений объекта.

    Требование инвариантности для ряда практических задач оказывается достаточно общим. Оно подразумевает все или некоторые из следующих требований:

  • инвариантность к шумовым и динамическим искажениям;
  • инвариантность к яркостным искажениям (изменению яркости и кон-
  • траста);
  • инвариантность к изменению местоположения объекта;
  • инвариантность к изменению масштаба объекта;
  • инвариантность к изменению ориентации объекта (к повороту объекта в
  • плоскости изображения);
  • инвариантность к произвольным аффинным преобразованиям.

    Инвариантность к данным искажениям достигается за счёт предварительного преобразования исходного изображения. Первая группа искажений, связанная с шумовыми и динамическими изменениями изображения, устраняется за счёт использования методов и алгоритмов восстановления. Яркостные искажения, относящиеся ко второй группе, могут быть эффективно устранены за счёт приведения изображения к «нормализованному» виду.

 

 

 

  1) Нормализация изображений при вычислении признаков.

    Под нормализацией будем понимать такое преобразование изображение, которое позволяет привести его к виду, удобному для распознавания. В качестве стандарта для нормализованного изображения могут выступать средняя яркость, разброс или дисперсии яркости на изображении, ориентация изображенного объекта, его размеры и т.д.

    В соответствии с подразделением задач распознавания на две группы наблюдается соответствующее разделение на группы для алгоритмов нормализации. Это связано с особенностями реализации вычислений при нормализации изображения в целом – глобальная нормализация, либо его фрагментов – локальная нормализация.

    Математические же основы и методы оказываются одинаковыми. Они подразделяются в соответствие с требованиями инвариантности к признакам, представленным ранее. Основными являются следующие: яркостная нормализация, нормализация положения объекта, нормализация масштаба объекта, нормализация ориентации объекта.

 

 2) Нормализация масштаба объекта. Изменение масштаба объекта приводит к тому, что доля    относящихся к объекту отсчетов будет увеличена или уменьшена пропорционально квадрату величины изменения линейных размеров. Пусть K - доля площади изображения, занятая объектом на эталонном изображении, µ0 = A0 + A и µB = A – средние объекта и фона. При изменении масштаба средние изображения изменяются в соответствии с изменением доли k отсчетов, относящихся к объекту: µf = k µ0 + (1- k) µb, откуда

 

 

 

    В результате линейное изменение масштаба

 

 

 

    При реализации этого алгоритма для локальной нормализации масштаба, величина среднего с точностью до постоянного множителя может быть эффективно вычислена с использованием параллельно-рекурсивного алгоритма.

 

 

  3) Нормализация ориентации объекта. Геометрический подход основан на использовании степенных моментов.  

    Выберем в качестве нормализованной ориентации положение центрированного изображения, при котором момент второго порядка µ11=0. Для симметричного объекта данное условие соответствует ситуации ,когда ось симметрии объекта расположена вдоль оси абсцисс или ординат.

    Пусть изображение повёрнуто относительно своего нормализованного положения. Тогда соответствие между моментами первого и второго порядка запишется так:

 

-

 

    Здесь µ11(0) = 0 – момент нормализованного изображения, φ – угол поворота изображения против часовой стрелки, относительно начального положения.  Тогда

 

= ,        

 

    Это выражение определяет ориентацию неоднозначно, а с точностью до поворота на tπ/2. Для однозначного ориентирования изображения можно воспользоваться значениями моментов µ02, µ20, µ30  так: в выражении выше коэффициент t выбирается исходя из условий:

 

t  =

 

   В случае нормализации бинарного изображения можно использовать статистический подход. Тогда в качестве ориентации объекта выбирают направление собственного вектора xλ матрицы ковариации B координат отсчётов ненулевой яркости. При этом собственный вектор должен соответствовать максимальному собственному числу λmax матрицы ковариации.

 

 

 К определению ориентации по собственному вектору матрицы ковариации: «- - >» - собственный вектор, соответствующий максимальному собственному числу, «- - - >» - собственный вектор, соответствующий минимальному собственному числу, «----- >» - оси координат изображения.

 

 

 

 

 

 

      Пусть матрицы ковариации имеет вид B= ,  возможные собственные значения λ находятся из уравнения (B-λE) xλ =0,  где Е – единичная матрица, xλ – собственный вектор, соответствующий числу λ. Из данного уравнения получим

 

 

 

 

    Тогда собственный вектор, соответствующий λmax, равен

 

 

 

    Cоответствует углу наклона φ такому, что

 

 

 

      Для центрированного изображения , ,

Информация о работе Распознавание объектов на изображении