Автор работы: Пользователь скрыл имя, 12 Мая 2013 в 11:02, реферат
Образ представляет собой описание объекта. Распознавание образов можно рассматривать как задачу установлений различий между исходными данными. Это осуществляется при помощи поиска признаков (инвариантных свойств) на множестве объектов, образующих определенную совокупность.
В задачах распознавания образов можно выделить два основных направления.
Изучение способностей к распознаванию, которыми обладает человек и другие живые организмы.
Развитие теории и методов построения устройств, предназначенных для решения отдельных задач распознавания образов в определенных прикладных областях.
Образ представляет собой описание объекта. Распознавание образов можно рассматривать как задачу установлений различий между исходными данными. Это осуществляется при помощи поиска признаков (инвариантных свойств) на множестве объектов, образующих определенную совокупность.
В задачах распознавания образов можно выделить два основных направления.
Первое направление связано с такими дисциплинами, как психология, физиология и биология, второе же имеет дело в первую очередь с техникой, вычислительными машинами и информатикой.
В соответствии с характером распознаваемых образов акты распознавания можно разделить на два основных типа:
Процесс, включающий распознавание зрительных и слуховых образов, можно определить как "сенсорное" распознавание. Процессы этого типа обеспечивают идентификацию и классификацию пространственных и временных образов.
Распознавание абстрактных объектов можно определить как "понятийное" распознавание в отличие от зрительного или слухового распознавания. Будут рассмотрены методы, относящиеся к распознаванию первого типа.
Распознавание представляет собой задачу преобразования входной информации, в качестве которой рассматриваются некоторые параметры, признаки распознаваемых образов, в выходную, представляющую собой заключение о том, к какому классу относится распознаваемый образ.
Основные понятия теории распознавания образов
Определение 1. Под классом образов понимается некоторая категория, определяющаяся рядом свойств, общих для всех ее элементов.
Определение 2. Образ – это описание любого элемента как представителя соответствующего класса образов.
В случае, когда множество образов разделяется на непересекающиеся классы, желательно использовать для отнесения этих образов к соответствующим классам какое-либо автоматическое устройство. Подобные задачи могут выполняться и людьми; машина, однако, справляется с ними намного быстрее. С другой стороны, некоторые задачи распознавания таковы, что человек едва ли в состоянии решать их. Примером задач такого рода служит выделение из множества морских сигналов и шумов тона подводной лодки посредством анализа подводных звуковых сигналов.
Основные задачи, возникающие при разработке систем
распознавания образов
Задачи, возникающие при построении автоматической системы распознавания образов, можно обычно отнести к нескольким основным областям.
Первая из них связана с представлением исходных данных, полученных как результаты измерений для подлежащего распознаванию объекта. Это проблема чувствительности. Каждая измеренная величина является некоторой характеристикой образа или объекта. Допустим, например, что образами являются буквенно-цифровые символы. В таком случае в датчике может быть успешно использована измерительная сетка. Если сетка состоит из п элементов, то результаты измерений можно представить в виде вектора измерений или вектора образа
где каждый элемент принимает, например, значение 1, если через i-ю ячейку сетки проходит изображение символа, и 0 в противном случае. В последующем изложении будем называть векторы образов просто образами в тех случаях, когда это не приводит к изменению смысла. Процесс измерения, которому подвергаются объекты определенного класса образов, можно рассматривать как процесс кодирования, заключающийся в присвоении каждой характеристике образа символа из множества элементов алфавита .
Вторая задача распознавания образов связана с выделением характерных признаков или свойств из полученных исходных данных и снижением размерности векторов образов. Эту задачу часто определяют как задачу предварительной обработки и выбора признаков.
Признаки классов образов представляют собой характерные свойства, общие для всех образов данного класса. Признаки, характеризующие различия между отдельными классами, можно интерпретировать как межклассовые признаки. Внутриклассовые признаки, общие для всех рассматриваемых классов, не несут полезной информации с точки зрения распознавания и могут не приниматься во внимание. Выбор признаков считается одной из важных задач, связанных с построением распознающих систем. Если результаты измерений позволяют получить полный набор различительных признаков для всех классов, собственно распознавание и классификация образов не вызовут особых затруднений. Автоматическое распознавание тогда сведется к процессу простого сопоставления или процедурам типа просмотра таблиц. В большинстве практических задач распознавания, однако, определение полного набора различительных признаков оказывается делом исключительно трудным, если вообще не невозможным. К счастью, из исходных данных обычно удается извлечь некоторые из различительных признаков и использовать их для упрощения процесса автоматического распознавания образов. В частности, размерность векторов измерений можно снизить с помощью преобразований, обеспечивающих минимизацию потери информации.
Третья задача, связанная с построением систем распознавания образов, состоит в отыскании оптимальных решающих процедур, необходимых при идентификации и классификации. После того, как данные, собранные о подлежащих распознаванию образах, представлены точками и векторами измерений в пространстве образов, предоставим машине выяснить, какому классу образов эти данные соответствуют.
Пусть машина предназначена для различения М классов, обозначенных . В таком случае, пространство образов можно считать состоящим из М областей, каждая из которых содержит точки, соответствующие образам одного класса. При этом задача распознавания может рассматриваться как построение границ областей решений, разделяющих М классов, исходя из зарегистрированных векторов измерений. Пусть эти границы определены, например, решающими функциями . Эти функции, называемые также дискриминантными функциями, представляют собой скалярные и однозначные функции образа х. Если для всех , то образ х принадлежит классу . Другими словами, если i-я решающая функция имеет наибольшее значение, то .
Решающие функции можно получать целым рядом способов. В тех случаях, когда о распознаваемых образах имеются полные априорные сведения, решающие функции могут быть определены точно на основе этой информации. Но, как правило, мы обладаем лишь немногочисленными (если они вообще имеются!) априорными сведениями о распознаваемых образах. В этих условиях при построении распознающей системы лучше всего использовать обучающую процедуру. На первом этапе выбираются произвольные решающие функции и затем в процессе выполнения итеративных шагов обучения эти решающие функции доводятся до оптимального либо приемлемого вида. Классификацию объектов с помощью решающих функций можно осуществлять самыми различными способами. Существуют детерминистские и статистические алгоритмы нахождения решающих функций.
Основные принципы построения систем распознавания
В основе идеи синтеза систем автоматического распознавания лежат способы, с помощью которых описываются и разделяются классы образов.
Под кластером понимают группу образов, образующих в пространстве описания компактную область или компактное множество. Под компактным множеством, например, изображений будем понимать множество точек в пространстве изображений со следующими свойствами:
1. Принцип перечисления членов класса
Задание класса перечислением образов, входящих в его состав, предполагает реализацию процесса автоматического распознавания образов посредством сравнения с эталоном. Множество образов, принадлежащих одному классу, запоминается системой распознавания. При предъявлении системе незнакомых (новых) образов она последовательно сравнивает их с хранящимися в ее памяти. Система распознавания относит новый образ к тому классу, к которому принадлежал находящийся в её памяти образ, совпавший с новым. Если, например, в память системы распознавания введены литеры различных наборных шрифтов, то подход, основанный на перечислении членов класса, позволяет распознать соответствующие буквы, но только в тех случаях, когда их изображения не искажены шумом, связанным с размазыванием или плохим нанесением краски. Несмотря на то, что этот метод несложный, однако он позволяет строить недорогие системы распознавания, которые в отдельных прикладных областях вполне справляются со своими задачами. Метод перечисления классов работает удовлетворительно, если выборка образов близка к идеальной (классы состоят из большого числа элементов, и каждый элемент описывается значениями большого числа признаков).
2. Принцип общности свойств
.
Задание класса с помощью свойств, общих для всех входящих в его состав членов, предусматривает реализацию процесса автоматического распознавания путем выделения подобных признаков и работы с ними. Основное допущение в этом методе заключается в том, что образы, принадлежащие одному и тому же классу, обладают рядом общих свойств или признаков, отражающих подобие таких образов. Эти общие свойства можно, в частности, ввести в память системы распознавания. Когда системе предъявляется неклассифицированный образ, то выделяется набор описывающих его признаков, причем последние иногда кодируются, и затем они сравниваются с признаками, заложенными в память системы распознавания. В таком случае, последняя зачислит предъявленный для распознавания образ в класс, характеризующийся системой признаков, подобным признакам этого образа. Итак, при использовании данного метода основная задача заключается в выделении ряда общих свойств по конечной выборке образов, принадлежность которых искомому классу известна. Вполне очевидно, что эта концепция распознавания во многих отношениях превосходит распознавание по принципу перечисления членов класса. Для запоминания признаков класса требуется значительно меньше памяти, чем для хранения всех объектов входящих в класс. Поскольку признаки, характеризующие класс в целом, обладают инвариантностью, принцип сопоставления признаков допускает вариацию характеристик отдельных образов. Процедура сопоставления с эталоном, с другой стороны, не допускает существенных вариаций характеристик отдельных образов. Если все признаки, определяющие класс, можно найти по имеющейся выборке образов, то процесс распознавания сводится просто к сопоставлению по признакам. Исключительно трудно, если не невозможно вообще, найти для некоторого класса полный набор различающих признаков. Следовательно, обращение к этому принципу распознавания часто связано с необходимостью развития методов выбора признаков, являющихся оптимальными.
3. Принцип кластеризации
Когда образы некоторого класса представляют собой векторы, компонентами которых являются действительные числа, этот класс можно рассматривать как кластер и выделять только его свойства в пространстве образов кластера. Построение систем распознавания, основанных на реализации данного принципа, определяется взаимным пространственным расположением отдельных кластеров. Если кластеры, соответствующие различным классам, разнесены достаточно далеко друг от друга, то с успехом можно воспользоваться сравнительно простыми схемами распознавания (например, классификация по принципу минимального расстояния). Если кластеры перекрываются, приходится обращаться к более сложным методам разбиения пространства образов. Перекрытие кластеров является результатом неполноценности доступной информации и шумовых искажений результатов измерения.
Для реализации основных принципов построения автоматических систем распознавания образов, существуют три основных метода: эвристический, математический и лингвистический (синтаксический). Нередко системы создаются на основе комбинации этих методов.
1. Эвристические методы
За основу эвристического подхода взяты интуиция и опыт человека, в нем используются принципы перечисления членов класса и общности свойств. Хотя эвристический подход играет большую роль в построении систем распознавания образов, решение каждой конкретной задачи требует использования специфических приемов разработки системы. Следовательно, структура и качество эвристической системы в значительной степени определяются одаренностью и опытом разработчиков.
2. Математические методы
В основу математического подхода положены правила классификации, которые формулируются и выводятся в рамках определенного математического формализма с помощью принципов общности свойств и кластеризации. Математические методы построения систем распознавания можно разделить на два класса: детерминистские и статистические. Первый подход базируется на математическом аппарате, не использующем в явном виде статистические свойства изучаемых классов образов. Статистический подход основывается на математических правилах классификации, которые формулируются и выводятся в терминах математической статистики.
3. Лингвистические (синтаксические) методы
Если описание образов производится с помощью непроизводных элементов (подобразов) и их отношений, то для построения автоматических систем распознавания применяется лингвистический или синтаксический подход с использованием принципа общности свойств.
Информация о работе Основные понятия теории распознавания образов