Автор работы: Пользователь скрыл имя, 17 Июня 2013 в 16:36, дипломная работа
Задач, поставленных на дипломную работу несколько:
Подробно рассмотреть и проанализировать существующие системы, занимающиеся распознаванием трехмерных объектов;
Рассмотреть алгоритмы предварительной обработки и выбрать оптимальные из них;
Рассмотреть признаки, применяемые для распознавания трехмерных объектов, а также выбрать оптимальные из них для реализации в ИС;
Сформировать структурно-функциональную схему СТЗ для распознавания объектов;
Реализовать алгоритм вычисления оценок;
Реализовать нахождение значений признаков объектов;
Реализовать построение моделей октодеревьев объектов;
Рисунок 1.18 - Представление в форме октодерева квадратной области плоскости ху, содержащей одну цветную область на фоне другого цвета
Кодирование в форме октодерева
позволяет существенно
Схема кодирования в форме октодерева делит область трехмерного пространства (обычно куб) на октанты и записывает восемь элементов данных в каждом узле дерева, как показано на рисунке 1.19. Отдельные подобласти после конечного этапа разбиения трехмерного пространства называются элементами объема или вокселями (voxels) по аналогии с пикселями прямоугольной области на экране дисплея. Воксель в представлении в форме октодерева хранит значения свойств для однородной подобласти пространства. Свойства объектов в трехмерной области пространства могут включать цвет, тип материала, плотность и другие физические характеристики. Например, в выбранной области пространства могут быть такие объекты, как скалы и деревья или ткани, кости и органы тела. Пустые области пространства представлены типом вокселей “void” (“пусто”). Как и для представления в форме квадродерева, неоднородный октант в области делится до тех пор, пока фрагменты не станут однородными. Для октодерева каждый узел может иметь от нуля до восьми непосредственных потомков.
Рисунок 1.19 - Куб, разделенный на нумерованные октанты, и соответствующий узел октодерева с восемью элементами данных
Признаком изображения называется его простейшая отличительная характеристика или свойство. Некоторые признаки являются естественными в том смысле, что они устанавливаются визуальным анализом изображения, тогда как другие, так называемые искусственные признаки, получаются в результате его специальной обработки или измерений. К естественным признакам относятся светлота (яркость) и текстура различных областей изображения, форма контуров объектов. Гистограммы распределения яркости и спектры пространственных частот дают примеры искусственных признаков.
Некоторые исследователи пытались дать качественное определение текстуры. Пикетт дал такую формулировку: «текстура используется для описания двумерных массивов изменений яркости. Элементы текстуры и правила их пространственной организации или расположения можно произвольно менять, если только остаются неизменными характеристики повторяемости изменений яркости». Хоукинс дал более подробное описание текстуры: «По-видимому, текстура охватывает следующие свойства изображения: 1) в нем можно найти фрагмент, «рисунок» которого регулярно повторяется в пределах области, которая велика по сравнению с размером фрагмента; 2) этот «рисунок» образуется элементарными составными частями фрагмента, размещенными в некотором неслучайном порядке; 3) элементарные части - это примерно однородные единицы, имеющие приблизительно одинаковую форму во всей текстурной области». Хотя эти описания текстуры кажутся разумными, они не приводят непосредственно к простым количественным признакам текстуры в том смысле, в котором представление о резком перепаде яркости ведет к количественному его определению через параметры, характеризующие положение перепада в пространстве, крутизну и высоту.
Резкие изменения (разрывы) яркости,
координат цвета или
Основной способ контрастирования
перепадов с последующим
Для распознавания трехмерных объектов используются такие признаки как: топологические, геометрические и текстурные. Эти признаки являются основными и ни одна идентификация объектов не проводится без учитывания данных признаков.
Тополо́гия - раздел математики, изучающий в самом общем виде явление непрерывности, в частности свойства пространства, которые остаются неизменными при непрерывных деформациях, например, связность, ориентируемость. В отличие от геометрии, в топологии не рассматриваются метрические свойства объектов (например, расстояние между парой точек). К топологическим признакам при обработке изображений относятся:
В задачах распознавания образов для классификации и селекции выделенных областей часто используются интегральные геометрические признаки. Обычно эти признаки задаются эвристически и характеризуют форму образа. К ним относятся следующие основные эвристики:
Сложно дать формальное определение таких понятий, как текстура, типы текстур, сходство текстур и т.д., которым человек обучается, в основном, по визуальным примерам. Человеческое зрение решает проблему соответствия текстур совершенно легко на подсознательном уровне, используя преимущественно "образное" полушарие головного мозга, или интуитивно. Примеры различных текстур изображены на рисунке 1.20.
Рисунок 1.20 - Примеры изображений с несколькими текстурными областями.
В качестве характеристик текстуры используются статистические, структурные и спектральные характеристики. Статистические характеристики пространственных распределений вычисляются как меры однородности изображения по одномерной гистограмме значений сигналов (характеристики 1-го порядка - среднее значение, дисперсия сигналов, второй момент) и по двумерным гистограммам значений сигналов (характеристики 2-го порядка - средняя мера однородности, корреляционная мера однородности, дисперсионная мера однородности, энтропия распределения значений, максимальная вероятность, контраст, обратный момент разности).[9]
Требования системы
Все существующие СТЗ похожи по своей структуре. Выделяются три основных блока представленных на рисунке 2.1.
Рисунок 2.1 - Обобщенная структура СТЗ, включающая переферийные устройства
В первом блоке рисунка 2.1 подразумевается система взаимодействия технических устройств и программной части СТЗ. Для существующих систем технического зрения важно поддерживать технические составляющие на высоком уровне и производить замену оборудования не по факту его износа, а при небольшом отставании в характеристиках от новейших производимых устройствах. В данный блок входят видеодатчики, сенсоры, а также системы освещения.
Во второй блок входят подсистемы программного обеспечения СТЗ:
В любых СТЗ производится первичная обработка полученных данных, а именно избавление от шумов, нормализация, а также бинаризация, если поступившая информация является изображением. В данной подсистеме производится обработка по известным всем алгоритмам, разработанных зачастую на заре развития информационных систем.
Подсистема выделения
Подсистема распознавания
На этапе формирования эталонов производится занесение информации об объектах-эталонах в базу данных. Основной частью для описания объектов в базе являются вычисленные признаки, точнее их значения.
В третий блок на рисунке 2.1 входит взаимодействие с техническими средствами, например роботами-манипуляторами. Результатом второго блока является идентифицированный объект, его координаты и месторасположение в пространстве. Техническим устройствам подается информация об объекте, а конкретно об его типе, угле поворота, возможно, его материале, фотографии и т.д.
Наиболее часто используемой моделью распознавания трехмерных объектов является структура, в которой в качестве исходной информации используется 2 снимка объекта с разных точек. Такая система (рисунок 2.2) используется в системе распознавания лиц VOCORD FaceControl 3D. Особенностью данной структуры является упрощение работы за счет уменьшения количества блоков. Снимки, поступающие на вход системе, обрабатываются одними алгоритмами, что сокращает время на создание систем, а также уменьшается количество ошибок.
Рисунок 2.2 – Структура СТЗ, используемая для распознавания трехмерных объектов, на основе снимков с двух камер
Для определения объемов, анализа размеров деталей, а также их захвата используется схема, применяемая на рисунке 2.3, в которой в качестве одного из блоков выступает 2D лазер. Данные лазером определяется расстояние до объекта, делается множество снимков, которые обрабатываются на следующем блоке. Минусом данной системы является разнородность поступаемых данных, что влияет на время создания системы, а также увеличивает время обработки поступающей информации.
Рисунок 2.3 – Структура СТЗ, используемая для распознавания трехмерных объектов, на основе снимков с камеры и 2D лазера
Для разрабатываемой системы выбирается первая структура СТЗ, а именно распознавание ведется с помощью двух камер. Рассматриваемые снимки не идеального качества, что требует от последующих блоков лучшей работы, а именно наилучшей первичной обработки, а также выделения признаков объекта.
При идентификации трехмерных изображений
ведется сравнение с уже
В системе VOCORD FaceControl 3D эталоном объекта является построенная модель лица. По координатам, имеющимся в системе, в базе данных, строится модель лица человека и сравнивается с реальным изображением. После снимка лица человека с двух камер строится его модель (рисунок 2.4), а именно с небольшим шагом отмечаются точки, лежащие на поверхность лица, и они сравниваются с эталонами объектов.
Рисунок 2.4 – Построенная сетка лица человека.
Важной особенностью эталонов объектов при идентификации лиц является взаимное расположение определенных точек на его лице, их удаленность друг от друга. Основные расстояния, необходимые для идентификации человека, показаны на рисунке 2.5.
Рисунок 2.5 – Необходимые размеры лица человека для идентификации личности
К основным размерам лица относятся:
При формировании базовых эталонов формируется и другие более специфические признаки, не раскрываемые фирмами-изготовителями.