Автор работы: Пользователь скрыл имя, 17 Июня 2013 в 16:36, дипломная работа
Задач, поставленных на дипломную работу несколько:
Подробно рассмотреть и проанализировать существующие системы, занимающиеся распознаванием трехмерных объектов;
Рассмотреть алгоритмы предварительной обработки и выбрать оптимальные из них;
Рассмотреть признаки, применяемые для распознавания трехмерных объектов, а также выбрать оптимальные из них для реализации в ИС;
Сформировать структурно-функциональную схему СТЗ для распознавания объектов;
Реализовать алгоритм вычисления оценок;
Реализовать нахождение значений признаков объектов;
Реализовать построение моделей октодеревьев объектов;
Другой подход к формированию базовых эталонов применяет компания Sick /IVP. Формирование эталонов происходит на основе трехмерной триангуляции. Важной особенностью в системах является применение 2D лазеров, поэтому в эталонах необходимо хранить общую структуру и профиль объекта. Структура эталона в данной системе является сложной. При формировании каждого снимка профиля объекта формируется набор признаков, что увеличивает затраты по потребляемой ЭВМ памяти. Основу набора признаков составляют ширина, высота объекта, а также количество точек контура(рисунок 2.6).
Рисунок 2.6 – Схема профиля объекта
Таким образом, в базе данных хранится вектор векторов признаков. Важным аспектом при распознавании является правильная подача объекта, чтобы сравнение производилось с первого вектора признаков. Очень важным является тот факт, что профили реальных объектов делаются ровно под таким же углом, что и профили объектов в базе данных.
Координаты центра площадного объекта определяются по известным формулам
,
где s – площадь объекта;
– яркость элемента объекта;
i, j – текущие координаты элементов объекта;
m, n – максимальные значения координат (i, j) элементов объекта. Определение координат центра объекта можно осуществить, используя формулу вычисления моментов
где – порядок момента
Координаты центра определяются так[10]
;
Длиной А объекта считается максимальное расстояние двумя внешними параллельными касательными и не пересекающими сам объект, к точкам ОЗЛ.
Рисунок 3.1 – Схема определения длины и ширины объекта
D шириной B объекта считается минимальное расстояние между двумя внешними параллельными касательными ( и ), не пересекающими сам объект, к точкам ОЗЛ (рисунок 3.1). Для определения длины и ширины объекта строят nz/2 пар параллельных касательных к точкам ОЗЛ (nz – количество точек объекта). Вычисляются евклидовые расстояния , между точками касания пар касательных. По результатам расчетов строят вариационный ряд V(a) расстояний между двумя парами касательных к ОЗЛ. По вариационному ряду V ( ) определяется длина А объекта как:
Определяется ширина В объекта как:
Существует возможность построения гистограмм H ( ) и h ( ) вычисления по ним статистических характеристик распределения .Значения А и В определяются для всех объектов. Формируются вариационные ряды V(A), V(B) и гистограммы Н(А), Н(В) распределений значений ширины и длины объектов
Определяется:
Максимальное значение А – ;
Максимальное значение В – ;
Минимальное значение A – ;
Минимальное значение В – ;
Сумма длин объектов – ;
Сумма ширин объектов – ;
Средняя длина объекта – ;
Средняя ширина объекта – [10]
1. Прямоугольный коэффициент
где la ,lb , – соответственно длины сторон описываемого вокруг объекта прямоугольника (рисунок 3.2).
Рисунок 3.2 - Схематическое представление объекта №1, вписанного в прямоугольник, a,b – стороны описанного прямоугольника
2. Диагональный коэффициент формы – отношение длины объекта (длина отрезка максимальной длины между двумя точками контура объекта) к длине диагонали описанного прямоугольника (диапазон значений от 0 до 1). Для объекта, изображенного на рисунке 3.3, диагональный коэффициент будет выглядеть следующим образом:
где – длина диагонали описанного прямоугольника, – длина объекта
Рисунок 3.3 - Схематическое представление объекта №2, вписанного в прямоугольник, c,d – диагонали описанного прямоугольника, e – длина отрезка максимальной длины между двумя точками контура объекта
3. Коэффициенты диагоналей
Диагонали объекта – отрезки, лежащие на диагоналях описанного вокруг него прямоугольника и соединяющие 2 точки контура объекта. На рисунке 3.4 диагоналями объекта являются FG’ и F’G. Обозначим их длины и .
Коэффициент диагонали объекта – отношение длины диагонали объекта к длине объекта.
4. Коэффициенты диагональных отрезков.
Вводятся понятия диагональных отрезков и коэффициентов диагональных отрезков. Диагональные отрезки описанного прямоугольника соединяют его вершины с серединой максимального отрезка объекта (рисунок 3.4 – HN, HM, HD, HE). Диагональные отрезки объекта лежат на диагональных отрезках описанного прямоугольника и соединяют середину максимального отрезка объекта с точкой пересечения ее контура (рисунок 3.4 – HG, HF, HF’, HG’). Для большинства объектов середина максимального отрезка совпадает с точкой пересечения диагоналей описанного вокруг него прямоугольника.
Коэффициенты диагональных отрезков – отношения длин соответствующих диагональных отрезков объекта, к диагональным отрезкам описанного вокруг него прямоугольника.
Рисунок 3.4 - Схематическое представление объекта №2, вписанного в прямоугольник.
Для объекта, изображенного на рисунок 3.4, диагональными отрезками будут: HG, HF, HF’, HG; для описанного прямоугольника: HN, HM, HD, HE. Их длины можно условно обозначить как с индексом соответствующего отрезка:
где , , , - коэффициенты диагональных отрезков объекта.
1 Коэффициент количества отверстий
где n – количество отверстий.
При n = 0, значение будет равно 1; при .
Данный набор признаков имеет одну общую особенность – диапазон значений от 0 до 1, что в свою очередь позволяет применять различные алгоритмы распознавания без дополнительных приведений к общему виду.
Кроме того, все предложенные признаки используют простую математику вычислений, при этом довольно подробно описывая основные отличительные особенности объектов.
Предложенный метод может быть применен в СТЗ для идентификации проекций трехмерных объектов на конвейере. [11]
Для распознавания трехмерного объекта была выбрана структура СТЗ, основанная на использовании двух снимков с камер, расположенных на расстоянии друг от друга. Сложность возникает с расположением объекта в поле зрения камер. Объект может лежать на разных гранях, а также может быть повернут под различными углами. На рисунке 3.5 отображена схема расположения камер и объекта в поле зрения камер.
Рисунок 3.5 - Схема макета СТЗ (1 – вид сбоку, 2 – вид сверху)
На данной схеме K1, K2 – видео датчики, изначальным условием является полное попадание объекта(G – на схеме) в поле зрения обеих камер. На рисунке также отображены возможные угла расположения объекта относительно камер в горизонтальной плоскости - α, а также угол наклона камеры K2 в вертикальной плоскости. Градус поворота объекта относительного центра рассматривается на рисунке 3.6.
Рисунок 3.6 - Поворот объекта в горизонтальной плоскости, угол φ, γ
Параллельно с вычислением угла α, рассчитывается угол φ – угол наклона объекта в горизонтальной плоскости относительного своего центра. Если в базе данных эталонов было принято, что проекция 1 является базовой (главной), то значения угла φ в данной плоскости будут следующими (рисунок 3.6):
1 – 0 градусов
2 – 90 градусов
3 – 180 градусов
4 – 270 градусов
Угол γ принимает те же значения что и угол φ, однако для этого объект вращается в другой плоскости относительно своего центра.
Общая схема структурная схема состоит из 14 блоков (рисунок 3.7). На первом этапе вычисляются углы поворота объекта в поле зрения камеры, а также устанавливается заранее известный угол поворота камеры относительно объекта. На втором этапе с учетом вычисленных признаков и при использовании алгоритма вычисления оцеок происходит идентификация объекта.
Рисунок 3.7 – Схема алгоритма распознавания трехмерных объектов
Исходные данные, конкретно исходные изображения поступают с двух камер: K1 – камера, расположенная над объектом, K2 – камера, расположенная под углом к объекту. Все блоки, входящие в схему условно разделены по четырем подсистемам, а именно:
Составными частями в схеме являются блоки, выполняющие различные функции:
1 – блок получения изображения проекции объекта с камеры;
2 – блок предварительной
3 – блок вычисления признаков ;
4 – база эталонов (база признаков объектов);
5 – блок фильтрации эталонов по основным классифицирующим признакам;
6 – блок алгоритма вычисления оценок ;
7 – блок идентификации проекции, полученной от камеры K1, определение подходящих эталонов по алгоритму вычисления оценок проекции объекта;
8 – блок определения по
9 – блок вычисления угла α
поворота объекта в
10 – база моделей октодеревьев;
11 – блок формирования и хранения косоугольных проекций эталонных объектов по моделям октодеревьев из базы моделей (11) и найденным углам α, β, φ;
12 – блок определения проекций подходящих эталонов по алгоритму вычисления оценок проекции объекта, полученной от камеры K2;
13 – блок распознавания объекта;
14 – блок вывода результатов
распознавания трехмерного
Под образом понимается структурированное
описание изучаемого объекта или
явления, представленное вектором признаков,
каждый элемент которого представляет
числовое значение одного из признаков,
характеризующих соответствующи
Рисунок 3.8. - Структура системы распознавания
Суть задачи распознавания - установить,
обладают ли изучаемые объекты
Задачи распознавания имеют следующие характерные черты.
Целесообразно выделить следующие типы задач распознавания.