Машинное зрение

Автор работы: Пользователь скрыл имя, 17 Апреля 2013 в 13:13, реферат

Описание работы

В истории развития машинного зрения можно выделить следующие этапы:
· 1955 г. - профессор Массачусетского технологического института (МТИ) Оливер Селфридж опубликовал статью «Глаза и уши для компьютера». В ней автор выдвинул теоретическую идею оснащения компьютера средствами распознавания звука и изображения.
· 1958 г. - психолог Фрэнк Розенблатт из Корнеллского университета создал компьютерную реализацию персептрона (от perception - восприятие) - устройства, моделирующего схему распознавания образов человеческим мозгом. Персептрон был впервые смоделирован в 1958 году, причем его обучение требовало около получаса машинного времени на ЭВМ IBM-704. Аппаратный вариант - Mark I Perceptron - был построен в 1960 г. и предназначался для распознавания зрительных образов.

Содержание работы

1. История развития машинного зрения 3
2. Задачи машинного зрения и области его применения 5
2.1 Определение понятия «машинное зрение» 5
2.2 Машинное зрение в настоящее время. 5
2.3. Основные задачи машинного зрения 5
2.4 Основные области применения машинного зрения 7
3. Техническая составляющая машинного зрения 8
3.1 Методы обработки изображения 8
3.2 Компоненты системы 8
3.2.1.Компоненты системы машинного зрения 8
3.2.2.Типовая система машинного зрения 10
3.3. Принципы функционирования систем машинного зрения 10
4. Смежные области 12
4.1. Компьютерное зрение 12
4.2. Обработка и анализ изображений 12
4.3. Машинное обучение 13
5. Наиболее интересные примеры систем машинного зрения 14
5.1. Видеонаблюдение 14
5.1.1. Система обнаружения и сопровождения движущихся объектов
по признак их движения 14
5.1.2. Система считывания регистрационных номеров автомобилей 15
5.2 Биометрия 15
5.2.1. Система обнаружения и распознавания лиц 16
5.2.2. Система распознавания жестов руки человека 17
5.3 Медицинские приложения 17
5.3.1. Системы для компьютерного анализа томографических изображений 17
6. Будущее машинного зрения. 19
6.1. Достоинства и недостатки систем машинного зрения 19
6.2 Будущее машинного зрения 20
Список литературы 21

Файлы: 1 файл

Документ Microsoft Word (3).docx

— 377.69 Кб (Скачать файл)

• идентификация лиц.

Модули применяются последовательно. Выделенные на текущем кадре изображения  лиц поступают в систему индексации, которая в ответ указывает  заданное количество «кандидатов» из хранящейся базы изображений лиц, наиболее похожих на текущее изображение. После этого процедура идентификации  обрабатывает изображения лиц найденных  кандидатов с целью их точного  распознавания. Такой подход позволяет  осуществлять полнофункциональную  работу с «живым» видеопотоком с  целью выделения и распознавания  лиц по значительным объемам банков изображений в режиме, близком  к режиму реального времени.

На рисунке 7 показаны составляющие описанной выше технологии обнаружения  и распознавания лиц.

 

Рис.7. Система обнаружения и  распознавания лиц

Показаны: текущее видеоизображение (слева вверху), результат выделения  лица (справа вверху); результат поиска в индексированной базе изображений  лиц (второй ряд изображений –  найденные «кандидаты», среди которых  могут быть и ложные); результат  окончательной идентификации лица (третий ряд изображений – показаны только «кандидаты», успешно прошедшие  идентификацию).

5.2.2. Система распознавания  жестов руки человека

Распознавание жестов представляет собой  обширную область приложений компьютерного  зрения. Под «жестами» в широком  смысле понимаются любые движения человеческого  тела. В узком смысле обычно подразумеваются  некоторые характерные движения рук человека, имеющие в определенной предметной области какие-либо определенные семантические значения. Распознавание  жестов может использоваться для  построения различного рода человеко-машинных интерфейсов, управления различными техническими средствами и системами виртуальной  реальности.

В качестве простого примера можно  рассмотреть систему распознавания  жестов руки человека по изображениям от черно-белой видеокамеры низкого  разрешения (рис.8). Система не требует  предварительного обучения и устойчиво  различает до 10 различных жестов

 

Рис.8. Простой пример системы распознавания  жестов

5.3 Медицинские приложения

Особое место в области разработки систем компьютерного зрения занимают задачи медицинской диагностики. Основные задачи, которые должны решать здесь  данные технологии, следующие: задача измерения объектов на рентгенограммах, компьютерных томограммах и современных цифровых ультразвуковых приборах, задача улучшения визуализации, задача восстановления трехмерных форм объектов. Наиболее современной и бурно развивающейся в области разработки медицинских диагностических приложений можно считать технологию, связанную с определением степени алкогольного и наркотического опьянения на основе анализа реакции зрачка пациента. 

5.3.1. Системы для компьютерного  анализа томографических изображений

При создании систем анализа томографических изображений общего назначения основной акцент делался на разработку процедур автоматической и полуавтоматической сегментации изображений. Реализованная схема алгоритма сегментации включает:

• первичную гистограммную сегментацию методом статистического выделения мод;

• формирование связных областей с заданными характеристиками методом слияния/разбиения.

Специально разработанный для  данного класса задач метод статистического  выделения мод позволяет оценивать  количество и степень выраженности мод гистограммы (рис.9), опираясь на соответствующий график статистической производной.

 

Рис.9. Пример автоматического разделения мод на гистограмме

Метод слияния/разбиения связных  областей использует полученную на первом этапе разметку пикселей изображения  в качестве стартового приближения, после чего происходит процесс итеративной  релаксации с целью минимизации  заданной энергетической функции. Алгоритм сегментации может быть использован  как в автоматическом, так и  в полуавтоматическом режиме. В этом случае врач-оператор может инициализировать процесс сегментации интересующих его объектов путем указания интересующих его точек.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6. Будущее машинного  зрения.

6.1. Достоинства и недостатки  систем машинного зрения

Главным недостатком систем машинного  зрения, заметно ограничивающим рост их рынка, считается отсутствие единых стандартов на оборудование и программные  интерфейсы. Пользователи систем постоянно  жалуются на невозможность использовать системы разных производителей, а  интеграционные продукты в этой области  стоят недешево. Кроме того, по мере улучшения качества сканируемого изображения  будет расти нужда в эффективном системном ПО для быстрого захвата видеоданных, их очистки, сжатия и хранения. Если со временем такие функции будут реализованы аппаратно, можно предсказать рост спроса на встраиваемые системы машинного зрения.

Многообещающей выглядит концепция  мультиспектральных систем машинного  зрения, обрабатывающих изображения  не только в области видимого человеком  спектра, но и получаемых с помощью  радарных или лазерных установок, а  также инфракрасных камер (есть примеры  применения систем машинного зрения при распознавании тепловых полей  людей в охранных системах и при  анализе качества горячих булочек  в кондитерской промышленности). Основная помеха на этом пути развития машинного зрения - дороговизна и сложность эксплуатации соответствующих датчиков.

Продолжительна и сложна процедура  калибровки систем машинного зрения при настройке на определенную предметную область. Нередко она требует  значительного времени и вычислительных ресурсов для обучения нейронной  сети. Прикладное ПО также нередко отличается неудобным интерфейсом, а перенастройка системы на новую номенклатуру, да еще в реальном масштабе времени, на чем нередко настаивает пользователь, чаще всего невозможна. Покупателям же уже нужны системы, способные анализировать продукцию на конвейере не поштучно, а разом - осматривая все, что находится в данный момент времени на ленте, и мгновенно оценивая состояние всех изделий.

Ощущается нехватка хороших математических алгоритмов, ориентированных на компьютеры с высокой производительностью  и поддерживающих параллельную обработку. Остается пока нерешенной проблема распознавания  схожих, но по-разному освещенных объектов, и вряд ли с ней удастся справиться в обозримом будущем.

Негативно сказываются на рынке  завышенные ожидания потребителей, не очень высокая прибыльность уже  существующих систем, небольшое число  хороших продуктов, а также возможность  решать производственные задачи другим путем - без систем машинного зрения, с помощью дешевого персонала.

Но все эти проблемы временные. Ведущие поставщики уже договариваются о единых стандартах, для чего планируется  создать общедоступный репозиторий знаний и типовых шаблонов продуктов, определить программные интерфейсы, а также выработать соглашение по языкам описания и представления данных систем машинного зрения.

Интерес к системам машинного зрения во многом поддерживается успехами машин  в тех областях, где они намного  превосходят человека по своим возможностям. Так, компьютер способен выявлять в  изображении тысячи градаций серого и различать миллионы цветов, очень  быстро решать типовые и хорошо формализуемые  задачи распознавания и определять мелкие детали изображений. А растущая вычислительная мощь дешевых процессоров  стимулирует выпуск общедоступных  бытовых и промышленных "зрячих" роботов, управляемых обычным ПК.

Производители электронных систем безопасности рассчитывают научить  системы машинного зрения автоматической классификации объектов. Хорошая  система будет выявлять в видеоизображении все виды автомобильной техники и определять их марки, отыскивать в толпе конкретных людей, отслеживать траектории перемещения отдельных лиц и даже движения частей их тел, предсказывая возможное поведение, и т. д.

Мэтт Аллен, руководитель направления  из компании Microscan, так описывает достоинства систем машинного зрения: "Сегодняшние технологии оперативных поставок и производства по заказу превратили информацию в один из самых ценных активов компании. Системы машинного зрения являются основой, позволяющей осуществлять автоматизацию многих производственных процессов. В качестве средств сбора данных системы машинного зрения используются в таких областях, как высокоскоростная сортировка, контроль качества продукции и слежение за ходом работ".

6.2 Будущее машинного  зрения

Машинное зрение имеет все шансы  превзойти человеческое в ближайшие  десять лет. Уже сейчас роботы видят  сквозь стены и на километры вперед. Последний бастион - расшифровка  видеоинформации - скоро падет. В  строй встанут роботы-автомобили, роботы-поезда и роботы-самолеты. А  еще - доктора, скальпель которых  никогда не сорвется, а зоркий глаз вовремя заметит артерию.

Остается надеяться, что люди сумеют направить мощь машинного зрения в верное русло, а не станут в спешном  порядке конструировать терминаторов [Талан, 2007].

У систем машинного зрения достаточно хорошие перспективы. Идеальная  система машинного зрения будет  полностью построена на цифровых технологиях, станет использовать интеллектуальные камеры и недорогое оборудование, реализующее набор стандартизованных  функций обработки и распознавания  изображений. Ключевым в ее успехе будет, конечно, удобная интеллектуальная программная среда, способная гибко  и быстро настраиваться на произвольную предметную область, допускающая динамическое расширение функциональных возможностей и легко стыкующаяся с технологической аппаратурой.

По мнению Хирохисы Хирукавы, исследователя из Национального института перспективных научных исследований и технологий, производство роботов в XXI веке может стать крупнейшей отраслью промышленности - подобно производству автомобилей в XX столетии. При этом уже к 2025-му, в крайнем случае к 2050 году стоит ожидать массового распространения роботов, служащих для выполнения домашних работ.

Боб Таплетт, руководитель проектного отдела компании Microscan, говорит следующее: "Полагаю, можно утверждать, что в будущем системы машинного зрения превратятся в системы сбора данных. Считыватели штрих-кодов уйдут в прошлое, и в значительной мере это будет обусловлено тем, что системы машинного зрения способны решать гораздо больший круг задач".

 

 

 

 

 

 

 

 

 

 

 

 

Список литературы

1.[Бобровский, 2004] Бобровский С. «Когда машины прозреют» - pcweek/themes/detail.php?ID=66663&sphrase_id=12198

2.[Визильтер и др., 2007] Визильтер Ю. В., Желтов С. Ю., Князь В. А., Ходарев А. Н., Моржин А. В. Обработка и анализ цифровых изображений с примерами на LabVIEW IMAQ Vision. – М.: ДМК Пресс, 2007.

3.[Зуева, 2008] Зуева Е.Ю. «Компьютерное зрение в ИПМ им. В.М. Келдыша РАН – история развития» - keldysh/papers/2009/art04/Zueva_09.htm

4.[Катыс , 1990] Катыс Г.П. Обработка визуальной информации. – М.: Машиностроение, 1990г.

5.[Компьютерное зрение ] Компьютерное (машинное) зрение (computer vision) es-prof/m_mvision.php

6.[Лысенко, 2007] Лысенко О. Машинное зрение от SICK/IVP // Компоненты и технологии. 2007. № 1

7.[Морзеев, 2002] Морзеев Ю. "Зачем компьютеру зрение" - compress/article.aspx?id=10656&iid=434

8.[Талан, 2007] Талан А. Перспективы машинного зрения, 2007 - mirf/Articles/art2170.htm

9. [Wikipedia] Машинное зрение - en./wiki/Machine_vision

 


Информация о работе Машинное зрение