Задачи машинного зрения и области его применения

Автор работы: Пользователь скрыл имя, 26 Мая 2012 в 01:36, реферат

Описание работы

Машинное зрение - это применение компьютерного зрения для промышленности и производства. Областью интереса машинного зрения являются цифровые устройства ввода/вывода и компьютерные сети, предназначенные для контроля производственного оборудования. Машинное зрение имеет некоторые преимущества перед зрением человека.

Файлы: 1 файл

дружин.docx

— 214.72 Кб (Скачать файл)

Рис.6. Выделение движущихся объектов сцены наблюдения

У систем обнаружения и  сопровождения движущихся объектов могут быть различные функции, такие  как:

• обнаружение новых объектов сцены наблюдения;

• обнаружение пропавших  объектов сцены наблюдения;

• регистрация новой сцены  наблюдения;

• контроль отсутствия сдвигов  камеры относительно сцены наблюдения.

5.1.2.Система считывания  регистрационных номеров автомобилей

Как уже говорилось, одной  из функций систем видеонаблюдения  является считывание идентификационных  меток объектов, прежде всего - номеров  транспортных средств, пересекающих зону наблюдения.

Одним из типовых приложений такого рода является разработанная  в ИИТ система выделения и  распознавания номерных знаков автомашин  в потоке на автомагистрали. Система  считывания автомобильных номеров  реализована на базе системы видеонаблюдения  «Интеллект» фирмы ITV и внедрена на ряде зарубежных автомобильных трасс [Визильтер и др., 2007].

Функции системы:

* регистрация появления  автомобиля (подсчет автомобилей);

* выделение номерного  знака;

* распознавание символов  номерного знака;

* сохранение распознанного  номера в базе данных.

5.2 Биометрия

В последние годы во всем мире наблюдается все возрастающий интерес к методам распознавания  и идентификации личности. Основные пути и способы решения этих задач  лежат в области разработки биометрических систем. В биометрических системах для распознавания человека используется совокупность биометрических характеристик, основанных на биологических особенностях человеческого тела. В качестве таких  биометрических характеристик могут  выступать голос, почерк, отпечатки  пальцев, геометрия кисти руки, рисунок  сетчатки или радужной оболочки глаза, лицо и ДНК.

Биометрическая защита более  эффективна в сравнении с такими методами, как использование паролей, PIN-кодов, смарт-карт поскольку биометрия позволяет идентифицировать именно конкретного человека, а не устройство. Традиционные методы защиты не исключают возможности потери или кражи информации, вследствие чего она становится доступной незаконным пользователям. Уникальный биометрический идентификатор, каковым является, например, отпечаток пальца или изображение лица, служит ключом, который невозможно потерять.

Биометрическая система  безопасности позволяет отказаться от парольной защиты либо служит для  ее усиления. Одной из основных причин, которые существенно повысили значимость автоматической обработки и анализа  биометрической информации, явилось  повышение требований к функциональным возможностям автоматических систем безопасности, расположенных в общественных местах (вокзалы, супермаркеты и т. п.)

 

Рассмотрим несколько  примеров биометрических приложений, встречающихся на практике.

5.2.1. Система обнаружения  и распознавания лиц

В ИИТ разработана технология обнаружения и распознавания  лиц по двумерным изображениям, включающая три основных модуля:

* детектирование (обнаружение)  лиц;

* индексация (кодирование  и последующий быстрый поиск  лиц в базе);

* идентификация лиц.

Модули применяются последовательно. Выделенные на текущем кадре изображения  лиц поступают в систему индексации, которая в ответ указывает  заданное количество «кандидатов» из хранящейся базы изображений лиц, наиболее похожих на текущее изображение. После этого процедура идентификации  обрабатывает изображения лиц найденных  кандидатов с целью их точного  распознавания. Такой подход позволяет  осуществлять полнофункциональную  работу с «живым» видеопотоком с целью выделения и распознавания лиц по значительным объемам банков изображений в режиме, близком к режиму реального времени.

На рисунке 7 показаны составляющие описанной выше технологии обнаружения  и распознавания лиц.

Рис.7. Система обнаружения  и распознавания лиц

Показаны: текущее видеоизображение (слева вверху), результат выделения  лица (справа вверху); результат поиска в индексированной базе изображений  лиц (второй ряд изображений - найденные  «кандидаты», среди которых могут  быть и ложные); результат окончательной  идентификации лица (третий ряд изображений - показаны только «кандидаты», успешно  прошедшие идентификацию).

5.2.2. Система распознавания жестов  руки человека

Распознавание жестов представляет собой обширную область приложений компьютерного зрения. Под «жестами»  в широком смысле понимаются любые  движения человеческого тела. В узком  смысле обычно подразумеваются некоторые  характерные движения рук человека, имеющие в определенной предметной области какие-либо определенные семантические  значения. Распознавание жестов может  использоваться для построения различного рода человеко-машинных интерфейсов, управления различными техническими средствами и  системами виртуальной реальности.

В качестве простого примера  можно рассмотреть систему распознавания  жестов руки человека по изображениям от черно-белой видеокамеры низкого  разрешения (рис.8). Система не требует  предварительного обучения и устойчиво  различает до 10 различных жестов

Рис.8. Простой пример системы  распознавания жестов

5.3 Медицинские приложения

Особое место в области  разработки систем компьютерного зрения занимают задачи медицинской диагностики. Основные задачи, которые должны решать здесь данные технологии, следующие: задача измерения объектов на рентгенограммах, компьютерных томограммах и современных цифровых ультразвуковых приборах, задача улучшения визуализации, задача восстановления трехмерных форм объектов. Наиболее современной и бурно развивающейся в области разработки медицинских диагностических приложений можно считать технологию, связанную с определением степени алкогольного и наркотического опьянения на основе анализа реакции зрачка пациента.

5.3.1. Системы для компьютерного  анализа томографических изображений

При создании систем анализа  томографических изображений общего назначения основной акцент делался на разработку процедур автоматической и полуавтоматической сегментации изображений. Реализованная схема алгоритма сегментации включает:

* первичную гистограммную  сегментацию методом статистического  выделения мод;

* формирование связных  областей с заданными характеристиками  методом слияния/разбиения.

Специально разработанный  для данного класса задач метод  статистического выделения мод  позволяет оценивать количество и степень выраженности мод гистограммы (рис.9), опираясь на соответствующий  график статистической производной.

Рис.9. Пример автоматического  разделения мод на гистограмме 

Метод слияния/разбиения  связных областей использует полученную на первом этапе разметку пикселей изображения в качестве стартового приближения, после чего происходит процесс итеративной релаксации с целью минимизации заданной энергетической функции. Алгоритм сегментации  может быть использован как в  автоматическом, так и в полуавтоматическом режиме. В этом случае врач-оператор может инициализировать процесс  сегментации интересующих его объектов путем указания интересующих его  точек.

6. Будущее машинного зрения.

6.1. Достоинства и недостатки  систем машинного зрения

Главным недостатком систем машинного зрения, заметно ограничивающим рост их рынка, считается отсутствие единых стандартов на оборудование и  программные интерфейсы. Пользователи систем постоянно жалуются на невозможность  использовать системы разных производителей, а интеграционные продукты в этой области стоят недешево. Кроме  того, по мере улучшения качества сканируемого изображения будет расти нужда  в эффективном системном ПО для быстрого захвата видеоданных, их очистки, сжатия и хранения. Если со временем такие функции будут реализованы аппаратно, можно предсказать рост спроса на встраиваемые системы машинного зрения.

Многообещающей выглядит концепция мультиспектральных систем машинного зрения, обрабатывающих изображения  не только в области видимого человеком  спектра, но и получаемых с помощью  радарных или лазерных установок, а  также инфракрасных камер (есть примеры  применения систем машинного зрения при распознавании тепловых полей  людей в охранных системах и при  анализе качества горячих булочек  в кондитерской промышленности). Основная помеха на этом пути развития машинного зрения - дороговизна и сложность эксплуатации соответствующих датчиков.

Продолжительна и сложна процедура калибровки систем машинного  зрения при настройке на определенную предметную область. Нередко она  требует значительного времени  и вычислительных ресурсов для обучения нейронной сети. Прикладное ПО также нередко отличается неудобным интерфейсом, а перенастройка системы на новую номенклатуру, да еще в реальном масштабе времени, на чем нередко настаивает пользователь, чаще всего невозможна. Покупателям же уже нужны системы, способные анализировать продукцию на конвейере не поштучно, а разом - осматривая все, что находится в данный момент времени на ленте, и мгновенно оценивая состояние всех изделий.

Ощущается нехватка хороших  математических алгоритмов, ориентированных  на компьютеры с высокой производительностью  и поддерживающих параллельную обработку. Остается пока нерешенной проблема распознавания  схожих, но по-разному освещенных объектов, и вряд ли с ней удастся справиться в обозримом будущем.

Негативно сказываются на рынке завышенные ожидания потребителей, не очень высокая прибыльность уже  существующих систем, небольшое число  хороших продуктов, а также возможность  решать производственные задачи другим путем - без систем машинного зрения, с помощью дешевого персонала.

Но все эти проблемы временные. Ведущие поставщики уже  договариваются о единых стандартах, для чего планируется создать  общедоступный репозиторий знаний и типовых шаблонов продуктов, определить программные интерфейсы, а также выработать соглашение по языкам описания и представления данных систем машинного зрения [Бобровский, 2004].

Интерес к системам машинного  зрения во многом поддерживается успехами машин в тех областях, где они  намного превосходят человека по своим возможностям. Так, компьютер  способен выявлять в изображении  тысячи градаций серого и различать  миллионы цветов, очень быстро решать типовые и хорошо формализуемые  задачи распознавания и определять мелкие детали изображений. А растущая вычислительная мощь дешевых процессоров  стимулирует выпуск общедоступных  бытовых и промышленных "зрячих" роботов, управляемых обычным ПК.

Производители электронных  систем безопасности рассчитывают научить  системы машинного зрения автоматической классификации объектов. Хорошая  система будет выявлять в видеоизображении все виды автомобильной техники и определять их марки, отыскивать в толпе конкретных людей, отслеживать траектории перемещения отдельных лиц и даже движения частей их тел, предсказывая возможное поведение, и т. д.

Мэтт Аллен, руководитель направления из компании Microscan, так описывает достоинства систем машинного зрения: "Сегодняшние технологии оперативных поставок и производства по заказу превратили информацию в один из самых ценных активов компании. Системы машинного зрения являются основой, позволяющей осуществлять автоматизацию многих производственных процессов. В качестве средств сбора данных системы машинного зрения используются в таких областях, как высокоскоростная сортировка, контроль качества продукции и слежение за ходом работ".

6.2 Будущее машинного зрения

Машинное зрение имеет  все шансы превзойти человеческое в ближайшие десять лет. Уже сейчас роботы видят сквозь стены и на километры вперед. Последний бастион - расшифровка видеоинформации - скоро  падет. В строй встанут роботы-автомобили, роботы-поезда и роботы-самолеты. А  еще - доктора, скальпель которых  никогда не сорвется, а зоркий глаз вовремя заметит артерию.

Остается надеяться, что  люди сумеют направить мощь машинного  зрения в верное русло, а не станут в спешном порядке конструировать терминаторов [Талан, 2007].

У систем машинного зрения достаточно хорошие перспективы. Идеальная  система машинного зрения будет  полностью построена на цифровых технологиях, станет использовать интеллектуальные камеры и недорогое оборудование, реализующее набор стандартизованных  функций обработки и распознавания  изображений. Ключевым в ее успехе будет, конечно, удобная интеллектуальная программная среда, способная гибко  и быстро настраиваться на произвольную предметную область, допускающая динамическое расширение функциональных возможностей и легко стыкующаяся с технологической  аппаратурой.

По мнению Хирохисы Хирукавы, исследователя из Национального института перспективных научных исследований и технологий, производство роботов в XXI веке может стать крупнейшей отраслью промышленности - подобно производству автомобилей в XX столетии. При этом уже к 2025-му, в крайнем случае к 2050 году стоит ожидать массового распространения роботов, служащих для выполнения домашних работ [Морзеев, 2002].

Боб Таплетт, руководитель проектного отдела компании Microscan, говорит следующее: "Полагаю, можно утверждать, что в будущем системы машинного зрения превратятся в системы сбора данных. Считыватели штрих-кодов уйдут в прошлое, и в значительной мере это будет обусловлено тем, что системы машинного зрения способны решать гораздо больший круг задач".

Заключение

Машинное зрение достаточно неоднозначная тематика. С одной  стороны, в этой области получены впечатляющие результаты и решены многие поставленные задачи. Системы машинного  зрения справляются с автоматизацией производства, видеонаблюдением, анализом медицинских снимков. С другой стороны, машинному зрению все еще далеко до человеческого. Многие высоты достигнуты, многие еще впереди. Поэтому существует два взгляда на развитие машинного зрения. Одни говорят, что машины достигнут небывалых высот и разовьют огромную мощь, опередят человека. Другие утверждают, что машины никогда не превзойдут человека и машинное зрение так и останется непригодным для решения некоторых проблем, где необходимо вмешательство человека.

Несовершенство машинного  зрения обусловлено отчасти техническими причинами, однако идет бурное развитие информационных технологий и находится  все больше решений технических  проблем.

Системы машинного зрения становятся все более актуальны, так как призваны решать наиболее актуальные проблемы человечества, такие как безопасность, медицинские вопросы, вопросы качества продукции.

Информация о работе Задачи машинного зрения и области его применения