Автор работы: Пользователь скрыл имя, 09 Декабря 2012 в 10:46, реферат
Человек всегда взаимодействовал с техникой, еще со времен изобретения первых орудий труда. Они помогали ему ощутить свое господство над природой. Развиваясь, человек совершенствовал технику, и она становилась частью него - без техники человек был бессилен. Современный человек намного больше общается с техническими устройствами, в особенности такими, как компьютер. Теперь он не просто облегчают человеку его работу, как умственную, так и физическую, как было ранее, а является помощником, способными выполнять и некоторую интеллектуальную работу.
I.Введение ……………………………………………..…….......……....…...….…3
II.Коммуникация «человек-компьютер»……………...….…………...…….….4
III.Коммуникация с помощью текстового сообщения.……………....………..6
IV.Коммуникация с помощью изображений……….…………………..……….9
V.Речевая коммуникация ………………………………..……...……………….15
Система распознавания речи……………………………...….….……………...18
Трудности и проблемы при распознавании речи ЭВМ……….….….……...…21
VI.Заключение………………………………………………….…….………...…...23
VII.Список литературы………………………………………….……………...…..
Взаимодействие человека и компьютера в зрительной области стало очень тесным, но разделилось на два направления: интерактивный режим работы и автоматический.
В интерактивном режиме компьютерные программы преобразуют изображение в соответствии с желанием человека, что позволяет ему лучше увидеть какие-то части или особенности изображения, выделить нужные элементы и подсчитать их количество или геометрические параметры. При всех плюсах этого варианта очевидны и его минусы: в процессе работы необходимо участие человека, который в целом имеет быстродействие, гораздо меньшее чем у компьютера, который ошибается, и который, наконец, просто устает. И, между прочим, нуждается в оплате своего труда.
Автоматический режим
Оба эти пути развиваются параллельно, хотя стремление к полной автоматизации является приоритетным.
В области интерактивного анализа
основными помощниками человека
становятся различные графические
пакеты, самыми известными из которых
можно считать PhotoFinish (ZSoft), PhotoShop
(Adobe), Corel Draw и некоторые другие, менее известных
фирм, но зачастую очень удобные и полезные.
Среди них много и бесплатных систем, например,
очень удачный продукт "ImageJ" ("http://rsb.info.nih.gov/ij/"
Эти программы позволяют проводить с изображением поистине чудесные преобразования, от имитации письма маслом в стиле определенной художественной школы, до анимационных эффектов, превращающих одну картину в другую через ряд промежуточных. О выводе всевозможных статистических характеристик изображения и говорить нечего, это само собой разумеется. Кроме того, заложенные в эти программы алгоритмы позволяют менять яркость, контрастность, резкость, насыщенность и многие другие параметры, а также выделять области и проводить различные математические операции с изображениями.
Человек, комбинируя различные преобразования, добивается эффекта визуального выделения на изображении необходимой ему информации. Потребность в подобных преобразованиях связана с тем, что изображения, получаемые с помощью различных видеокамер и других детекторов, далеко не всегда являются качественными и подчас содержат шума не меньше, чем полезного сигнала. Кроме того, получаемые изображения часто несут информацию из очень непривычных человеку мест и условий, в результате он просто не может корректно анализировать такое изображение. Тут можно упомянуть не только электронно-микроскопические изображения горных пород или внутренностей клетки, но и переданные из космоса изображения далеких планет. Для человека эти картины по сути чужды и непривычны, поэтому ему крайне трудно правильно их интерпретировать.
Получается, что проводить качественный и количественный анализ изображений даже с помощью столь замечательных программ может только специалист очень высокой квалификации, имеющий большие знания в данной конкретной области, а также большой практический опыт. Но таких специалистов мало, стоят они очень дорого, и не всегда они есть там, где нужны.
В этой ситуации очень заманчиво
построить такую систему
Автоматический анализ изображений необходим и тогда, когда требуется в реальном времени обработать тысячи кадров видеосъемки, пытаясь найти там изображение, например, конкретного человека. Это особенно актуально сейчас, когда в мире растет глобальная преступность и терроризм, а мир обрастает паутиной видеокамер, круглосуточно следящих за многими тысячами финансовых и правительственных объектов.
Использование человека тут невозможно хотя бы по причине огромного количества таких камер.
Попытки создания систем автоматического анализа предпринимаются во всем мире уже давно, собственно, с тех пор, как люди научились вводить изображения в компьютер. Из математических способов обработки изображений широкое распространение получил метод быстрых преобразований Фурье (БПФ). Его применение позволяет получить спектр изображения (спектр этот не предназначен для человеческого восприятия), применить к нему различные фильтры, а потом обратным преобразованием получить снова изображение, но уже откорректированное, по которому уже человек и проводит визуальный анализ. И вся задача исследователей сводится практически к выбору нужного фильтра, а часто и созданию своего собственного в соответствии с конкретной задачей.
Эта методика демонстрирует свою успешность во многих практических применениях, однако она требует огромных вычислительных ресурсов, даже сейчас доступных не везде и не всем, а самое главное, на 100% исходит из самого факта применения компьютеров. Иными словами, эта методика явно не имеет ничего общего с тем, как мозг самого человека проводит анализ этого же изображения.
Имеет ли это значение? Бесспорно, имеет. Прежде всего, разработка фильтров для БПФ сама по себе является крайне трудной задачей, ибо мозг человека вынужден выполнять чуждую ему работу и фактически моделировать в себе компьютерное восприятие. Напрашивается вопрос, а не правильней ли было бы наоборот, на компьютере моделировать работу и восприятие мозга?
Ведь как уже говорилось выше, человек способен проводить анализ почти мгновенно, при этом в зависимости от конкретной задачи выделять на изображении те или иные характерные особенности. Разумеется, такая рутинная работа, как подсчет числа элементов или определение их формы (например, в ходе анализа крови), у компьютера всегда будет получаться лучше, чем у человека. И быстрее, и надежнее. Но анализ изображения, его осмысление - тут пока ни один компьютер не может сравниться с человеком.
Исследования мозговой деятельности проводятся во всем мире уже много лет. В области этой достигнуты значительные успехи, хотя в сущности человек еще очень далек от понимания принципов работы его собственного мозга. Попытки моделирования человеческого восприятия визуальных образов предпринимаются в различных научных центрах мира, но пока что нигде и никем не было объявлено, что такое понимание достигнуто. Очевидно, что восприятие это основано на комбинации многих факторов и критериев, понимание хотя бы некоторых из них может существенно продвинуть человечество вперед.
Когда в 97 году одна исследовательская группа занялась созданием программы анализа изображений, были испробованы различные подходы. Прежде всего они попытались обратиться к общеизвестным методикам, анализируя гистограмму изображения и применяя к ней различные математические операции. Наряду с этим для всего изображения также применялись стандартные алгоритмы выделения областей, наращивания и удаления точек и т.д. Все эти способы давали некоторый результат, но ни о какой автоматизации и речи быть не могло, не говоря уже о том, что такой подход выглядел явно искусственным.
Сама задача состояла в анализе изображений горных пород, полученных в сканирующем электронном микроскопе, в результате такого анализа нужно было получить различные петрофизические характеристики исследуемого образца (пористость, проницаемость и т.д.). На сегодняшний день такие задачи решаются в мире многими, но все они исследуют не грубую поверхность (скол породы), а гладкий и тонкий специально приготовленный шлиф (срез). При изготовлении такого шлифа не только нарушается целостность породы на микроуровне, но и искажается само восприятие анализируемого объекта с потерей трехмерности информации. Но самое главное, что все существующие методики и программы рассчитаны на интерактивный режим работы со всеми его указанными выше недостатками.
Все это довольно быстро натолкнуло ученых на мысль отказаться от стандартных подходов и подойти к решению задачи именно со стороны моделирования человеческого восприятия, что позволит работать не в интерактивном, а именно в автоматическом режиме.
Изображения, получаемые с электронного микроскопа, являются серыми, т.е. там присутствуют только компоненты яркости и контрастности. В то же время, например, космические фотографии содержат в себе и цвет, причем его роль не менее значима, чем роль яркости.
За прошедшее время учеными была проведена очень большая работа как в области экспериментов, так и в вопросах теоретических. В результате создана единая методика и разработан комплекс алгоритмов, которые позволяют проводить анализ и обработку изображения полностью в автоматическом режиме. Пока это применимо непосредственно только к серым изображениям, хотя и в области цветных изображений также имеется много перспективных идей и наработок. Проблемы, как обычно, находятся в плоскости финансирования и технического обеспечения.
Практической реализацией разработанного нами метода стала программа, которая не требует для своей работы ни сотен мегабайтов памяти, ни еще каких-либо суперресурсов. По этой программе были выполнены (и далеко не на современных компьютерах) сотни анализов как для тестовых образцов породы, так и непосредственно исследовательских анализов керна (и даже шлама), с получением подробных и достоверных данных о поровой системе изучаемых объектов.
Результаты анализов были использованы различными нефтяными компаниями в практических целях и никаких нареканий с их стороны высказано не было.
Разумеется, методика нуждается в
дальнейшем совершенствовании и
расширении на другие области исследования,
однако лежащие в ее основе алгоритмы
обработки изображения являются
по своей сути универсальными и
отражают именно человеческое восприятие,
во всяком случае, в данной области. А применение
ее возможно не только в геологии, металлургии,
медицине или астрономии, но и в такой
сфере, как, например, техническое зрение
роботов, тем более, что и эта сфера сейчас
бурно развивается. [http://erichware.com/litvor/
Речевая коммуникация
Наше общение с людьми при помощи устного языка, не важно, происходит ли оно при личном контакте с человеком, по телефону или при помощи интернета, можно назвать термином «речевая коммуникация». При этом мы обмениваемся мыслями, информацией при помощи звуковых волн. При помощи речи мы можем хорошо выражать свои мысли и достигать наилучшего взаимопонимания с собеседником, конечно, если тот способен адекватно воспринимать нашу речь и понимает язык. В достижении взаимопонимания между людьми важную роль играет эмоциональный аспект. Через речь мы передаем собеседнику свое эмоциональное состояние.
Речь имеет
массу преимуществ перед
С точки зрения науки, «речевая коммуникация представляет собой процесс, в котором участники должны совершать сложные действия. С точки зрения этого подхода речевая коммуникация наитеснейшим образом связана с практическими и умственными действиями индивидуума».[1, c. 28] Минимальной единицей речевой коммуникации является речевой знак или звук. Он является достаточно сложным образованием. Для его воспроизводства требуется движение определенных органов, а центр их управления находится в головном мозгу. При этом говорящий преследует определенное коммуникативное намерение. Сочетания элементарных единиц языка образуют различные типы сложных единиц: сочетания звуков – конкретные фонетические синтагмы, словоформ – лексикограмматические синтагмы, сем – сематические синтагмы. [1, c.122] Таким образом, процесс продуцирования речевых значительно сложнее, чем кажется на первый взгляд. В целом речевая деятельность – один из сложнейших видов деятельности человека и довольно сложный процесс с точки зрения науки. Ее природа стала понятной сравнительно недавно.
Речевой диалог является одной из форм взаимодействия человека и машины, считающейся перспективной и усиленно разрабатываемой в последнее время. Диалог – это основная форма общения, поэтому в последнее время ей уделяется много внимания. Наука стремится к реализации успешного общения на устном диалоге между человеком и компьютером, и для этого ей необходимо учитывать особенности взаимодействия «человек-человек». В результате сравнительно недавно выделилась такая область исследования, как речеведение.[1, c.125]
Преимуществами устной речи перед всеми другими способами общения являются то, что руки остаются свободными, никакие инструменты не требуются, освещение также не имеет значение, легко осуществляется сопряжение с телефонными системами. При диалоговом общении человек не нуждается в клавиатуре или дисплее. Кроме того, в систему «человек-компьютер» могут быть включены люди с физическими недостатками. Развитие же теории цифровой обработки речевого общения, увеличение возможностей и снижение себестоимости современных систем на основе ЭВМ способствовало развитию этой отрасли в современной науке. Кроме того, автоматическое распознавание речи несомненно является важным шагом на пути упрощения общения между человеком и машиной.
Когда взаимодействие человека и компьютера осуществлялось в кодах, для управления вычислительными машинами человеку требовалось знать язык машины или освоить манипуляции с клавиатурой, чтобы набирать коды в нужной последовательности и в нужном формате. Любое же отклонение от искусственного языка приводило к ошибке и таким образом трудностям общению с ЭВМ. [1, с.303-304]
Информация о работе Особенности взаимодействия "Человек-компьютер"