Автор работы: Пользователь скрыл имя, 09 Декабря 2012 в 10:46, реферат
Человек всегда взаимодействовал с техникой, еще со времен изобретения первых орудий труда. Они помогали ему ощутить свое господство над природой. Развиваясь, человек совершенствовал технику, и она становилась частью него - без техники человек был бессилен. Современный человек намного больше общается с техническими устройствами, в особенности такими, как компьютер. Теперь он не просто облегчают человеку его работу, как умственную, так и физическую, как было ранее, а является помощником, способными выполнять и некоторую интеллектуальную работу.
I.Введение ……………………………………………..…….......……....…...….…3
II.Коммуникация «человек-компьютер»……………...….…………...…….….4
III.Коммуникация с помощью текстового сообщения.……………....………..6
IV.Коммуникация с помощью изображений……….…………………..……….9
V.Речевая коммуникация ………………………………..……...……………….15
Система распознавания речи……………………………...….….……………...18
Трудности и проблемы при распознавании речи ЭВМ……….….….……...…21
VI.Заключение………………………………………………….…….………...…...23
VII.Список литературы………………………………………….……………...…..
Речевая коммуникация с машиной обладает следующими достоинствами:
Поэтому в целях упрощения взаимодействия между человеком и компьютером ученые разрабатывают систему распознавание речи компьютером, что является достаточно непростой задачей.
Система распознавания речи
Самым сложным для машины является автоматическое распознавание слитной речи. Разработка систем автоматического распознавания речи ведет к тому, что не человек приспосабливается к машине, а машина к человеку. Это значительно упрощает коммуникацию в системе «человек-компьютер», так как она ведется на естественном для человека языке. Люди получают возможность наговаривать информацию в компьютер, не прибегая к клавиатуре или другим устройствам, и управлять механическоми устройствами с помощью речевых команд. [1, с.304]
В начале 40-х
годов ХХ века инженеры впервые попытались
распознать с помощью машины отдельные
звуки речи, однако оказалось не
так просто найти соответствие между
конкретными звуками речи человека
и акустическими
Что касается гласных, если компьютер уловит частотные колебания в области 1000 ГЦ, то велика вероятность того, что бы произнесен гласный «а», если же он обнаруживает сильные колебания в зоне 2000-3000 Гц, есть вероятность присутствия звука «и». Однако с согласными дело обстоит хуже. Машине сложно уловить смычные взрывные согласные «г», «к», «б», «п», «д», «т». Они не уловимы сами по себе, так как образуются при смыкании тех или иных органов артикуляции. Распознать их в речи легче по соседним гласным. Машина также часто путает такие сонорные звуки, как «м» и «н». Легче дело обстоит с распознаванием шипящих звуков «ш» и «с», их частоты колеблются в районе высоких частот спектра: 8000-10000 Гц.
К лингвистическим трудностям добавляются и такие, которые возникают вследствие большой вариативности звуков речи при их произнесении. Кроме того, звуки в процессе включения в речевой поток попадают в разное окружение, разный фонетический контекст, что усложняет способность распознования речи машиной.
Для того чтобы машина смогла распознать не только звуки, но и целые слова, фразы, она должна включать в себя несколько блоков рецепторов, классификаторов, эффекторов. Рецептор измеряет некоторые параметры речевого сигнала. Затем классификатор выносит решение о том, что это за слог. Другой классификатор определяет, принадлежит ли этот слог произнесенному слову, образец которого находится у него в памяти, и т.д. Таким образом, распознающая машина решает следующие задачи:
Чтобы машина распознавала слова, ее вначале обучали, как они произносятся и что обозначают. Для этого слова произносились в магнитофон или записывались на пленку. Машина тем временем сравнивает произнесенные слова с образцами слов, хранящимися у нее в памяти, а также характеристики голоса человека, произносящего слово, с образцами голосов, хранящимися у нее в памяти. При этом различают адаптивные и неадаптивные машины. Адаптивные предназначены для какого-то узкого круга лиц, голос которых они распознают, другого человека машина не сможет распознать. Неадаптивные предназначены непосредственно для любого пользователя.
Иногда возникают такие помехи как различного рода шумы (дыхания, разговоров на заднем плане и т.п.). Для их подавления используются специальные шумоподавляющие, шумостойкие микрофоны либо акустически изолированные камеры.[2, с.88-95]
Системы распознания отдельных слов, т.е. речи, в которой слова разделены паузами, появились уже в 90-е гг. прошлого века. Распознать же слитную речь было намного труднее, так как в ней сложно определить, где кончается одно слово и начинается другое. Наиболее трудной задачей из всех задач распознавания была я является проблема распознания речи без ограничений словарного запаса.
«Говорящий в процессе речевой коммуникации использует свое знание языка, знание об окружающей обстановке и ситуации при производстве и понимании сообщения. Эти источники знаний включают в себя характеристики звуков речи, произносительную вариативность, ударение и интонационный контур речи, звуковые образы слов, грамматическую структуру языка, , значение слов и предложения и контекст общения. Для того, чтобы походить в своих действиях на человека, машина должна так же эффективно использовать все доступные источники знаний».[1, с.305] Конечно, ответственность за то, чтобы машина полностью понимала человека, лежала и лежит на самом человеке. Ученые проводили и проводят массу исследований в этой области, а результаты экспериментов часто лежат в основе функционирования той или иной системы. «Современные системы распознавания включают различные уровни, каждый из них несет свою функциональную нагрузку: акустический, параметрический, лексический, синтаксический, семантический и прагматический»[1, с. 505]
Трудности и проблемы при распознавании речи ЭВМ
Распознавание живого языка требует огромных знаний системы об окружающем мире и возможности с ним взаимодействовать. Само определение смысла слова «понимать» — одна из главных задач искусственного интеллекта. Качество понимания зависит от множества факторов: от языка, от национальной культуры, от самого собеседника и т. д. Вот основные проблемы, с которыми сталкиваются разработчики систем распознавания речи.
1. Проблема анализа и распознавания слитной речи. В слитном потоке речи отсутствуют объективные границы. Кроме того фонемы слов, т.е. звуки, в них входящие, часто зависят от контекста, число же их огромно.
2. Проблема увеличения объема словаря: это влечет за собой рост ошибок распознавания и увеличение времени принятия решения. При большом объеме словаря появляется слишком много схожих слов, что альтернативный подбор слова в случае его нераспознания машиной, вряд ли решит проблему.
3. Проблема использования синтаксиса: сколько допустимых ограничений может наложить искусственный синтаксис языка, и как эти ограничения могут быть использованы. Связь синтаксического и фонетического уровней необходима и полезна для распознавания слитной речи. Роль синтаксического анализа сводится к тому, чтобы сформировать грамматическую цепочку, свободную от ошибок.
Вот пример сложностей, с которыми сталкиваются системы понимания текстов: предложения «Мы отдали бананы обезьянам, потому что они были голодные» и «Мы отдали бананы обезьянам, потому что они были перезрелыми» похожи по синтаксической структуре. В одном из них местоимение «они» относится к обезьянам, а в другом — к бананам. Правильное понимание зависит от знаний компьютера, какими могут быть бананы и обезьяны. По нормам русского языка второе предложение некорректно, потому что в нем местоимение ссылается не на последнее подходящее слово, однако в живой речи такое предложение очень даже может встретиться.
Свободный порядок слов может привести к совершенно иному толкованию фразы: «Бытие определяет сознание», кто здесь кого определяет, будет непросто понять машине. В русском языке свободный порядок компенсируется развитой морфологией, служебными словами и знаками препинания, но в большинстве случаев для компьютера это представляет дополнительную проблему.
4. Проблема неоднозначности языка, распознавания омонимов и неологизмов.
В речи могут встретиться неологизмы, например, глагол «Пятидесятирублируй» — то есть высылай 50 рублей. Система должна уметь отличать такие случаи от опечаток и правильно их понимать.
Правильное понимание омонимов – нелегкая задача для компьютера. Во фразе «Серый волк в глухом лесу встретил рыжую лису» выделенные слова слышатся одинаково, и без знания, кто глухой, а кто рыжий, не обойтись (Кроме того, что лиса может быть рыжей, а лес — глухим, лес также может быть рыжим (характеристика, в данном случае обозначающая преобладающий цвет листвы в лесу), в то время как лиса может быть глухой, что порождает дополнительную проблему, вытекающую из предыдущей.)
5. Проблема распознавания речи пользователей. Системы распознавания речи настраивают, как правило, небольшое количество дикторов, в итоге расширить круг пользователей является непростой задачей. Проблемами являются: пол, диалект, степень владения языком, т.е. языковой опыт диктора, и другие индивидуальные характеристики диктора. Кроме того, даже голос одного человека может звучать по-разному, в зависимости от того, чем он занят в конкретный момент, влияет также эмоциональное состояние человека, и его здоровье (каждый, наверное, сталкивался с явлением появления хрипоты в горле). Современные же системы требуют четкого и ясного произнесения слов.
6. Проблема подстройки: зачастую требуется серьезная предварительная настройка систем (например, неоднократное повторение слова диктором). При увеличении словаря скорее всего придется отказаться от солидной настройки систем.
7. Проблема обучения пользователя синтаксису и словарю систем, что не намного легче, чем обучение языкам программирования. Диктор не может без большого напряжения приобрести новые навыки в произношении и артикуляции.
8. Проблема шумов в окружающей обстановке. Современные системы распознавания достаточно чувствительны к шумам, которые могут исказить звуковой сигнал и препятствовать тем саамы распознанию речи.
9. Проблема
машинного перевода текстов с одного языка
на другой. В современном мире большую
роль играет разработка методов информационного
поиска. [1, с.506-507; 4, с. 93-104; http://ru.wikipedia.org/wiki/
Заключение
Общество меняется, вместе с ним меняется техника. И бессмысленно в наше время, я считаю, говорить об отрицательном влиянии техники на человека. Техника стала уже частью нас, кроме того она управляема и полностью подчинена человеку. За все ее сбои и неполадки ответственен лишь человек, как и за ее прогресс. Она наш помощник, без которого мы практически бессильны. Она помогает человеку развиваться, в то же время человек постоянно вносит какой-либо вклад в развитие самой техники.
Взаимодействие человека с компьютером радикально преобразовало сознание первого. Человек видит мир глазами компьютера, работая с формальными понятиями и объектами, создавая алгоритмы процессов, или изучая основы искусственного интеллекта.
С точки зрения социологии, техника и здесь вносит свой вклад. Она позволяет людям взаимодействовать друг с другом, и не зависеть при этом от времени и расстояния. Телекоммуникации становятся нашим спутником по жизни, позволяя общаться с людьми, которые отдалены от нас на тысячи километров.
Кроме того, совершенствуя коммуникацию «человек-компьютер», человек лучше научился понимать самого себя. Он глубже исследует психологию, пытаясь понять, что движет теми или иными его поступками, что является причиной тех или иных действий, реакций человека. Ведь без этих знаний он не сможет построить механизм, понимающий человека. Ученые, совершенствуя методы коммуникаций между человеком и машиной пытаются приблизить взаимодействие «человек-компьютер» к взаимодействию «человек-человек».
Таким образом, взаимодействие человека и компьютера представляет собой не просто общение человека с техникой, а двустороннюю взаимообогащающую коммуникацию, активный процесс взаимодействия человека с информационным богатством накопленного веками человеческого опыта.
Современные компьютерные
средства, по сравнению с программами
пяти- или десятилетней давности, позволяют
лучше визуализировать
Тем не менее компьютерные устройства еще
во многом уступают человеку. Но прогресс
в развитии техники продолжает набирать
скорость. Наука делает упор на создание
интеллектуальных роботов. Их появление
значительно облегчит и усовершенствует
деятельность людей в различных сферах.
Роботы смогут заменить человека там,
где его труд сопряжен с опасными условиями,
либо с тяжелыми физическими нагрузками.
Для их создания человеку просто необходимо
изучить тщательнейшим образом наиболее
эффективные способы коммуникации человека
и компьютера и особенности их взаимодействия.
Список литературы:
Информация о работе Особенности взаимодействия "Человек-компьютер"