Машинный перевод

Автор работы: Пользователь скрыл имя, 09 Декабря 2014 в 19:31, курсовая работа

Описание работы

Перевод имеет долгую историю. Своими корнями он восходит к тем далеким временам, когда праязык начал распадаться на отдельные языки и возникла необходимость в людях, знавших несколько языков и способных выступать в роли посредников при общении представителей разных языковых общин.

Файлы: 1 файл

Моя курсовая.doc

— 189.00 Кб (Скачать файл)

О Г Л А В Л Е Н И Е

 

ВВЕДЕНИЕ…………………………………………………………………..……2

МАШИННЫЙ ПЕРЕВОД ……………………………………………………….6

1. История развития машинного перевода …………………………..………7

2. Электронные словари ……………………………………………………..10

3. Компьютер на месте переводчика …………………………………….….13

4. Как переводит компьютер ………………………………………………..15

   4.1. Словарь ………………………………………………………………15

   4.2. Грамматика …………………………………………………………..17

5. Ответ критикам машинного перевода …………………………...………20

(или Почему популярны  программмы-перводчики)

6. Машинный перевод – это… инструмент ………………………………..22

7. Переводчик для офиса …………………………………………………….25

8. Кто в доме переводчик? …………………………………….…………….30

9. Машинный перевод в Интернете ……………………………………...…35

10. Как улучшить качество перевода (Практические советы) …………......38

ЗАКЛЮЧЕНИЕ ……………………………………………………………..…..43

Литература …………………………………………………………………..…..46

 

 

В В Е Д Е Н И Е

 

Перевод имеет долгую историю. Своими корнями он восходит к тем далеким временам, когда праязык начал распадаться на отдельные языки и возникла необходимость в людях, знавших несколько языков и способных выступать в роли посредников при общении представителей разных языковых общин.

Переводом называется процесс и результат создания на основе исходного текста на одном языке равноценного ему в коммуникативном отношении текста на другом языке. При этом коммуникативная равноценность, или эквивалентность, понимается как такое качество текста перевода, которое позволяет ему выступать в процессе общения носителей разных языков в качестве полноправной замены исходного текста (оригинала) в сфере действия языка перевода1.

Коммуникативная эквивалентность нового текста по отношению к оригиналу обеспечивается выполнением трех основных требований:

• текст перевода должен в возможно более полном объеме передавать содержание оригинала, что прежде всего означает недопустимость произвольного опущения или добавления информации;

• текст перевода должен соответствовать нормам языка перевода, так как их нарушение, по меньшей мере, создает помехи для восприятия информации, а иногда ведет и к ее искажению;

• текст перевода должен быть примерно сопоставим с оригиналом по своему объему, чем обеспечивается сходство стилистического эффекта с точки зрения лаконичности или развернутости выражения.

Однако выполнение указанных требований к тексту перевода часто связано с преодолением разного рода объективно существующих трудностей. В данной работе мы рассмотрим те из них, с которыми мы можем столкнуться при машинном переводе. Понятно, что в данном случае, если перевод не соответствует этим нормам, винить некого, поскольку машинный перевод еще не предназначен для самостоятельного перевода, он требует редактирования. Что же касается других видов этой деятельности, и письменный, и устный переводчики должны отдавать себе отчет в том, что «их работу замечают скорее тогда, когда они терпят неудачу, чем когда перевод идет нормально»2.

Круг деятельности, охватываемой понятием «перевод», очень широк. Переводятся с одного языка на другой стихи, художественная проза, научные и научно-популярные книги из различнейших областей знания, дипломатические документы, деловые бумаги, статьи политических деятелей и речи ораторов, газетные материалы, беседы лиц, разговаривающих на разных языках и вынужденных прибегать к помощи посредника – «толмача», дублируются кинофильмы.

Перевод может осуществляться:

1. с одного языка на другой – неродной, родственный, близкородственный;

2. с литературного языка на его диалект и наоборот, или с диалекта одного языка на другой литературный язык;

3. с языка древнего периода на данный язык в его современном состоянии (например, с древнерусского языка на современный русский, со староанглийского на современный английский и т.д.).

Следует заметить, что для машинного перевода характерен лишь пункт 1, поскольку, как мы знаем из экономики, спрос рождает предложения. Я думаю, никто не будет отрицать, что спрос на программу-переводчик, скажем, с английского или немецкого языка на русский намного превышает спрос на перевод с какого-нибудь праязыка.

Итак, развитие кибернетики сделало возможным машинный перевод, т.е. перевод, строящийся на использовании машиной определенных и постоянных для данного вида материала соответствий между словами и грамматическими явлениями разных языков. В настоящее время имеется достаточно широкий выбор пакетов программ, облегчающих труд переводчика, которые условно можно подразделить на две основные группы3: электронные словари (electronic dictionary) и системы машинного перевода (machine translation system). Тем не менее, данную работу мне хотелось бы больше посвятить именно системам машинного перевода, нежели электронным словарям (хотя справедливости ради следует будет упомянуть хотя бы об их классификации), поскольку работа с электронными словарями практически ничем не отличается от использования обычного словаря, так как они предоставляют пользователю возможность быстрого поиска лишь 1 отдельного слова (термина) или фразеологизма; системы же машинного перевода обеспечивают связный перевод текстов, учитывающий морфологические, синтаксические и семантические связи членов предложения. Сегодня программы-переводчики умеют строить осмысленные фразы, и за последние несколько лет качество перевода улучшилось. Однако компьютер еще плохо разбирается в грамматических нюансах и жаргоне, поэтому его главное назначение – переводы деловых бумаг, руководств, писем из электронной почты, страничек из Интернета (Web-страниц). Это если вам достаточно лишь общего понимания текста. Другое применение систем – облегчение рутинной работы переводчиков, выполнение за них подстрочного перевода, который можно легко подправить. О наиболее удачных системах мы и поговорим в этой работе.

Я также расскажу о том, как осуществляется машинный перевод, кто занимается составлением программ-переводчиков и как они работают. Особое внимание мне хотелось бы уделить проблематике машинного перевода, поскольку машинный перевод для нас пока еще новшество, область мало в литературе освещенная, поэтому и поле для работы огромно. К тому же я ни за что не поверю, чтобы Вы ни разу не задавали себе вопрос: «А может очень скоро в результате новых компьютерных технологий спрос на переводчиков упадет до минимума?», но тут же успокаивали себя: «Нет, компьютер никогда не вытеснит профессию переводчика, ведь любая компьютерная программа – результат деятельности человека, а главное, мы можем чувствовать, в отличие от машины, а следовательно, лучше подбирать слова и эквиваленты». Тогда нужен ли вообще машинный перевод? Что ж, не будем забегать вперед, и рассмотрим все по порядку.

 

М А Ш И Н Н Ы Й П Е Р Е В О Д

 

В последнее время знание иностранных языков может понадобиться не только в путешествии или на приеме гостей из-за рубежа, но и в собственном доме, например, при просмотре популярных голливудских кинолент, при чтении инструкции по использованию заморских товаров или Web-страниц, которые разыскивает по всему свету неутомимый браузер. Таким образом, оказывается, что даже не покидая родных стен, мы нуждаемся в услугах переводчика. Однако необходимую помощь нам вполне может оказать домашний компьютер.

Системы машинного перевода (МП) давно перестали быть диковинкой. Они постепенно выходят из младенческого возраста и вместо бессвязного детского лепета начинают изъясняться на вполне понятном, "человеческом" языке. До последнего времени такие программы были не только очень дороги, уступая в цене разве что мощным графическим и издательским системам, но и весьма сложны и капризны в работе. И вот появились первые переводчики, пригодные для использования на домашнем ПК. Давайте познакомимся с ними поближе и узнаем, на что они способны. Но начнем, конечно же, с истории развития МП.

 

 

  1. ИСТОРИЯ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА

 

По свидетельству биографов, еще выдающийся математик XIX века Чарльз Бэббидж пытался убедить британское правительство в необходимости финансировать его исследования по разработке “вычислительной машины”. В числе прочих благ он обещал, что когда-нибудь эта машина сможет автоматически переводить разговорную речь. Но, хотя сегодня Бэббидж и считается признанным автором множества идей, лежащих в основе работы компьютера, он так и не сумел ни построить свою машину, ни выполнить обещания по поводу МП. И сегодня эта идея по-прежнему остается в значительной степени нереализованной. Однако в последнее время благодаря появлению Интернет как платформы глобальной связи она вновь начала привлекать широкое внимание и инвестиции.

Вообще, первые программы МП появились в 50-х годах, всего несколько лет спустя после рождения компьютера, но до широкого распространения ПК МП был скорее интересным объектом научных исследований, чем важной сферой использования вычислительной техники, по двум причинам: дороговизна времени работы компьютера и коллективное пользование его ресурсами. Последнее обстоятельство часто не позволяло немедленно обратиться к электронному помощнику, сводя на нет важнейшее преимущество МП перед обычным – его оперативность.

Датой рождения МП (как области исследований) принято считать 1947 г., и все началось с письма Уоррена Уивера, директора отделения естественных наук Рокфеллеровского фонда, к Норберту Винеру в марте того же года, в котором задача перевода сравнивалась с задачей дешифровки текстов. Последняя в то время уже стала выполняться на электромеханических устройствах. За этим письмом последовало множество дискуссий, появился меморандум о целях, и наконец, были выделены средства на исследования. И в 1952 г. состоялась первая конференция, организованная знаменитым математиком Бар-Хиллелем, на которой исследователи обменялись мыслями относительно организации множества синтаксических правил языка, способов описания семантики, морфологических структур, структуры словарей для систем перевода. Достижения в академических исследованиях стимулировали коммерческий интерес к проблеме МП, и фирма IBM совместно с Джорджтаунским университетом в США в 1954 г. сумела показать первую систему, базирующуюся на словаре из 250 слов и 6 синтаксических правил и обеспечивающую перевод 49 заранее отобранных предложений. Этот эксперимент положил начало исследовательскому буму: в следующие 10 лет правительство и военные ведомства США затратили на исследования в области МП около 40 млн. долларов.

От эйфории, связанной с первыми результатами, до практически полного отрицания осуществимости МП прошло всего восемь лет. К подобному выводу пришли на основании обзора, выполненного специальным комитетом по прикладной лингвистике (ALPAC) Национальной Академии наук США. В нем констатировалось, что системы автоматического перевода не смогут обеспечить приемлемое качество в обозримом будущем. Этот отчет драматически повлиял на развитие МП, так как были практически прекращены какие бы то ни было исследования из-за отсутствия финансирования, по крайней мере, в США и Европе. И лишь в конце 70-х годов занятия МП возобновились вместе с возрастанием интереса со стороны проектировщиков и исследователей к лингвистическим проблемам искусственного интеллекта и компьютерного поиска информации.

И только с начала 80-х годов, когда ПК уверенно и мощно начали завоевывать мир, время их работы, естественно, подешевело и доступ к ним можно было получить в любую минуту. А значит, МП наконец-то стал экономически выгодным. К тому же в эти и последующие годы совершенствование программ позволило достаточно точно переводить многие виды текстов, однако некоторые проблемы МП остались нерешенными и по сей день.

90-е годы можно считать  подлинной эпохой возрождения в развитии МП, что связано не только с высоким уровнем возможностей персональных компьютеров, появлением сканеров4 и программ OCR5, но и с распространением Интернет/интранет (Internet/intranet), обусловивших реальный спрос на МП. Он вновь стал привлекательной областью вложения капиталов как для частных инвесторов, так и для государственных структур.

И хотя технологии МП по-прежнему страдают множеством недостатков, многие организации вновь стали серьезно относиться к обещанию Бэббиджа. “Машинный перевод все еще далек от совершенства, но любой желающий с его помощью сможет, по крайней мере, понять основной смысл документа”, — считает Луи Монье, технологический директор Alta Vista, крупного поискового Web-узла, который начал эксперимент с МП в онлайновом режиме6.

Страны Европейского Союза потратили за последние 15 лет более 70 млн. долл. на исследования по этой проблеме, а японские государственные организации — более 200 млн. долл. По словам T.Р.Педтке (представителя правительства США), сделавшего очень интересный доклад на MT SUMMIT VI о стратегической важности МП для его страны, одну из главных ролей в развитии этого направления продолжает играть правительство. Проблема МП рассматривается как ключевая в вопросах продвижении высоких технологий и обеспечении конкурентоспособности США в глобальном информационном пространстве.

 

 

  1. ЭЛЕКТРОННЫЕ СЛОВАРИ

 

Электронные словари (ЭС) начали разрабатываться значительно раньше, чем альтернативные им системы МП, поэтому в настоящее время на рынке программного обеспечения имеется чрезвычайно широкий выбор словарей — от самых простейших (например, DIC) до мощных систем, объединяющих в одной программной оболочке несколько лексических баз данных — специализированных тематических словарей, последовательность подключения которых определяется пользователем (LINGVO). Выбор того или иного программного продукта зависит исключительно oт аппаратных возможностей компьютера, которым располагает пользователь, финансовых соображений и конкретных условий, в которых работает переводчик.

Потенциальную аудиторию этих программ можно определить совершенно точно – это учащиеся и студенты, использующие словарь как одно из пособий при изучении иностранного языка, а также домашние и бизнес-пользователи, которым нужен универсальный и простой в применении словарь-справочник для эпизодического перевода деловых бумаг и корреспонденции.

Ниже представлена классификация электронных словарей по их основным техническим и эксплуатационным характеристикам. Всю совокупность ЭС можно подразделить по следующим критериям.

Информация о работе Машинный перевод