Програмные системы -переводчики

Автор работы: Пользователь скрыл имя, 07 Мая 2012 в 16:24, контрольная работа

Описание работы

Принято считать, что мировая история машинного перевода началась с развитием компьютеров, однако идея создания механизма, способного осуществлять перевод текста с одного языка на другой, появилась еще в первой половине XVII века. Появление компьютеров позволило начать воплощение этих проектов в жизнь.

Содержание работы

ВВЕДЕНИЕ..............................................................................................................3

1. ИСТОРИЯ РАЗВИТИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА И ИХ СОВРЕМЕННОЕ СОСТОЯНИЕ............................................................................4
История машинного перевода как научно-прикладного

направления...................................................................................................4

2. ПРОГРАММНЫЕ СИТЕМЫ-ПЕРЕВОДЧИКИ.............................................14

2.1 Понятие и принцип работы программы-переводчика.......................14

2.2 Классификация систем перевода.........................................................19

3. АНАЛИЗ ПОПУЛЯРНЫХ СИСТЕМ – ПЕРЕВОДЧИКОВ..........................22

3.1 Характеристика онлайн-переводчиков...............................................22

3.2 Характеристика технологии Translation Memory...............................24

3.3 Анализ комбинированных систем.......................................................27

4 .СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПЕРЕВОДОВ, ВЫПОЛНЕННЫХ ПРОГРАММАМИ PROMT И PRAGMA............................................................29

5.ЗАКЛЮЧЕНИЕ..................................................................................................33

6.СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ.........................................34

Файлы: 1 файл

Контр.работа.Информатика.Программные_системы_переводчики.docx

— 59.60 Кб (Скачать файл)

СОДЕРЖАНИЕ

 

 

ВВЕДЕНИЕ..............................................................................................................3

1. ИСТОРИЯ РАЗВИТИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА И ИХ СОВРЕМЕННОЕ СОСТОЯНИЕ............................................................................4

    1. История машинного перевода как научно-прикладного

направления...................................................................................................4

2. ПРОГРАММНЫЕ СИТЕМЫ-ПЕРЕВОДЧИКИ.............................................14

2.1 Понятие и принцип  работы программы-переводчика.......................14

2.2 Классификация систем  перевода.........................................................19

3. АНАЛИЗ ПОПУЛЯРНЫХ СИСТЕМ – ПЕРЕВОДЧИКОВ..........................22

3.1 Характеристика онлайн-переводчиков...............................................22

3.2 Характеристика технологии Translation Memory...............................24

3.3 Анализ комбинированных  систем.......................................................27

4 .СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПЕРЕВОДОВ, ВЫПОЛНЕННЫХ ПРОГРАММАМИ PROMT И PRAGMA............................................................29

5.ЗАКЛЮЧЕНИЕ..................................................................................................33

6.СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ.........................................34

 

 

 

ВВЕДЕНИЕ

 

 

Принято считать, что мировая  история машинного перевода началась с развитием компьютеров, однако идея создания механизма, способного осуществлять перевод текста с одного языка  на другой, появилась еще в первой половине XVII века. Появление компьютеров  позволило начать воплощение этих проектов в жизнь.

Современные технологии машинного  перевода далеко ушли от первых попыток "научить" компьютер переводить текст. Сегодня системы машинного  перевода по праву принадлежат к  классу систем искусственного интеллекта, поскольку выполняют отдельные  функции интеллекта человека: они  конструируют текст на выходном языке  на основе входного текста, пользуясь  сводом определенных правил, заданных в виде структур данных и алгоритмов.

При пользовании системами машинного  перевода всегда встает вопрос о качестве их работы. Качество перевода зависит от многих факторов: размеров текста, использованных в тексте слов, сложности предложений. С одной стороны, на сегодняшний день ни одна система машинного перевода не может дать 100% качественный результат. После обработки текста подобной системой требуется обязательная его коррекция человеком. Но с другой стороны, идеального перевода от них никто и не ждет. Программные переводчики используются обычно для того, чтобы можно было понять общий смысл текста на иностранном языке.

 

 

 

 

 

1 ИСТОРИЯ РАЗВИТИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА И ИХ СОВРЕМЕННОЕ СОСТОЯНИЕ

 

 

1.1 История машинного перевода как научно-прикладного направления

 

История машинного перевода как научно-прикладного направления  началась в конце 40-х годов прошлого века (если не считать механизированное переводное устройство П. П. Смирнова-Троянского, своего рода лингвистический арифмометр, изобретенный в 1933 году). Теоретической  основой начального (конец 1940-х –  начало 1950-х годов) периода работ  по машинному переводу был взгляд на язык как кодовую систему. Пионерами  МП были математики и инженеры. Описания их первых опытов, связанных с использованием только что появившихся ЭВМ для  решения криптографических задач, были опубликованы в США в конце 1940-х годов. Датой рождения машинного  перевода как исследовательской  области обычно считают март 1947; именно тогда специалист по криптографии Уоррен Уивер в своем письме Норберту Винеру впервые поставил задачу машинного  перевода, сравнив ее с задачей  дешифровки.

Тот же Уивер после ряда дискуссий составил в 1949 г. меморандум, в котором теоретически обосновал  принципиальную возможность создания систем машинного перевода. У. Уивер писал: «I have a text in front of me which is written in Russian but I am going to pretend that it is really written in English and that it has been coded in some strange symbols. All I need to do is strip off the code in order to retrieve the information contained in the text» («У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все, что мне нужно, — это взломать код, чтобы извлечь информацию, заключенную в тексте»). Аналогия между переводом и дешифрованием была естественной в контексте послевоенной эпохи, если учитывать успехи, которых достигла криптография в годы Второй мировой войны.

Идеи Уивера легли в  основу подхода к МП, основанного  на концепции interlingva: стадия передачи информации разделена на два этапа. На первом этапе исходное предложение переводится  на язык-посредник (созданный на базе упрощенного английского языка), а затем результат этого перевода представляется средствами выходного  языка.

Меморандум Уивера вызвал самый живой интерес к проблеме МП. В 1948 г. А. Бут и Ричард Риченс (Richard Richens) произвели некоторые предварительные  эксперименты (так, Риченс разработал правила разбиения словоформ  на основы и окончания). Вскоре началось финансирование исследований. На ранних этапах разработка МП активно поддерживалась военными, при этом в США основное внимание уделялось русско-английскому  направлению, а в СССР — англо-русскому.

Помимо очевидных практических нужд важную роль в становлении машинного  перевода сыграло то обстоятельство, что предложенный в 1950 г. английским математиком А. Тьюрингом знаменитый тест на разумность («тест Тьюринга») фактически заменил вопрос о том, может ли машина мыслить, на вопрос о том, может ли машина общаться с  человеком на естественном языке  таким образом, что тот не в  состоянии будет отличить ее от собеседника-человека. Тем самым вопросы компьютерной обработки естественно-языковых сообщений  на десятилетия оказались в центре исследований по кибернетике (а впоследствии по искусственному интеллекту), а между  математиками, программистами и инженерами-компьютерщиками  с одной стороны и лингвистами  – с другой установилось продуктивное сотрудничество.

В 1952 г. состоялась первая конференция  по МП в Массачусетском технологическом  университете, а в 1954 г. в Нью-Йорке  была представлена первая система МП — IBM Mark II, разработанная компанией IBM совместно с Джоржтаунским университетом (это событие вошло в историю как Джорджтаунский эксперимент). Была представлена очень ограниченная в своих возможностях программа (она имела словарь в 250 единиц и 6 грамматических правил), осуществлявшая перевод с русского языка на английский. В том же 1954-м первый эксперимент по машинному переводу был осуществлен в СССР И. К. Бельской (лингвистическая часть) и Д. Ю. Пановым (программная часть) в Институте точной механики и вычислительной техники Академии наук СССР, а первый промышленно пригодный алгоритм машинного перевода и система машинного перевода с английского языка на русский на универсальной вычислительной машине были разработаны коллективом под руководством Ю. А. Моторина. После этого работы начались во многих информационных институтах, научных и учебных организациях страны. Казалось, что создание систем качественного автоматического перевода вполне достижимо в пределах нескольких лет (при этом акцент делался на развитии полностью автоматических систем, обеспечивающих высококачественные переводы; участие человека на этапе постредактирования расценивалось как временный компромисс). Профессиональные переводчики всерьез опасались в скором времени остаться без работы.

50-е: первое  разочарование

К началу 50-х годов целый  ряд исследовательских групп  в США и в Европе работали в  области МП. В эти исследования были вложены значительные средства, однако результаты очень скоро разочаровали инвесторов. Одной из главных причин невысокого качества МП в те годы были ограниченные возможности аппаратных средств: малый объем памяти при  медленном доступе к содержащейся в ней информации, невозможность  полноценного использования языков программирования высокого уровня. Другой причиной было отсутствие теоретической  базы, необходимой для решения  лингвистических проблем, в результате чего первые системы МП сводились к пословному (word-to-word) переводу текстов без какой-либо синтаксической (а тем более смысловой) целостности.

В 1959 г. философ Й. Бар-Хиллел (Yohoshua Bar-Hillel) выступил с утверждением, что высококачественный полностью  автоматический МП (FAHQMT) не может быть достигнут в принципе. В качестве примера он привел проблему нахождения правильного перевода для слова pen в следующем контексте: John was looking for his toy box. Finally he found it. The box was in the pen. John was very happy (Джон искал свою игрушечную коробку. Наконец он ее нашел. Коробка была в манеже. Джон был очень счастлив). Pen в данном случае должно переводиться не как «ручка» (инструмент для письма), а как «детский манеж» (play-pen). Выбор того или иного перевода в этом случае и в ряде других обусловлен знанием внеязыковой действительности, а это знание слишком обширно и разнообразно, чтобы вводить его в компьютер. Однако Бар-Хиллел не отрицал идею МП как таковую, считая перспективным направлением разработку машинных систем, ориентированных на использование их человеком-переводчиком (своего рода «человеко-машинный симбиоз»).

Это выступление самым  неблагоприятным образом отразилось на развитии МП в США. В 1966 г. специально созданная Национальной Академией  наук комиссия ALPAC (Automatic Language Processing Advisory Committee), основываясь в том числе  и на выводах Бар-Хиллела, пришла к заключению, что машинный перевод  нерентабелен: соотношение стоимости  и качества МП было явно не в пользу последнего, а для нужд перевода технических и научных текстов  было достаточно человеческих ресурсов. За докладом ALPAC последовало сокращение финансирования исследований в области  МП со стороны правительства США  — и это несмотря на то, что  в то время как минимум три  различные системы МП регулярно  использовались рядом военных и  научных организаций (в числе  которых ВВС США, Комиссия США  по ядерной энергии, Центр Евроатома  в Италии).

 

60-е: низкий  старт

Следующие десять лет разработка систем МП осуществлялась в США университетом Brigham Young University в Прово, штат Юта (ранние коммерческие системы WEIDNER и ALPS) и финансировалась  Мормонской церковью, заинтересованной в переводе Библии; в Канаде группами исследователей, в числе которых TAUM в Монреале с ее системой METEO; в  Европе — группами GENA (Гренобль) и SUSY (Саарбрюкен). Особого упоминания заслуживает  работа в этой области отечественных  лингвистов, таких, как И. А. Мельчук  и Ю. Д. Апресян (Москва), результатом  которой стал лингвистический процессор  ЭТАП. В 1960 г. в составе Научно-исследовательского института математики и механики в Ленинграде была организована экспериментальная  лаборатория машинного перевода, преобразованная затем в лабораторию  математической лингвистики Ленинградского государственного университета.

70-80-е: новый  импульс

Новый подъем исследований в области МП начался в 1970-х  годах и был связан с серьезными достижениями в области компьютерного  моделирования интеллектуальной деятельности. Соответствующая область исследований, возникшая несколько позже МП (датой ее рождения обычно считают 1956 г.), получила название искусственного интеллекта, а создание систем машинного  перевода было осмыслено в 1970-е годы как одна из частных задач этого  нового исследовательского направления.

При этом несколько сместились акценты: исследователи теперь ставили  целью развитие «реалистических» систем МП, предполагавших участие человека на различных стадиях процесса перевода. Системы МП из «врага» и «конкурента» профессионального переводчика  превращаются в незаменимого помощника, способствующего экономии времени  и человеческих ресурсов.

За период 1978-93 гг. в США  на исследования в области МП истрачено 20 миллионов долларов, в Европе — 70 миллионов, в Японии — 200 миллионов.

Можно выделить два основных стимула к развитию работ по машинному  переводу в современном мире. Первый – собственно научный; он определяется комплексностью и сложностью компьютерного  моделирования перевода. Как вид  языковой деятельности перевод затрагивает  все уровни языка – от распознавания  графем (и фонем при переводе устной речи) до передачи смысла высказывания и текста. Кроме того, для перевода характерна обратная связь и возможность  сразу проверить теоретическую  гипотезу об устройстве тех или иных языковых уровней и эффективности  предлагаемых алгоритмов. Эта характеристическая черта перевода вообще и машинного  перевода в частности привлекает внимание теоретиков, в результате чего продолжают возникать все новые  теории автоматизации перевода и  формализации языковых данных и процессов. Вместе с тем разработки в области  МП стимулировали развитие не только лингвистики. Результаты работ по МП способствовали началу и развитию исследований и разработок в области автоматизации  информационного поиска, логического  анализа естественно-языковых текстов, экспертных систем, способов представления  знаний в вычислительных системах и  т.д.

Второй стимул – социальный, и обусловлен он возрастающей ролью  самой практики перевода в современном  мире как необходимого условия обеспечения  межъязыковой коммуникации, объем которой  возрастает с каждым годом. Другие способы  преодоления языковых барьеров на пути коммуникации – разработка или принятие единого языка, а также изучение иностранных языков – не могут  сравниться с переводом по эффективности. С этой точки зрения можно утверждать, что альтернативы переводу нет, так  что разработка качественных и высокопроизводительных систем машинного перевода способствует разрешению важнейших социально-коммуникативных  задач.

Информация о работе Програмные системы -переводчики