Автор работы: Пользователь скрыл имя, 07 Мая 2012 в 16:24, контрольная работа
Принято считать, что мировая история машинного перевода началась с развитием компьютеров, однако идея создания механизма, способного осуществлять перевод текста с одного языка на другой, появилась еще в первой половине XVII века. Появление компьютеров позволило начать воплощение этих проектов в жизнь.
ВВЕДЕНИЕ..............................................................................................................3
1. ИСТОРИЯ РАЗВИТИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА И ИХ СОВРЕМЕННОЕ СОСТОЯНИЕ............................................................................4
История машинного перевода как научно-прикладного
направления...................................................................................................4
2. ПРОГРАММНЫЕ СИТЕМЫ-ПЕРЕВОДЧИКИ.............................................14
2.1 Понятие и принцип работы программы-переводчика.......................14
2.2 Классификация систем перевода.........................................................19
3. АНАЛИЗ ПОПУЛЯРНЫХ СИСТЕМ – ПЕРЕВОДЧИКОВ..........................22
3.1 Характеристика онлайн-переводчиков...............................................22
3.2 Характеристика технологии Translation Memory...............................24
3.3 Анализ комбинированных систем.......................................................27
4 .СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПЕРЕВОДОВ, ВЫПОЛНЕННЫХ ПРОГРАММАМИ PROMT И PRAGMA............................................................29
5.ЗАКЛЮЧЕНИЕ..................................................................................................33
6.СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ.........................................34
Действующие системы машинного
перевода, как правило, ориентированы
на конкретные пары языков (например, французский
и русский или японский и английский)
и используют, как правило, переводные
соответствия либо на поверхностном
уровне, либо на некотором промежуточном
уровне между входным и выходным
языком. Качество машинного перевода
зависит от объема словаря, объема информации,
приписываемой лексическим
В практике переводческой деятельности и в информационной технологии различаются два основных подхода к машинному переводу. С одной стороны, результаты машинного перевода могут быть использованы для поверхностного ознакомления с содержанием документа на незнакомом языке. В этом случае он может использоваться как сигнальная информация и не требует тщательного редактирования. Другой подход предполагает использование машинного перевода вместо обычного «человеческого». Это предполагает тщательное редактирование и настройку системы перевода на определенную предметную область. Здесь играют роль полнота словаря, ориентированность его на содержание и набор языковых средств переводимых текстов, эффективность способов разрешения лексической многозначности, результативность работы алгоритмов извлечения грамматической информации, нахождения переводных соответствий и алгоритмов синтеза. На практике перевод такого типа становится экономически выгодным, если объем переводимых текстов достаточно велик (не менее нескольких десятков тысяч страниц в год), если тексты достаточно однородны, словари системы полны и допускают дальнейшее расширение, а программное обеспечение удобно для постредактирования.
2.2 Классификация систем перевода
1. Системы машинного перевода (МП)
Системы машинного перевода - программы, осуществляющие полностью автоматизированный перевод.Главным критерием программы является качество перевода. Кроме этого, для пользователя важными моментами является удобство интерфейса, лёгкость интеграции программы с другими средствами обработки документов, выбор тематики, утилита пополнения словаря. С появлением Internet основные поставщики систем машинного перевода включили в свои продукты Web-интерфейсы, обеспечив при этом их интеграцию с остальным программным обеспечением и электронной почтой, что позволило применять механизмы МП для перевода Web-страниц, электронной корреспонденции и онлайновых разговорных сеансов.
2. Системы перевода с функцией Translation Memory (TM)
Предоставляют средства для
так называемого Machine Assisted Human Translation
(MAHT) - перевода, выполняемого человеком
с помощью машины. Первоначальное
предназначение систем ТМ - облегчение
работы переводчиков при локализации
программных продуктов и
3. Контролируемый язык и машинный перевод на основе базы знаний
В системах на основе контролируемого языка реализован переход от свободного входного языка к контролируемому входному языку. Контроль входного языка предусматривает определённые ограничения лексики, грамматики, семантики. Контролируемый входной язык используется для упрощения выражений исходного текста, чтобы повысить качество перевода.
4. Онлайн переводчики
Службы онлайн перевода выполняют
перевод непосредственно в окне
Web-браузера, не требуя установки программы-
Как правило, существует ограничение на объем вводимого текста. Так же существует различие в количестве языков, на которые переводчик способен переводить и с которых.
Онлайн перевод с Английского – English:
5. Онлайн словари
Существует возможность поиска, есть строка ввода и меню для выбора входного и выходного языка, среди словарей - SDL-TRADOS MultiTerm, Langenscheidt's New College Dictionary online, ABBYY Lingvo и т.д.
6. Услуги по переводу в Интернете
Практически каждая компания-производитель
систем машинного перевода предлагает
услуги по переводу. Чаще всего пользователю
представляется возможность выбора:
получить только машинный перевод, либо
машинный перевод с последующим
редактированием
3 АНАЛИЗ ПОПУЛЯРНЫХ СИСТЕМ - ПЕРЕВОДЧИКОВ
3.1 Характеристика онлайн-переводчиков
Translate.ru — самый известный переводчик текстов , web-страниц, электронной почты и wap от компании PROMT. Доступны 24 направления перевода. Для расширения возможностей перевода необходимо зарегистрироваться на сайте. В этом случае пользователь получает возможность переводить тексты большого размера и доступ к выбору тематики перевода: общая лексика, автомобили, банковское дело, интернет, логистика и т.д. Присутствует проверка орфографии.
ImTranslator — многофункциональный переводчик от компании Smart Link Corporation. Позволяет переводить тексты на множество языков, использовать словари, проверку орфографии, виртуальную клавиатуру, а также печатать результаты перевода и отправлять e-mail. ImTranslator содержит 24 языка перевода: английский, арабский, болгарский, голландский, греческий, датский, испанский, итальянский, китайский традиционный, китайский упрощенный, корейский, немецкий, норвежский, польский, португальский, румынский, русский, финский, французский, хинди, хорватский, чешский, шведский, японский. Текст для перевода может быть на: английском, арабском, греческом, датском, испанском, итальянском, китайском, корейском, немецком, португальском, русском, французском, японском. Кроме того, данный онлайн-переводчик содержит интерфейс на 6 языках. Предоставляет хорошее качестов перевода.
Reverso — онлайн-переводчик текста и сайтов от французской компании Softissimo. Reverso работает с 6 языками: английский, итальянский, испанский, немецкий, русский, французский. Текст для перевода может быть на любом из этих языков. Позволяет использовать виртуальную клавиатуру и печать результатов перевода. Текстовый блок имеет ограничение в 300 символов. Качество перевода среднее.
WorldLingo — онлайн-переводчик текста, документов и сайтов. Доступны 14 языков перевода: английский, арабский, голландский, греческий, итальянский, испанский, китайский, корейский, немецкий, португальский, русский, французский, шведский, японский. Текст для перевода может быть на любом из этих языков. Данный онлайн-переводчик содержит более 20 тематик. Текстовый блок имеет ограничение в 500 слов. Качество пеервода оставляет желать лучшего.
InterTran — онлайн-переводчик небольших текстов и словосочетаний. Имеет 27 языков перевода: английский, болгарский, валлийский, венгерский, голландский, греческий, датский, исландский, испанский, испанский (европейский), испанский (латиноамериканский), итальянский, немецкий, норвежский, польский, португальский (бразильский), португальский (европейский), румынский, русский, сербский, словенский, финский, французский, хорватский, чешский, шведский, японский. Текст для перевода может быть на любом из этих языков. InterTran лучше всего переводит короткие словосочетания. Текстовый блок имеет ограничение в 1000 символов.
Windows Live Translator работает с 11 языками, включая русский. При этом с использованием русского языка поддерживаются только два направления перевода: русско-английский и англо-русский (на другие языки с русского перевести нельзя, так же как нельзя перевести на русский с других языков, кроме английского). Объем переводимого текста ограничен 500 словами. При осуществлении перевода Windows Live Translator в основном использует систему SYSTRAN, но для перевода текстов компьютерной тематики также применяется собственная система машинного перевода, разрабатываемая в Microsoft.
Ectaco работает с 43 языками, это не только английский, французский и другие стандартные языки, но и арабский, два варианта китайского, хинди, японский, корейский. Сам сайт не имеет русской версии, но форма перевода включает русский интерфейс, на который можно переключиться. Есть проверка орфографии. Изюминкой системы является предоставляемая возможность прослушать, как будет звучать то или иное слово или даже текст на одном из доступных языков: английский, русский, китайский, французский, немецкий, итальянский, японский, корейский, португальский и испанский. Можно даже менять скорость, с которой произносится текст.
Google Translate — онлайн-переводчик текста и веб-страниц, встроенный в поисковую систему Google. Содержит 42 языка перевода. В отличие от других сервисов перевода, которые используют технологию SYSTRAN, Google использует собственное программное обеспечение. Google Translate, как и другие инструменты автоматического перевода, имеет свои ограничения. Этот инструмент может помочь читателю понять общий смысл содержания текста на иностранном языке, но он не предоставляет достаточно точных переводов. Google Translate часто дает буквальные переводы слова, вне контекста, не применяя к ним каких-либо грамматических правил. Данный онлайн-переводчик содержит дополнительнкю функцию — поиск с переводом. Пользователь вводит запрос на родном языке и указывает язык, на который этот запрос переводится. В результатах выводятся сайты, переведенные на язык пользователя.
3.2 Характеристика технологии Translation Memory
ТМ – это база данных, где хранятся выполненные переводы. Технология ТМ работает по принципу накопления: в процессе перевода в ТМ сохраняется исходный сегмент (предложение) и его перевод. При обработке нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами. Если идентичный или подобный исходному сегмент найден, то перевод этого сегмента отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются подсветкой. Таким образом, переводчику остается перевести только новые сегменты и отредактировать частично совпадающие. Каждое изменение или новый перевод сохраняются в ТМ. А в результате нет необходимости дважды переводить одно и то же предложение.
С другой стороны, при работе
с крупными проектами переводчик
сталкивается с проблемой согласованного
применения терминологического глоссария
в ходе длительного проекта или
быстрого повторного использования
ранее переведенного текста. По своей
природе подобные рутинные задачи сравнительно
легко (в отличие от машинного
перевода) формализуются и
Каждая запись базы данных ТМ представляет собой единицу (предложение или абзац) параллельных текстов (как правило, на двух языках). Такая база данных хранит предыдущие переводы с целью их возможного повторного использования и решения задач быстрого поиска по содержимому. Несмотря на то что программы, оснащенные памятью перевода, называются системами автоматизированного перевода (CAT, computer-aided/assisted translation), их не следует путать с программами машинного перевода (machine translation) – память перевода ничего не переводит сама по себе, в то время как машинный перевод основан на генерации переводов по результатам грамматического разбора исходного текста.
Как правило, запись памяти
перевода состоит из двух сегментов:
на исходном (source) и конечном (target) языках.
Если идентичный (или похожий) сегмент
на исходном языке встречается в
тексте, сегмент на конечном языке
будет найден в памяти перевода и
предложен переводчику в
Преимущества от использования
такого программного обеспечения поначалу
могут быть неочевидны – однако
по мере наполнения базы данных результаты
автоматической подстановки основ
для перевода будут становиться
все более точными и
Архитектура автоматизированной
системы и ее функциональные возможности
могут различаться. Средства поиска
могут работать как с целыми сегментами,
так и с отдельными словами
или фразами, позволяя переводчику
выполнять терминологический