Системы автоматизированного перевода и машинный перевод

Автор работы: Пользователь скрыл имя, 18 Октября 2012 в 17:02, реферат

Описание работы

За последние 10-15 лет характер работы переводчика и требования к нему существенно изменились. В первую очередь изменения коснулись перевода научно-технической, официальной и деловой документации. Сегодня уже недостаточно просто перевести текст, пользуясь компьютером как пишущей машинкой.

Файлы: 1 файл

lk4.doc

— 107.50 Кб (Скачать файл)

     В узких  предметных областях при большом  количестве исходных текстов  и устоявшейся терминологии переводчики могут использовать и машинный перевод, который может обеспечить хорошее качество перевода терминологии и устойчивых выражений в узкой области. Переводчик в этом случае осуществляет пост-редактирование полученного текста. Более половины текстов внутри Еврокомиссии (главным образом юридические тесты и текущая корреспонденция) переводится с использованием МП.

Память переводов

     Па́мять перево́дов (ПП, англ. translation memory, TM иногда называемая «Накопитель переводов») — база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже — часть сложносочинённого предложения, либо абзац). Если очередное предложение исходного текста в точности совпадает с предложением, хранящимся в базе (точное соответствие, англ. exact match), оно может быть автоматически подставлено в перевод. Новое предложение может также слегка отличаться от хранящегося в базе (неточное соответствие, англ. fuzzy match). Такое предложение может быть также подставлено в перевод, но переводчик будет должен внести необходимые изменения.

     Помимо  ускорения процесса перевода  повторяющихся фрагментов и изменений, внесенных в уже переведенные тексты (например, новых версий программных продуктов или изменений в законодательстве), системы ПП также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.

     В каждой  конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который могут порождать практически все системы ПП. Благодаря этому результаты работы переводчиков можно обменивать между приложениями, то есть переводчик работающий с OmegaT может использовать ПП, созданную в ТРАДОСе и наоборот.

      Большинство  систем ПП как минимум поддерживают  создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

Популярные программные системы ПП

В соответствии с недавними  обзорами использования систем ПП к  наиболее популярным системам относятся:

  • Deja Vu
  • OmegaT (бесплатная система, распространяемая по лицензии GNU)
  • SDLX
  • Trados (наиболее популярная программа, долгое время бывшая стандартом ПП)
  • Star Transit

Wordfast (реализована как набор макросов для MS Word)


Информация о работе Системы автоматизированного перевода и машинный перевод