Автоматизированный перевод

Автор работы: Пользователь скрыл имя, 18 Ноября 2012 в 19:30, курсовая работа

Описание работы

За последние 10-15 лет характер работы переводчика и требования к нему существенно изменились. В первую очередь изменения коснулись перевода научно-технической, официальной и деловой документации.

Скачать архив (599.45 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

Автоматизированный перевод.doc

— 763.00 Кб (Скачать файл)

Память переводов

Па́мять перево́дов (ПП, англ. translation memory, TM иногда называемая «Накопитель переводов») — база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже — часть сложносочинённого предложения, либо абзац). Если очередное предложение исходного текста в точности совпадает с предложением, хранящимся в базе (точное соответствие, англ. exact match), оно может быть автоматически подставлено в перевод. Новое предложение может также слегка отличаться от хранящегося в базе (неточное соответствие, англ. fuzzy match). Такое предложение может быть также подставлено в перевод, но переводчик будет должен внести необходимые изменения.

Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведенные тексты (например, новых версий программных продуктов или изменений в законодательстве), системы ПП также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.

В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который могут порождать практически все системы ПП. Благодаря этому результаты работы переводчиков можно обменивать между приложениями, то есть переводчик работающий с OmegaT может использовать ПП, созданную в ТРАДОСе и наоборот.

Большинство систем ПП как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

1.3 Средства автоматизированного перевода (CAT-tools)

Наиболее распространенные CAT-средства

SDL Trados

Trados — система автоматизированного перевода, первоначально (с 1992 года) разработанная немецкой компанией Trados GmbH. Является одним из мировых лидеров в классе систем Translation Memory (TM, Память переводов).

Trados GmbH была основана в 1984 году в Штутгарте. В 1997 году 20 % акций компании были приобретены Microsoft. В 2002 году Trados объединилась с Uniscape Inc., и объединённая компания получила название Trados Inc. со штаб-квартирой в Александрии (США, штат Виргиния). В июне 2005 года компания Trados была приобретена британской SDL International, и в 2006 году был выпущен совместный продукт SDL Trados, включающий системы Trados и SDLX.

Система Trados состоит из модулей, предназначенных для перевода текстов различного формата: документов Microsoft Word, презентаций PowerPoint, текстов в формате HTML и других метаданных, документов FrameMaker, InterLeaf и др., а также для ведения терминологических баз данных (модуль MultiTerm). Последняя версия системы, выпущенная независимой компанией Trados — 7.0. Последняя версия Trados на сегодняшний день — SDL Trados Studio 2011.

Концепция Translation Memory предполагает выявление в переводимом тексте фрагментов, переводы которых уже имеются в базе данных переводов, и за счет этого сокращение объёма работы переводчика. Фрагменты, оставшиеся непереведёнными, передаются дальше для ручной обработки переводчику или системе машинного перевода (Machine Translation, MT). Переводчик на этом этапе может выделить вновь переведённые фрагменты и занести новые пары параллельных текстов на двух языках в базу данных. Такая схема наилучшим образом работает в случае однотипных текстов, где повторяемость словосочетаний достаточно высока, то есть в случае разного рода инструкций для пользователей, технических описаний и т. п.

Основные модули

Translator’s Workbench — модуль работы с базами данных памяти переводов TM (создания, обслуживания, импорта, экспорта). Создание документов перевода и их редактирование производятся в отдельных модулях.
Панель Trados в Microsoft Word — модуль для перевода документов в Microsoft Word.
TagEditor — модуль для перевода документов в формате PowerPoint, Excel, HTML, XML и т. п.
WinAlign — модуль для создания памяти переводов на основе ранее переведённых двуязычных текстов.
S-Tagger — модуль для перевода документов в формате FrameMaker и InterLeaf.
T-Window — модуль для перевода текста из буфера обмена.
MultiTerm — модуль для ведения глоссариев.
ExtraTerm — модуль для автоматического поиска терминологических кандидатов в тексте и создания глоссариев на их основе.

Déjà Vu

Déjà Vu — проприетарная система автоматизированного перевода, разработанная испанской компанией Atril Language Engineering. Является одним из мировых лидеров в классе систем памяти переводов.

Компания Atril Language Engineering основана в 1993 году. Компания занимается разработкой компьютерных систем для автоматизации работы переводчиков и переводческих агентств.

Версия продукта	Год выпуска	Поддерживаемая ОС
Déjà Vu version 1	1993 — 1996	MS DOS
Déjà Vu 3	1996 — 2001	MS Windows 95
Déjà Vu X	2001 — 2011	MS Windows 98, ME, 2000, XP, Vista, 7
Déjà Vu X2	c 2011 года	MS Windows XP, Vista, 7
Версия продукта	Год выпуска	Поддерживаемая ОС

Déjà Vu Х Standard

Целевая группа: переводчики-фрилансеры. Описание: данная версия предназначена для переводчиков, желающих получить простой и удобный инструмент для работы. Позволяет создавать полноценные проекты, однако в ней отсутствуют некоторые автоматизированные функции, которые есть в версии Professional.

Déjà Vu Professional

Целевая группа: переводчики-фрилансеры. Описание: классическая версия программы для переводчиков со всеми автоматизированными функциями «Интеллектуального качества»: «Предперевод», «Автопоиск» по базам данных, «Автоподстановка» перевода по всем аналогичным сегментам на проекте, «Автопополнение» баз данных, а также «Автосборка» перевода из фрагментов, хранящихся в базах данных. Использование функций Лексикона позволяет создавать глоссарии на основе переводимых Вами проектов, определить частотность употребления терминов и использовать полученные глоссарии для контроля качества.

Déjà Vu Workgroup

Целевая группа: переводческие агентства и отделы переводов. Описание: мощный инструмент, который включает все функции версии Professional, плюс широкие возможности по организации коллективной работы, управлению проектами и интеграции. Обладает всеми функциями Déjà Vu Professional, но также позволяет вести коллективную работу через создание проектов-сателлитов для переводчиков-фрилансеров или редакторов с текстами на перевод, памятью переводов и терминологией, либо через задания на перевод во внешнем формате, с которым можно работать с помощью любого текстового редактора.

Déjà Vu X TeaM Server

Гибкое решение, которое дает возможность пользователям Déjà Vu X2 Workgroup делиться базами данных в режиме реального времени по всему миру. Данное решение обеспечивает непревзойденное качество, единообразие и производительность, плюс более низкие проектные затраты. Возможные схемы лицензирования могут снизить или совсем исключить ручное администрирование проектов.

Поддерживаемые форматы

Déjà Vu X способен создавать проекты и работать с Microsoft Word, Rich Text Format, Windows Help, Microsoft Excel, Micosoft PowerPoint, Microsoft Access, OpenOffice/StarOffice, Adobe FrameMaker MIF, Adobe InDesign, Adobe PageMaker tagged text, QuarkXPress XTG, Interleaf ASCII, HTML, ASP/ASP.NET, PHP, JavaScript, VBScript, HTML Help, SGML, XML, RC, C/C++/Java, Java properties, IBM TM untranslated segments, Trados WorkBench documents, TradosTag TTX, Trados TagEditor BIF, Trados TagEditor TMX, GNU PO и POT files и файлами в кодах ASCII — plain text files.

WORDfast (http://www.wordfast.net)

Wordfast - это программа автоматизированного перевода (CAT), разработанная в качестве надстройки для Microsoft Word.

Разработка Wordfast ver. 1 (называемой в то время просто Wordfast) началась в 1999 в Париже Ивом Шамполионом. Это был набор макросов, запускаемых из-под Microsoft Word, версии 97 или выше. В то время все программы автоматизированного перевода работали из-под Microsoft Word, например Trados.

Вплоть до конца 2002 года, это ПО (теперь называемое Wordfast Classic) распространялось бесплатно. Благодаря хорошим отзывам, Wordfast стал вторым по распространенности среди переводчиков средством автоматизированного перевода.

В 2006, была основана компания Wordfast LLC. До этого времени разработка программы производилась лично Ивом Шамполлионом.

В январе 2009 года, компания Wordfast выпустила в свет Wordfast Translation Studio включившую Wordfast Classic и Wordfast Professional, отдельно работающее Java приложение автоматизированного перевода. Оба инструмента могут быть приобретены как отдельно, так и вместе в составе студии.

В мае 2010 года, компания Wordfast запустила бесплатный онлайн инструмент Wordfast Anywhere. Данный инструмент позволяет переводчикам работать над проектами практически из любого места и с любого устройства, имеющего выход в сеть. К концу июля 2010 года на проекте зарегистрировалось более 5000 пользователей, а к ноябрю их число стало 10 000.

Wordfast использует прозрачный, открытый формат для всех своих данных и в то же время поддерживает совместимость с Trados и большинством программ автоматизированного перевода. Можно переводить файлы Ms-Word, Ms-Excel, Ms-PowerPoint а также целый ряд размеченных документов. К Wordfast подключаются программы машинного перевода, например PowerTranslator, Systran, Reverso и т.д. Имеются широкие возможности работы с терминологией.

Хотя Wordfast в основном предназначен для индивидуальной работы переводчика, он легко интегрируется в рабочий процесс бюро переводов и крупных клиентов. Вся эта мощь умещается в одном компактном шаблоне Word™ можно обмениваться данными посредством локальной сети или через Интернет.

Интеграция Wordfast с распространенными средствами перевода

Wordfast совместим со всеми распространенными программами перевода (Trados, IBM Translation Manager, SDLX, DéjàVu, Transit - либо через формат TMX, либо напрямую, на уровне собственного формата).

Wordfast сомвместим с файлами, подготовленными (размеченными) для перевода с помощью стандартных программ, например фильтров Trados (Stagger) или RWS (Rainbow).

Wordfast совместим с Trados на уровне переведенных (сегментированных, двуязычных) документов: файл, переведенный в Wordfast, можно очистить при помощи Trados и наоборот.

Совместимость с платформами:

Операционная система	Примечания
Windows 95, 98, Me	Тест пройден: совместимы
Windows NT 4	Тест пройден: совместимы
Windows 2000	Тест пройден: совместимы
Windows XP	Тест пройден: совместимы
Windows Vista	Тест пройден (возможно потребуется отключить управление учётными записями пользователей (UAC) в панели управления): совместимы
Mac OS 7, 8, 9	Идёт тестирование
Mac OSX (рекомендуется: OSX 10.3.4 или выше)	Идёт тестирование
Linux (Mandrake, XFCE, VMWare & Office 97)	Тест пройден: несовместимы
Linux (Suse, KDE2 + Crossover & Word 2000)	Тест пройден: несовместимы

Принцип работы САТ-средств. (http://www.tmemory.ru/)

Программа извлекает текст из файлов с оригиналом, делит его на сегменты (по знакам препинания или другим настраиваемым критериям) и представляет в виде таблицы, слева – сегменты оригинала, справа – пустые сегменты, куда переводчик заносит перевод. Простой табличный формат помогает переводчику следить за тем, чтобы не оставалось непереведенных фраз и предложений. Из всех сегментов в паре «оригинал-перевод» составляются базы данных памяти перевода.

При обработке нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами прошлых переводов. Если идентичный или сегмент, подобный исходному, найден, то перевод этого сегмента отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются цветом, в таком случае следует провести только редактирование, а в случае если совпадений с базой не найдено, выполняется перевод.

Помимо этого осуществляется контроль над соблюдением терминологии, соответствием числовых значений и дат, проверяется орфография, сокращается время на верстку и редактирование, осуществляется автоматический анализ трудозатрат и трудоемкости.

Базы данных памяти перевода можно составить также из уже выполненных переводов с помощью встроенных функций в самом начале работы с программой.

Преимущества перевода с помощью CAT-средств (http://www.englishelp.ru)

Обеспечивается единообразие перевода, что положительно сказывается на его качестве;
Ускоряется сам темп работ по переводу за счет возможности не переводить одинаковые фрагменты текста дважды. В результате, сокращаются сроки, необходимые на перевод;
Изменения, дополнения и замечания заказчика достаточно легко можно внести по всей базе переводов, что позволяет мгновенно исправить неточности в уже переведенных сегментах и избежать нового появления подобных ошибок.
В случае если исходный документ предоставлен в одном из приведенных ниже форматов, то перевод осуществляется без нарушения структуры документа. Фактически необходимо лишь подправить текстовые фрагменты для устранения несоответствия объемов текста оригинала и перевода.
CAT-средства позволяют снизить общую стоимость перевода для заказчика. В отличие от обычных расчетов на перевод, перевод с помощью CAT-средств тарифицируется по количеству слов с учетом следующих параметров:

количество одинаковых (повторяющихся) сегментов;
количество сегментов, совпадающих с памятью переводов в процентном соотношении.

Информация о работе Автоматизированный перевод