Автор работы: Пользователь скрыл имя, 18 Ноября 2012 в 19:30, курсовая работа
За последние 10-15 лет характер работы переводчика и требования к нему существенно изменились. В первую очередь изменения коснулись перевода научно-технической, официальной и деловой документации.
Память переводов
Па́мять перево́дов (ПП, англ. translation memory, TM иногда называемая «Накопитель переводов») — база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже — часть сложносочинённого предложения, либо абзац). Если очередное предложение исходного текста в точности совпадает с предложением, хранящимся в базе (точное соответствие, англ. exact match), оно может быть автоматически подставлено в перевод. Новое предложение может также слегка отличаться от хранящегося в базе (неточное соответствие, англ. fuzzy match). Такое предложение может быть также подставлено в перевод, но переводчик будет должен внести необходимые изменения.
Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведенные тексты (например, новых версий программных продуктов или изменений в законодательстве), системы ПП также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.
В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который могут порождать практически все системы ПП. Благодаря этому результаты работы переводчиков можно обменивать между приложениями, то есть переводчик работающий с OmegaT может использовать ПП, созданную в ТРАДОСе и наоборот.
Большинство систем ПП как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.
1.3 Средства автоматизированного перевода (CAT-tools)
Наиболее распространенные CAT-средства
SDL Trados
Trados — система автоматизированного перевода, первоначально (с 1992 года) разработанная немецкой компанией Trados GmbH. Является одним из мировых лидеров в классе систем Translation Memory (TM, Память переводов).
Trados GmbH была основана в 1984 году в Штутгарте. В 1997 году 20 % акций компании были приобретены Microsoft. В 2002 году Trados объединилась с Uniscape Inc., и объединённая компания получила название Trados Inc. со штаб-квартирой в Александрии (США, штат Виргиния). В июне 2005 года компания Trados была приобретена британской SDL International, и в 2006 году был выпущен совместный продукт SDL Trados, включающий системы Trados и SDLX.
Система Trados состоит из модулей, предназначенных для перевода текстов различного формата: документов Microsoft Word, презентаций PowerPoint, текстов в формате HTML и других метаданных, документов FrameMaker, InterLeaf и др., а также для ведения терминологических баз данных (модуль MultiTerm). Последняя версия системы, выпущенная независимой компанией Trados — 7.0. Последняя версия Trados на сегодняшний день — SDL Trados Studio 2011.
Концепция Translation Memory предполагает выявление в переводимом тексте фрагментов, переводы которых уже имеются в базе данных переводов, и за счет этого сокращение объёма работы переводчика. Фрагменты, оставшиеся непереведёнными, передаются дальше для ручной обработки переводчику или системе машинного перевода (Machine Translation, MT). Переводчик на этом этапе может выделить вновь переведённые фрагменты и занести новые пары параллельных текстов на двух языках в базу данных. Такая схема наилучшим образом работает в случае однотипных текстов, где повторяемость словосочетаний достаточно высока, то есть в случае разного рода инструкций для пользователей, технических описаний и т. п.
Основные модули
Déjà Vu
Déjà Vu — проприетарная система автоматизированного перевода, разработанная испанской компанией Atril Language Engineering. Является одним из мировых лидеров в классе систем памяти переводов.
Компания Atril Language Engineering основана в 1993 году. Компания занимается разработкой компьютерных систем для автоматизации работы переводчиков и переводческих агентств.
Версия продукта |
Год выпуска |
Поддерживаемая ОС |
Déjà Vu version 1 |
1993 — 1996 |
MS DOS |
Déjà Vu 3 |
1996 — 2001 |
MS Windows 95 |
Déjà Vu X |
2001 — 2011 |
MS Windows 98, ME, 2000, XP, Vista, 7 |
Déjà Vu X2 |
c 2011 года |
MS Windows XP, Vista, 7 |
Версия продукта |
Год выпуска |
Поддерживаемая ОС |
Déjà Vu Х Standard
Целевая группа: переводчики-фрилансеры. Описание: данная версия предназначена для переводчиков, желающих получить простой и удобный инструмент для работы. Позволяет создавать полноценные проекты, однако в ней отсутствуют некоторые автоматизированные функции, которые есть в версии Professional.
Déjà Vu Professional
Целевая группа: переводчики-фрилансеры. Описание: классическая версия программы для переводчиков со всеми автоматизированными функциями «Интеллектуального качества»: «Предперевод», «Автопоиск» по базам данных, «Автоподстановка» перевода по всем аналогичным сегментам на проекте, «Автопополнение» баз данных, а также «Автосборка» перевода из фрагментов, хранящихся в базах данных. Использование функций Лексикона позволяет создавать глоссарии на основе переводимых Вами проектов, определить частотность употребления терминов и использовать полученные глоссарии для контроля качества.
Déjà Vu Workgroup
Целевая группа:
переводческие агентства и
Déjà Vu X TeaM Server
Гибкое решение, которое дает возможность пользователям Déjà Vu X2 Workgroup делиться базами данных в режиме реального времени по всему миру. Данное решение обеспечивает непревзойденное качество, единообразие и производительность, плюс более низкие проектные затраты. Возможные схемы лицензирования могут снизить или совсем исключить ручное администрирование проектов.
Поддерживаемые форматы
Déjà Vu X способен создавать проекты и работать с Microsoft Word, Rich Text Format, Windows Help, Microsoft Excel, Micosoft PowerPoint, Microsoft Access, OpenOffice/StarOffice, Adobe FrameMaker MIF, Adobe InDesign, Adobe PageMaker tagged text, QuarkXPress XTG, Interleaf ASCII, HTML, ASP/ASP.NET, PHP, JavaScript, VBScript, HTML Help, SGML, XML, RC, C/C++/Java, Java properties, IBM TM untranslated segments, Trados WorkBench documents, TradosTag TTX, Trados TagEditor BIF, Trados TagEditor TMX, GNU PO и POT files и файлами в кодах ASCII — plain text files.
WORDfast (http://www.wordfast.net)
Wordfast - это программа автоматизированного перевода (CAT), разработанная в качестве надстройки для Microsoft Word.
Разработка Wordfast
ver. 1 (называемой в то время просто
Wordfast) началась в 1999 в Париже Ивом Шамполионом.
Это был набор макросов, запускаемых
из-под Microsoft Word, версии 97 или выше. В
то время все программы автоматизи
Вплоть до конца 2002 года, это ПО (теперь называемое Wordfast Classic) распространялось бесплатно. Благодаря хорошим отзывам, Wordfast стал вторым по распространенности среди переводчиков средством автоматизированного перевода.
В 2006, была основана компания Wordfast LLC. До этого времени разработка программы производилась лично Ивом Шамполлионом.
В январе 2009 года, компания Wordfast выпустила в свет Wordfast Translation Studio включившую Wordfast Classic и Wordfast Professional, отдельно работающее Java приложение автоматизированного перевода. Оба инструмента могут быть приобретены как отдельно, так и вместе в составе студии.
В мае 2010 года, компания Wordfast запустила бесплатный онлайн инструмент Wordfast Anywhere. Данный инструмент позволяет переводчикам работать над проектами практически из любого места и с любого устройства, имеющего выход в сеть. К концу июля 2010 года на проекте зарегистрировалось более 5000 пользователей, а к ноябрю их число стало 10 000.
Wordfast использует
прозрачный, открытый формат для
всех своих данных и в то
же время поддерживает
Хотя Wordfast в основном предназначен для индивидуальной работы переводчика, он легко интегрируется в рабочий процесс бюро переводов и крупных клиентов. Вся эта мощь умещается в одном компактном шаблоне Word™ можно обмениваться данными посредством локальной сети или через Интернет.
Интеграция Wordfast с распространенными средствами перевода
Wordfast совместим
со всеми распространенными
Wordfast сомвместим с файлами, подготовленными (размеченными) для перевода с помощью стандартных программ, например фильтров Trados (Stagger) или RWS (Rainbow).
Wordfast совместим с Trados на уровне переведенных (сегментированных, двуязычных) документов: файл, переведенный в Wordfast, можно очистить при помощи Trados и наоборот.
Совместимость с платформами:
Операционная система |
Примечания |
Windows 95, 98, Me |
Тест пройден: совместимы |
Windows NT 4 |
Тест пройден: совместимы |
Windows 2000 |
Тест пройден: совместимы |
Windows XP |
Тест пройден: совместимы |
Windows Vista |
Тест пройден (возможно потребуется отключить управление учётными записями пользователей (UAC) в панели управления): совместимы |
Mac OS 7, 8, 9 |
Идёт тестирование |
Mac OSX (рекомендуется: OSX 10.3.4 или выше) |
Идёт тестирование |
Linux (Mandrake, XFCE, VMWare & Office 97) |
Тест пройден: несовместимы |
Linux (Suse, KDE2 + Crossover & Word 2000) |
Тест пройден: несовместимы |
Принцип работы САТ-средств. (http://www.tmemory.ru/)
Программа извлекает текст из файлов с оригиналом, делит его на сегменты (по знакам препинания или другим настраиваемым критериям) и представляет в виде таблицы, слева – сегменты оригинала, справа – пустые сегменты, куда переводчик заносит перевод. Простой табличный формат помогает переводчику следить за тем, чтобы не оставалось непереведенных фраз и предложений. Из всех сегментов в паре «оригинал-перевод» составляются базы данных памяти перевода.
При обработке нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами прошлых переводов. Если идентичный или сегмент, подобный исходному, найден, то перевод этого сегмента отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются цветом, в таком случае следует провести только редактирование, а в случае если совпадений с базой не найдено, выполняется перевод.
Помимо этого осуществляется контроль над соблюдением терминологии, соответствием числовых значений и дат, проверяется орфография, сокращается время на верстку и редактирование, осуществляется автоматический анализ трудозатрат и трудоемкости.
Базы данных памяти перевода можно составить также из уже выполненных переводов с помощью встроенных функций в самом начале работы с программой.
Преимущества перевода с помощью CAT-средств (http://www.englishelp.ru)