Автор работы: Пользователь скрыл имя, 30 Ноября 2013 в 18:57, реферат
Новим інструментом перекладача стала технологія Translation Memory (TM). На Заході технологія TM і створений на її базі інструментарій перекладача - Translation Memory Tools (TMT) - добре відомі й широко застосовуються. Особливістю такої технології є механізація перекладацької діяльності, а не її автоматизація в тому вигляді, якому її бачили творці технології MT. Причому це більш скромне, на перший погляд, рішення принесло практичної користі набагато більше, ніж глобальний задум "електронних перекладачів".
Відмінність від електронних словників та інших інструментів перекладача полягає в тому, що типова програма класу ТМ заснована на нейронних мережах, які здатні в певній мірі моделювати роботу людського мозку при обробці даних
Зміст
Глава 1. Що таке технологія Translation Memory 3
Глава 2. Огляд основних програм класу Memory Translations 5
Глава 3. Перспективи технології Translation Memory в нашій країні. 9
Література 11
Міністерство освіти і науки, молоді та спорту України
Київський національний лінгвістичний університет
Реферат
з дисципліни «Сучасні інформаційні
технології
та засоби автоматизованого перекладу»
Тема:
«Пам`ять перекладача. Системи Translation Memory»
Київ 2012
Зміст
Глава 1. Що таке технологія Translation Memory 3
Глава 2. Огляд основних програм класу Memory Translations 5
Глава 3. Перспективи технології Translation Memory в нашій країні. 9
Література 11
Новим
інструментом перекладача стала технологія
Translation Memory (TM). На Заході технологія TM і
створений на її базі інструментарій перекладача
- Translation Memory Tools (TMT) - добре відомі й широко
застосовуються. Особливістю такої технології
є механізація перекладацької діяльності,
а не її автоматизація в тому вигляді,
якому її бачили творці технології MT. Причому
це більш скромне, на перший погляд, рішення
принесло практичної користі набагато
більше, ніж глобальний задум "електронних
перекладачів".
Відмінність від електронних словників
та інших інструментів перекладача полягає
в тому, що типова програма класу ТМ заснована
на нейронних мережах, які здатні в певній
мірі моделювати роботу людського мозку
при обробці даних. Ці мережі здатні навчатися
й аналізувати складні набори даних, які
складно обробляти за допомогою лінійних
алгоритмів.
У цих програмах використовуються розмитий
алгоритм, що дозволяє відшукувати слова
не тільки в їх словникових формах, а й
в інших формах, наприклад, в іншому відмінку.
Крім того, вони можуть знаходити словосполучення
в іншому порядку слів. Самоорганізована
штучна нейронна мережа здатна знаходити
закономірності і визначати взаємозв'язки
між ними. Програма порівнює той фрагмент,
над яким ви зараз працюєте, з вмістом
бази даних, і надає цю інформацію на дисплей.
Вона може встановити, що даний фрагмент
схожий на аналогічний фрагмент, який
є в пам'яті системи, наприклад, на 99%, на
74%, або навіть на 20%.
Кожному перекладачу знайоме відчуття, що фраза, над якою він зараз б'ється, вже десь, колись зустрічалася, хоча б у приблизному вигляді. Причому попадалася або в цьому ж матеріалі, або в якомусь іншому, перекладному раніше. Прямо дежавю якесь ... Подивитися б її, цю фразу, хоча б для довідки, щоб толково сформулювати ту, над якою працюєш зараз...
Починаєш гортати оригінал назад, ритися на книжковій полиці. І часто бувало так, що шукана фраза дійсно виявлялася. Найчастіше, коли вже пізно, вже після того, як робота над перекладом закінчена. Здається, в таку хвилину все б віддав за засіб, яке допомогло б знайти необхідний текст. Навіть зараз, коли друкуєш текст перекладу з допомогою комп'ютера, а не на друкарській машинці, завжди шкода переробляти те, що складалося з таким трудом. Давня мрія перекладача - придумати якесь засіб, який би звільняло від необхідності переводити одну і ту ж фразу кілька разів.
Подібного роду ідея лежить в основі створення технології Translation Memory, або просто ТМ, на основі якої з кінця 80-х - початку 90-х років почали з'являтися більш-менш працездатні програми. По суті справи, така програма є керуючу оболонку, яка працює з тієї чи іншої підключається базою даних (ТМ) і яку я б назвав скарбничкою переказів. ТМ - це комп'ютеризована версія великого картотечного шафи, в якому зберігається кожна фраза, яку ви коли-небудь перекладали, причому в парі - як мовою оригіналу, так і перекладу. Кожна така пара називається білінгви. Програма миттєво нагадає вам, як цю фразу переводили в минулий раз. Доступ до інформації легкий і швидкий.
В даний час на світовому ринку представлено кілька програмних продуктів, що використовують технологію ТМ. Вони відрізняються один від одного, і часом істотно. Разом з тим їм усім притаманні деякі загальні функціональні можливості.
Наприклад, у них, як правило, передбачений текстовий редактор, що має два паралельних вікна. Одне вікно призначене для тексту оригіналу, друге - для перекладу. Коли у вікно оригіналу виводиться вихідний фрагмент тексту (це може бути пропозиція, абзац, окреме слово), починається пошук аналогічного фрагмента в базі даних. Якщо в пам'яті виявився точно такий же фрагмент, він виводиться у вікно перекладу автоматично. Якщо в точності такого ж фрагмент не знайшлося, але виявився якийсь схожий, то в вікно програми виводиться знайдений фрагмент із зазначенням відсотка збіги.
Перекладач редагує
Першу програму такого типу, що отримала назву Translation Manager, розробила фірма IBM. Спочатку IBM використовувала Translation Manager для власних потреб - для локалізації (адаптації на іноземні мови) власного програмного забезпечення. Потім Translation Manager був запропонований ринку в якості комерційного продукту, і деякий час він був монополістом у цій галузі. Ця програма досить проста у використанні, відрізняється швидкодією і забезпечує хороші можливості для індивідуальних налаштувань користувача. Для кожної з трьох основних функцій передбачені окремі вікна - Translation, Translation Memory і Dictionary. У вікні Translation Memory відображаються знайдені в пам'яті відповідності, якщо вони там є, а у вікно Dictionary виводиться термінологія зі словників, розроблених IBM. Є в цій програмі і деякі незручності, наприклад, ускладнена процедура пошуку в скарбничці пам'яті (Translation Memory) окремих слів.
Ще одна програма - SDLX - розроблена для своїх власних потреб англійською компанією SDL, що займається локалізацією програмного забезпечення. Кожна програма, що входить в комплект, встановлюється окремо. SDL Edit - це, власне, сама програма, за допомогою якої здійснюється переклад. У ній є три вікна, що показують вихідний текст, переклад і Translation Memory. Слід зазначити, що документ для перекладу не можна імпортувати безпосередньо в SDL Edit. Спочатку його необхідно перетворювати за допомогою SDL Convert, що є певним незручністю.
Програма Déjà Vu користується у перекладачів в Європі популярністю завдяки своїй гнучкості та адаптивності. Крім зручності, Déjà Vu відрізняється від інших продуктів найвищим співвідношенням ціна / якість. У порівнянні з двома попередніми програмами розглянутий продукт має ряд зручних можливостей. Фахівці відзначають, що з самого початку ця програма розроблялася в контакті з її майбутніми користувачами. Відомо, що остання версія Déjà Vu тестувалася, зокрема, російськими перекладачами. Один з них, Андрій Герасимов, написав позитивну рецензію на цю програму в журналі MultiLingual Computing & Technology
Відома в нашій країні й популярна в Європі програма STAR Transit. По своїй ідеології вона абсолютно не схожа на інші продукти розглянутого класу. Ви вже отримали певне уявлення про них, і знаєте, що всі вони мають центральну базу даних великої ємності, скарбничку перекладів, в якій потрібні дані виявляються миттєво (якщо вони там є, звичайно). Як сказав би Білл Гейтс: "Information at your fingertips". Так от, всі програми Translation Memory мають електронний каталожний шафа, а Transit - не має. У нього все по-іншому. Вихідні дані і переклад зберігаються в текстовому форматі у вигляді файлів, які перекладач розміщує в директоріях на свій розсуд. Потім перекладач може просто вказати програмі, які директорії і навіть які файли йому необхідні. Потім Transit формує асоціативну мережу посилань, з якою і ведеться робота. Незважаючи на окремі плюси, в Росії Transit не отримав широкого розповсюдження. В кінцевому рахунку Promt, офіційний дистриб'ютор Transit, переключився на дистрибуцію Translator's Workbench фірми Trados.
А ось Translator's Workbench, або просто Традос, швидко набув широкого поширення в Росії, спочатку серед перекладацьких фірм, а потім і серед індивідуальних перекладачів. Напевно, це можна пояснити тим, що він дає можливість працювати, не виходячи з Word'a, що психологічно комфортніше. Кому приємно дивитися на текст, поцяткований всілякими кодами в квадратних дужках? Translator's Workbench (Традос) в порівнянні з іншими програмами більш зручний для звичайного перекладача, який не є фахівцем з програмування, він більш зрозумілий у порівнянні з іншими програмами подібного типу. Зокрема, кнопки управління забезпечені спливаючими підказками. Перебуваючи в знайомому і зрозумілому Word'е, можна використовувати всі його інструменти (наприклад, автотекст).
Даний продукт має повний набір корисних інструментів, які в інших програмах присутні лише в тій чи іншій мірі. Одним з таких інструментів є Analise, що дозволяє заздалегідь проаналізувати текст оригіналу і з'ясувати, чи є там (і в якій кількості) повні і неповні збіги. Варто згадати і таку зручний інструмент, як Placeables, що дозволяє, наприклад, автоматично змінювати цифри в тексті, якщо все інше в перекладному фрагменті збігається з виявленим в скарбничці переказів (ТМ). Дуже зручна автоматична функція заміни в цифрах десяткових точок і / або ком, формату часу, абревіатур і т.д. на відповідні параметри, що задаються перекладачем.
Резюмуючи опис основних програмних продуктів класу Translation Memory, слід відзначити наявність у них, як правило, ряду загальних функціональних можливостей.
Зведення – Alignment. Ця функція дозволяє створювати скарбнички переказів (ТМ) з існуючих файлів. З двох файлів - один з текстом оригіналу, а інший з текстом перекладу - створюється набір білінгв. Навпаки пропозиції вихідного тексту вибудовується його переклад. І так по всіх файлів, які перекладач звів у єдину скарбничку. Ступінь зручності функції суміщення у різних програм різна.
Обслуговування – Maintenance. У міру накопичення в базі даних білінгв їх кількість може збільшитися настільки, що вміст бази може вийти за всі межі. Можуть виявитися якісь неточності і навіть помилки, особливо якщо програма використовується в мережі багатьма користувачами. Виникне необхідність щось змінити або уточнити, а то й просто видалити. Справедливості заради треба сказати, що згадане засіб обслуговування програм до кінця цю проблему не вирішує - боротися на практиці з засміченням скарбничок перекладів все одно важко.
Термінологічний словник - Terminology Program. Всі розглянуті програми мають свої термінологічні словники, які є по суті відомими всім електронними словниками. Термінологічні словники можуть імпортувати файли в форматі словників або глосаріїв, їх можна поповнювати і вручну.
Текстовий редактор - Document Editor. Тут, власне, і здійснюється процес перекладу. Для цього у всіх програм передбачені згадувані вище два вікна - для вихідного тексту і для його перекладу. У всіх текстових редакторів є можливість встановлювати в процентах ступінь подібності між перекладним в даний момент вихідним текстом і текстом в скарбничці переказів. Чим вище ви встановите відсоток схожості, наприклад, 90% або 95%, тим менше вірогідність виявлення там відповідного тексту. Однак можна встановить відсоток поменше, тоді може набратися чимало матеріалу, який був би корисний хоча б для довідки.
Конкорданси (Зв'язка слововживання з контекстом) – Concordance. Це дуже корисна функція всіх розглянутих програм. Нерідко буває, що якийсь термін (або поєднання термінів) може мати кілька значень або відтінків значень. Виділивши термін, можна переглянути у вікні все білінгви, наявні в скарбничці, причому в самих різних контекстах. Це завжди полегшує вибір найбільш точного варіанта перекладу даного терміна або поєднання.
Наталія Шахова, директор агентства EnRus, вважає що більшість TM-продуктів позбавляють користувача від необхідності знайомитися з різними текстовими процесорами. Досить вивчити особливості текстового редактора самого продукту, і вам стане підвладне все розмаїття текстів, будь вони представлені в QuarkXPress, FrameMaker або Adobe Illustrator. Тут є, звичайно, певний підступ: для того щоб освоїти черговий текстовий процесор або видавничу систему, вам знадобиться відповідна програма-фільтр, яка - що? Правильно - продається за окремі гроші! Взагалі грошове питання самий серйозний, коли мова йде про TMT. Коштують вони недешево (як правило, кілька сотень доларів), сумісності, ясна річ, немає. Тому якщо ви придбали (і освоїли!) Який-небудь продукт для одного проекту, то для наступного може знадобитися придбати інший продукт і знову витрачати час на його вивчення.
Далі Наталія Шахова зазначає, що на Заході вже щосили обговорюють наслідки повсюдного поширення таких програм. Одне з них полягає в тому, що перекладач-новачок втрачає можливість вийти на ринок. Точно так само, як в Росії вже дуже важко отримати замовлення перекладачеві, якщо у нього немає комп'ютера і принтера, так і за кордоном виникають проблеми працевлаштування у перекладачів, які не мають TM-програми. У цього явища є і позитивна сторона - наймаючи на роботу власника TM-програми, замовник отримує деяку гарантію його професіоналізму. Але ж і новачки повинні мати можливість стартувати!
Коли в 1999 році бюро перекладів
"Фонетікс" почало працювати з
Trados Translator's Workbench, то природно, в ході
контактів з замовниками ми розповідали
про перехід на нову технологію.
Всупереч очікуванням, реакція була
настороженою, а часом і просто
негативною. Виявилося, що ідея машинного
перекладу була вже скомпрометована
бездумним застосуванням в 90-х
роках програм типу Stylus і Socrat. Причому
їх нерідко використовували
Информация о работе Пам`ять перекладача. Системи Translation Memory