Обзор онлайн-переводчиков

Автор работы: Пользователь скрыл имя, 06 Апреля 2015 в 19:24, контрольная работа

Описание работы

Онлайн-переводчики: за и против. История становления машинного перевода. Обзор систем онлайн-перевода текста. Сравнительная таблица программ для автоматического перевода текста.

Файлы: 1 файл

Обзор онлайн.doc

— 227.00 Кб (Скачать файл)

Это письмо вызвало большой резонанс, и в 1949 г., после многочисленных дискуссий, Уоррен Уивер опубликовал специальный меморандум, теоретически обосновывавший возможность реализации предложенной им идеи машинного перевода. Мысли, высказанные в этом меморандуме, вызвали очень активный интерес международных ученых и инженеров и легли в основу «концепции «interlingva», согласно которой процесс перевода делился на два этапа: 1) перевод исходного текста на промежуточный язык (в основе которого лежал упрощенный вариант английского языка), 2) оформление промежуточного перевода средствами конечного языка. В 1952 г. была проведена первая конференция, организатором которой стал известный математик Бар-Хиллел, посвященная вопросу о выработке различных способов семантического описания, синтаксических языковых правил, морфологических структур и структуры словарей, необходимых для систем автоматического перевода.

Большую роль в развитии машинного перевода также сыграл факт, что популярный в те времена «тест на разумность», который был предложен в 1950 г. Алан Тьюрингом, английским математиком, практически сменил вопрос «обладает ли машина способностью мыслить?» вопросом «способна ли машина общаться с человеком посредством естественного языка таким образом, чтобы человек не смог отличить ее от живого человека?». В центр исследований встал вопрос о компьютерной обработке языковых сообщений на естественном языке, а между программистами и лингвистами установилось невиданное доселе взаимопонимание. Органы государственной власти стали проявлять активный интерес к идее машинного перевода и начали выделять огромные суммы денежных средств на финансирование данного проекта.

Первый успех в сфере автоматизации переводов связан с "Джорджтаунским экспериментом", который был осуществлены 1954 г. на машине IBM-701. Программно-языковое обеспечение данного эксперимента было очень скромным: словарная база состояла лишь из 250 слов, а грамматика была представлена 6 синтаксическими правилами, вся же система могла перевести всего 49 предварительно отобранных предложений. Эксперимент положил начало настоящему исследовательскому буму, в течение следующего десятилетия правительство США потратило на исследования в области машинного перевода примерно 40 млн. долл. Следует отметить, что перевод выполнялся с русского языка на английский, что, возможно, в какой-то мере объясняет последующую резкую активизацию разработок в этой области также в СССР. К концу 1955 г. во многих академических центрах СССР были созданы и протестированы программы машинного перевода, в основу которых легла имевшаяся в то время вычислительная база (БЭСМ и "Стрела").

Первые успехи вызвали настоящую эйфорию среди специалистов. Сразу же после достижения положительных результатов было создано несколько глобальных проектов, направленных на решение проблемы машинного перевода для современных языков, а также большое количество мелких проектов для отдельных направлений. Особое внимание стало уделяться вопросам моделирования языка и языковых аспектов, языковой и мыслительной деятельности, изучению языковой формы. В 50-х гг. прошлого века во многих странах мира были созданы отделения машинного перевода и прикладной лингвистики.

Но, к сожалению, реализация идеи машинного перевода оказалось не таким уж легким делом, как казалось поначалу. Изучение данной проблемы за свою историю переживало триумфы и падения. В середине 60-х гг. был завершен первый этап исследований систем машинного перевода, и первоначальное воодушевление сменилось скептическим настроением, чему в значительной степени поспособствовала публикация доклада специального комитета по прикладной лингвистике (ALPAC) Национальной академии наук США, так называемая «черная книги машинного перевода». Авторы данного доклада утверждали, что системы автоматического перевода не смогут обеспечивать приемлемое качество переводов в будущем. В результате этого было прекращено финансирование подобных исследований и, соответственно, остановлены все начатые работы.

Но, несмотря на то, что машинный перевод был признан бесперспективным, данная проблема всегда вызывала высокий интерес, и лишь на заре 80-х гг. тема машинного перевода снова приобрела актуальность - наряду с изучением систем информационного поиска и искусственного интеллекта началось восстановление незаконченных разработок в области автоматизации переводов. В течение этого времени были выработаны способы морфологического анализа (автоматического) для основных языков Европы, сформулированы основные требования к семантическим элементам таких систем и разработаны методы автоматического анализа синтаксических структур. В условиях международного терминологического обмена были составлены крупные электронные словари, оснащенные богатым словарным запасом и терминологической базой по различным научно-техническим отраслям. За это время были созданы крупные международные проекты с солидными бюджетами, к числу которых относятся EU ROTRA (Европейское экономическое сообщество), METAL (США и Германия), ARIANE (Франция), KANT (США) и пр. Но, как и раньше, ни один из этих проектов не смог предложить уникальное решение, применимое в рамках массового использования.

Глобальные проекты были посвящены решению общих задач машинного перевода и ориентированы на разработку способов описания слов, входящих в терминологическую базу словаря, и, отдельно, на создание алгоритмов перевода. Наряду с этими разработками, проводились отдельные исследования, посвященные описанию, например, способов выражения прямого дополнения для глаголов говорения». К сожалению, все эти системы сопровождались скромным уточнением «прототип» или «экспериментальная», а реальную коммерческую систему так никто и не мог предложить. Объяснением всему был тот факт, что все разработанные методы описания перевода, при их переносе в естественную среду, противоречили с методами, применяемыми при составлении словарных статей. Локальные же проекты занимались решением узких задач. В рамках таких проектов словарное описание и описание алгоритмов трактовались как стороны одного вопроса, но поиск решения осуществлялся в ограничении грамматического или семантического аспекта. Это ограниченное количество грамматических алгоритмов можно было применить для описания определенной части предложений естественных языков, но на его основе невозможно было правильно анализировать и переводить реальные тексты. Несмотря на то, что эти подходы не привели к созданию практически применимых коммерческих систем, проведенные работы позволили понять всю сложность стоявшей перед разработчиками задачи и сузить сферу исследований в подобных проектах. Как это ни парадоксально, однако именно такие локальные проекты легли в основу систем машинного перевода, которые сегодня предлагаются пользователям. К их числу относятся системы Power Translator (производство Globalink), TRANSEND (компания Intergraph), а также Language Assistant (MicroTac).

Однако реальная сложность задач, с которыми столкнулись создатели систем машинного перевода, была выше, чем уровень развития имевшегося в то время аппаратно-программного обеспечения. Количество одних только грамматических и орфографических правил, необходимых для создания таких систем, доходило до десятков тысяч. Объемы памяти и скорость работы имевшихся в то время компьютеров не были в состоянии справиться с реальными массивами данных. В результате этого, «вторая волна» разработок и исследований в области систем машинного перевода тоже сошла на нет.

Зато 90-е годы, в течение которых индустрия информационных и коммуникационных технологий пережила бурный прогресс, стали эпохой возрождения машинного перевода: создание персональных компьютеров, внедрение Интернета и локальных сетей обусловили стремительный рост интереса к машинному переводу. Созданные программы машинного перевода стали перспективной сферой для капиталовложений для частных предпринимателей и государственных структур. В условиях такого расцвета совершенствование систем машинного перевода казалось более реальной задачей, а достигнутые результаты – пользующимися еще большим спросом.

В целом, история становления машинного перевода насчитывает чуть больше 50 лет. За все это время одни системы машинного перевода сменялись другими – начиная с программ, основанных на ресурсах первых прототипов современных компьютеров и заканчивая коммерческими системами, предлагаемыми конечным пользователям и использующими мощные ресурсы онлайн-серверов и персональных компьютеров. В ходе устранения технических недостатков, становилось очевидным, что перевод текстов с одних языков на другие не ограничивается примитивной перекодировкой слов. Основные трудности, возникающие в процессе перевода, должны устраняться путем автоматизированного представления смыслового содержания текста, а также фоновых знаний о понятиях той предметной области, к которой относится исходный текст.

По мере того, как разрабатывались новые методики и программные решения для осуществления машинного перевода, мировой рынок наполнялся огромным количеством соответствующих программ. Сегодня сеть Интернет предлагает пользователям свыше сотни сервисов, предоставляющих услуги онлайн-перевода текста.

3. Обзор систем  онлайн-перевода текста

Сегодня разработками программ машинного перевода занимаются многие компании, однако на мировом рынке лидируют продукты двух организаций – зарубежная компания Systran и российская компания ПРОМТ. В число других крупных производителей входят Linguatec и Langenscheidt (Германия), Transparent Language, Babylon, Translation Experts (США), японо-тайская компания Asia Online и др.

Ознакомившись с результатами рейтинга существующих сервисов онлайн-перевода текста и мнениями пользователей различных форумов, посвященных современным онлайн-переводчикам, мы выделили наиболее популярные онлайн-сервисы, доступные современным пользователям сети Интернет:

1. Translate.ru (онлайн-переводчик  компании ПРОМТ) 
2. SYSTRANet (Systran) 
3. Google Trnslate (Google) 
4. Free Translation (SDL) 
5. Babel Fish (Systran) 
6. Worldlingo (Systran) 
7. InterTran (Translation Experts Limited) 
8. ImTransator (Smartlink Corp) 
9. Tranlslate Online.ua 
10. Windows Life Translator (Microsoft)

Многие разработчики программ машинного перевода предоставляют свои услуги переводов в режиме онлайн в качестве рекламы своего программного обеспечения для выполнения профессиональных переводов.

Итак, давайте рассмотрим функциональные возможности каждого из сервисов онлайн-перевода текста.

1. Translate.ru (PROMT) 
http://www.translate.ru

Компания ПРОМТ считается абсолютным лидером на российском рынке услуг онлайнового перевода. Данный сервис существует с 1998 года (для западных пользователей есть версии на других языках по адресу: www.online-translator.com).

Онлайн-переводчик ПРОМТ поддерживает семь европейских языков (английский, русский, итальянский, немецкий, испанский, португальский и французский) и осуществляет переводы в 25 направлениях:

  • с английского языка - на испанский, португальский, итальянский, русский, немецкий и французский языки;
  • с испанского – на английский, немецкий, русский и французский языки;
  • с итальянского – на английский и русский языки;
  • с немецкого – на русский, английский, испанский и французский;
  • с португальского – на английский;
  • с русского – на испанский, английский, французский и немецкий;
  • с французского – на испанский, английский, немецкий и русский.

При переводе специализированных текстов можно выбрать определенную тематику – общение, бизнес, компьютеры, автомобили, путешествия, спорт или «другое». Кроме того, бесплатно зарегистрировавшись на сайте, пользователь имеет возможность выбрать дополнительные настройки (подключить специализированные словари, установить настройки для перевода текстов большего объема, получить грамматическую информацию). Недостатком программы является ограничение объема вводимого текста до 500 знаков.

Помимо перевода текстов, данный онлайн-переводчик текста также предлагает услуги перевода web-страниц с полным сохранением исходного форматирования, электронных сообщений (e-mail), а также WAP (перевод отдельных слов для мобильных пользователей). Если при переходе по необходимой ссылке вы хотите получить готовый перевод веб-страницы, нужно просто установить флажок «Автоматический перевод ссылок», выбрать в списке «Тема» соответствующую тематику и нажать на кнопку «Перевести».

К числу дополнительных удобств относятся виртуальная клавиатура, возможность проверки орфографии, опциональная настройка транслитерации незнакомых слов и перекодировки кириллицы. Кроме того, существуют различные возможности работы с готовым переводом – его можно отправить по электронной почте, распечатать или просто скопировать из поля для перевода.

2. SYSTRANet 
http://www.systranet.com/

Сервис онлайн-перевода, предлагаемый другим мировым лидеров в области систем машинного перевода - американской компанией Systran.

Онлайн-перевод текста этого сервиса поддерживает 15 языков: арабский, китайский, английский, голландский, немецкий, французский, итальянский, греческий, корейский, японский, португальский, русский, польский, шведский и испанский. В общей сложности, данный переводчик осуществляет переводы в 53 языковых направлениях:

  • с арабского, китайского, японского, польского, корейского, русского и шведского языков - на английский;
  • с китайского - на английский;
  • с голландского - на английский и французский языки;
  • с английского – на арабский, китайский, французский, голландский, греческий, немецкий, корейский, японский, итальянский, польский, русский, португальский, шведский и испанский языки;
  • с французского – на голландский, немецкий, греческий, английский, итальянский, португальский и испанский языки;
  • с немецкого – на итальянский, португальский, английский, французский и испанский языки;
  • с греческого – на английский и французский;
  • с итальянского – на немецкий, английский, французский, испанский и португальский языки;
  • с португальского – на немецкий, английский, итальянский, французский и испанский языки;
  • с испанского – на итальянский, английский, португальский, немецкий и французский языки;

Кроме обычной функции перевода связных текстов онлайн-переводчик SYSTRANet также осуществляет переводы веб-страниц, а также файлов с расширениями .txt, .htm, .rtf. Кроме того, пользователю предлагается опция выбора тематических словарей или создания собственного словаря. Но чтобы создать свой словарь или загрузить файл поддерживаемого формата, сначала необходимо зарегистрироваться на данном сайте.

3. Google Translate 
http://translate.google.com/ 
http://translate.google.ru/

Сервис Google Translate представляет собой онлайн-переводчик текстов и веб-страниц, который является одним из элементов поисковой системы Google. Данный онлайн-переводчик работает с 51 языком (английский, африкаанс, арабский, албанский, болгарский, белорусский, валлийский, вьетнамский, венгерский, греческий, голландский, галисийский, иврит, датский, идиш, индонезийский, ирландский, исландский, испанский, итальянский, корейский, каталанский, китайский, литовский, латышский, малайский, македонский, мальтийский, норвежский, немецкий, польский, португальский, персидский, русский, румынский, суахили, словацкий, сербский словенский, тайский, турецкий, тагальский, украинский, французский, финский, хорватский, хинди, чешский, шведский, эстонский и японский) и, в целом, осуществляет перевод в 2250 языковых направлениях. В данном сервисе появилось несколько новых удобных функций. Теперь можно не пользоваться кнопкой «Перевести», так как программа автоматически переводит слово или текст по мере их ввода в соответствующее поле. При переводе отдельных слов программа функционирует как онлайн-словарь и предлагает все возможные варианты перевода, разбивая все слова по частям речи. Кроме того, при переводе труднопроизносимого слова программа предлагает пользователю выбрать опцию «Показать транслитерацию», которая осуществляет написание данного слова средствами расширенной латиницы. Данная опция доступна для всех языков, которые используют нелатинскую письменность, за исключением арабского, персидского языков и иврита. Как и другие онлайн-переводчики текстов, Google осуществляет перевод веб-страниц. Кроме того, он поддерживает дополнительную поисковую функцию «Поиск с переводом», которая позволяет найти веб-сайты на языке пользователя по переводу того или иного слова или предложения.

Информация о работе Обзор онлайн-переводчиков