Автор работы: Пользователь скрыл имя, 16 Ноября 2015 в 01:37, курсовая работа
Цель исследования: изучить состав и структуру автоматических переводных словарей.
Задачи исследования:
1) проанализировать существующие определения словаря
2) дать определение переводному словарю, привести его характеристику
3) проанализировать лексический состав и объём автоматического переводного словаря
4) изучить динамичность автоматического переводного словаря
5) проанализировать состав и структуру словарных статей автоматического переводного словаря
Содержание
Научно-технический процесс продолжается, и в настоящее время компьютеры занимают все более значительное место не только среди программистов и инженеров, но и в среде самых разнообразных пользователей, включая лингвистов, переводчиков и специалистов, нуждающихся в оперативном переводе иноязычной информации.
В этой связи автоматические переводные словари являются очень удобным подручным средством. Они значительно экономят время и оптимизируют процесс понимания иноязычной информации, благодаря чему постепенно заменяют традиционные бумажные словари. Кроме того, сейчас имеются программы-переводчики, которые могут производить адекватный перевод иноязычных текстов и могут являться подспорьем в работе специалистов различных профилей, что так же весьма полезно и удобно.
Актуальность темы обусловлена интересом ученых к проблемам создания автоматического словаря, а также заинтересованностью профессионалов и пользователей ПК в быстром и эффективном переводе.
Объект исследования: автоматические переводные словари.
Предмет исследования: лингвистические особенности автоматических переводных словарей.
Цель исследования: изучить состав и структуру автоматических переводных словарей.
Задачи исследования:
1) проанализировать существующие определения словаря
2) дать
определение переводному
3) проанализировать лексический состав и объём автоматического переводного словаря
4) изучить динамичность автоматического переводного словаря
5) проанализировать состав и структуру словарных статей автоматического переводного словаря
6) изучить
автоматические переводные
Данная курсовая работа состоит из двух глав, введения, заключения и списка использованных источников и литературы.
Словари играют большую роль в современной культуре, в них отражаются знания, накопленные обществом на протяжении веков. Они служат целям описания и нормализации языка, содействуют повышению правильности и выразительности речи его носителей.
Вот какое определение дают словарю разные источники[5]:
Словари принято делить на два типа: энциклопедические и лингвистические[5].
Энциклопедические (от греч. enkyklios paideia – обучение по всему кругу знаний) словари содержат экстралингвистическую информацию об описываемых языковых единицах; эти словари содержат сведения о научных понятиях, терминах, исторических событиях, персоналиях, географии и т.п. В энциклопедическом словаре нет грамматических сведений о слове, а даётся информация о предмете, обозначаемом словом.
Объект описания лингвистических (языковых) словарей – языковые единицы (слова, словоформы, морфемы). В таком словаре слово (словоформа, морфема) может быть охарактеризовано с разных сторон, в зависимости от целей, объёма и задач словаря: со стороны смыслового содержания, словообразования, орфографии, орфоэпии, правильности употребления. В зависимости от того, сколько признаков слова описаны в словаре, различают словари одноаспектные и многоаспектные.
Одним из видов лингвистических словарей, является переводной словарь.
Переводной словарь — словарь, содержащий в сопоставлении слова одного языка и их переводные эквиваленты на другом языке (или на нескольких других языках, в таком случае переводной словарь является многоязычным)[5].
Характеристика переводных словарей осуществляется по следующим основным параметрам [1]:
Словарь, имеющий один входной и один выходной язык – двуязычный. Если мы имеем дело с многоязычным словарем, то он может иметь более одного входного и более одного выходного языка;
Возможность по желанию пользователя менять входной и выходной языки переводного словаря местами называется обратимостью словаря. Лексическая обратимость переводного словаря означает, что каждая лексическая единица может выступать в качестве запроса и в качестве ответа. При полной лексической обратимости словаря каждая лексическая единица, выступая в качестве единицы входного языка, должна иметь переводные эквиваленты на всех отдельных языках, входящих в состав многоязычного словаря);
В зависимости от того, кому адресован словарь, переводные словари делятся на активные и пассивные. Двуязычный словарь является активным, если он используется для перевода с родного языка на иностранный, а если он используется для перевода с иностранного на родной, то словарь – пассивный;
Лексика включенная в словарь;
Под словарным эквивалентом подразумевается перевод, приписываемый автором словаря лексеме входного языка. Традиционно выделяют три типа эквивалентности: полная, частичная и ложная (безэквивалентность).
Полная эквивалентность наблюдается в том случае, когда лексемы сравниваемых языков имеют сходную внешнюю форму и полностью совпадают семантически. Частичная эквивалентность имеет место в случае совпадения одних и несовпадения других значений семантических структур внешне сходных лексем. Ложная эквивалентность наблюдается тогда, когда лексемы не совпадают;
Словари – непременная часть личной библиотеки интеллигентного человека. Если подбор другой литературы определяется нашей профессией, вкусами, склонностями, то словари нужны всем и всегда. Их листают любопытные дети, причем преподаватели говорят, что чтение словарей "от нечего делать" – очень полезное развивающее занятие. Без словарей невозможно обойтись ни школьнику, ни студенту. Специалисты разных профилей заглядывают в них по миллиону поводов. И даже самые опытные переводчики, знающие иностранный язык, как родной, садясь за работу, все равно обкладывают весь рабочий стол словарями.
Огромные массивные книги, на перелистывание которых тратились часы, – стремительно уходят в прошлое. Нынешний переводчик предпочитает электронные словари, сокращающие время поиска нужного слова до нескольких секунд. Качеством и количеством статей автоматические переводные словари не уступают бумажным. Вдобавок они предоставляют массу всевозможных инструментов: сортировку входов по различным критериям, тезаурус, перевод словосочетаний, объединение нескольких словарей специализированной лексики в один массив слов, звуковую запись произношения слов и многое другое. Словари и сама концепция электронной книги оказались как будто созданными друг для друга. Примерно за десять последних лет компьютерный словарь научился сам находить нужное слово, уместился на недорогой и удобный компакт-диск и начал активно помогать пользователю учиться.
Отбор лексики для любого словаря обусловлен прежде всего тем, для решения каких задач данный словарь предназначен и кто будет его основным пользователем. Составитель словаря сам определяет, какие пласты лексики следует в него включать. Основной объем в нетерминологических переводных словарях отведен нормативной лексике общего языка, но немалую часть занимает и специальная лексика. В них включаются в меньших масштабах, устаревшая и диалектная лексика, региона- лизмы, экзотизмы и собственные имена. Остро стоит вопрос о введении ненормативной лексики [7].
Автоматические переводные словари предназначены в первую очередь для повышения оперативности перевода научно-технической литературы и документации [3]. Это объясняется особой ролью научно-технического перевода в информационной деятельности развитых стран. Причем его объемы и значение постоянно возрастают. Такая ориентация автоматических словарей предопределяет тот факт, что основную часть их состава занимает терминологическая лексика.
Однако наука не стоит на месте, она развивается, ежегодно появляются сотни новых изобретений, название каждого из которых – новый термин. Поэтому встает проблема нормирования в терминологии [3][7]. Одним из разработанных средств решения этой проблемы являются терминологические стандарты. В настоящее время создано значительное количество стандартов и рекомендаций по терминологии на международном, региональном и национальном уровнях. В некоторых странах стандартизованные термины и выражения становятся обязательными для употребления во всех документах, исходящих от правительственных организаций, в контрактах, в учебной литературе и в научных публикациях. Однако многие термины, рекомендованные к употреблению, в практике научно-технического общения используются редко или же вовсе не используются. Иногда специалисты не принимают стандартизованные термины, и активно выступают с их критикой. Это особенно остро ощущается в новых и развивающихся отраслях науки и техники. Включение в терминологические словари только стандартизованной лексики приводит к тому, что специалисты и переводчики не получают необходимой информации о множестве разговорных и сленговых синонимов рекомендованных терминов.
В некоторых языках, например в английском, разговорная лексика вообще и нерекомендованные термины довольно часто встречаются в научно-технических текстах, так что их отсутствие в терминологическом словаре становится реальной помехой для понимания текстов.
Автоматические переводные словари предназначены для обработки всех видов научно-технических текстов, поэтому они должны включать все термины, как стандартизованные и рекомендуемые, так и нерекомендуемые, как устоявшиеся, так и новые, которые еще не успели получить единого понимания и не вошли в общепринятую лексикографическую обработку.
Одно из основных преимуществ автоматического словаря перед традиционным состоит не в том, что он автоматический и потенциально превосходит традиционный словарь по скорости поиска нужной лексики, а именно в том, что он включает всю используемую терминологию, постоянно и часто пополняет свой состав новыми терминами и, как следствие, качественно превосходит по составу традиционный словарь [7]. Вместе с тем при таком свободном подходе к отбору лексики, для того чтобы словарь пользовался у читателя доверием, целесообразно сопровождать каждую лексическую единицу информацией, уточняющей сферу ее употребления, указанием на то, является ли данный термин общепринятым, зафиксирован ли он в стандартах, в авторитетных лексикографических изданиях.
Как правило, крупные промышленные автоматические словари содержат лексику нескольких тематических областей, поэтому проблема тематического пересечения для них стоит столь же остро, как и для традиционных терминологических словарей [7] [1]. Если для традиционной лексикографии эта проблема фактически равнозначна дилемме — включать или не включать слово, то в автоматическом переводном словаре, в силу его политематичности и большого объема, задача чаще сводится к решению, к какой тематической области отнести данную лексическую единицу.
Создатели промышленных автоматических переводных словарей уделяют решению этой задачи самое серьезное внимание и разрабатывают специальные тематические классификации лексики. Тематическое кодирование в таком словаре предназначено в первую очередь для решения проблемы омонимии и многозначности терминов и установления границ запроса. Поэтому чем глубже используемая в словаре тематическая классификация, тем успешнее могут быть решены эти задачи. Однако углубление классификации сопряжено с увеличением возможностей ошибок лексикографа при составлении словарных статей и затруднений пользователя при формировании запроса. Ошибки тематической атрибуции лексической единицы, либо приводят к сбоям в работе автоматического словаря, либо вынуждают пользователя расширять поиск необходимой ему лексики на несколько тематических областей, что, в конечном счете, снижает качество и скорость работы словаря и повышает эксплуатационные расходы.
Трудности создателей автоматических переводных словарей усугубляются и тем, что пока не разработаны общепризнанные теоретические принципы терминологической классификации человеческой деятельности, и поэтому каждый словарь и каждый терминологический банк руководствуются своей собственной, часто несовместимой с другими, классификацией, что осложняет координацию усилий в этом направлении и обмен лексическими массивами [7].
К тому же крупный автоматический переводной словарь промышленного типа должен быть «тексто-независимым», то есть ориентированным на обработку текстов самых различных видов, поэтому в него следует включать всю терминологическую лексику по основной тематике словаря, наиболее употребительную лексику из соседних тематических областей, общенаучную и общетехническую лексику, а также наиболее общеупотребительную [3]. Необходимость включения общей лексики объясняется тем, что при работе с техническими текстами трудности могут скрываться в незнании не только специальной лексики, но и некоторых слов общего языка.
Создатели автоматических переводных словарей не могут пойти по пути составителей традиционных терминологических словарей, которые обычно не включают в их состав общую лексику, справедливо полагая, что читатель найдет ее в обычных переводных словарях. Отсутствие в переводном словаре значительного числа слов из обрабатываемого текста заставляет пользователя слишком часто прерывать свою работу и обращаться за помощью к традиционному словарю. Не отрицая самой возможности обращения по конкретным вопросам к традиционным лексикографическим источникам, следует подчеркнуть, что чем чаще пользователь вынужден это делать, тем меньшими будут для него преимущества автоматического словаря перед традиционными и тем менее выгодным покажется ему использование автоматического переводного словаря в процессе обработки иноязычных текстов [3][7].
Информация о работе Состав и структура автоматических переводных словарей