Базы данных и лингвистические информационные ресурсы

Автор работы: Пользователь скрыл имя, 16 Июня 2014 в 14:53, курсовая работа

Описание работы

Цель настоящей работы – провести обзор исследований в области баз данных и информационных ресурсов рассмотреть возможности их использования.
Задачи:
Рассмотреть лингвистику как объект информационного отражения, определив те ее черты, которые обуславливают особенности и состав информационных ресурсов в этой области.
Изучить историю развития БД выделить и охарактеризовать основные возможности, функции и преимущества.

Файлы: 1 файл

Базы данных и лингвистические информационные ресурсы.docx

— 23.98 Кб (Скачать файл)

-  В грамматике (для определения частоты употребления грамматических морфем в текстах различного типа, выявления наиболее употребляемых типов словосочетаний и предложений, определения значений синонимичных морфологических единиц, частоты употребления классов слов и т.д.).

- В лингвистике текста (для дифференциации типов текста, создания конкордансов, выявления связи между предложениями в абзацах и между абзацами «т.д.).

- При автоматическом переводе текстов (для поиска контекстов слов, имеющих несколько переводных эквивалентов, поиска переводных эквивалентов терминологических и фразеологических словосочетаний в параллельных текстах и т.д.).

-  В учебных целях (для выбора цитат, отдельных фрагментов произведений, примеров, используемых в процессе создания учебников и учебных пособий. б) таггированные корпусы текстов (от англ, tag — ‘индекс, помета’). Все слова такого корпуса получают некоторые буквенные или цифровые индексы, которые обозначают их грамматические, лексические, семантические или структурные признаки. Таких индексов может быть несколько.

3)  Фонетические лингвистические ресурсы

В настоящее время общепринято, что для создания машиночитаемых фонетических корпусов используется транскрипция на основе орфографического представления звуков речи с дополнительными знаками, передающими (при необходимости) просодические, паралингвистические и другие особенности произношения. а) Фонетические корпусы текстов широко используются для решения следующих задач:

-  сопоставительного изучения устной и письменной форм языка;

- изучения грамматических и лексических особенностей устной речи;

- исследования фонетических особенностей диалектов;

-  построения частотных списков фонем и их сочетаний;

- изучения акустических свойств речевых единиц и их использования в психолингвистических и лингвистических экспериментах;

- создания компьютерных систем, распознавания и синтеза устной речи.[ Михайлов: 1976,7]

 

 

ЗАКЛЮЧЕНИЕ

 

База данных не является понятием собственно лингвистики. Это понятие общее для всех информационных технологий. База данных – это структурированная совокупность взаимосвязанных данных в рамках некоторой предметной области, предназначенная для длительного хранения во внешней (не оперативной) памяти компьютера и постоянного применения. Тем не менее создание базы данных – ключевая технология компьютерной лексикографии. Современные словари создаются на основе хранимых в памяти компьютера контекстов, для их создания используют программы, позволяющие формальным образом представить морфологические, словообразовательные, синтаксические и даже семантические характеристики слова.

Знания,  которые необходимо усвоить в филологических вузах, в большом количестве содержаться на магнитных носителях и в сети интернет.

Преимущества использования БД :

 Рассмотрим, какие преимущества получает пользователь при использовании БД как безбумажной технологии: 

· Компактность (Информация хранится в БД, нет необходимости хранить многотомные бумажные картотеки)

·Скорость (Скорость обработки информации (поиск, внесение изменений) компьютером намного выше ручной обработки)

· Низкие трудозатраты (Нет необходимости в утомительной ручной работе над данными)

·  применимость (Всегда доступна свежая информация) 

Дополнительные преимущества появляются при использовании БД в многопользовательской среде, поскольку становится возможным осуществлять централизованное управление данными. Современные системы управления базами данных обеспечивают как физическую (независимость от способа хранения и метода доступа), так и логическую независимость данных (возможность изменения одного приложения без изменения остальных приложений, работающих с этими же данными). Современные СУБД дают возможность включать в них не только текстовую и графическую информацию, но и звуковые фрагменты и даже видеоклипы. 
Простота использования СУБД позволяет создавать новые базы данных, не прибегая к программированию, а пользуясь только встроенными функциями. СУБД обеспечивают правильность, полноту и непротиворечивость данных, а также удобный доступ к ним.

Популярные СУБД - FoxPro, Access for Windows, Paradox. Для менее сложных применений вместо СУБД используются информационно-поисковые системы (ИПС), которые выполняют следующие функции:

·  хранение большого объема информации;

·   быстрый поиск требуемой информации;

·  добавление, удаление и изменение хранимой информации;

·  вывод ее в удобном для человека виде.

В работе показано соотношение между общепринятыми понятиями «база данных»,  «система управления базами данных» и  современными «лингвистическими информационными ресурсами». Достаточно подробно представлены пути поиска и извлечения таких знаний.

Выполнены все поставленные задачи, такие как:

  • Рассмотреть лингвистику как объект информационного отражения, определив те ее черты, которые обуславливают особенности и состав информационных ресурсов в этой области.
  • Изучить историю развития БД  выделить и охарактеризовать основные возможности, функции и преимущества.

 

 

 

СПИСОК ЛИТЕРАТУРЫ

  • Гендина Н.И. Лингвистические средства автоматизации документального потока. СПб.: изд. отд. б - ки РАН, 1992. - 188с.
  • Диахроническая лингвистика и история лингвистических учений. М.: изд-воМГУ, 1988. -235 с.
  • Кондрашов H.A. История лингвистических учений: Учеб. М.: Просвещение, 1979. - 224 с.
  • Лингвистические исследования 1995г. Лексикология, лексикография, грамматика.: Сб. научн. тр./ Отв. ред. А.П. Сытов. СПб.: ИЛИРАН, 1996. - 156с
  • Мамудян М. Лингвистика. М. : Прогресс, 1985. - 200с.
  • Марчук Ю.Н., Убин И.И. Действующие системы машинного перевода и автоматические словари// Обзор, информ. Сер.2. ( Машин, перевод и автоматизация информ. процессов). - 1979. - Вып. 3. - 70с.
  • Мдивани P.P., Глинский В.А. Лингвистическое обеспечение автоматизированной системы по общественным наукам: состав и структура// Вопр. информ. теории и практики. 1985. - №52. - С. 37 -55.
  • Мелихова Л. Английский on line / / Мир Internet. - 1997. - № 11. - С. 16- 19.
  • Мельников Г.П., Преображенсикй С.Ю. Методология лингвистики. : Учеб. пособие. М. : изд - во Ун - та дружбы народов, 1989. - 88с.
  • Мелюхин И.С. Об управлении информационными ресурсами//НТИ. -Сер. 1.-1992.-N10-11. С.56 -59.
  • Методические вопросы анализа потоков информации на исследовательском этапе подготовки прогнозов// Науковедение и информатика: Межд.сб. науч.тр. Киев: Наук, думка, 1988. - Вып.32. -С.ЗЗ - 38.
  • Методические рекомендации по анализу отраслевых потоков информации/НИИ информ. по машиностроению. М.,1978. - 72с.
  • Михайлов А.И. О будущем научной информации//НТИ. Сер.1. -1985. -N1. -С.1 -3.
  • Михайлов А.И. Проблемы лингвистического обеспечения АСНТИ// Вопр. информ. теории и практики. 1984. - №51. - С. 5 -11.
  • Михайлов А.И., Черный А.И. Научная коммуникация и информатика. -М.: Наука,- 1976.-98с.

 


Информация о работе Базы данных и лингвистические информационные ресурсы