Автоматическое реферирование и аннотирование текста

Автор работы: Пользователь скрыл имя, 13 Ноября 2013 в 20:45, реферат

Описание работы

Актуальность выбранной проблемызаключается в том, что аннотирование и реферирование является неотъемлемой частью любого современного издания. Кроме того аннотирование и реферирование присутствует не только в издательском деле, но и используется как краткая характеристика фильма, статьи, научной работы и др. Любое издание, будь то монография, учебник, аналитический обзор и пр., всегда предваряется вторичным документом (рефератом или аннотацией). Отсутствие вторичного документа свидетельствует о непрофессионализме издателя и крайне отрицательно сказывается на эффективности издания как средства распространения информации. С аннотации (реферата) начинается знакомство читателя с изданием в целом и основным произведением в частности.

Содержание работы

Введение
1 Понятие о библиографической продукции
2 Основные типы и виды библиографической записи
3 Аннотирование
4Реферирование
5Автоматическое реферирование и аннотирование текста
Заключение
Библиографический список

Файлы: 1 файл

Курсовая работа.docx

— 54.17 Кб (Скачать файл)

В целом, отрасль средств  реферирования находится в самом  начале своего развития. Многие из технологий уже работают, и можно ожидать, что инструменты реферирования  будут играть решающую роль в завоевании широких информационных пространств  в будущем.

Понятие о реферате, его  структура

Реферат (от лат. «refero», что означает «сообщаю») представляет собой краткое изложение в письменном виде или в форме публичного доклада содержания научного труда (трудов) литературы по теме с раскрытием его основного содержания по всем затронутым вопросам, сопровождаемое оценкой и выводами референта. Он должен дать читателю объективное представление о характере освещаемой работы, изложить наиболее существенные моменты ее содержания.

В отличие от аннотации  реферат не только дает ответ на вопрос о чем говорится в первичном печатном документе, но и что говорится, т.е. какая основная информация содержится в реферируемом первоисточнике. Реферат дает описание первичного документа, оповещает о выходе в свет и о наличии соответствующих первичных документов, он является также источником для получения справочных данных и самостоятельным средством научной информации. Реферат может быть выполнен в письменном виде и в форме устного доклада.

Цель реферата – дать читателю относительно полное представление о затронутых в первоисточнике вопросах.

В структуре реферата можно  выделить три основные части: заголовочную, собственно реферативную и справочный аппарат.

Собственно реферативная часть включает в себя основную информацию, получаемую путем аналитико-синтетической  переработки содержания первичного документа. Наряду со словесным текстом  она может включать также формулы, таблицы, иллюстрации, что бывает обусловлено правилами, которые устанавливают редакции реферативных изданий, исходя в большинстве случаев из технологической возможности их подготовки и выпуска. Например, реферативная часть рефератов по общественным наукам наряду с информацией, извлеченной непосредственно из первичного документа, включает дополни-тельные сведения справочного характера (об авторе, рефери-руемом источнике и т.п.), вносимые референтом. Дополнительные справочные сведения, относящиеся к автору, принято вводить также в начало рефератов по культуре и искусству.

 

Заголовочная часть состоит  из заглавия реферата и библио-графического описания первичного документа.

К справочному аппарату реферата относятся сведения, дополнительно  характеризующие реферируемый документ и реферат, такие как индекс УДК; шифр (номер) реферата; справки о  количестве иллюстраций и таблиц в тексте реферируемого документа, об имеющейся в нем притекстовой библиографии; ссылки, примечания референта или редактора, фамилия референта (название организации, составившей реферат). В тех случаях, когда указывается фондовый номер реферируемого документа, его также нужно относить к справочному аппарату.

Расположение отдельных  структурных элементов, относящихся  к заголовочной части, справочному  аппарату и собственно реферативной части обусловливается конкретным материалом, а также официальными правилами, установленными стандартами  или редакцией.

Одним из важных является вопрос о том, с чего следует начинать изложение собственно реферативной части. Как варианты можно рассматривать: название решаемой проблемы, научной  задачи, темы. Такое начало сразу  вводит потребителя информации в  атмосферу того существенного, что  дано в реферате. Для рефератов документов, в которых описаны изделия, технологические процессы, методы исследований и т.п., характерным является начало, в котором указывается назначение предмета описания. Сам предмет обычно называется в заглавии. К типичным относится начало реферата, в котором дается обобщенная характеристика содержания реферируемого документа или указывается, в чем суть этого содержания.

Объем собственно реферативной части связан с нормами, установленными государственным стандартом ГОСТ 7.9-95. Средний объем текста в печатных знаках определен: 500 – для заметок  и кратких сообщений, 1000 –для большинства  статей и описаний изобретений, 2500 –  для документов большого объема. Однако при всем стремлении сделать объем  реферата стабильным, он остается зависимым  от объема и оригинальности реферируемого  источника информации, от его научной  ценности, доступности широкому кругу  читателей, от целевой направленности реферата, а также от того, как  и где он опубликован, и от области  знания, к которой относится первичный  документ.

Получение выводов – особое действие в реферировании. Оно может  входить в написание реферата, но в силу специфики его следует  выделить. Выводы даются в заключении. Их еще предстоит получить, как  бы «вывести» из всего текста. Выводы – это всегда новое знание, как умозаключение из ранее сделанных посылок. Вот почему их следует разрабатывать, все время особо ориентируясь на цель, в выводах достигая ее. Кроме краткого и четкого и изложения выводов необходим анализ степени выполнения поставленных во введении задач.

Составление библиографии для  реферата целесообразно ограничивать, во-первых, конкретно используемыми  в тексте источниками, из которых  цитируются положения и на которые  есть ссылки, во-вторых, только теми работами, которые имеют самое прямое отношение  к теме и цели реферата. Составлять список литературы следует с соблюдением всех правил ГОCТа и оформлять в алфавитной последовательности. В него вносится весь перечень изученных учащимся в процессе написания реферата монографий, статей, учебников, справочников, энциклопедий и пр.

Реферирование и аннотирование  текста являются сложными видами интеллектуальной деятельности. Составление человеком  рефератов или аннотаций занимает много времени. Это приводит к  тому, что до ученых, педагогов, инженеров  и других специалистов новейшая информация (особенно зарубежная) доходит очень  медленно, что, в свою очередь, ведет  к повторению в разных странах  и в пределах одной страны одних  и тех же исследований, более позднему применению новейших методик, технологий, процессов. Чтобы как-то избежать этого, для составления рефератов и аннотаций применяют современные компьютеры.

Автоматическое  реферирование и аннотирование  текста

Научно-технический прогресс привел к появлению большого числа  публикаций (книг, статей и т.п.) по самым разным проблемам науки, техники, образования, и специалисты не успевают следить за новейшей литературой по своей области знания. Для этого, как установлено, человек должен был бы прочитывать ежедневно 1500 страниц текста на разных языках, что явно превышает его физические возможности. Поэтому для оперативного «поверхностного» знакомства с новейшими публикациями используются рефераты и аннотации книг и статей, которые составляются в специальных организациях и публикуются в реферативных журналах (РЖ) и реферативных сборниках (PC).

Составление реферата или  аннотации текста с помощью компьютера называется автоматическим реферированием или аннотированием.

Если поручить составление  реферата или аннотации компьютеру, то, очевидно, его надо научить выполнять те же действия, которые осуществляет человек. Компьютер должен уметь:

1) находить в тексте  ключевые слова, словосочетания и предложения;

2) находить в тексте  менее значимые единицы;

3) составлять из текстовых  единиц двух первых типов смысловые единицы реферата или аннотации;

4) составлять из таких  единиц текст реферата или  аннотации. Говоря о двух последних  «умениях» компьютера, необходимо  помнить, что почти во всех  существующих системах автоматического реферирования в качестве основных смысловых единиц реферата выступают ключевые предложения или ключевые словосочетания и слова исходного текста. Первые в их последовательной совокупности (в том порядке, в котором они идут в исходном тексте) образуют текст (квазитекст) реферата. Второй тип смысловых единиц (ключевые словосочетания и слова) используется компьютером для построения так называемых табличных рефератов.

При составлении с помощью  компьютера аннотации также используются как ключевые предложения (в том  виде, что и при составлении  реферата), так и ключевые слова  и словосочетания. Последние перечисляются вслед за реляторами вида: «В статье рассматриваются следующие вопросы:...», «Книга посвящена следующим проблемам: ...», «Статья раскрывает следующие понятия: ...» и т.д.

По способам выделения  из исходных текстов ключевых словосочетаний и предложений (первые два «умения» компьютера) различают несколько методов автоматического реферирования и аннотирования текстов. Наиболее известны следующие три группы методов:

1) статистические;

2) позиционные;

3) логико-семантические.

Суть статистической группы методов заключается в том, что:

1) ключевыми словами считаются  такие знаменательные слова текста, которые с учетом всех синонимов  встречаются в тексте наибольшее  число раз;

2) ключевым предложением  считается предложение текста, которое:

а) имеет несколько ключевых слов;

б) содержит ключевые слова  на небольшом расстоянии друг от друга.

Принадлежность слова, словосочетания или предложения к числу ключевых определяется специальными статистическими коэффициентами.

В позиционных методах  автоматического реферирования и аннотирования ключевым предложением считается предложение, входящее в заголовок, подзаголовок, начало или конец какой-то части текста или всего текста. Такие предложения, как правило, содержат информацию о целях, методах, выводах и результатах исследования, описанного в первичном документе. Важность тех или иных предложений с указанной точки зрения определяется экспертами путем изучения семантической структуры первичных документов определенного типа.

Логико-семантические методы опираются на исследование структуры  и семантики текстов. Существует несколько вариантов этих методов, но цель их одна — выделить из конкретного  текста предложения с наибольшим функциональным весом. Величина эта  зависит от многих факторов: наличия в исследуемом предложении специальных семантически значимых слов, связи этого предложения с другими предложениями текста, синтаксического типа самого предложения и т.д.

Заключение

Несмотря на то что существует ГОСТ 7.9-95. «Реферат и аннотация», пока нет общепринятой методики аннотирования, хотя этот вопрос многократно поднимался на страницах специальных изданий. Так, М. В. Истрина выделяет пять групп сведений об изданиях литературы, которые обычно содержатся в издательской аннотации. Но А. А. Гречихин, И. Г. Здоров, в типологии М. В. Истриной находят много недостатков. А. А. Гречихин, И. Г. Здоров предлагают типологию аннотаций, беря за основу именно целевое назначение, и выделяют три типа аннотаций. М.В. Истрина не предложила и своей типологии аннотаций, что является первым и обязательным условием и от ее качества зависит методика аннотирования.

Обратимся к типологии  аннотаций и методике аннотирования, предложенных О.П.Коршуновым. Он по функциональному  назначению делит аннотации на справочные и рекомендательные. В свою очередь, они по второму признаку - способу  характеристики документов - подразделяются на общие, аналитические и групповые. О.П.Коршунов более четко квалифицировал содержательный аспект типологии. Более того, он ввел еще и количественный критерий, так как аннотирование осуществляется не только на один документ (составную часть его), но и на некоторое множество их - групповое аннотирование (аннотация). Сравнив эти методики можно сделать вывод, что при общей их повторяемости в смысле идентификации содержания обязательно указывается необходимость оценки (краткой рецензии) соответствующего произведения, документа, издания (книги).Целенаправленная оценка - особая функция библиографии, в данном случае - аннотации. Аннотация - это результат более или менее углубленного изучения книги. Чтобы грамотно составить библиографическую запись нужно воспользоваться действующими нормативными документами ГОСТами 7.1.-2003, ГОСТ 7.9-95,ГОСТ 7.80-2000. Но в порядке поиска «золотой середины» в современной методике составления библиографических записей можно предложить типовую структуру аннотации. Эта структура определяет те составляющие аннотации, которые образуют как бы ее стержень. В частности, показывает, что без библиографического описания такого жанра в библиографии, как аннотация, не бывает. И никакой речи о дополнительности аннотации к библиографическому описанию быть не должно. Специфика аннотации заключается в особен-ностях отражения в ней содержания произведения. Эта специ-фика обусловлена, прежде всего, функциями аннотирования, соотносимыми с основными функциями библиографии.

Реферирование есть разновидность  самостоятельной работы с литературным источником, состоящей в использовании  разно-образных приемов обработки заключенной в нем информации. При реферировании материал источника конспектируется, цитируется, анализируется, обобщается, сравнивается, в нем выделяется главная мысль, к нему выражается личное отношение, проводятся обоснование, доказательство, моделирование, класси-фикация.

В настоящее время рефераты пользуются большой популярностью. В интернете появились ресурсы, целиком посвященные этому виду работ. Это свидетельствует о  повышении степени образованности населения, о развитии науки и  техники, о качественных переменах  в системе образования – начального, среднего и высшего звена. Реферированию  подвергаются чаще всего научные, научно-популярные, публицистические произве-дения и некоторые официальные документы. Пожалуй, лишь художественные тексты с доминирующей эстетической функцией редко подлежат реферированию. В учебной практике распространено и реферирование как упражнение, направленное на контроль понимания прочитанного обучаемым и на развитие навыков продуктивной речевой деятельности.

Информация о работе Автоматическое реферирование и аннотирование текста