Автор работы: Пользователь скрыл имя, 23 Января 2012 в 10:36, курсовая работа
Представлению знаний в базе знаний предшествуют процессы извлечения знаний, их структуризация и формализация.
Данная работа посвящена одному из методов извлечения знаний
Первая часть: реферат на тему «Текстологические методы извлечения знаний» 3
Введение 3
1. Классификация методов извлечения знаний 4
2. Схема извлечения знаний из специальных текстов 5
3. Алгоритм извлечения знаний из текстов 11
Заключение 13
Список литературы 14
Вторая часть: разработка экспертной системы «Выбор спортивной секции для ребенка» 15
1. Постановка задачи 15
2. Разработка дерева решений 15
3. Таблица имен переменных 17
4. База знаний 17
5. Таблицы структур данных 18
6. Блок схема алгоритма программной реализации 21
7. Программа 22
Приложение: программная реализация экспертной системы 23
Федеральное Государственное
образовательное учреждение высшего профессионального образования
Пермская государственная
сельскохозяйственная академия имени академика Д.Н. Прянишникова
Кафедра Информационных систем
по дисциплине: «Интеллектуальные информационные системы»
на тему:
«Разработка
экспертной системы
«Выбор спортивной секции
для ребенка».
Выполнила:
студентка 4 курса заочного отделения
По специальности: 080801 «Прикладная информатика в экономике»
шифр Пи-03-404
Толокнов Дмитрий
Проверил:
профессор
Козлов
Алексей Николаевич
Пермь-2011
Содержание
Первая часть: реферат на тему «Текстологические методы извлечения знаний» 3
Введение 3
1. Классификация методов извлечения знаний 4
2. Схема извлечения знаний из специальных текстов 5
3. Алгоритм извлечения знаний из текстов 11
Заключение 13
Список литературы 14
Вторая часть: разработка экспертной системы «Выбор спортивной секции для ребенка» 15
1. Постановка задачи 15
2. Разработка дерева решений 15
3. Таблица имен переменных 17
4. База знаний 17
5. Таблицы структур данных 18
6. Блок схема алгоритма программной реализации 21
7. Программа 22
Приложение:
программная реализация экспертной системы 23
Теоретическая часть
Одним из важнейших и ключевых понятий в области систем искусственного интеллекта является понятие базы знаний.
Под базой знаний будем понимать совокупность единиц знаний, которые представляют собой формализованное с помощью некоторого метода представления знаний отражение объектов проблемной области и их взаимосвязей, действий над объектами и, возможно, неопределенностей, с которыми эти действия осуществляются.
Представлению знаний в базе знаний предшествуют процессы извлечения знаний, их структуризация и формализация.
Данная работа посвящена одному из методов извлечения знаний.
Группа текстологических методов объединяет методы извлечения знаний, основанные на изучении специальных текстов из учебников, монографий, статей, методик и других носителей профессиональных знаний.
Среди методов извлечения знаний эта группа является наименее разработанной. Задачу извлечения знаний из текстов можно сформулировать как задачу понимания и выделения смысла текста. Сам текст на естественном языке является лишь проводником смысла, а замысел и знания автора лежат во вторичной структуре (смысловой структуре текста), настраиваемой над естественным текстом. При этом можно выделить две смысловые структуры – смысл, который пытался заложить автор (это его модель мира), и смысл, который постигает читатель, т.е. инженер по знаниям в процессе интерпретации. Сложность процесса заключается в принципиальной невозможности совпадения знаний за счет разной совокупности представлений автора и читателя. Цель извлечения знаний – достичь максимального понимания.
Рассмотрим, разработанную в [1], классификацию методов извлечения знаний, в которой используются наиболее употребительные термины, что позволит инженерам по знаниям в зависимости от конкретной задачи и ситуации выбрать подходящий метод (рис.1).
Коммуникативные методы. Они разделяются на пассивные и активные. В пассивных методах ведущую роль играет эксперт, в активных — инженер по знаниям. При решении конкретных задач, как правило, используются как пассивные, так и активные методы. Активные методы делятся на индивидуальные и групповые. В групповых методах знания получают от множества экспертов, в индивидуальных — от единственного эксперта. Индивидуальные методы получили более широкое применение на практике по сравнению с групповыми
Из предложенной схемы классификации видно, что основной принцип деления связан с источником знаний. Коммуникативные методы охватывают все виды контактов с живым источником знаний - экспертом, а текстологические касаются методов извлечения знаний из документов (методик, пособий, руководств) и специальной литературы (статей, монографий, учебников)
Разделение этих групп методов на верхнем уровне классификации не означает их антагонистичности, обычно инженер по знаниям комбинирует различные методы, например, сначала изучает литературу, затем беседует с экспертами, или наоборот.
Текстологические методы включают методы извлечения знаний, основанные на изучении текстов учебников, специальной литературы и документов. Текстология — это наука, целью которой является практическое прочтение текстов, изучение и интерпретация литературных источников, а также рассмотрение семиотических, психолингвистических и других аспектов извлечения знаний из текстов.
Группа текстологических методов объединяет методы извлечения знаний, основанные на изучении специальных текстов из учебников, монографий, статей, методик и других носителей профессиональных знаний.
В буквальном смысле текстологические методы не относятся к текстологии, науке, которая родилась в русле филологии с целью критического прочтения литературных текстов, изучения и интерпретации источников с узко прикладной задаче - подготовки текстов к изданию. Сейчас текстология расширила свои границы включением аспектов смежных наук - герменевтики (науки правильного толкования древних текстов - библии, античных рукописей и др.), семиотики, психолингвистики и др.
Текстологические методы извлечения знаний, безусловно, используя основные положения текстологии, отличаются принципиально от ее методологии, во-первых, характером и природой своих источников (профессиональная специальная литература, а не художественная, живущая по своим особым законам), а во-вторых, жесткой прагматической направленностью извлечения конкретных профессиональных знаний.
Среди
методов извлечения знаний эта группа
является наименее разработанной, по ней
практически нет никакой
Задачу извлечения знаний из текстов можно сформулировать как задачу понимания и выделения смысла текста. Сам текст на естественном языке является лишь проводников смысла, а замысел и знания автора лежат во вторичной структуре (смысловой структуре или макроструктуре текста), настраиваемой над естественным текстом[2]. «Текст не содержит и не передает смысл, а является лишь инструментом для автора текста»[3].
Схема извлечения знаний из текста показана на рис. 2.
Рис.2. Схема извлечения знаний
Можно выделить две такие смысловые структуры: M1 - смысл, который пытался заложить автор, это его модель мира, и М2 - смысл, который постигает читатель, в данном случае инженер по знаниям (аналитик) в процессе интерпретации I, При этом Т - это словесное одеяние M1, т. е. результат вербализации V.
Сложность процесса заключается в принципиальной невозможности совпадения знаний, образующих M1 и М2, из-за того, что М1 образуется за счет всей совокупности представлений, потребностей, интересов и опыта автора, лишь малая часть которых находит отражение в тексте Т. Соответственно и М2 образуется в процессе интерпретации текста Т за счет привлечения всей совокупности научного и человеческого багажа читателя. Таким образом, два инженера по знаниям извлекут из одного Т две различные модели М2i и М2j.
Встает задача: выяснить, за счет чего можно достичь максимальной адекватности M1 и М2, помня при этом, что понимание всегда относительно, поскольку это синтез двух смыслов «свое - чужое».
Рассмотрим подробнее, какие источники питают модель M1 и создают текст Т. Существуют два компонента любого научного текста. Это первичный материал наблюдений a и система научных понятий b в момент создания текста. В дополнение к этому, помимо объективных данных экспериментов и наблюдений, в тексте обязательно присутствуют субъективные взгляды автора g, результат его личного опыта, а также некоторые «общие места» или «вода» d, кроме этого, любой научный текст содержит заимствования из других источников (статей, монографий и т. д.) q. При этом все компоненты погружены в языковую среду L. Можно записать
Т = (a, b, g, d, q )L.
Таким образом, компоненты научного текста Т:
При этом компоненты a,g, часть а входят и в модель М1.
При извлечении знаний аналитику, интерпретирующему текст, приходится решать задачу декомпозиции этого текста (на перечисленные выше компоненты для выделения истинно значимых для реализации базы знаний фрагментов). Сложность интерпретации научных и специальных текстов заключается еще и в том, что любой текст приобретает смысл только в контексте, где под контекстом понимается окружение, в которое «погружен» текст.
Различают микро- и макроконтекст. Микроконтекст – это ближайшее окружение текста. Так, предложение получает смысл в контексте абзаца, абзац в (контексте главы и т. д. Макроконтекст - это вся система знаний, связанная с предметной областью (т. е. знания об особенностях и свойствах, явно не указанных в тексте). Другими словами, любое знание обретает смысл в контексте некоторого метазнания.
Информация о работе Разработка экспертной системы-Выбор спортивной секции