Построение онтологии предметной области «Направления музыки»

Автор работы: Пользователь скрыл имя, 02 Декабря 2013 в 21:10, курсовая работа

Описание работы

Задание: 1) Провести поиск источников, ознакомиться с терминологической базой и основными публикациями в области разработки онтологий, выполнить обзор современных методов онтологического инжениринга; Изучить методологию METHONTOLOGY для построения онтологий; Пользуясь методологией METHONTOLOGY разработать онтологию предметной области.

Содержание работы

ВСТУПЛЕНИЕ 5
1 ОНТОЛОГИЯ 6
1.1 ТИПЫ ОНТОЛОГИЙ 8
1.2 ЯЗЫКИ ОПИСАНИЯ ОНТОЛОГИЙ 10
1.3 СРЕДСТВА СЕМАНТИЧЕСКОГО ОПИСАНИЯ ДАННЫХ 12
1.4 МОДЕЛЬ RDFS И ЕЁ ПРИМЕНЕНИЕ В ИСИР 16
2 МЕТОДОЛОГИЯ METHONTOLOGY 17
3 ОНТОЛОГИЯ «НАПРАВЛЕНИЯ МУЗЫКИ» 20
ВЫВОД 25

Скачать архив (27.01 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

kyrsovaya_orgbd_ontologiya.doc

— 117.00 Кб (Скачать файл)

OIL также можно рассматривать в сравнении с Ontolingua, разработанной в рамках инициативы On-To-Knowledge. По сравнению с Ontolingua, OIL менее выразителен, но все же позволяет делать логические выводы: поддержка вывода обеспечивается системой FaCT - классификатором, который работает на основе description logic.

Однако в целом можно сказать, что ориентированность языков описания онтологий на системы математической логики делает их слишком тяжеловесными для огромного количества приложений, которым достаточно простого языка описания словарей - RDFS. И это правильно, каждая ступень в пирамиде - это ступень, на которой многие приложения могут остановиться, согласно своим собственным требованиям к данным и их использованию.

1.3 СРЕДСТВА СЕМАНТИЧЕСКОГО ОПИСАНИЯ ДАННЫХ

На сегодняшний день уже имеется много средств семантического описания данных, многие из которых считаются достаточно выразительными для задач семантического моделирования данных. В качестве примера можно привести модель описания ресурсов (Resource Definition Framework), диаграммы Сущность-Связь (Entity-Relationship model). Мы опишем, в чем заключаются преимущества онтологий перед другими механизмами описания семантики предметной области, например, RDFS, ER-диаграммами.

Ограничения традиционных моделей данных

Для начала примем некоторые договоренности об использовании терминологии. Согласно М.Р. Когаловскому, под термином "модель данных" мы понимаем инструмент моделирования, т.е. является совокупностью понятий для описания данных, для описания структуры данных. "Модель предметной области" представляет собой визуальное представление сущностей предметной области и отношений между ними, т.е. спецификацию модели предметной области, и является результатом моделирования.

Первые модели данных предметной области описывались конструкторами типов таких языков программирования, как Алгол, а также в схемах баз данных. Позднее появились сложные модели данных, историю развития которых описал в своей работе Петер Чен, вместе с тем предложив новую модель данных, называемая моделью "сущность-связь" (Entity-Relationship model), основанную на некоторой важной семантической информации о реальном мире.

Модель Entity Relationship

ER-модель явилась основой, из которой могут быть порождены три существующие модели данных: сетевой модели, реляционной модели и модели набора сущностей, представляя данные более строго и естественно и одновременно обеспечивая независимость данных от приложений (ER- модель основывается на теории множеств и реляционной теории). С тех пор было предложено множество расширений ER-схем, чтобы обеспечить более мощные средства выражения семантики данных: механизмы задания иерархии подклассов классов сущностей, некоторых семантических ограничений типа "часть-целое", реификаций как классов сущностей, благодаря которым можно было распознавать общие характеристики сущностей различных классов. Примеры таких моделей - "semantic data modeling", "extended ER modeling", "hyper-semantic data modeling", "OMT approach" и др.

Ограничения ER-модели и её расширений в том, что они, описывая семантику "сущностей", позволяют интерпретировать данные одним единственным способом.

Например, допустим, что модель данных Интегрированной Системы Информационных Ресурсов (ИСИР) РАН будет содержать тип ресурса "Научная организация" вместе с некоторыми атрибутами и соотношениями. Сущностями этого типа будут служить конкретные научные организации. С помощью механизма иерархии классов можно понять, к какому типу относится данный ресурс (к типу "Организация"), однако самому типу "Научная организация" в процессе моделирования данных обычно можно дать только одну интерпретацию. Поэтому, повторно использовать данное понятие "Научная организация" не удастся, т.к. этот термин в разных контекстах (т.е. при различных точках зрения видения предметной области) имеет разное значение. Например, с научной точки зрения нас будут интересовать такие аспекты, как направление научных исследований, список ведущих научных сотрудников и т.д. В административной структуре интересен управленческий состав, организационные вопросы. В плане внешних связей данной организации полезна информация о рейтинге и научном сотрудничестве, филиалах и т.д.

Архитектура ANSI/SPARC

Можно с уверенностью сказать, что повторное использование знаний в различных контекстах не возможно без наличия механизмов, позволяющих фиксировать различное понимание этих знаний. Идея разработки такого механизма была представлена частично в ANSI/SPARC-архитектуре баз данных.

Эта архитектура включает три уровня:

Логический уровень (называемый "концептуальной схемой*"), который является промежуточным уровнем и основой данной архитектуры.

Внутреннее представление базы данных описывает способ, по которому концептуальная схема может быть реализована в терминах объектов физического уровня: файлов, индексов, хэш-таблиц и т.д.

На верхнем уровне концептуальной модели можно определить множественное "внешнее представление". Оно будет состоять из выборок и комбинаций элементов концептуальной схемы и представлять видение схемы для каждого конкретного пользователя этого приложения. Например, база данных, содержащая административную информацию о сотрудниках организации, должна содержать два различных представления данных: для финансового отдела и для самих научных сотрудников.

Главное ограничение внешнего представления ANSI/SPARC заключается в том, что в логической модели архитектуры ANSI/SPARC должна содержаться вся имеющаяся в базе данных информация, однако новые данные, добавленные в представления верхнего уровня, нельзя перенести на логический (основной) уровень этой архитектуры. Другими словами, нет единого, унифицированного представления для всех представлений контекстов, которое было бы достаточным для любой возможной ситуации, поскольку число различных представлений контекстов практически неограниченно. Не существует также способа понять, применима ли какая-то конкретная часть знаний для другого контекста, и если неприменима, то почему.

1.4 МОДЕЛЬ RDFS И ЕЁ ПРИМЕНЕНИЕ В ИСИР

RDF Schema - это стандарт инициативы W3C для преставления онтологических знаний. RDF Schema специфицирует множество всевозможных допустимых схем данных. RDF модели предметных областей описываются посредством ресурсов, свойств и их значений. Ограничения RDFS в невозможности с его помощью выразить аксиоматические знания, т.е. задать аксиомы и правила вывода, построенные на аксиомах.

RDFS предоставляет хорошие базовые возможности для описания словарей типов предметных областей.

Однако расширение выразительных способностей инструмента RDFS возможно и чрезвычайно полезно. Механизм расширения внутренне присущ RDFS путем "уточнения" или дополнения базовых типов. Поэтому RDFS стал фундаментом для более богатых языков описания концепций предметных областей, называемых языками описания онтологий предметных областей, о которых пойдет речь позже.

2 МЕТОДОЛОГИЯ METHONTOLOGY

METHONTOLOGY, как подход к построению и сопровождению онтологий, разработан Асунсьон Гомез-Перез (А. Gomez-Perez) с коллегами В рамках этой методологии реализуются принципы Грубера, а также разработано программное окружение спецификации онтологии ODE (Ontology Design Environment). Данный подход выделяет следующие процедуры в «жизненном цикле» создания онтологии: управление проектом, собственно разработка и поддержка разработки. Процедуры управления проектом включают планирование, контроль и гарантии качества. Планирование определяет, какие задачи должны быть выполнены, как они организуются, как много времени и какие ресурсы нужны для их выполнения. Контроль гарантирует, что запланированные задачи выполнены и именно так, как это предполагалось. Гарантии качества нужны для того, чтобы быть уверенным в том, что компоненты и продукт в целом находятся на заданном уровне.

Собственно разработка включает спецификацию, концептуализацию, формализацию и реализацию.

Согласно обсуждаемой методологии сначала здесь строится глоссарий терминов, включающий все термины (концепты и их экземпляры, атрибуты, действия и т. п.), важные для предметной области, и их естественно-языковые описания. Когда глоссарий терминов достигает «существенного» объема, строятся деревья классификации концептов. Таким образом, идентифицируются основные таксономии предметной области, а каждая таксономия, согласно рассматриваемой методологии, дает в конечном счете онтологию. В рамках инициативы (КА)2 идентифицировано несколько таксономий. Следующим шагом является построение Диаграмм бинарных отношений, целью создания которых является фиксация отношений между концептами одной или разных онтологий. Заметим, что в дальнейшем эти Диаграммы могут послужить исходным материалом для интеграции разных онтологий.

После построения представлений, фиксированных выше, для каждого дерева классификации концептов строятся:

1. Словарь концептов (Concept Dictionary), содержащий все концепты предметной области, экземпляры таких концептов, атрибуты экземпляров концептов, отношения, источником которых является концепт, а также (опционально) синонимы и акронимы концепта.

2. Таблица бинарных отношений (Table of Binary Relations) для каждого отношения, исходный концепт которого содержится в классификационном дереве. Для каждого отношения фиксируется его имя, имена концепта-источника и целевого концепта, инверсное отношение и т. п. характеристики.

3. Таблица атрибутов экземпляра (Instance Attribute Table) для каждого экземпляра из словаря концептов. Основные характеристики здесь следующие: имя атрибута, тип значения, единица измерения, точность, диапазон изменения, значение «по умолчанию», атрибуты, которые могут быть выведены с использованием данного, формула или правило для вывода атрибута и др.

4. Таблица атрибутов класса (Class Attribute Table) для каждого класса из словаря концептов с аналогичными характеристиками.

5. Таблица логических аксиом (Logical Axioms Table), в которой даются определения концептов через всегда истинные логические выражения. Определение каждой аксиомы включает ее имя, естественно-языковое описание, концепт, к которому аксиома относится, атрибуты, используемые в аксиоме, логическое выражение, формально описывающее аксиому, и др.

6. Таблица констант (Constants Table), где для каждой константы указывается ее имя, естественно-языковое описание, тип значения, само значение, единица измерения, атрибуты, которые могут быть выведены с использованием данной константы, и т. п.

7. Таблица формулы (Formula Table) для каждой формулы, включенной в таблицу атрибутов экземпляра. Каждая таблица этого типа, помимо собственно формулы, должна специфицировать ее имя, атрибут, выводимый с помощью этой формулы, естественно-языковое описание, точность, ограничения, при которых возможно использовать формулу, и др.

8. Деревья классификации атрибутов (Attribute Classification Trees), которые графически показывают соответствующие атрибуты и константы, используемые для вывода значения корневого атрибута и формулы, применяемые для этого. По сути дела, эти деревья используются для проверки того, что все атрибуты, представленные в формуле, имеют описания и ни один из атрибутов не пропущен.

9. Таблица экземпляров (Instance Table) для каждого входа в словарь концептов. Здесь специфицируется имя экземпляра, его атрибуты и их значения.

3 ОНТОЛОГИЯ «НАПРАВЛЕНИЯ МУЗЫКИ»

Согласно методологии METHONTOLOGY, необходимо начинать построение онтологии с Глоссария терминов, который представлен в таблице №1.

ТЕРМИНЫ	ОПИСАНИЕ
Направления в музыке	Вид музыки, который установился благодаря творчеству отдельных людей, и получил широкое распространение
Национальна музыка	Музыка, присущая какой-либо нации
Современная музыка	Музыка, которая появилась в наше время
Музыка афро-американцев США	Музыка, основоположниками которой было афро-американское население США в 60-80-х годах
Классическая музыка	Музыка, которая прошла через века и получила признание в наше время
Электронная музыка	Музыка разрабатываемая при помощи компьютерных средств
Шансон	Музыка, распространенная в конце 80 – начале 90-х годов, ей характерны блатные мотивы
Фолк	Одно из направлений национальной музыки
Этническая музыка	Одно из направлений национальной музыки
Джаз	Одно из направлений музыки афро-американцев США
Блюз	Одно из направлений музыки афро-американцев США
Рок	Одно из направлений современной музыки
Реп	Одно из направлений современной музыки
Хип-хоп	Одно из направлений современной музыки
Хард-рок	Одно из направлений современной музыки
«Металл»	Одно из направлений современной музыки
Исполнитель	Группа, либо индивид, который исполняет песни в том либо ином направлении музыки
Сама популярная песня	Одна из наиболее известных песен группы либо индивида в том либо ином направлении музыки

Таблица №1 Глоссарий терминов

После создания словаря концептов, можно перейти к дальнейшей части создания онтологии, и следующим шагом будет создание дерева классификации концептов, которое буде представлено ниже:

НАПРАВЛЕНИЯ В МУЗЫКЕ

НАЦИОНАЛЬНАЯ МУЗЫКА

ФОЛК

ЭТНИЧЕСКАЯ МУЗЫКА

Информация о работе Построение онтологии предметной области «Направления музыки»