Банки данных и знаний

Автор работы: Пользователь скрыл имя, 09 Декабря 2013 в 18:42, курсовая работа

Описание работы

Базы данных являются составной частью информационной системы (ИС), осуществляющей хранение и обработку данных в широком смысле, включая ввод и корректировку данных, удаление данных, выполнение различных запросов, арифметические и логические преобразования данных, составление отчетов, выдачу информации в различных формах на экране и в бумажном виде.

Содержание работы

Введение 3
1. Проектирование базы данных 6
1.1. Инфологическая модель базы данных 6
1.1.1. Характеристика связей и язык моделирования 6
1.1.2. Классификация сущностей 7
1.1.3. О первичных и внешних ключах 7
1.1.4. Ограничения целостности 8
2. СУБД Oracle Database XE 9
2.1. Назначения языка SQL, основные операторы 9
2.2. Приложения на СУБД Oracle Database XE 11
3. Постановка задачи 12
3.1. Описание инфологической модели базы данных ВУЗа на языке инфологического проектирования 12
Инфологическая модель БД созданная в CASEStudio(рис.10) 17
3.3. Вертикальная диаграмма 17
3.4. Создание таблицы на СУБД Oracle Database XE 18
3.5. Создание запросов на SQL 19
3.6. Создание пользовательских приложений на СУБД Oracle Database XE 24
4. Заключение 29
5. Литература 30

Файлы: 1 файл

Курсовой проект.doc

— 1.41 Мб (Скачать файл)

Ташкентский институт инженеров железнодорожного транспорта

 

Кафедра 
"Информационные системы  
на ж.д. транспорте"

 

 

 

 

 
КУРСОВОЙ ПРОЕКТ 
по дисциплине  
"Банки данных и знаний"

 

 

 

 

 

 

 

 

 

 

Выполнил: ст-т гр. AT-15 
Газиев С.У.  
Руководитель: Бабина В.Г.

Дата: ____________

 

 

 

 

 

Ташкент - 2013

 

Содержание

 

 

 

 

 

 

 

 

 

Введение

Базы данных являются составной частью информационной системы (ИС), осуществляющей хранение и обработку данных в широком смысле, включая ввод и корректировку данных, удаление данных, выполнение различных запросов, арифметические и логические преобразования данных, составление отчетов, выдачу информации в различных формах на экране и в бумажном виде.

Проектирование, создание и поддержка баз данных (БД) представляет собой достаточно сложный процесс, основывающийся на многих научных дисциплинах таких. В предлагаемом учебном пособии рассматриваются вопросы концептуального моделирования, теории проектирования баз данных на основе операций реляционной алгебры и её реализация в конкретной системе управления базами данных (СУБД).

При проектировании ИС необходимо провести анализ целей этой системы и выявить требования к ней отдельных пользователей. Сбор данных начинается с изучения сущностей организации и процессов, использующих эти сущности. Одним из основных этапов работы с БД является процесс проектирования БД. Любая СУБД основывается на конкретной модели данных. Модель данных отражает взаимосвязи между объектами, описываемыми в БД. Компонентами в модели данных являются объекты и их взаимосвязи.

В самом широком смысле информационная система представляет собой программный комплекс, функции которого состоят в поддержке надежного хранения информации в памяти компьютера, выполнении специфических для данного приложения преобразований информации и/или вычислений, предоставлении пользователям удобного и легко осваиваемого интерфейса. Обычно объемы данных, с которыми приходится иметь дело таким системам, достаточно велики, а сами данные обладают достаточно сложной структурой. Классическими примерами информационных систем являются банковские системы, системы резервирования авиационных или железнодорожных билетов, мест в гостиницах и т. д.

Данные – это отдельные факты, характеризующие объекты, процессы и явления предметы и явления предметной области, а также их свойства. Знания основаны на данных, полученных эмпирическим путем. Они представляют собой мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате его практической деятельности. Знания – это закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам ставить и решать задачи в этой области.

Для хранения данных используются базы данных (для них  характерны большой объем и относительно небольшая удельная стоимость информации), для хранения знаний – базы знаний (небольшого объема, но исключительно дорогие информационные массивы). База знаний – основа любой интеллектуальной системы.

База знаний – совокупность знаний предметной области, записанная на машинный носитель в форме, понятной эксперту и пользователю.

В начальной стадии развития информатики  прикладные информационные системы работали непосредственно с файлами данных. В свое время переход к использованию систем управления файлами стал историческим шагом. С точки зрения прикладной программы файл – это именованная область внешней памяти, в которую можно записывать и из которой можно считывать данные. Правила именования файлов, способ доступа к данным, хранящимся в файле, и структура этих данных зависят от конкретной системы управления файлами и, возможно, от типа файла. Система управления файлами берет на себя распределение внешней памяти, отображение имен файлов в соответствующие адреса внешней памяти и обеспечение доступа к данным.

База данных –  это совокупность связанных данных конкретной предметной области, организованных в виде набора записей определенной структуры и хранящиеся в файлах, где помимо самих данных, содержится описание их структуры.

СУБД – это программно–технологический комплекс, с помощью которого пользователи могут определять, создавать и поддерживать базу данных, а также получать к ней контролируемый доступ.

Основные функции  СУБД:

    • Управление данными во внешней памяти;
    • Управление буферами оперативной памяти;
    • Управление транзакциями;
    • Журнализация и восстановление БД после сбоев;
    • Поддержание языков БД.

Назначения БД:

  • Представление сложных структур информации, когда объектом хранения являются не только данные, но описания структур данных;
  • Сокращение дублирования информации
  • Независимость прикладных программ от изменений описаний данных и наоборот;
  • Сокращение затрат на обслуживание БД;
  • Интеграция данных (множество пользователей, прикладных программ, типов данных).

В основе любой  СУБД лежит определенная модель данных. Как правило, используются сетевая, иерархическая, реляционная модель или комбинация этих моделей.

Иерархическая модель данных строится по принципу иерархии типов объектов, т. е. один тип объекта является главным, а остальные, находящиеся на низших уровнях иерархии, – подчиненными. Например, описание одинаковых комплектующих (гайки, болты) в разных узлах (рис.1).

рис. 1 Фрагмент иерархической БД

В сетевой  модели данных (рис.2) понятия главного и подчиненных объектов несколько расширены. Любой объект может быть и главным, и подчиненным. Один и тот же объект может одновременно выступать и в роли владельца, и в роли члена набора. Это означает, что каждый объект может участвовать в любом числе взаимосвязей.

рис. 2 Фрагмент сетевой БД для метаданных

В реляционной  модели данных (рис. 3) объекты и взаимосвязи между ними представляются с помощью таблиц. Взаимосвязи также рассматриваются в качестве объектов. Каждая таблица представляет один объект. В терминологии реляционной модели таблица называется отношением. Каждый столбец в таблице является атрибутом. Значения в столбце выделяются из домена, т. е. домен – суть множества значений, которые может принимать некоторый атрибут. Строки таблицы называются кортежами.

рис. 3 Отношения между таблицами

Постреляционная модель – это качественное и количественное расширение реляционной модели. Если в реляционных моделях используется первая нормальная форма, то в постреляционных моделях данные описываются не первой нормальной формой, не требуется определять для поля специфический тип и длину. Благодаря этому, можно задать таблицу, в которую вложены другие таблицы. Если всю информацию свести в одну большую таблицу, такая таблица неизбежно будет содержать пустые клетки или избыточные данные, при использовании нескольких таблиц потребуется выполнять весьма ресурсоемкую операцию соединения, снижая тем самым эффективность работы СУБД.

 

1. Проектирование базы данных

1.1. Инфологическая модель базы данных

Цель инфологического  моделирования – обеспечение  наиболее естественных для человека способов сбора и представления  той информации, которую предполагается хранить в создаваемой базе данных. Поэтому инфологическую модель данных пытаются строить по аналогии с естественным языком. Основными конструктивными элементами инфологических моделей являются сущности, связи между ними и их свойства (атрибуты).

Сущность – любой различимый объект, информацию о котором необходимо хранить в базе данных. Сущностями могут быть люди, места, самолеты, рейсы, вкус, цвет и т.д. Необходимо различать такие понятия, как тип сущности и экземпляр сущности. Понятие тип сущности относится к набору однородных личностей, предметов, событий или идей, выступающих как целое. Экземпляр сущности относится к конкретной вещи в наборе. Например, типом сущности может быть ГОРОД, а экземпляром – Москва, Киев и т.д.

Атрибут – поименованная характеристика сущности. Его наименование должно быть уникальным для конкретного типа сущности, но может быть одинаковым для различного типа сущностей. Атрибуты используются для определения того, какая информация должна быть собрана о сущности. Примерами атрибутов для сущности АВТОМОБИЛЬ являются ТИП, МАРКА, НОМЕРНОЙ ЗНАК, ЦВЕТ и т.д. Здесь также существует различие между типом и экземпляром. Тип атрибута ЦВЕТ имеет много экземпляров или значений: 

Красный, Синий, Банановый, Белая  ночь и т.д., однако каждому экземпляру сущности присваивается только одно значение атрибута.

Абсолютное различие между  типами сущностей и атрибутами отсутствует. Атрибут является таковым только в связи с типом сущности. В другом контексте атрибут может выступать как самостоятельная сущность. Например, для автомобильного завода цвет – это только атрибут продукта производства, а для лакокрасочной фабрики цвет – тип сущности.

Связь – ассоциирование двух или более сущностей. Если бы назначением базы данных было только хранение отдельных, не связанных между собой данных, то ее структура могла бы быть очень простой. Однако одно из основных требований к организации базы данных – это обеспечение возможности отыскания одних сущностей по значениям других, для чего необходимо установить между ними определенные связи. А так как в реальных базах данных нередко содержатся сотни или даже тысячи сущностей, то теоретически между ними может быть установлено более миллиона связей. Наличие такого множества связей и определяет сложность инфологических моделей.

1.1.1. Характеристика связей и язык моделирования

При построении инфологических моделей можно использовать язык ER-диаграмм (от англ. Entity-Relationship, т.е. сущность-связь). В них сущности изображаются помеченными прямоугольниками, ассоциации – помеченными ромбами или шестиугольниками, атрибуты – помеченными овалами, а связи между ними – ненаправленными ребрами, над которыми может проставляться степень связи (1 или буква, заменяющая слово "много") и необходимое пояснение.

Среди бинарных связей существует три фундаментальных вида связи: один-к-одному (1:1), один-ко-многим (1:М), многие-ко-многим (M:N). Связь один-к-одному (1:1) существует когда один экземпляр одной сущности связан с единственным экземпляром другой сущности. Связь один-ко-многим (1:М) имеет место, когда один экземпляр одной сущности связан с одним или более экземпляром другой сущности и каждый экземпляр второй сущности связан только с одним экземпляром первой сущности. Связь многие-ко-многим (M:N) существует, когда один экземпляр одной сущности связан с одним или более экземпляром другой сущности и каждый экземпляр второй сущности связан с одним или более экземпляром первой сущности.

1.1.2. Классификация сущностей

Настал момент разобраться  в терминологии. К.Дейт определяет четыре основные класса сущностей: 

Стержневые, ассоциативные и характеристические, а также подкласс ассоциативных сущностей – обозначения.

Стержневая сущность (стержень) – это независимая сущность.

Ассоциативная сущность (ассоциация) – это связь вида "многие-ко-многим" между двумя или более сущностями или экземплярами сущности. Ассоциации рассматриваются как полноправные сущности:

они могут участвовать  в других ассоциациях и обозначениях точно так же, как стержневые сущности;

могут обладать свойствами, т.е. иметь не только набор ключевых атрибутов, необходимых для указания связей, но и любое число других атрибутов, характеризующих связь.

Характеристическая  сущность (характеристика) – это связь вида "многие-к-одной" или "одна-к-одной" между двумя сущностями (частный случай ассоциации). Единственная цель характеристики в рамках рассматриваемой предметной области состоит в описании или уточнении некоторой другой сущности. Необходимость в них возникает в связи с тем, что сущности реального мира имеют иногда многозначные свойства. Муж может иметь несколько жен, книга – несколько характеристик переиздания (исправленное, дополненное, переработанное, ...) и т.д.

Обозначающая сущность (обозначения) – это сущность, также формализующая  связь вида 1:M или 1:1 между двумя  сущностями, но отличающаяся от характеристики тем, что не зависит от обозначаемой сущности.

Существование характеристики полностью зависит от характеризуемой сущности: женщины лишаются статуса жен, если умирает их муж.

Для описания характеристики используется новое предложение  ЯИМ, имеющее в общем случае вид:

ХАРАКТЕРИСТИКА (атрибут 1, атрибут 2, ...)              

{СПИСОК  ХАРАКТЕРИЗУЕМЫХ СУЩНОСТЕЙ}.

Расширим также язык ER-диаграмм, введя для изображения характеристики трапецию (рис. 4).

рис. 4 Элементы расширенного языка ER-диаграмм

Обозначающая  сущность или обозначение – это связь вида "многие-к-одной" или "одна-к-одной" между двумя сущностями и отличается от характеристики тем, что не зависит от обозначаемой сущности.

1.1.3. О первичных и внешних ключах

Напомним, что ключ или возможный ключ – это минимальный набор атрибутов, по значениям которых можно однозначно найти требуемый экземпляр сущности. Минимальность означает, что исключение из набора любого атрибута не позволяет идентифицировать сущность по оставшимся. Каждая сущность обладает хотя бы одним возможным ключом. Один из них принимается за первичный ключ. При выборе первичного ключа следует отдавать предпочтение несоставным ключам или ключам, составленным из минимального числа атрибутов. Нецелесообразно также использовать ключи с длинными текстовыми значениями (предпочтительнее использовать целочисленные атрибуты). Так, для идентификации студента можно использовать либо уникальный номер зачетной книжки, либо набор из фамилии, имени, отчества, номера группы и может быть дополнительных атрибутов, так как не исключено появление в группе двух студентов (а чаще студенток) с одинаковыми фамилиями, именами и отчествами. Плохо также использовать в качестве ключа не номер блюда, а его название, например, " Закуска из плавленых сырков "Дружба" с ветчиной и соленым огурцом" или "Заяц в сметане с картофельными крокетами и салатом из красной капусты".

Информация о работе Банки данных и знаний