Автор работы: Пользователь скрыл имя, 03 Декабря 2012 в 16:56, шпаргалка
. Модели данных: многомерная модель.
Многомерная модель данных (ММД)
Существуют два направления в развитии концепции информационных систем:
• Системы оперативной (транзакционной ) обработки.
• Системы аналитической обработки (системы поддержки принятия решений).
39 Продолжение
7. Модели данных: многомерная модель.
Многомерная модель данных (ММД)
Существуют два направления в развитии концепции информационных систем:
Транзакция - одна или несколько команд выполняются все сразу
(единица работы БД).
Многомерные СУБД являются узкоспециализированными,
предназначены
для интерактивной
информации.
Свойства данных ММД:
Агрегируемость - это рассмотрение информации на различных
уровнях и ее обобщения.
Историчность - предполагает обеспечение высокого уровня
статичности (неизменяемости ) самих данных и их взаимосвязей, а
также обязательность привязки данных ко времени.
Прогнозируемость - подразумевает задание функции
прогнозирования и применение их к различным временным
интервалам.
Термины ММД:
Измерение (Dimension)- множество однотипных данных,
образующих одну из граней гиперкуба.
Ячейка - это поля, значение которого однозначно определяется
фиксированным набором измерений.
В существующих ММД имеются два варианта организации
данных:
В полекубической схеме предполагается, что в БД может быть
определено
несколько видов кубов с
различными измерениями (Oracle Express Server).
В случае гиперкубической схемы предполагается, что у всех
гиперкубов БД одинаковые размерности и совпадающие
измерения.
Операции над данными:
10.
Операции обновления данных: добавление,
удаление, изменение записей. Проблемы,
возникающие при обновлении дан
ADD - данная операция сообщает об ошибках в следующих случаях:
DEL - для удаления достаточно указать значение ключа удаленного кортежа. Ошибка возникает только в том случае, если удаляемый кортеж в отношении отсутствует. СН - для данной операции все ошибки добавления и удаления имеют место.
Аномалия обновления При изменении:
Необходимо многократное изменение данных. При удалении:
Существует возможность потерять очень важную информацию. При добавлении:
Основными причинами аномалии является
избыточность данных. Типичная ошибка проектирования - это
сведение всех данных о различных информационных
объектов в одну таблицу. Избыточность
в БД может возникнуть при наличии линейной
связи между объектами.
2. Понятие системы управления базами данных (СУБД). Требования к централизованному управлению данными. Преимущества и недостатки СУБД.
Система управления данными (СУБД) - комплекс программно-аппаратных средств, обеспечивающих доступ к БД и управление данными.
Технологией БД предполагается , что создание БД, ее поддержка и обеспечение доступа пользователей осуществляется централизованно с помощью специального программного обеспечения (СУБД).
централизованное управление данными должно обеспечиать требования:
- дорого, т.к. требуется больше памяти для хранения
дублируемых данных.
- требуется более одной операции при обновлении данных.
Из-за этого (дублирования) различные копии данных могут быть на разных стадиях обновления и БД может содержать противоречивую информацию.
1-й уровень - это физическая независимость данных, 2-й уровень - это логическая независимость данных.
Преимущества СУБД:
Недостатки СУБД:
5. Модели данных: реляционная модель. Фундаментальные свойства отношений. Модели данных
Виды взаимосвязей:
1. Один к одному 1:1 означает что в любой момент времени
одному значению поля А соответствует
только одно значение поля
В.
В настоящее время является единственной моделью с хорошо
проработанной теоретической БД.
В РМД объекты и связи между ними представляются в виде
набора взаимосвязанных двумерных таблиц. Каждая таблица
имеет собственное имя и представляет один информационный
объект.
Большинство операций над БД сводится к разрезанию и
склеиванию по строкам и столбцам таблиц. Связь между
таблицами осуществляется за счет наличия общих
столбцов(полей).
Достоинства РМД:
памяти и при выполнении запросов.
3. Отсутствие
упорядоченности атрибутов, позволяет
модифицировать схему отношений путем
не только добавления
новых атрибутов, но и удаления уже существующих.
В
большинстве систем упорядоченность атрибутов
не требуется
4.Лтомарность значения
атрибутов. Это свойство следует из
определения домена как множества значений
простого типа
данных. В реляционных БД
допускаются только нормализованные
отношения или отношения, находящиеся
в первой нормальной
форме.
* В оригинале речь идет об отношениях sibling (брат или сестра) и offspring (сын или дочь). К сожалению, в русском языке такие
отношения не выражаются одним словом. — Прим.. перев. Структуры данных, о которых идет речь, называются Б-деревьями,
an — порядком Б-дерева. Они обладают следующими свойствами:
1. Каждая страница содержит не более 2п элементов (ключей).
2. Каждая страница кроме корневой содержит
не менее п
элементов.
в оперативную память
и можно воспользоваться
К удивлению, включение в Б-дерево проводится сравнительно просто. Если элемент нужно поместить на страницу с m < 2n элементами, то процесс включения затрагивает лишь эту страницу. Лишь включение в уже полную страницу затрагивает структуру дерева и может привести к появлению новых страниц. Для того чтобы понять, что происходит в этом случае, обратимся к рис. 4.47, иллюстрирующему процесс включения в Б-дерево порядка 2 ключа, равного 22. Включение проходит за три шага:
1. Обнаруживается, что ключ 22 отсутствует.
Включение в
страницу С невозможно, поскольку
она уже заполнена.
2. Страница С разделяется на две страницы
(т. е. вводится новая
страница D).
| 7 10 15 18||26 30 35 4о[ [7 10 15 1 а) 122 26 J fe 40 |
ВС В С Р
Рис. 4.47. Включение в Б-дерево ключа со значением 22.
3. Ключи—их всего 2п + 1—поровну распределяются в С и D, а средний ключ переносится на один уровень вверх на «родительскую» страницу.
Такая весьма элегантная
схема сохраняет все
Теперь, основываясь на таком эскизном описании, начнем разработку полной программы. Конечно, уже ясно, что в данном случае лучше всего воспользоваться рекурсивной конструкцией, поскольку процесс разделения страниц распространяется по пути поиска в обратном направлении. Поэтому общее строение программы аналогично включению в сбалансированное дерево, хотя и есть отличие в деталях. Прежде всего нужно сформулировать определение структуры страницы. Будем считать, что элементы представляются в виде массива.