Автор работы: Пользователь скрыл имя, 22 Марта 2013 в 20:07, курсовая работа
Современные геоинформационные системы (ГИС) представляют собой новый тип интегрированных информационных систем, которые, с одной стороны, включают методы обработки данных многих ранее существовавших автоматизированных систем (АС), с другой - обладают спецификой в организации и обработке данных. Практически это определяет ГИС как многоцелевые, многоаспектные системы.
Сущности, атрибуты и связи хранятся в таблицах как данные определенной структуры. Структура данных обусловливается используемыми моделями данных.
Таблица состоит из строк и столбцов и имеет имя, уникальное внутри базы данных. Таблица отражает тип объекта реального мира (сущность), а каждая ее строка - конкретный объект.
Основным средством
Ключ отношения - это подмножество атрибутов, имеющее следующие свойства:
Первичный атрибут отношения - это атрибут, присутствующий по крайней мере в одном ключе, все другие атрибуты непервичные.
В реляционной модели данных схема отношения может быть использована для представления типа сущности.
Реляционная модель является табличной моделью, некоторые типы связей между отношениями могут представляться в схеме неявно. В этих моделях не предусматривается поддержание логической упорядоченности, однако кортежи помещаются в физическую память в соответствии с некоторым порядком. Физическая упорядоченность используется для выборки.
Рассмотренная выше иерархическая модель данных может быть сведена к реляционной с помощью "нормализации" - пошагового процесса приведения к табличной форме с полным сохранением информации. Рассмотрим пример реляционной модели. Таблица "Сотрудник" (рис. 3.10, а) содержит сведения о сотрудниках, работающих в организации, а ее строки являются наборами значений атрибутов. Каждый столбец таблицы - это совокупность значений конкретного атрибута объекта. Например, столбец "Специальность" содержит множество значений специальностей, столбец "Стаж" - целые неотрицательные числа.
Код |
Ф.И.О |
Специальность |
Стаж |
Название отдела |
137 |
Иванов И. И. |
Физик |
10 |
Экспериментальный |
139 |
Иванов А.П. |
Экономист- |
9 |
Технологический |
143 |
Петров А. Г. |
Математик |
12 |
Теоретический |
147 |
Рыбкин И.И. |
Математик |
11 |
Экспериментальный |
149 |
Слонов К. И. |
Физик |
5 |
Экспериментальный |
151 |
Семин П.П. |
Экономист |
10 |
Теоретический |
155 |
Трунов К.А. |
Физик |
11 |
Технологический |
156 |
Теркин П.И. |
Физик |
14 |
Экспериментальный |
а
Название отдела |
Код отдела |
Численность |
Технологический Теоретический Экспериментальный |
007 Oil 008 |
8 12 20 |
б
Рис. 3.10. Реляционная модель: а - "Сотрудник" ; б - "Отдел"
Значения в столбце "Специальность" выбираются из множества имен всех возможных специальностей данной организации. В нем принципиально невозможно появление значения, которого нет в соответствующем домене, например "15" или "с.н.с".
Каждый столбец имеет имя, которое обычно записывается в верхней части таблицы. Оно должно быть уникальным в таблице, однако различные таблицы могут иметь столбцы с одинаковыми именами. Любая таблица должна иметь по крайней мере один столбец. Столбцы расположены в таблице в соответствии с порядком следования их имен при се создании. В отличие от столбцов строки не имеют имен, порядок их следования в таблице не определен, а количество логически не ограничено.
Так как строки в таблице не упорядочены, невозможно выбрать строку по ее позиции - среди них не существует "первой", "второй", "последней". Любая таблица имеет один или несколько столбцов, значения в которых однозначно идентифицируют каждую ее строку. Такой столбец (или комбинация столбцов) называется первичным ключам (primary key).
В таблице "Сотрудник" первичный ключ - это столбец "код". В нашем примере каждый сотрудник имеет единственный номер (код), по которому из таблицы извлекается необходимая информация. Следовательно, в этой таблице первичный ключ - это столбец "код". В нем значения не могут дублироваться - в таблице "Сотрудник" не должно быть строк, имеющих одно и то же значение в столбце "код".
Взаимосвязь таблиц - важнейший элемент реляционной модели данных. Она поддерживается внешними ключами (foreign key).
Рассмотрим пример, в котором база данных хранит информацию о сотрудниках (таблица "Сотрудник") и отделах (таблица "Отдел") в некоторой организации. Первичный ключ таблицы "Отдел" (рис. 3.10,6)-столбец "Название отдела". Столбец "Численность" не может выполнять роль первичного ключа, так как в одной организации могут существовать несколько отделов с одинаковой численностью.
Любой сотрудник работает в одном отделе, что должно быть отражено в базе данных. Таблица "Сотрудник" содержит столбец "Название отдела" и значения в этом столбце выбираются из столбца "Название отдела" таблицы "Отдел". Столбец "Название отдела" является внешним ключом в таблице "Сотрудник".
Для обработки данных, размещенных в таблицах, нужны дополнительные данные о данных, например описатели таблиц, столбцов и т.д. Их называют обычно метаданными. Метаданные также представлены в табличной форме и хранятся в словаре данных (data dictionary).
Помимо таблиц в ГИС могут храниться и другие объекты, такие, как экранные формы, отчеты (reports), представления (views) и даже прикладные программы, работающие с информацией, размещенной в реляционной модели.
Данные
информационной системы должны быть
однозначными и непротиворечивыми.
В таком случае говорят, что реляционная
модель удовлетворяет условию
Существует несколько типов ограничений целостности. Например, требуется, чтобы значения в столбце таблицы выбирались только из соответствующего домена. На практике учитывают и более сложные ограничения целостности, в частности, целостность по ссылкам (reference integrity). Ее суть заключается в том, что внешний ключ не может быть указателем на несуществующую строку в таблице.
Модель данных "сущность-связь" или ER-модель (Entity Relationship Model) дает представление о предметной области в виде объектов, называемых сущностями, между которыми фиксируются связи.
Для каждой связи определено число связываемых ею объектов. На схеме сущности изображаются прямоугольниками, связи - ромбами. Число связываемых объектов указывается цифрой на линии соединения объекта и связи.
Появление моделей данных типа "сущность-связь" было обусловлено практическими потребностями проектирования баз данных для коммерческих СУБД. Такие модели имеют много общего с иерархическими и сетевыми моделями данных.
Теоретической основой этого подхода является известная модель, введенная М. Ченом в 1976 г. и получившая широкое распространение в качестве средств концептуального проектирования баз данных.
В основе модели Чена лежит представление о том, что предметная область состоит из отдельных объектов, находящихся друг с другом в определенных связях. Объекты описываются различными параметрами или атрибутами; однотипные объекты описываются одним и тем же набором параметров и объединяются во множества или классы (сущности). Конкретные объекты, составляющие класс, называют экземплярами соответствующей сущности. Между сущностями идентифицируются взаимосвязи различного вида: один к одному, один ко многим и др.
На рис. 3.11 приведена схема проектирования геоинформационной системы, построенная на основе модели "сущность-связь". В силу своей ориентации на процесс проектирования ER-модели могут рассматриваться как обобщение и развитие иерархических и сетевых моделей.
Это, в частности, означает, что допускаются явная спецификация ограничений целостности и непосредственное представление связей типа "один к одному" (1:1), "один ко многим" (1: М) , "многие к одному" (М : 1) "многие ко многим" (М : N).
При построении ER-моделей важно учитывать разновидность объектов. Прежде всего это простые и сложные объекты. Объект модели рассматривается как простой, если он имеет свойства атомарного объекта или модели.
Сложными называют объекты, которые могут быть представлены в виде совокупности более простых объектов. На схеме это соответствует тому, что блок, отображающий такой объект, может быть заменен несколькими взаимосвязанными подблоками, определяющими другие объекты или наборы данных.
Такое разделение условно, так как в одних случаях объект может считаться простым, в других - сложным.
Сложные объекты подразделяют на составные, обобщенные и агрегированные.
Составной объект структурирован на основе связей "целое-часть". Он строится аналогично классификации.
Обобщенный объект построен на основе обобщения, т.е. на основе связей "тип-тип", "род-вид" и т.д. Выделение родовых-видовых связей позволяет осуществлять классификацию, т.е. выделение классов и подклассов, с использованием признаков и свойств объектов.
Агрегированным объектом, строго говоря, следует считать объект, спроектированный (смоделированный ) на основе агрегации. Однако в разных приложениях допускают введение дополнительных условий. В частности, агрегированными обозначают объекты, участвующие в каком-либо процессе. Это соответствует описанию динамических свойств, и такие агрегированные объекты называют "отглагольными существительными", например, поставлять - "поставка", производить - "производство" и т.п.
Большинство ограничений в ER-моделях относится к классу явных. Однако в них существует ограничение для случая, когда сущность может быть идентифицирована по связям, а не по значениям своих атрибутов. Такое ограничение называется зависимостью по идентификации и обозначается как ID-зависимость.
Сетевые модели дают представление о проблемной области в виде объектов, связанных бинарными отношениями "многие ко многим". В отличие от иерархических моделей в сетевой модели каждый объект может иметь несколько "подчиненных" и несколько "старших" объектов.
Сетевые модели используют табличные и значительно чаще графовые представления. Вершинам графа сопоставляют некоторые типы сущности, представляемые таблицами, а дугам - типы связей.
Многие типы сетевых моделей данных используют для описания экономических и организационных систем.
Наиболее развитой сетевой моделью данных является модель, разработанная Рабочей группой по базам данных Ассоциации по языкам систем обработки данных КОДАСИЛ. Ее спецификации впоследствии неоднократно пересматривались.
Дискуссия по поводу сравнительных достоинств реляционной и сетевой моделей данных окончательно не закончилась. Пока признано, что нет модели, наилучшей в любых условиях, и что различным задачам адекватны различные модели.
Бинарная модель. Она дает представление о проблемной области в виде бинарных отношений, характеризуемых триадой: объект, атрибут, значение.
Как известно, в иерархической графовой модели вершины представляют атрибуты или агрегаты атрибутов и соответствуют множествам или Смотренным множествам. Дуги могут использоваться для представления агрегации двух атрибутов в тип сущности или двух типов сущности в тип связи.
Вершина графа
бинарной модели соответствует
Дуга бинарной модели соответствует бинарному отношению категорий. Используя исчисление предикатов, бинарное отношение можно определить как двухместный предикат. Алгебра этих множеств определяется двухместными, или бинарными, операциями.
Графовое представление бинарных моделей дает структуру так называемого B-дерева в отличие от Е-дерева - иерархической структуры общего вида.
Семантические сети. Как модели данных они созданы для изучения проблем искусственного интеллекта. Базовые структуры в этих моделях могут быть представлены графом, множество вершин и дуг которого, как для бинарной, так и сетевой модели образует сеть.
Первоначально такую модель предполагали использовать для описания памяти в психологических задачах, но по мере развития она стала одним из основных способов представления знаний.
В отличие от сетевых моделей данных, применяемых в экономической сфере, семантические сети предназначены для представления и систематизации знаний общего характера. Развитие моделей этого класса связано с проблемами понимания естественного языка, а не с проблемами теории типов и категорий данных.
Выбор базовых информационных моделей во многом определяется не только задачами и технологией, но и возможностью программно-технологических средств. Обоснованный выбор моделей данных - залог оптимальной работы ГИС. Этот процесс является обязательным пр" системном анализе и построении ГИС.
Рассматривая базовые модели данных в ГИС для применения их в управлении, следует подчеркнуть, что эти же самые модели используют в информационных системах, решающих экономические задачи и задачи управления.