Лекции "Базе данным"

Автор работы: Пользователь скрыл имя, 05 Июня 2012 в 14:05, курс лекций

Описание работы

Основные этапы развития информационных систем
Файлы и файловые системы
Основные понятия и определения баз и банков данных

Файлы: 1 файл

Лекции ПКС БД.docx

— 340.22 Кб (Скачать файл)

    Эта архитектура позволяет обеспечить логическую (между уровнями 1 и 2) и  физическую (между уровнями 2 и 3) независимость при работе с данными. Логическая независимость предполагает возможность изменения одного приложения без корректировки других приложений, работающих с этой же базой данных. Физическая независимость предполагает возможность переноса хранимой информации с одних носителей на другие при сохранении работоспособности всех приложений, работающих с данной базой данных.

  1. Пользователи банков данных

    Как любой программно-организационно-технический  комплекс, банк данных существует во времени  и в пространстве. Он имеет определенные стадии своего развития:

  1. Проектирование.
  2. Реализация.
  3. Эксплуатация;
  4. Модернизация и развитие.
  5. Полная реорганизация.

    На  каждом этапе своего существования  с банком данных связаны разные категории  пользователей.

    Конечные  пользователи. Это основная категория пользователей, в интересах которых и создается банк данных. В зависимости от особенностей создаваемого банка данных круг его конечных пользователей может существенно различаться. Это могут быть случайные пользователи, обращающиеся к БД время от времени за получением некоторой информации, а могут быть регулярные пользователи. В качестве случайных пользователей могут рассматриваться, например, возможные клиенты фирмы, просматривающие каталог ее продукции или услуг с обобщенным или подробным описанием того и другого. Регулярными пользователями могут быть сотрудники фирмы, работающие со специально разработанными для них программами, которые обеспечивают автоматизацию их деятельности при выполнении своих должностных обязанностей. Главный принцип состоит в том, что от конечных пользователей не должно требоваться каких-либо специальных знаний в области вычислительной техники и языковых средств.

    Администраторы  банка данных. Это группа пользователей, которая на начальной стадии разработки банка данных отвечает за его оптимальную организацию с точки зрения одновременной работы множества конечных пользователей, на стадии эксплуатации отвечает за корректность работы данного банка информации в многопользовательском режиме. На стадии развития и реорганизации эта группа пользователей отвечает за возможность корректной реорганизации банка без изменения или прекращения его текущей эксплуатации.

    Разработчики  и администраторы приложений. Это группа пользователей, которая функционирует во время проектирования, создания и реорганизации банка данных. Администраторы приложений координируют работу разработчиков при разработке конкретного приложения или группы приложений, объединенных в функциональную подсистему. Разработчики конкретных приложений работают с той частью информации из базы данных, которая требуется для конкретного приложения.

    Не  в каждом банке данных могут быть выделены все типы пользователей.

  1. Классификация моделей данных. Физические  модели

    Одними  из основополагающих в концепции  баз данных являются обобщенные категории «данные» и «модель данных».

    Понятие «данные» в концепции баз данных — это набор конкретных значений, параметров, характеризующих объект, условие, ситуацию или любые другие факторы. Данные не обладают определенной структурой и становятся информацией тогда, когда пользователь задает им определенную структуру,  то есть осознает их смысловое содержание. Поэтому центральным понятием в области баз данных является понятие модели.

    Модель  данных — это некоторая абстракция, которая, будучи отнесена к конкретным данным, позволяет пользователям и разработчикам трактовать их уже как информацию, то есть сведения, содержащие не только данные, но и взаимосвязь между ними.

    В соответствии с рассмотренной ранее  трехуровневой архитектурой, понятие модели данных рассматривается по отношению к каждому уровню. Физическая модель данных оперирует категориями, касающимися организации внешней памяти и структур хранения, используемых в данной операционной среде. В настоящий момент в качестве физических моделей используются различные методы размещения данных, основанные на файловых структурах. Кроме того, современные СУБД широко используют страничную организацию данных. Физические модели данных, основанные на страничной организации, являются наиболее перспективными.

    

  1. Документальные модели

    Документальные  модели данных соответствуют представлению о слабоструктурированной информации, ориентированной в основном на свободные форматы документов, текстов на естественном языке.

    Модели, основанные на языках разметки документов, например, HTML. Этот язык позволяет определять оформление элементов документа и имеет некий ограниченный набор инструкций — тегов, при помощи которых осуществляется процесс разметки. Инструкции HTML в первую очередь предназначены для управления процессом вывода содержимого документа на экране программы-клиента и определяют этим самым способ представления документа, но не его структуру. В качестве элемента гипертекстовой базы данных, описываемой HTML, используется текстовый файл, который может легко передаваться по сети с использованием протокола HTTP. Эта особенность, а также то, что HTML является открытым стандартом и огромное количество пользователей имеет возможность применять возможности этого языка для оформления своих документов, безусловно, повлияли на рост популярности HTML и сделали его сегодня главным механизмом представления информации в Интернете.

    Тезаурусные модели основаны на принципе организации словарей, содержат определенные языковые конструкции и принципы их взаимодействия в заданной грамматике. Эти модели эффективно используются в системах-переводчиках, особенно многоязыковых переводчиках. Принцип хранения информации в этих системах и подчиняется тезаурусным моделям.

    Дескрипторные модели — самые простые из документальных моделей, они широко использовались на ранних стадиях использования документальных баз данных. В этих моделях каждому документу соответствовал дескриптор — описатель. Этот дескриптор имел жесткую структуру и описывал документ в соответствии с теми характеристиками, которые требуются для работы с документами в разрабатываемой документальной БД. Например, для БД, содержащей описание патентов, дескриптор содержал название области, к которой относился патент, номер патента, дату выдачи патента и еще ряд ключевых параметров, которые заполнялись для каждого патента. Обработка информации в таких базах данных велась исключительно по дескрипторам, то есть по тем параметрам, которые характеризовали патент, а не по самому тексту патента.

  1. Теоретико-графовые модели данных
 

    Теоретико-графовые модели данных отражают совокупность объектов реального мира в виде графа взаимосвязанных информационных объектов. В зависимости от типа графа выделяют иерархическую или сетевую модели, которые предполагают наличие связей между данными, имеющими какой либо общий признак. Исторически эти модели появились раньше, и в настоящий момент они используются реже, чем более современная реляционная модель данных. Однако до сих пор существуют системы, работающие на основе этих моделей, а одна из концепций развития объектно-ориентированных баз данных предполагает объединение принципов сетевой модели с концепцией реляционной.

    Иерархическая модель данных

      Иерархическая модель данных является наиболее простой среди всех даталогических моделей. Появление иерархической модели связано с тем, что в реальном мире очень многие связи соответствуют иерархии, когда один объект выступает как родительский, а с ним может быть связано множество подчиненных объектов. Иерархия проста и естественна в отображении взаимосвязи. Иерархическая структура данных представляет собой совокупность элементов, связанных между собой по определенным правилам. Объекты, связанные иерархическими отношениями, образуют ориентированный граф (перевернутое дерево).

Уровень 3

    Уровень 2

Уровень 1

А

В1

В2

В3

В4

В5

С1

С2

С3

С4

    С5

С6

С7

С8

    На  схеме иерархического дерева узлы представляются вершинами графа. Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину, не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т.д. уровнях.

    К каждой записи базы данных существует только один (иерархический) путь от корневой записи. Примером иерархической структуры  является файловая система.

    Достоинством  данной модели является возможность реализовать очень быстрый поиск, когда условия запроса соответствуют иерархии в схеме БД, однако при работе с данными со сложными логическими связями иерархическая модель оказывается слишком громоздкой.

    Сетевая модель данных

    В сетевой модели данные организуются в виде произвольного графа. Достоинством этой модели является высокая скорость поиска и возможность адекватно  представлять данные для решения  множества задач в самых различных предметных областях. Недостатком сетевой модели является жесткость структуры и высокая сложность ее организации.

    

    Существенным недостатком иерархической и сетевой моделей является то, что структура данных задается на этапе проектирования БД и не может быть изменена при организации доступа к данным.

  1. Реляционная модель данных

    Эта структура характеризуются простотой  организации данных, удобным для пользователя табличным представлением и возможностью использования формального аппарата алгебры отношений и реляционного исчисления для обработки данных.

    Реляционная модель ориентирована на организацию  данных в виде двумерных таблиц. Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:

    • каждый элемент таблицы — один элемент данных;
    • все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковый тип (числовой, символьный и т.д.) и длину;
    • каждый столбец имеет уникальное имя;
    • одинаковые строки в таблице отсутствуют;
    • порядок следования строк и столбцов может быть произвольным.

    Таблицы, образующие БД, хранятся в файлах и  похожи на отдельные документы,  их можно перемещать и копировать обычным способом. Однако, в отличие  от документов, таблицы поддерживают многопользовательский режим доступа, т. е. могут одновременно использоваться несколькими приложениями. Каждая таблица БД состоит из строк и столбцов и предназначена для хранения данных об однотипных объектах информационной системы. Строка таблицы называется записью, столбец таблицы — полем (атрибутом). Каждое поле должно иметь уникальное в пределах таблицы имя. Поле содержит данные одного из допустимых типов, например, текстового, числового или даты. При вводе значения в поле таблицы БД автоматически производится проверка соответствия типа значения и типа поля.

    Каждая  таблица имеет свою структуру, которую  образуют следующие элементы:

    • описание полей;
    • ключи;
    • индексы;
    • ограничения на значения полей;
    • ограничения ссылочной целостности между таблицами;
    • права доступа.

    Основу  структуры таблицы составляет описание ее полей, каждая таблица должна иметь хотя бы одно поле.

  1. . Ключи и индексы в реляционных базах данных

    Ключ  представляет собой комбинацию полей, данные в которых однозначно определяют каждую запись в таблице. Простой ключ состоит из одного поля, а составной (сложный) — из нескольких полей. Поля, по которым построен ключ, называют ключевыми. В таблице может быть определен только один ключ. Ключ обеспечивает:

    • однозначную идентификацию записей таблицы;
    • ускорение выполнения запросов к БД;
    • установление связи между отдельными таблицами БД;
    • использование ограничений ссылочной целостности.

    Ключ  также называют первичным ключом или первичным (главным) индексом.

Информация о работе Лекции "Базе данным"