Автор работы: Пользователь скрыл имя, 08 Апреля 2013 в 11:55, реферат
В настоящее время под информационными технологиями чаще всего понимают компьютерные технологии. В частности, ИТ имеют дело с использованием компьютеров и программного обеспечения для сбора, преобразования, обработки, хранения, защиты, передачи информации заинтересованному пользователю.
Информационная система, ИС (Information System - IS) - система, предназначенная для реализации и ведения информационной модели какой- либо области человеческой деятельности.
Эксплуатируемая программа имеет дело с данными различных типов, предназначенных для решения конкретных задач.
Хранение информации. Базы и хранилища данных
Предметная область какой-либо
деятельности - часть реального мира,
подлежащая изучению с целью организации
управления процессами и объектами
для получения бизнес-
Рис. 2.2. Общая схема базы данных
База данных, БД (Data Base) - структурированный
организованный набор данных, объединенных
в соответствии с некоторой выбранной
моделью и описывающих
Понятие "динамически обновляемая
БД" означает, что соответствие базы
данных текущему состоянию предметной
области обеспечивается не периодически,
а в режиме реального времени.
При этом одни и те же данные могут
быть по-разному представлены в соответствии
с потребностями различных
Система управления базами данных,
СУБД (Data Base Management System) - специализированная
программа или комплекс программ,
предназначенные для
СУБД часто упрощенно или ошибочно называют "базой данных". Нужно различать набор данных (собственно БД) и программное обеспечение, предназначенное для организации и ведения баз данных (СУБД).
Отличительной чертой баз данных следует считать то, что данные хранятся совместно с их описанием, а в прикладных программах описание данных не содержится. Независимые от программ пользователя данные обычно называются метаданными или данными о данных. В ряде современных систем метаданные, содержащие также информацию о пользователях, форматы отображения, статистику обращения к данным и др. сведения, хранятся в специальном словаре базы данных.
Организация структуры БД формируется исходя из следующих соображений:
адекватность описываемому объекту/системе - на уровне концептуальной и логической моделей;
удобство использования для ведения учета и анализа данных - на уровне так называемой физической модели.
Виды концептуальных и логических моделей БД:
картотеки;
сетевые;
иерархические;
реляционные;
дедуктивные;
объектно-ориентированные;
многомерные.
На уровне физической модели электронная БД представляет собой файл или набор данных в dbf-форматах приложений Excel, Access либо в специализированном формате конкретной СУБД. Также в СУБД в понятие физической модели включают специализированные виртуальные понятия, существующие в ее рамках, - "таблица", "табличное пространство", "сегмент", "куб", "кластер" и т. д.
В настоящее время наибольшее распространение получили реляционные базы данных. Картотеками пользовались до появления электронных баз данных. Сетевые и иерархические базы данных считаются устаревшими, объектно-ориентированные пока никак не стандартизированы и не получили широкого распространения.
Реляционная база данных - база данных, основанная на реляционной модели. Слово "реляционный" происходит от английского "relation" (отношение).
Теория реляционных баз данных была разработана доктором Эдгаром Коддом из компании IBM в 1970 году. В реляционных базах данных все данные представлены в виде простых таблиц, разбитых на строки и столбцы, на пересечении которых расположены данные. Запросы к таким таблицам возвращают таблицы, которые сами могут становиться предметом дальнейших запросов. Каждая база данных может включать несколько таблиц. Кратко особенности реляционной базы данных можно сформулировать следующим образом:
данные хранятся в таблицах, состоящих из столбцов ("атрибутов") и строк ("записей");
на пересечении каждого столбца и строчки стоит в точности одно значение;
у каждого столбца есть свое имя, которое служит его названием, и все значения в одном столбце имеют один тип;
запросы к базе данных возвращают результат в виде таблиц, которые тоже могут выступать как объект запросов;
строки в реляционной базе данных неупорядочены, упорядочивание производится в момент формирования ответа на запрос.
Общепринятым стандартом языка работы с реляционными базами данных в настоящее время является язык структурированных запросов (Structured Query Language - SQL). Это универсальный компьютерный язык, применяемый для создания, модификации и управления данными в реляционных базах данных. Вопреки существующим заблуждениям, SQL является информационно-логическим языком, а не языком программирования.
SQL основывается на реляционной алгебре. Язык SQL делится на три части:
операторы определения данных;
операторы манипуляции данными (Insert, Select, Update, Delete);
операторы определения доступа к данным.
Основные функции системы управления базами данных:
управление данными во внешней памяти (на различных носителях);
управление данными в оперативной памяти;
журналирование изменений и восстановление базы данных после сбоев;
поддержка языков БД (язык определения данных, язык манипулирования данными, язык определения доступа к данным).
Рис. 2.3. Основные компоненты СУБД
Обычно современная СУБД содержит следующие компоненты (рис. 2.3):
По архитектуре организации хранения данных:
локальные СУБД (все части локальной СУБД размещаются на одном компьютере);
распределенные СУБД (части СУБД могут размещаться на двух и более компьютерах).
Классификация СУБД по способу доступа к БД:
файл-серверные;
клиент-серверные;
трехзвенные;
встраиваемые.
Файл-серверные СУБД. Архитектура "файл-сервер" не имеет сетевого разделения компонентов диалога и использует компьютер для функции отображения, что облегчает построение графического интерфейса. "Файл-сервер" только извлекает данные из файлов, так что дополнительные пользователи добавляют лишь незначительную нагрузку на центральный процессор, и каждый новый клиент добавляет вычислительную мощность сети. Минус - высокая загрузка сети. На данный момент файл-серверные СУБД считаются устаревшими. Примеры: Microsoft Access, MySQL (до версии 5.0).
Клиент-серверные СУБД. Такие СУБД состоят из клиентской части (которая входит в состав прикладной программы) и сервера. Клиент-серверные СУБД, в отличие от файл-серверных, обеспечивают разграничение доступа между пользователями и меньше загружают сеть и клиентские машины. Сервер является внешней по отношению к клиенту программой, и по мере надобности его можно заменить другим. Недостаток клиент-серверных СУБД - в самом факте существования сервера (что плохо для локальных программ - в них удобнее встраиваемые СУБД) и больших вычислительных ресурсах, потребляемых сервером. Примеры: Firebird, Interbase, MS SQL Server, Oracle, DB2, PostgreSQL, MySQL (старше версии 5.0).
Существенным недостатком
клиент-серверной архитектуры
Встраиваемая СУБД - это, как
правило, "библиотека", которая
позволяет унифицированным
В общем случае СУБД могут быть классифицированы в системе координат "Неоднородность - Автономность -Распределенность" (рис. 2.4).
Таким образом, распределенная обработка данных в обязательном порядке предполагает наличие банков и баз данных. Но база данных - это не просто место, куда складывают данные, ими нужно пользоваться, актуализировать, изменять форматы и связи, совершать множество других действий. Если бессистемно наполнять базу данных информацией, то через некоторое время ее невозможно будет использовать - времени на поиск нужных данных будет уходить все больше и больше, физическое пространство базы переполнится. Чтобы этого избежать, данные необходимо "очищать" и структурировать, а для эффективной работы с ними необходимы системы управления работой баз данных.
Индустрия создания баз данных
и СУБД берет свое начало в 60-х
годах прошлого века и к настоящему
времени достаточно развита, однако
понятие "хранилище данных" в
современном понимании его
Рис. 2.4. Классификационная система координат
Идея хранилищ данных оказалась востребованной, так как во многих видах государственной, деловой, научной, социальной деятельности необходимы тематически объединенные и исторически очищенные совокупности данных, при этом постоянно возрастала потребность:
в более дешевых данных;
в точных и структурированных данных;
в большей оперативности получения и обработки данных;
в интегрированных данных.
К концу 1980-х годов, когда была в полной мере осознана необходимость интеграции корпоративной информации и надлежащего управления этой информацией, появились технические возможности для создания соответствующих систем, которые первоначально были названы "хранилищами информации" (Information Warehouse - IW). И лишь в 1990-е годы, с выходом книги Уильяма (Билла) Инмона, хранилища получили свое нынешнее наименование "хранилища данных" (Data Warehouse - DW) [Inmon W.H. Building the Data Warehouse, QED/Wiley, 1991, 312 р.].
Билл Инмон определил
хранилища данных как "предметно-ориентированные,
интегрированные, неизменные, поддерживающие
хронологию наборы данных, организованные
для целей поддержки
В основе концепции хранилищ данных
лежат следующие
интеграция ранее разъединенных детализированных данных (исторические архивы, данные из традиционных систем обработки документов, разрозненных баз данных, данные из внешних источников) в едином хранилище данных;
тематическое и временное структурирование, согласование и агрегирование;
разделение наборов данных, используемых для операционной (производственной) обработки, и наборов данных, используемых для решения задач анализа.
Данные, помещаемые в хранилище, должны отвечать определенным требованиям - предметной ориентированности, интегрированности, поддержки хронологии и неизменяемости (таблица 2.3).
Таблица 2.3.
Предметная ориентированность
Интегрированность Все данные о различных бизнес-объектах взаимно согласованы и хранятся в едином общекорпоративном хранилище
Поддержка хронологии Данные хронологически структурированы и отражают историю за период времени, достаточный для выполнения задач бизнес-анализа, прогнозирования и подготовки принятия решения
Неизменяемость Исходные (исторические) данные, после того как они были согласованы, верифицированы и внесены в общекорпоративное хранилище, остаются неизменными и используются исключительно в режиме чтения