Базы и банки данных

Автор работы: Пользователь скрыл имя, 06 Декабря 2013 в 14:16, реферат

Описание работы

Развитие вычислительной техники и появление емких внешних запоминающих устройств прямого доступа предопределило интенсивное развитие автоматических и автоматизированных систем разного назначения и масштаба, в первую очередь заметное в области бизнес приложений. Такие системы работают с большими объемами информации, которая обычно имеет достаточно сложную структуру, требует оперативности в обработке, часто обновляется и в то же время требует длительного хранения. Примерами таких систем являются автоматизированные системы управления предприятием, банковские системы, системы резервирования и продажи билетов и т. д. (рис. 1.1)

Содержание работы

1. Базы и банки данных…………………………………………………………………………………..……….………2
1.1. Понятие базы и банка даны……………………………………………………………………….………2
2. Компоненты банка данных…………………………………………………………………………………….……4
2.1. Информационная база………………………………………………………………………………….……4
2.2. Лингвистические средства……………………………………………………………………..….………5
2.3. Программные средства…………………………………………………………………………….….……6
2.4. Технические средства……………………………………………………..……………………….……..…7
2.5. Организационно-административные подсистемы……..……………..………...………8
3. Пользователи баз данных…………………………………………………………………………….……..………8
4. Типология баз данных………………………………………………………………………………….………………8
4.1. Типология баз данных с точки зрения информационных процессов….…………...9
5. Семантика баз данных……………………………………………………………………………………….………10
6. Типология моделей…………………………………………………………………………………………...………11
7. Модели и структуры данных……………………………………………………………..…………….…..……15
8. Литература………………………………………………………………………………………………………….………17

Файлы: 1 файл

реферат базы данных.docx

— 144.19 Кб (Скачать файл)

Автоматическое приведение такого рода представлений к очевидно наилучшей  для этого случая табличной форме, потребовало бы применения трудно реализуемых  процедур морфологического и семантического анализов. Однако с другой стороны, выделение смысла (и генерация  новой информации) обычно производится человеком, сознание которого (как среда  преобразования) ориентировано именно на обработку лингвистических переменных.

Рассматривая процесс автоматизированной генерации новой информации (рис. 1.6), где в качестве источника исходных данных используются БД, 

 

 

 

 

 

нужно сказать, что отбор и обработка  должны быть выделены в отдельные  процессы, так как с точки зрения общей (суммарной) эффективности один из них (обычно поиск) должен быть опосредованным — оценка полезности найденной информации производится обычно человеком, так  как сознание человека— внешняя по отношению к машине среда, работает со слабоструктурированной информацией эффективнее машин.

Случаи, когда информация представляется в форме, не адекватной архитектуре  фон-неймановских машин, могут быть обусловлены разными факторами. Рассмотрим следующие случаи.

1. Хорошо структурированная информация, представляемая в графическом  или специальном формате. Например, структурные химические формулы,  конструкторская документация и  т. д. В этом случае для  автоматической обработки требуются  узкоспециализированные средства, что приводит к общей неунифицированности представления семантических элементов (например, графических примитивов) на уровне данных.

2. Информация, точная по содержанию, но вариантно представляемая по форме. Например, описание в текстовом виде численно задаваемых параметров изделия. Лингвистические переменные в этом случае имеют точное значение, однако построение универсальной процедуры автоматического выделения факта из текста трудоемко и потому нецелесообразно.

3. Слабоструктурированная информация, обычно представляемая в текстовой  форме. Например, учебная или научная  публикация, где новые понятия  строятся на основании ранее  определенных. В этом случае лингвистические переменные могут принимать новые, ранее не определенные значения, которые определяются контекстом — ближним (словосочетания) или общим (темой сообщения).

Возвращаясь к процедуре поиска как важнейшей составляющей использования  баз данных, еще раз отметим, что  критерий отбора должен содержать не только величину (например, слово), но и  контекст.

В реальных системах поиск документальной информации, представленной в текстовой  форме, производится по вторичным документам — специально создаваемым поисковым  образам, точно идентифицирующим сам  документ как единицу хранения, и  приблизительно, в краткой форме, путем перечисления основных понятий, отражающий смысловое содержание. Такой подход позволяет построить процедуры поиска на основе теоретико-множественной модели с точной логикой отбора по критерию наличия заданного сочетания терминов запроса в списке терминов поискового образа. Однако контекст использования терминов должен быть доопределен отдельно — либо во время поиска, например, указанием тематической области, либо после отбора из базы — во время ознакомления человека с содержанием найденного.

Определение контекста предметной области в целом осуществляется с помощью тезаурусов терминологических  систем, фиксирующих с помощью  родо-видовых и других отношений роль и семантику дескрипторов — выделенных терминов, которые используются для формирования поисковых образов документов.

Для доопределения смысла термина в составе поискового образа документа в первых поколениях автоматизированных информационных систем применялись специальные указатели роли, однако их использование было трудоемко и требовало специальной подготовки пользователя, поэтому в современных системах не применяется.

Другой важный фактор, влияющий на эффективность работы человека с  информацией — это форма хранения и представления— структура и оформление документа. Это особенно заметно при работе с объемными полнотекстовыми документами, причем иногда определяется на уровне машинного формата (например, DOC, PDF, HTML и т. д.), от выбора которого зависит возможность дальнейшей обработки.

В том случае когда для хранения информации используются базы данных, структура документов может быть определена двумя путями.

• так же как и для фактографических БД, заданием схемы — последовательности именованных типизированных полей данных;

• контекстным определением — использованием специализированных языков разметки (например, НТМL или ХМL), задающим индивидуальные особенности представления материала каждого документа.

Использование встраиваемых определений  структуры позволяет ввести «само  определяемые» форматы представления  документов. Это обеспечивает практически  неограниченную гибкость при организации  хранения коллекций разнородных  документов, однако создает семантические  проблемы согласованного использования  материала (из-за возможности различной  интерпретации определений), что  в свою очередь требует создания доступного всем пользователям репозитария метаинформации — описаний природы и способов представления информации. 

 

6. Типология моделей 

 

Основные отличия любых методов  представления информации заключаются  в том, каким способом фиксируется  семантика предметной области. Однако следует особо отметить, что для  всех уровней и для любого метода представления предметной области (нам важен контекст создания и  использования машинных баз данных) в основе отображения (т. е. собственно формирования представления) лежит кодирование понятий и отношений между понятиями. Многоуровневая система моделей представления информации иллюстрируется рис. 1.7. Рассмотрим далее основные из них.

Ключевым этапом при разработке любой информационной системы является проведение системного анализа: формализация предметной области и представление  системы как совокупности компонент. Системный анализ позволяет, с одной стороны, лучше понять «что надо делать» и «кому надо делать» (аналитику, разработчику,  

 

 

 

руководителю, пользователю), а с другой — отслеживать  во времени изменения рассматриваемой  модели и обновлять проект.

Декомпозиция как основа системного анализа может быть функциональной (построение иерархий функций) или объектной.

Однако в большинстве систем, если говорить, например, о базах  данных, типы данных являются более  статичным элементом, чем способы  их обработки. Поэтому получили интенсивное  развитие такие методы системного анализа, как диаграммы потоков данных (Data Flow Diagram). Развитие реляционных баз данных в свою очередь стимулировало развитие методик построения моделей данных, и в частности, ER-диаграмм (Entity Relationship Diagram). Однако и функциональная декомпозиция и диаграммы потоков данных дают только некоторый срез исследуемой предметной области, но не позволяют получить представление системы в целом.

Различаются и методы отображения, используемые на этапе построения даталогических моделей, отражающих способ идентификации элементов и связей, но, что особенно важно — в контексте их будущего представления в одномерном пространстве памяти вычислительной машины. Модели подразделяются на фактографические — ориентированные на представление хорошо структурированной информации, и документальные — представляющие наиболее распространенный способ отражения слабоструктурированной информации. Если в первом случае говорят о реляционной, иерархической или сетевой моделях данных, то во втором — о семантических сетях и документальных моделях.

При проектировании информационных систем свойства объектов (их характеристики) называются атрибутами. Именно значения атрибутов позволяют выделить как  в предметной области различные  объекты (типы объектов), так и среди  объектов одного типа — их различные  экземпляры. Представление атрибутов  удобнее всего моделируется теоретико-множественными отношениями. Отношение наглядно представляется как таблица, где каждая строка —  кортеж отношения, а каждый столбец (домен) представляет множество значений атрибута. Список имен атрибутов отношения  образует схему отношения, а совокупность схем отношений, используемых для представления  БД, в свою очередь образует схему  базы данных.

Представление схем БД в виде схем отношений упрощает процедуру проектирования БД. Этим объясняется создание систем, в которых проектирование БД ведется  в терминах реляционной модели данных, а работа с БД поддерживается СУБД одного из упомянутых ранее типов.

Основное отличие методов представления  информации заключается в том, каким  способом фиксируется семантика  предметной области. Первые, фактографические БД, задают четкую схему соответствия, в рамках которой и отображается предметная область. Подобное построение по сути своей является довольно статичным, требует априорного знания типов  отношений. В нем достаточно сложно вводить информацию о новых типах  отношений между объектами, но с  другой стороны, зафиксированная схема  базы данных позволяет довольно эффективно организовать поиск информации.

Во втором случае предметная среда  отображается (по крайней мере, на уровне модели) в виде однородной сети, любые  изменения которой, как по вводу  новых классов объектов, так и  новых типов отношений, не связаны  с какими-либо структурными преобразованиями сети. В силу большого количества типов  отношений манипулирование подобной «элементарной» информацией достаточно затруднено, поэтому для данного  случая характерно введение большого количества более общих понятий (и соответствующих им отношений), что упрощает работу с сетью.

Модель данных должна, так или  иначе, дать основу для описания данных и манипулирования ими, а также  дать средства анализа и синтеза  структур данных. Любая модель, построенная  более или менее аккуратно  с точки зрения математики, сама создает объекты для исследования и начинает жить как бы параллельно  с практикой.

Реляционная модель данных в качестве основы отображения непосредственно  использует понятие отношения. Она  ближе всего находится к так называемой концептуальной модели предметной среды и часто лежит в основе последней.

В отличие от теоретико-графовых моделей в реляционной модели связи между отношениями реализуются неявным образом, для чего используются ключи отношений. Например, отношения иерархического типа реализуется механизмом первичных / внешних ключей, когда в подчиненном отношении должен присутствовать набор атрибутов, связывающих это отношение с основным. Такой набор атрибутов в основном отношении будет называться первичным ключом, а в подчиненном — вторичным.

Прогресс в области разработки языков программирования, связанный  в первую очередь с типизацией данных и появлением объектно-ориентированных  языков, позволил подойти к анализу  сложных систем с точки зрения иерархических представлений —  с помощью классов объектов со свойствами инкапсуляции, наследования и полиморфизма, схемы которых  отображают не только данные и их взаимосвязи, но и методы обработки данных.

В этом смысле объектно-ориентированный  подход является гибридным методом  и позволяет получить более естественную формализацию системы в целом. В  итоге это позволяет снизить  существующий барьер между аналитиками  и разработчиками (проектировщиками и программистами), повысить надежность системы и упростить сопровождение, в частности, интеграцию с другими  системами. Модель будет структурно объектно-ориентированной, если она поддерживает сложные объекты; модель будет поведенчески объектно-ориентированной,если она обеспечивает процедурную расширяемость; для того чтобы модель была полностью объектно-ориентированной, она должна обладать обоими свойствами.

Разделение на фактографические и документальные в этой группе моделей является достаточно условным. Документ как последовательность полей может быть представлен в том числе и реляционной моделью. И в этом случае выбор специализированного решения чаще всего обуславливается требованием общей эффективности.

В заключение отметим, что представленная здесь типология моделей не претендует на полноту, и она не является классификацией в точном смысле этого слова. Она  скорее иллюстрирует эклектичность  преобладающих в разное время  взглядов, методов и решений, используемых при проектировании и реализации баз данных.  

 

7. Модели и структуры данных  

 

Рассматриваемые в контексте понятия  «информационная система» элементы реального мира, информацию о которых  мы сохраняем и обрабатываем, будем  называть объектами. Объект может быть материальным (например, служащий, изделие или населенный пункт) и нематериальным (например, имя, понятие, абстрактная идея). Будем называть набором объектовсовокупность объектов, однородных с не которой точки зрения (например, объектов нашего внимания, пусть даже и разнородных по своей внутренней природе).

Объект имеет различные свойства (например, цвет, вес, имя), которые важны  для нас в то время, когда мы обращаемся к объекту (например, выбираем среди множества других) с какой-либо целью его использования. Причем свойства могут быть заданы как отдельными однозначно интерпретируемыми количественными показателями, так и словесными нечеткими описаниями, допускающими разную трактовку, иногда зависящую от точки зрения и наличных знаний воспринимающего субъекта.

Однако во всех случаях человек, работая с информацией, имеет  дело с абстракцией, представляющей интересующий его фрагмент реального мира — той совокупностьюхарактеристических свойств (атрибутов), которые важны для решения его прикладной задачи. Абстрагирование — это способ упрощения совокупности фактов, относящихся к реальному объекту (по своей сути бесконечно сложному и разнообразному при изучении его человеком). При этом некоторые свойства объекта игнорируются, поскольку считается, что для решения данной прикладной задачи (или совокупности задач) они не являются определяющими и не влияют на конечный результат действий при решении.

Цель такого абстрагирования —  построение конструктивного операбельного  описания (рабочей модели), удобного в обработке как для человека, так и для машины, позволяющего организовать эффективную обработку больших объемов информации, причем высокопроизводительной должна быть работа не только вычислительной системы, но и взаимодействующего с ней человека.

Информация о работе Базы и банки данных