Автор работы: Пользователь скрыл имя, 06 Декабря 2013 в 14:16, реферат
Развитие вычислительной техники и появление емких внешних запоминающих устройств прямого доступа предопределило интенсивное развитие автоматических и автоматизированных систем разного назначения и масштаба, в первую очередь заметное в области бизнес приложений. Такие системы работают с большими объемами информации, которая обычно имеет достаточно сложную структуру, требует оперативности в обработке, часто обновляется и в то же время требует длительного хранения. Примерами таких систем являются автоматизированные системы управления предприятием, банковские системы, системы резервирования и продажи билетов и т. д. (рис. 1.1)
1. Базы и банки данных…………………………………………………………………………………..……….………2
1.1. Понятие базы и банка даны……………………………………………………………………….………2
2. Компоненты банка данных…………………………………………………………………………………….……4
2.1. Информационная база………………………………………………………………………………….……4
2.2. Лингвистические средства……………………………………………………………………..….………5
2.3. Программные средства…………………………………………………………………………….….……6
2.4. Технические средства……………………………………………………..……………………….……..…7
2.5. Организационно-административные подсистемы……..……………..………...………8
3. Пользователи баз данных…………………………………………………………………………….……..………8
4. Типология баз данных………………………………………………………………………………….………………8
4.1. Типология баз данных с точки зрения информационных процессов….…………...9
5. Семантика баз данных……………………………………………………………………………………….………10
6. Типология моделей…………………………………………………………………………………………...………11
7. Модели и структуры данных……………………………………………………………..…………….…..……15
8. Литература………………………………………………………………………………………………………….………17
Автоматическое приведение такого
рода представлений к очевидно наилучшей
для этого случая табличной форме,
потребовало бы применения трудно реализуемых
процедур морфологического и семантического
анализов. Однако с другой стороны,
выделение смысла (и генерация
новой информации) обычно производится
человеком, сознание которого (как среда
преобразования) ориентировано именно
на обработку лингвистических
Рассматривая процесс
нужно сказать, что отбор и обработка должны быть выделены в отдельные процессы, так как с точки зрения общей (суммарной) эффективности один из них (обычно поиск) должен быть опосредованным — оценка полезности найденной информации производится обычно человеком, так как сознание человека— внешняя по отношению к машине среда, работает со слабоструктурированной информацией эффективнее машин.
Случаи, когда информация представляется в форме, не адекватной архитектуре фон-неймановских машин, могут быть обусловлены разными факторами. Рассмотрим следующие случаи.
1. Хорошо структурированная
2. Информация, точная по содержанию, но вариантно представляемая по форме. Например, описание в текстовом виде численно задаваемых параметров изделия. Лингвистические переменные в этом случае имеют точное значение, однако построение универсальной процедуры автоматического выделения факта из текста трудоемко и потому нецелесообразно.
3. Слабоструктурированная
Возвращаясь к процедуре поиска как важнейшей составляющей использования баз данных, еще раз отметим, что критерий отбора должен содержать не только величину (например, слово), но и контекст.
В реальных системах поиск документальной информации, представленной в текстовой форме, производится по вторичным документам — специально создаваемым поисковым образам, точно идентифицирующим сам документ как единицу хранения, и приблизительно, в краткой форме, путем перечисления основных понятий, отражающий смысловое содержание. Такой подход позволяет построить процедуры поиска на основе теоретико-множественной модели с точной логикой отбора по критерию наличия заданного сочетания терминов запроса в списке терминов поискового образа. Однако контекст использования терминов должен быть доопределен отдельно — либо во время поиска, например, указанием тематической области, либо после отбора из базы — во время ознакомления человека с содержанием найденного.
Определение контекста предметной области в целом осуществляется с помощью тезаурусов терминологических систем, фиксирующих с помощью родо-видовых и других отношений роль и семантику дескрипторов — выделенных терминов, которые используются для формирования поисковых образов документов.
Для доопределения смысла термина в составе поискового образа документа в первых поколениях автоматизированных информационных систем применялись специальные указатели роли, однако их использование было трудоемко и требовало специальной подготовки пользователя, поэтому в современных системах не применяется.
Другой важный фактор, влияющий на
эффективность работы человека с
информацией — это форма
В том случае когда для хранения информации используются базы данных, структура документов может быть определена двумя путями.
• так же как и для фактографических БД, заданием схемы — последовательности именованных типизированных полей данных;
• контекстным определением — использованием специализированных языков разметки (например, НТМL или ХМL), задающим индивидуальные особенности представления материала каждого документа.
Использование встраиваемых определений
структуры позволяет ввести «само
определяемые» форматы
6. Типология моделей
Основные отличия любых
Ключевым этапом при разработке любой информационной системы является проведение системного анализа: формализация предметной области и представление системы как совокупности компонент. Системный анализ позволяет, с одной стороны, лучше понять «что надо делать» и «кому надо делать» (аналитику, разработчику,
руководителю,
пользователю), а с другой — отслеживать
во времени изменения
Декомпозиция как основа системного анализа может быть функциональной (построение иерархий функций) или объектной.
Однако в большинстве систем, если говорить, например, о базах данных, типы данных являются более статичным элементом, чем способы их обработки. Поэтому получили интенсивное развитие такие методы системного анализа, как диаграммы потоков данных (Data Flow Diagram). Развитие реляционных баз данных в свою очередь стимулировало развитие методик построения моделей данных, и в частности, ER-диаграмм (Entity Relationship Diagram). Однако и функциональная декомпозиция и диаграммы потоков данных дают только некоторый срез исследуемой предметной области, но не позволяют получить представление системы в целом.
Различаются и методы отображения, используемые на этапе построения даталогических моделей, отражающих способ идентификации элементов и связей, но, что особенно важно — в контексте их будущего представления в одномерном пространстве памяти вычислительной машины. Модели подразделяются на фактографические — ориентированные на представление хорошо структурированной информации, и документальные — представляющие наиболее распространенный способ отражения слабоструктурированной информации. Если в первом случае говорят о реляционной, иерархической или сетевой моделях данных, то во втором — о семантических сетях и документальных моделях.
При проектировании информационных систем свойства объектов (их характеристики) называются атрибутами. Именно значения атрибутов позволяют выделить как в предметной области различные объекты (типы объектов), так и среди объектов одного типа — их различные экземпляры. Представление атрибутов удобнее всего моделируется теоретико-множественными отношениями. Отношение наглядно представляется как таблица, где каждая строка — кортеж отношения, а каждый столбец (домен) представляет множество значений атрибута. Список имен атрибутов отношения образует схему отношения, а совокупность схем отношений, используемых для представления БД, в свою очередь образует схему базы данных.
Представление схем БД в виде схем отношений упрощает процедуру проектирования БД. Этим объясняется создание систем, в которых проектирование БД ведется в терминах реляционной модели данных, а работа с БД поддерживается СУБД одного из упомянутых ранее типов.
Основное отличие методов
Во втором случае предметная среда
отображается (по крайней мере, на уровне
модели) в виде однородной сети, любые
изменения которой, как по вводу
новых классов объектов, так и
новых типов отношений, не связаны
с какими-либо структурными преобразованиями
сети. В силу большого количества типов
отношений манипулирование
Модель данных должна, так или
иначе, дать основу для описания данных
и манипулирования ими, а также
дать средства анализа и синтеза
структур данных. Любая модель, построенная
более или менее аккуратно
с точки зрения математики, сама
создает объекты для
Реляционная модель данных в качестве основы отображения непосредственно использует понятие отношения. Она ближе всего находится к так называемой концептуальной модели предметной среды и часто лежит в основе последней.
В отличие от теоретико-графовых моделей в реляционной модели связи между отношениями реализуются неявным образом, для чего используются ключи отношений. Например, отношения иерархического типа реализуется механизмом первичных / внешних ключей, когда в подчиненном отношении должен присутствовать набор атрибутов, связывающих это отношение с основным. Такой набор атрибутов в основном отношении будет называться первичным ключом, а в подчиненном — вторичным.
Прогресс в области разработки языков программирования, связанный в первую очередь с типизацией данных и появлением объектно-ориентированных языков, позволил подойти к анализу сложных систем с точки зрения иерархических представлений — с помощью классов объектов со свойствами инкапсуляции, наследования и полиморфизма, схемы которых отображают не только данные и их взаимосвязи, но и методы обработки данных.
В этом смысле объектно-ориентированный
подход является гибридным методом
и позволяет получить более естественную
формализацию системы в целом. В
итоге это позволяет снизить
существующий барьер между аналитиками
и разработчиками (проектировщиками
и программистами), повысить надежность
системы и упростить
Разделение на фактографические и документальные в этой группе моделей является достаточно условным. Документ как последовательность полей может быть представлен в том числе и реляционной моделью. И в этом случае выбор специализированного решения чаще всего обуславливается требованием общей эффективности.
В заключение отметим, что представленная здесь типология моделей не претендует на полноту, и она не является классификацией в точном смысле этого слова. Она скорее иллюстрирует эклектичность преобладающих в разное время взглядов, методов и решений, используемых при проектировании и реализации баз данных.
7. Модели и структуры данных
Рассматриваемые в контексте понятия «информационная система» элементы реального мира, информацию о которых мы сохраняем и обрабатываем, будем называть объектами. Объект может быть материальным (например, служащий, изделие или населенный пункт) и нематериальным (например, имя, понятие, абстрактная идея). Будем называть набором объектовсовокупность объектов, однородных с не которой точки зрения (например, объектов нашего внимания, пусть даже и разнородных по своей внутренней природе).
Объект имеет различные
Однако во всех случаях человек,
работая с информацией, имеет
дело с абстракцией, представляющей
интересующий его фрагмент реального
мира — той совокупностьюхарактеристически
Цель такого абстрагирования — построение конструктивного операбельного описания (рабочей модели), удобного в обработке как для человека, так и для машины, позволяющего организовать эффективную обработку больших объемов информации, причем высокопроизводительной должна быть работа не только вычислительной системы, но и взаимодействующего с ней человека.