Проблемы в процессе проектирования распределенных баз данных

Автор работы: Пользователь скрыл имя, 12 Декабря 2013 в 19:53, реферат

Описание работы

Распределенные системы призваны решить проблему информационных островов. Если на предприятии имеется несколько баз данных, их иногда рассматривают как некие разрозненные территории, представляющие собой отдельные итруднодоступные для многих места, подобные удаленным друг от друга островам. Данное положение может являться следствием географической разобщенности, несовместимости используемой компьютерной архитектуры, несовместимости используемых протоколов связи и т.д. Подобное положение дел способна изменить интеграция отдельных баз данных в одно логическое целое.

Содержание работы

Введение
Распределенные базы данных: преимущества и недостатки.
Основы проектирования. Стратегии распределения.
Проблемы в процессе проектирования распределенных баз данных.
Заключение
Список использованной литературы

Файлы: 1 файл

реферат по инф. системам.docx

— 164.27 Кб (Скачать файл)

1) проблему дезагрегации, состоящую в необходимости рационального,  в соответствии с системой  расчетов (решаемых задач), распределения  учетной информации по уровням  обработки и участкам учета с обеспечением их взаимосвязи;

2) проблему, связанную с  созданием инфологической структуры  информационного фонда распределенной  базы данных, ориентированного на  решение всего комплекса задач  избранной системы расчетов;

3) технологическую проблему, состоящую в удовлетворении требований  рационализации вычислительного  процесса на основе распределенной  базы данных и распределенного комплекса технических средств;

4) организационно–правовую  проблему, состоящую в обеспечении  защиты данных н соблюдении  юридических норм доступа к  базам данных, их заполнения, изменения  и уничтожения.

Кроме этих четырех проблем  при создании программного обеспечения  интегрированной распределенной обработки  учетных данных важным вопросом является распределение данных в логических узлах обработки информации. С  этой точки зрения существует четыре основных стратегии организации распределенных баз данных.

1. Централизация баз данных. Централизованный, или метод извлечения данных вручную (рис.1), является самым простым для реализации способом. На одном сервере находится единственная копия базы данных. Все операции с базой данных обеспечиваются этим сервером. Доступ к данным выполняется с помощью удаленного запроса или удаленной транзакции. Достоинством такого способа является легкая поддержка базы данных в актуальном состоянии. Недостатком является то, что размер базы ограничен размером внешней памяти, все запросы направляются к единственному серверу с соответствующими затратами на стоимость связи и временную задержку. Отсюда – ограничение на параллельную обработку. База может быть недоступной для удаленных пользователей при появлении ошибок связи и полностью выходит из строя при отказе центрального сервера.

Рис. 1 — Централизованное распределение

2. Расчленение распределенной  базы данных. При этой стратегии  существует единственная копия  базы данных, а локальные базы  данных распределены по отдельным  узлам. Объем распределенной базы  данных ограничивается необходимым объемом вторичной памяти, имеющейся уже во всей информационно-вычислительной сети. Эффективность стратегии расчленения тем выше, чем выше степень локализации ссылок, то есть чем больше число запросов пользователей реализуется в базах данных соответствующих локальных информационных систем.

Рис. 2 — Метод расчленения

Достоинстваэтого метода: увеличивается объем базы данных; большинство запросов удовлетворяется  локальными базами, что сокращает  время ответа; увеличиваются доступность  и надежность; стоимость запросов на выборку и обновление снижается  по сравнению с централизованным распределением; если выйдет из строя  один сервер, система останется частично работоспособной.

Недостаткиметода: часть  удаленных запросов или транзакций могут потребовать доступ ко всем серверам, что увеличивает время  ожидания и цену; необходимо иметь  сведения о размещении данных в БД. Однако доступность и надежность увеличиваются. Расчлененные базы данных наиболее подходят к случаю совместного  использования локальных и глобальных сетей ЭВМ.

3. Дублирование распределенных  баз данных. При использовании метода дублирования (рис. 3) в каждом сервере сети ЭВМ размещается полная база данных.При этой стратегии организуется несколько копий базы данных; полная копия всех данных располагается в каждом логическом узле. Основное преимущество данной стратегии заключаются в высокой надежности информационной базы к простоте ее восстановления.Этот метод дает наиболее надежный способ хранения данных.

Недостатки: повышенные требования к объему внешней памяти; усложнение корректировки баз, так как требуется синхронизация с целью согласования копий. Достоинства метода: все запросы выполняются локально, что обеспечивает быстрый доступ. Этот метод используется, когда фактор надежности является критическим, база — небольшой, а интенсивность обновления невелика.

Рис. 3 — Метод дублирования

4. Смешанная стратегия.  В методе смешанного распределения объединены два способа распределения данных: дублирование и расчленение (рис. 4). При этом приобретены как преимущества, так и недостатки обоих способов. Появилась необходимость хранить информацию о том, где находятся данные в сети. Главноепреимущество метода — гибкость этой системы, так как можно установить компромисс между объемом памяти под базу в целом и под базу в каждом сервере, чтобы обеспечить надежность и эффективность работы. В этой стратегии легко реализуется параллельная обработка, т.е. обслуживание распределенного запроса или транзакции. Недостаткиметода: остается проблема взаимозависимости факторов, влияющих на производительность системы, ее надежность, повышаются требования к памяти. Смешанную стратегию используют при наличии сетевойСУБД, которая обеспечивает реализацию распределенной базы данных.

Рис. 4 — Смешанное распределение

В связи с вышеизложенным, сокращение сроков и стоимости создания распределенных БД, необходимость эффективного использования ресурсов распределенных БД определяют целесообразность разработки формализованных моделей и методов, позволяющих автоматизировать наиболее трудоемкие этапы проектирования распределенных БД, выбрать решения, оптимизирующие их состав и структуру.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

    1. Проблемыв процессе проектирования распределенных баз данных

Основными проблемами в процессе проектирования баз данных являются целостность, согласованность, восстанавливаемость, безопасность, эффективность, а также  последствия предполагаемого роста  базы данных в будущем.

Указанные проблемы можно  сгруппировать следующим образом:

    1. Целостность, согласованность, восстанавливаемость.
    2. Безопасность.
    3. Эффективность, рост, размер, эксплуатационные ограничения.

Это разделение на группы отображает степени свободы проектировщика баз данных. Первая группа обычно отображает требования пользователей и состоит  из «жестких» ограничений, в рамках которых должен работать проектировщик. Вторая и третья группы обычно предоставляют  проектировщику больше свободы для  удовлетворения этих требований. Решение  проблем третьей группы является в значительной степени (но не полностью) прерогативой проектировщика, когда  уже найдено возможное решение, удовлетворяющее требованиям пользователей.

Вопросы эффективности должны быть разрешены как можно раньше, с целью дальнейшего беспрепятственного развития системы.

Децентрализация при решении  этих вопросов приводит к возникновению  проблем координации, гибкости и  организации при реализации системы.

Распределенную базу данных в общем случае можно рассматривать как слабосвязанную сетевую структуру, узлы которой представляют собой локальные базы данных. Локальные базы данных автономны, независимы и самоопределены; доступ к ним обеспечивается от различных поставщиков.

Рассмотрим теперь проблемы реальных распределенных баз данных. Проблемы централизованных СУБД существуют и здесь, однако децентрализация добавляет новые:

а) Какова общая модель данных распределенной системы? Мы должны иметь единую концептуальную схему всей сети. Это обеспечит  логическую прозрачность данных для  пользователя, в результате чего он сможет формировать запрос ко всей базе, находясь за отдельным терминалом (т. е. как бы работая с централизованной базой данных).

б) Необходима схема, определяющая местонахождение  данных в сети. Это обеспечит прозрачность размещения данных, благодаря которой  пользователь может не указывать, куда переслать запрос, чтобы получить требуемые данные.

в) Распределенные базы данных могут  быть однородными или неоднородными  по аппаратным и программным средствам. Проблему неоднородности сравнительно легко решить, если распределенная база является неоднородной по аппаратным средствам, но однородной по программным  средствам (одинаковые СУБД в узлах). Если же в узлах распределенной системы  используются разные СУБД, необходимы средства преобразования структур данных и языков. Это должно обеспечить прозрачность преобразования в узлах  распределенной базы данных.

г) Управление словарями. Для обеспечения  всех видов прозрачности в распределенной базе данных нужны программы, управляющие  многочисленными справочниками  или словарями.

д) Методы выполнения запросов в распределенной базе данных отличаются от аналогичных  методов централизованных СУБД, так  как отдельные части запроса  нужно выполнять в месторасположении  соответствующих данных и передавать частичные результаты на другие узлы; при этом должна быть обеспечена координация  всех процессов.

е) В распределенной базе данных нужен  сложный механизм управления одновременной  обработкой, который, в частности, должен обеспечивать синхронизацию при обновлениях информации, это гарантирует непротиворечивость данных.

ж) Развитая методология распределения  и размещения данных, включая разбиение, является одним из основных требований к распределенной базе данных.

База данных физически распределяется по узлам компьютерной информационной системы при помощи фрагментации и репликации (тиражирования) данных.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заключение

Распределенная база данных представляет собой набор логически связанных между собой разделяемых данных (и их описаний), которые физически размещены в некоторой компьютерной сети.

Распределенная СУБД представляетсобой  программный комплекс, предназначенный  для прозрачного управленияраспределенной базой данных.

Преимущества распределенной СУБД заключаются в том, что она позволяет отразить организационную структуру и повышает возможности совместногоиспользования удаленных данных, а также повышает надежность, доступность и производительность системы, позволяет получить экономию средств иобеспечивает модульное наращивание мощности всей системы. Основными еенедостатками являются более высокая стоимость, сложность, отсутствиестандартов и нехватка опыта разработки и эксплуатации.

Аналогично тому, как централизованная СУБД должна предоставлять определенный набор стандартных функциональных средств, распределеннаяСУБД должна предоставлять расширенные возможности связи, включатьрасширенный системный каталог, обеспечивать распределенную обработкузапросов, представлять расширенные функции защиты, поддерживать расширенные средства распараллеливания.

С точки зрения пользователя распределенная СУБД должна выглядеть точно так же, как и обычная централизованная СУБД, что достигается за счет обеспечения различных типов прозрачности. Благодаря прозрачности размещения пользователи не нуждаются в каких-либо сведениях о существующей в системе фрагментации или репликации данных.

 

Список использованной литературы

  1. Базы данных: учеб.для вузов: рек. УМО по образованию в обл. ав-томатики, электроники, микроэлектроники и радиотехники при обучении по техническим и экон. спец. / под ред. А. Д. Хомоненко. - 4-е изд., доп. и перераб. - СПб.: Корона принт, 2004. - 736 с.
  2. Гайдамакин, Николай Александрович. Автоматизированные ин-формационные системы, базы и банки данных: Вводный курс: Учеб.пособие для студ. вузов, обуч. по спец. "Компьютерная безопас-ность" и "Комплекс. обеспеч. информ. безопасности автоматизир. систем": Доп. УМО вузов по образов.в обл. информ. безопасности / Гайдамакин, Николай Александрович. - М.: Гелиос АРВ, 2002. - 368с.
  3. Диго, Светлана Михайловна. Базы данных: проектирование и ис-пользование: учеб.для студ. вузов, обуч. по спец. "Прикл. инфор-матика (по областям): рек. Минобразования и науки России / Диго, Светлана Михайловна. - М.: Финансы и статистика, 2005. - 592 с.
  4. Дубнов,Павел Юрьевич. Access 2000:Проектирование баз данных / Дубнов,Павел Юрьевич. - М.: ДМК, 2000. - 276с.
  5. Коннолли,Томас. Базы данных:Проектирование,реализация и сопровождение.Теория и практика: Учеб.пособие / Коннолли,Томас, Бегг,Каролин; Пер.сангл.Ю.Г.Гордиенко,А.В.Слепцова. - 2-е изд.,испр.и доп. - М.;СПб.;Киев: Вильямс, 2000. - 1120с.
  6. Малыхина, Мария Петровна. Базы данных: основы, проектирова-ние, использование: учеб.пособие для вузов. - СПб.: БХВ-Петербург, 2004. - 500 с.
  7. Острейковский, Владислав Алексеевич. Информатика : учеб.для студ. вузов / Острейковский, Владислав Алексеевич. - 4-е изд., стер. - М. :Высш. шк., 2007. - 511 с.
  8. Преснякова, Галина Владимировна. Проектирование интегри-рованных реляционных баз данных : учеб.пособие для вузов. - М. ; СПб. : КДУ : Петроглиф, 2007. - 224 с.
  9. Ролланд, Фред Д. Основные концепции баз данных / Ролланд, Фред Д. - М.: Вильямс, 2002. - 254с.
  10. Советов, Борис Яковлевич. Базы данных. Теория и практика : учеб.для студ. вузов. - Изд. 2-е, стер. - М. :Высш. шк., 2007. - 463 с.

Информация о работе Проблемы в процессе проектирования распределенных баз данных