Хранилища данных

Автор работы: Пользователь скрыл имя, 29 Мая 2012 в 22:27, контрольная работа

Описание работы

Хранилище данных - предметно-ориентированный, интегрированный, неизменчивый, поддерживающий хронологию набор данных, организованный для целей поддержки управления.
Актуальность проблемы хранения и оперативного поиска данных привела к появлению такого понятия, как «хранилище данных». Следует упомянуть о необходимости использования единых информационных хранилищ в аналитических системах и в первую очередь в системах поддержки принятия решений (СППР).

Содержание работы

1. Концепция хранилища данных
2. Виртуальные информационные хранилища…………………………….…5
3. Обзор возможностей применения ведущих СУБД для построения хранилищ данных (DataWarehouse)……………………………………….11
4. Технологии передачи данных……………………………………………...15
Заключение………………………………………………………………….27
Список использованной литературы………………………………………28

Файлы: 1 файл

контрольная работа по информационным технологиям в экономике.doc

— 956.50 Кб (Скачать файл)

     Такое разделение каналов во многом объясняется  различными требованиями к пересылке  данных. В сети на первом месте стоит  доставка нужной информации одному клиенту, из множества возможных, для чего необходимо создать определенные и весьма сложные механизмы адресации. Кроме того, сетевой канал предполагает значительные расстояния, поэтому здесь для передачи данных предпочтительно последовательное соединение. А вот канал хранения выполняет крайне простую задачу, предоставляя возможность обмена с заранее известным накопителем данных. Единственное, что от него требуется, - делать это максимально быстро. Расстояния здесь, как правило, небольшие.

     Однако  современные сети сталкиваются с  задачами обработки все больших и больших объемов данных. Высокоскоростные мультимедиа-приложения, обработка изображений требуют гораздо большей скорости ввода-вывода, чем когда-либо ранее. Организации вынуждены хранить все большие объемы данных в режиме online, что требует увеличения емкости внешней памяти. Необходимость страхового копирования огромных объемов данных требует разнесения устройств, вторичной памяти на все большие расстояния от серверов обработки. В ряде случаев оказывается, что объединить ресурсы серверов и накопителей в единый пул для центра обработки информации с помощью Fibre Channel гораздо эффективнее, чем при использовании стандартного набора сеть Ethernet плюс интерфейс SCSI.

     Технология Fibre Channel обладает рядом преимуществ, которые делают этот стандарт удобным при организации обмена данными в группах компьютеров, а также при использовании в качестве интерфейса устройств массовой памяти, в локальных сетях и при выборе средств доступа к глобальным сетям. Одно из основных достоинств этой технологии - высокая скорость передачи данных.

     FC-AL - лишь одна из трех возможных  топологий Fibre Channel, которая, в  частности, используется для систем  хранения данных. Кроме нее, возможна топология точка-точка и звездообразная топология, построенная на основе коммутаторов и концентраторов. Сеть, которая построена на основе коммутаторов, соединяющих множество узлов (рисунок№ 1), в терминологии Fibre Channel называется фабрикой (fabric).  

Рисунок № 1 - Фабрика на базе Fibre Channel. 
 

      
 

     В «петлю» FC-AL можно включить до 126 устройств с возможностью горячей замены. При использовании коаксиального кабеля расстояние между ними может достигать 30 м, в случае же волоконно-оптического кабеля оно увеличивается до 10 км. В основу технологии положена методика простого перемещения данных из буфера передатчика в буфер приемника с полным контролем этой и только этой операции. Для FC-AL совершенно неважно, как обрабатываются данные индивидуальными протоколами до и после помещения в буфер, вследствие чего тип передаваемых данных (команды, пакеты или кадры) не играет никакой роли.

     Архитектурная модель Fibre Channel в деталях описывает  параметры соединений и протоколы  обмена между отдельными узлами. Эта  модель может быть представлена в  виде пяти функциональных уровней, которые определяют физический интерфейс, протокол передачи, сигнальный протокол, общие процедуры и протокол отображения. Нумерация идет от самого низкого аппаратного уровня FC-0, отвечающего за параметры физического соединения, до верхнего программного FC-4, взаимодействующего с приложениями более высокого уровня. Протокол отображения обеспечивает связь с интерфейсами ввода-вывода (SCSI, IPI, HIPPI, ESCON) и сетевыми протоколами (802.2, IP). В данном случае все поддерживаемые протоколы могут использоваться одновременно. Например, интерфейс FC-AL, работающий с IP- и SCSI-протоколами, пригоден как для обмена система-система, так и система-периферия. Это исключает потребность в дополнительных контроллерах ввода-вывода, существенно уменьшает сложность кабельной системы и, разумеется, общую стоимость.

     Поскольку Fibre Channel - это низкоуровневый протокол, не содержащий команд ввода-вывода, то связь с внешними устройствами и  компьютерами обеспечивается протоколами  более высокого уровня, такими, как SCSI и IP, для которых FC-PH служит транспортом. Сетевые протоколы и протоколы ввода-вывода (например, команды SCSI) преобразуются в кадры протокола FC-PH и доставляются до адресата. Любое устройство (компьютер, сервер, принтер, накопитель), имеющее возможность обмениваться данными с использованием технологии Fibre Channel, называется N_порт (Node port), или просто узел. Таким образом, основное назначение Fibre Channel - возможность манипулировать протоколами высокого уровня, используя различную среду передачи и уже существующие кабельные системы.

     Высокая надежность обмена при использовании Fibre Channel обусловлена двухпортовой архитектурой дисковых устройств, циклическим контролем  передаваемой информации и заменой  устройств в горячем режиме. Протокол поддерживает практически любые применяемые сегодня кабельные системы. Однако наибольшее распространение получили два носителя - оптика и витая пара. Оптические каналы используются для соединения между устройствами сети Fibre Channel, а витая пара - для соединения отдельных компонентов в устройстве (например, дисков в дисковой подсистеме).

     Стандарт  предусматривает несколько полос  пропускания и обеспечивает скорость обмена 1, 2 или 4 Гбит/с. C учетом того, что  для соединения устройств применяются  два оптических кабеля, каждый из которых работает в одном направлении, при сбалансированном наборе операций «запись-чтение» скорость обмена данными удваивается. Иными словами, Fibre Channel работает в полнодуплексном режиме. В пересчете на мегабайты, паспортная скорость Fibre Channel составляет соответственно 100, 200 и 400 Мбайт/с. Реально при 50%-ном соотношении операций «запись-чтение» скорость интерфейса достигает 200, 400 и 800 Мбайт/с. В настоящее время, наиболее популярны решения Fibre Channel 2 Гбит/с, поскольку они имеют лучшее соотношение цена-качество.

     Отметим, что оборудование для Fibre Channel можно  условно разбить на четыре основные категории: адаптеры, концентраторы, коммутаторы  и маршрутизаторы, причем последние  широкого распространения пока не получили.

      Решения на базе Fibre Channel обычно предназначены для организаций, которым необходимо поддерживать большие объемы информации в режиме online, ускорить операции обмена с первичной и вторичной внешней памятью для сетей с интенсивным обменом данных, а также при удалении внешней памяти от серверов на большие расстояния, чем это допускается в стандарте SCSI. Типичные области применения решений Fibre Channel - базы и банки данных, системы анализа и поддержки принятия решений, основанные на больших объемах данных, системы хранения и обработки мультимедийной информации для телевидения, киностудий, а также системы, где диски должны быть удалены на значительные расстояния от серверов из соображений безопасности.

     Fibre Channel дает возможность отделить  все потоки данных между серверами предприятия, архивирование данных и т. п. от локальной сети пользователей. В этом варианте возможности конфигурирования огромны - любой сервер может обращаться к любому разрешенному администратором системы дисковому ресурсу, возможен доступ к одному и тому же диску нескольких устройств одновременно, причем с очень высокой скоростью. В этом варианте архивирование данных тоже становится легкой и прозрачной задачей. В любой момент можно создать кластер, высвободив под него ресурсы на любой из систем хранения Fibre Channel. Масштабирование также довольно наглядно и понятно - в зависимости от того, каких возможностей не хватает, можно добавить либо сервер (который будет куплен исходя исключительно из его вычислительных возможностей), либо новую систему хранения.

     Одна  из весьма важных и нужных особенностей Fibre Channel - возможность сегментирования  или, как еще говорят, зонирования  системы. Разделение на зоны подобно  разделению на виртуальные сети (Virtual LAN) в локальной сети - устройства, находящиеся в разных зонах, не могут «видеть» друг друга. Разделение на зоны возможно либо с помощью коммутируемой матрицы (Switched Fabric) или на основе указания адреса WWN (World Wide Name). Адрес WWN подобен MAC-адресу в сетях Ethernet, каждый FC-контроллер имеет свой уникальный WWN-адрес, который присваивает ему производитель, а любая правильная система хранения данных позволяет ввести адреса тех контроллеров или портов матриц, с которыми этому устройству разрешено работать. Разделение на зоны предназначено в первую очередь для повышения безопасности и производительности сетей хранения данных. В отличие от обычной сети, из внешнего мира нельзя получить доступ к закрытому для данной зоны устройству.  

Технология FICON

     Технология FICON (FIber CONnection) обеспечивает повышенную производительность, расширенные функциональные возможности и связь на больших расстояниях. Как протокол передачи данных она базируется на стандарте ANSI для систем Fibre Channel (FC-SB-2). Первый разработанный IBM стандарт общего назначения для связи между мэйнфреймами и внешними устройствами (такими, как диски, принтеры и ленточные накопители) основывался на параллельных подключениях, не слишком отличаясь от многожильных кабелей и многоштырьковых разъемов, которые применялись в те годы для подключения настольных принтеров к ПК. Множество параллельных проводов служило для переноса большего объема данных «за раз» (параллельно); в мэйнфреймах это называлось bus and tag.  

     Огромные  по физическим размерам соединители  и кабельная разводка были единственным способом связи до появления на рынке в 1990-х гг. технологии ESCON. Это была принципиально иная технология: в ней впервые вместо меди использовалось оптоволокно и данные передавались не параллельно, а последовательно. Все прекрасно понимали, что ESCON намного лучше и значительно быстрее, по крайней мере, на бумаге, но до всеобщего принятия технологии потребовалось множество испытаний и усилий по убеждению покупателей. Считается, что технология ESCON появилась во время застоя на рынке; к тому же поддерживающие этот стандарт устройства были представлены с заметным запозданием, поэтому технология и встретила прохладный прием, а для широкого ее распространения понадобилось почти четыре года.

     С FICON история во многом повторилась. Впервые эту технологию IBM представила на серверах S/390 еще в 1997 г. Многим аналитикам было сразу понятно, что это во многом технически более продвинутое решение. Однако на протяжении нескольких лет FICON применяли практически исключительно для подсоединения ленточных накопителей (существенно улучшенное решение для целей создания резервных копий и восстановления) и принтеров. И лишь в 2001 г. IBM наконец оборудовала FICON свою систему хранения Enterprise Storage Server под кодовым названием Shark («акула»). Это событие снова совпало с серьезным экономическим спадом, когда внедрение новых технологий на предприятиях замедлилось. Буквально через год возник ряд обстоятельств, которые способствовали ускоренному принятию FICON. На сей раз концепция оптоволокна была уже не нова, а технологии сетей хранения данных (SAN) получили широкое распространение как в мире мэйнфреймов, так и за его пределами. Сейчас продолжается устойчивый рост рынка устройств хранения данных. Сегодняшние устройства, называемые директорами (director), с самого начала разработанные для поддержки ESCON, теперь поддерживают стандарт Fibre Channel, на основе этих же устройств развертывают FICON-решения. Как считают разработчики, FICON обеспечивает существенно большую функциональность по сравнению с Fibre Channel.  

InfiniBand

     Архитектура InfiniBand определяет общий стандарт для  обработки операций ввода-вывода коммуникационных, сетевых подсистем и систем хранения данных. Этот новый стандарт привел к формированию торговой ассоциации InfiniBand Trade Association (IBTA, http://www.infinibandta.org). Проще говоря, InfiniBand - это стандарт архитектуры ввода-вывода нового поколения, который использует сетевой подход к соединению серверов, систем хранения и сетевых устройств информационного центра.

     Технология InfiniBand разрабатывалась как открытое решение, которое могло бы заменить все остальные сетевые технологии в самых разных областях. Это касалось и общеупотребительных технологий локальных сетей (все виды Ethernet и сетей хранения, в частности, Fibre Channel), и специализированных кластерных сетей (Myrinet, SCI и т. д.), и даже подсоединения устройств ввода-вывода в ПК в качестве возможной замены шин PCI и каналов ввода-вывода, таких, как SCSI. Кроме того, инфраструктура InfiniBand могла бы служить для объединения в единую систему фрагментов, использующих разные технологии. Преимущество InfiniBand перед специализированными, ориентированными на высокопроизводительные кластеры сетевыми технологиями состоит в ее универсальности. Корпорация Oracle, например, поддерживает InfiniBand в своих кластерных решениях. Год назад HP и Oracle установили рекорд производительности в тестах TPC-H (для баз данных емкостью 1 Тбайт) в InfiniBand-кластере на базе ProLiant DL585 с использованием СУБД Oracle 10g в среде Linux. Летом 2005 г. IBM достигла рекордных показателей для TPC-H (для баз данных емкостью 3 Тбайт) в среде DB2 и SuSE Linux Enterprise Server 9 в InfiniBand-кластере на базе xSeries 346. При этом достигнутая стоимость одной транзакции оказалась почти вдвое ниже, чем у ближайших конкурентов.

     Используя технику, называемую коммутируемой  сетевой структурой, или коммутирующей  решеткой, InfiniBand переносит трафик операций ввода-вывода с процессоров сервера  на периферийные устройства и иные процессоры или серверы по всему  предприятию. В качестве физического канала используется специальный кабель (линк), обеспечивающий скорость передачи данных 2,5 Гбит/с, в обоих направлениях (InfiniBand 1х). Архитектура организована как многоуровневая, она включает четыре аппаратных уровня и верхние уровни, реализуемые программно. В каждом физическом канале можно организовать множество виртуальных каналов, присвоив им разные приоритеты. Для повышения скорости существуют 4-кратные и 12-кратные версии InfiniBand, в которых используется соответственно 16 и 48 проводов, а скорости передачи данных по ним равны 10 Гбит/с (InfiniBand 4х) и 30 Гбит/с (InfiniBand 12х).

     Решения на основе архитектуры InfiniBand востребованы на четырех основных рынках: корпоративные  центры данных (включая хранилища  данных), высокопроизводительные компьютерные кластеры, встроенные приложения и коммуникации. Технология InfiniBand позволяет объединять стандартные серверы в кластерные системы, чтобы обеспечить центрам данных производительность, масштабируемость и устойчивость к сбоям - возможности, обычно предоставляемые только платформами высшего класса стоимостью в миллионы долларов. Кроме того, хранилища InfiniBand можно подключать к кластерам серверов, что позволяет связать все ресурсы хранения данных напрямую с вычислительными ресурсами. Рынок высокопроизводительных кластеров все время агрессивно ищет новые пути расширения вычислительных возможностей и потому может извлечь огромную выгоду из высокой пропускной способности, низкой латентности и прекрасной масштабируемости, предлагаемой недорогими продуктами InfiniBand. Встроенные приложения, такие, как военные системы, системы, работающие в реальном времени, обработка видеопотоков и т. д., получат огромные преимущества от надежности и гибкости соединений InfiniBand. Кроме того, рынок коммуникаций постоянно требует увеличения пропускной способности соединений, чего удается достичь благодаря 10- и 30-Гбит/с соединениям InfiniBand.

Информация о работе Хранилища данных