Автор работы: Пользователь скрыл имя, 22 Мая 2013 в 19:54, реферат
ВВ той или иной степени Системы Поддержки Принятия Решений (СППР) присутствуют в любой информационной системе (ИС). Поэтому, осознанно или нет, к задаче создания системы поддержки принятия решений организации приступают сразу после приобретения вычислительной техники и установки программного обеспечения. По мере развития бизнеса, упорядочения структуры организации и налаживания межкорпоративных связей, проблема разработки и внедрения СППР становится особенно актуальной.
Введение 3
1 Зарождение концепции хранилища данных 5
2 Технология разработки и внедрения Хранилища Данных 7
2.1 Этапы проекта 7
2.2 Выбор модели данных Хранилища 10
2.3 Выбор структуры Хранилища Данных 13
2.4 Витрины Данных 15
2.5 Хранилище Метаданных (Репозитарий) 17
2.6 Загрузка Хранилища 20
2.7 Анализ данных: OLAP 22
3 Интеллектуальный анализ данных 26
Заключение 29
Список использованной литературы 30
Министерство Образования Российской Федерации
Пензенский государственный университет
Кафедра «Автоматика и телемеханика»
Реферат
на тему «Интеллектуальный анализ данных в системах поддержки принятия решений»
Выполнил: студент гр. 12ПАМ1:
Ладугин А. В.
___________________________
Проверил: Д.Т.Н., профессор:
Щербаков М.А.
___________________________
Пенза, 2013 г.
Содержание
с.
Введение 3
1 Зарождение концепции хранилища данных 5
2 Технология разработки и внедрения Хранилища Данных 7
2.1 Этапы проекта 7
2.2 Выбор модели данных Хранилища 10
2.3 Выбор структуры Хранилища Данных 13
2.4 Витрины Данных 15
2.5 Хранилище Метаданных (Репозитарий) 17
2.6 Загрузка Хранилища 20
2.7 Анализ данных: OLAP 22
3 Интеллектуальный анализ данных 26
Заключение 29
Список использованной литературы 30
Введение
В той или иной степени
Системы Поддержки Принятия Решений
(СППР) присутствуют в любой информационной
системе (ИС). Поэтому, осознанно или
нет, к задаче создания системы поддержки
принятия решений организации приступают
сразу после приобретения вычислительной
техники и установки
СППР можно, в зависимости от данных, c которыми они работают, разделить на оперативные, предназначенные для немедленного реагирования на текущую ситуацию, и стратегические - основанные на анализе большого количества информации из разных источников с привлечением сведений, содержащихся в системах, аккумулирующих опыт решения проблем.
СППР первого типа получили
название Информационных Систем Руководства
(Executive Information Systems, ИСР). По сути, они
представляют собой конечные наборы
отчетов, построенные на основании
данных из транзакционной информационной
системы предприятия или OLTP-системы,
в идеале адекватно отражающей в
режиме реального времени все
аспекты производственного
СППР второго типа предполагают
достаточно глубокую проработку данных,
специально преобразованных так, чтобы
их было удобно использовать в ходе
процесса принятия решений. Неотъемлемым
компонентом СППР этого уровня являются
правила принятия решений, которые
на основе агрегированных данных подсказывают
менеджерскому составу выводы и
придают системе черты
1 Зарождение концепции хранилища данных
Ясно, что чем больше информации вовлечено в процесс принятия решений, тем более обоснованное решение может быть принято. Информация, на основе которой принимается решение, должна быть достоверной, полной, непротиворечивой и адекватной. Поэтому при проектировании СППР возникает вопрос о том, на основе каких данных эти системы будут работать. В ИСР качество оперативных решений обеспечивается тем, что данные выбираются непосредственно из информационной системы управления предприятием (или из БД предприятия), которая адекватно отражает состояние бизнеса на данный момент времени. Ранние версии СППР второго типа в качестве исходных использовали относительно небольшой объем агрегированных данных, поддающихся проверке на достоверность, полноту, непротиворечивость и адекватность.
По мере роста и развития
ИСР, а также совершенствования
алгоритмов принятия решений на основе
агрегированных данных, системы принятия
решений столкнулись с
В СППР второго типа традиционная технология подготовки интегрированной информации на основе запросов и отчетов стала неэффективной из-за резкого увеличения количества и разнообразия исходных данных. Это стало сильно задерживать менеджмент, для которого требовалось быстро принимать решения. Кроме того, постепенное накопление в БД предприятия данных для принятия решений и последующий их анализ стали отрицательно сказываться на оперативной работе с данными.
Решение было найдено и сформулировано в виде концепции Хранилища Данных (Data Warehouse, ХД), которое выполняло бы функции предварительной подготовки и хранения данных для СППР на основе информации из системы управления предприятием (или базы данных предприятия), а также информации из сторонних источников, которые в достаточном количестве стали доступны на рынке информации.
Этот подход потребовал новых технологических решений, к созданию которых несколько лет назад приступили основные производители промышленных СУБД и разработчики систем анализа данных. Сегодня накоплен обширный опыт разработки и внедрения специализированных структур данных и создания СППР на основе СУБД разных типов. Известна и технология создания больших Хранилищ, как правило, на основе реляционных СУБД.
Ограниченный объем статьи не позволил рассмотреть все аспекты Технологии Хранилищ Данных, поэтому некоторые вопросы затронуты здесь только вскользь, а отдельные проблемы (например, взаимодействие СППР с Internet) не обсуждаются вовсе. Мы постарались сосредоточиться на ключевых этапах разработки ХД, чтобы охарактеризовать процесс разработки ХД в целом.
2 Технология разработки и внедрения Хранилища Данных
2.1 Этапы проекта
Первой фазой проекта
разработки ХД является бизнес-анализ
процессов и данных предприятия.
В России, несмотря на широкое распространение
CASE-технологии, к бизнес-анализу
и проектированию данных на концептуальном
уровне не всегда относятся достаточно
серьезно. Между тем относительно
СППР на основе ХД можно с уверенностью
утверждать, что ее разработка без
подобного анализа заранее
Основное назначение модели предприятия - определение и формализация данных, действительно необходимых в процессе принятия решения. Известно два подхода к бизнес-анализу. Первый ориентируется на описание бизнес-процессов, протекающих на предприятии, которое моделируется набором взаимосвязанных функциональных элементов. Поскольку эти процессы, как правило, хорошо известны, на первый взгляд кажется, что это самый естественный и быстрый путь бизнес-анализа. Действительно, если бизнес стабилен и внешние факторы не играют в нем решающей роли либо также стабильны, этот путь может оказаться наиболее эффективным. Второй подход основан на первичном анализе бизнес-событий. При проектировании СППР на основе ХД именно он обеспечивает наибольшую эффективность:
Иными словами, бизнес-событие
является более устойчивым и более
тесно связанным с
Через анализ бизнес-событий необходимо перейти к анализу данных, используемых предприятием. При этом должна быть собрана информация об используемых внешних данных и их источниках; о форматах данных, периодичности и форме их поступления; о внутренних информационных системах предприятия, их функциях и алгоритмах обработки данных, используемых при наступлении бизнес-событий. Такой анализ, как правило, производится при проектировании любой информационной системы. Особенность анализа данных при проектировании СППР на основе ИХ состоит в необходимости создания моделей представления информации. То, что в транзакционных системах является вторичным понятием, а именно состав и форма отображаемых данных, в СППР приобретает особую важность, так как нужно выявить все без исключения признаки, требуемые для менеджерского состава.
Модель представления данных является организационно-функциональным срезом модели системы, а при ее разработке последовательно изучаются:
При проектировании транзакционной
системы обычно строго выдерживается
последовательность процессов: бизнес-анализ,
концептуальная модель данных, физическая
модель данных, структура интерфейса
и т. п. Возврат на предыдущий уровень
происходит редко и считается
отклонением от нормального хода
выполнения проекта. В случае СППР на
основе ХД нормальным считается итерационный,
а иногда и параллельный, характер
моделирования, при котором возврат
на предыдущую стадию - обычное явление.
Это связано с необходимостью
выделения всех требуемых данных
для произвольных запросов (ad-hoc), для
чего следует составить
В ходе анализа бизнес-событий необходимо также сформировать схему взаимодействия между транзакционной и аналитической системами на предприятии. Помимо того, что транзакционная система зачастую является важнейшим источником данных для хранилища, желательно задействовать один и тот же пользовательский интерфейс в ИСР и СППР. Подходы к совместному использованию этих систем определяются именно на данной фазе выполнения проекта.
Итак, по результатам анализа бизнес-процессов и структур данных предприятия отбирается действительно значимая для бизнеса информация с учетом неопределенности будущих запросов. Следующий шаг связан с пониманием того, в каком виде и на каких аппаратных и программных платформах размещать структуру данных СППР на основе ХД.
2.2 Выбор модели Данных Хранилища
В самом простом варианте для Хранилищ Данных используется та модель данных, которая лежит в основе транзакционной системы. Если, как это часто бывает, транзакционная система функционирует на реляционной СУБД (Oracle, Informix, Sybase и т. п.), самой сложной задачей становится выполнение запросов ad-hoc, поскольку невозможно заранее оптимизировать структуру БД так, чтобы все запросы работали эффективно.
Однако практика принятия
решений показала, что существует
зависимость между частотой запросов
и степенью агрегированности данных,
с которыми запросы оперируют, а
именно чем более агрегированными
являются данные, тем чаще запрос выполняется.
Другими словами, круг пользователей,
работающих с обобщенными данными,
шире, чем тот, для которого нужны
детальные данные. Это наблюдение
легло в основу подхода к поиску
и выборке данных, называемого
Оперативной Аналитической
Информация о работе Интеллектуальный анализ данных в системах поддержки принятия решений