Автор работы: Пользователь скрыл имя, 15 Апреля 2015 в 16:40, методичка
Системы класса Businessintelligence (BI) - это информационные системы, предназначенные для построения отчетов и анализа информации о деятельности предприятия и его окружения в ходе работы над задачами, связанными с принятием решений на основе фактических данных. Бизнес-аналитика - мощный катализатор развития предприятия. Политика информационной безопасности.
Пятая проблема при создании систем бизнес-аналитики состоит в том, что интеграции корпоративных данных препятствуют не сведенные к единой форме факты и измерения. Топ-менеджерам требуется всестороннее представление данных, а его невозможно получить, потому что в разных подразделениях данные представляются по-разному. В качестве решения предлагается при проектировании витрин данных использовать шинную матрицу для согласования данных. Как подчеркивает Ральф Кимбалл, это решение является не столько техническим, сколько организационным.
Шестой проблемой при создании систем бизнес-аналитики является недостаточная подробность (гранулированность) данных, результатом чего становится невыразительная система бизнес-аналитики. Симптомом является недостаточное число атрибутов у данных измерений. Предлагается постоянно стремиться к повышению выразительности данных, а для создания содержательного контекста данных использовать вспомогательные источники данных.
Седьмую проблему при создании систем бизнес-аналитики представляют неудобные форматы данных. По Ральфу Кимбаллу, неудобной является нормализованная форма реляционных данных. Симптомами проблемы, кроме этого, могут быть запутанность и запуганность пользователей, сложность формулировки запросов, сложные процедуры ETL, потребность в специализированном оборудовании для достижения требуемой производительности.
Одним из возможных решений является представление данных в многомерной модели. Это представление соответствует пользовательской интуиции, облегчает формулировку запросов, упрощает процедуру ETL и позволяет добиться нужного уровня производительности на обычной аппаратуре.
Восьмая проблема при создании систем бизнес-аналитики состоит в слишком медленной доставке данных конечным пользователям. Данные не поступают в оперативном режиме, пользователи остерегаются задавать медленно выполняемые запросы, имеются количественные ограничения на использование данных.
Решением этой проблемы является тщательное проектирование БД, создание многомерных моделей данных, подбор качественных программных средств СУБД с развитыми механизмами индексации, оснащение компьютеров основной памятью большого объема, использование распараллеливания, применение компьютеров с быстрыми центральными процессорами.
Девятая проблема при создании систем бизнес-аналитики проявляется в том, что некоторые данные оказываются "запертыми" в каком-то приложении и их невозможно переместить оттуда в другое приложение простым образом. Выходом из положения является использование только таких приложений, для которых возможно копирование данных в электронную таблицу через буфер обмена с помощью одного нажатия на клавишу мыши.
Десятая проблема при создании систем бизнес-аналитики связана с низким качеством данных. Симптомами проблемы являются отсутствие содержательных данных, наличие ненадежных или бессмысленных данных, присутствие дублирующих или несогласованных записей (чаще всего такие записи относятся к заказчикам компании). В качестве решения проблемы предлагается расширить используемые средства ETL системой экранов качества данных. В многомерной модели данных для фиксации ошибок в данных создается схемы событий с ошибками (ErrorEventSchema) — таблица фактов со своими измерениями. На основе этой таблицы порождаются измерения аудита данных для других таблиц фактов, и эти измерения могут использоваться при формировании отчетов, в которых учитываются ненадежные данные.
Одиннадцатая проблема при создании систем бизнес-аналитики состоит в преждевременной агрегации данных. Наличие в многомерной модели агрегированных данных без соответствующих атомарных данных не позволяет проводить детализацию данных. Рекомендуемым решением проблемы является поддержка для витрин данных физических структур хранения, содержащих атомарные данные. Детализация данных поддерживается за счет агрегатной навигации [2].
Двенадцатой проблемой при создании систем бизнес-аналитики Ральф Кимбалл считает отвлечение внимания на оценку показателей возврата инвестиций (ROI) ХД. Симптомами этой проблемы является расчет показателей ROI до создания ХД с применением стандартных методов, основанных на периоде окупаемости, чистой приведенной стоимости, внутренней норме прибыли, системе сбалансированных показателей, экономической добавленной стоимости. По его мнению, во всех этих методах упускается основной смысл стоимости и в конечном счете – ценности ХД.
ХД поддерживает принятие решений. Рекомендуется после принятия решения отнести часть полученной прибыли на счет ХД, а затем сравнить ее с расходами на ХД. Ральф Кимбалл рекомендует считать, что 20% прибыли, полученной в результате принятия решения, получено благодаря использованию ХД. Такой подход соответствует той идее, что единственным осмысленным способом оценки эффективности ХД является оценка его возможности поддерживать принятие решений конечными пользователями.
Тринадцатая проблема при создании систем бизнес-аналитики состоит в затрате сил и времени на создание корпоративной модели данных. Симптомом является появление большого количества сущностей, которые никогда не наполняются реальными данными. Ральф Кимбалл считает, что усилия, затрачиваемые на разработку корпоративной модели данных, только задерживают работу над ХД, и расчет делается на то, что при выполнении процедуры ETL будут выявляться ошибки и несоответствие данных.
Отметим, что решение о разработке корпоративной модели данных действительно требует больших интеллектуальных затрат и времени на ее создание. Может оказаться, что модель устареет к моменту ввода ее в эксплуатацию. Исследователями по ИТ предлагаются различные подходы к созданию актуальной корпоративной модели.
Четырнадцатой проблемой при создании систем бизнес-аналитики Ральф Кимбалл считает возможное требование использовать все источники данных для наполнения ХД. В соответствии с его опытом если при построении ХД выдвигается требование использования трех или более источников данных, то ХД не заработает и через два года. На первом этапе построения ХД рекомендуется потратить шесть недель на полноценный аудит данных, а затем выбрать один источник данных, который, во-первых, влияет на наиболее важные решения конечных пользователей, и во-вторых, проще всего подключается к процедуре ETL. После заполнения ХД из первого источника следует оценить полученный результат и обдумать следующие шаги.
Одной из главных предназначений системы бизнес-аналитики является публикация данных в формате, удобном для принятия решений, и предоставление простых и удобных инструментов руководителям организации для манипулирования этими данными с целью их исследования и анализа.
Одно из главных предназначений ХД — аккумулирование данных из различных источников для аналитической обработки и отделение формирования отчетов и проведения интеллектуального анализа данных от систем оперативной обработки данных предприятия с целью увеличения производительности.
Таким образом, ХД представляют собой очень большие репозитории исторических данных, а системы бизнес-аналитики представляют собой взаимосвязанный (или нет) набор приложений для бизнес-анализа этих данных.
Ниже, на рис. 1.6, показано, как система бизнес-аналитики взаимодействует с ХД.
Разработчики систем бизнес-аналитики являются по существу издателями. Они собирают данные из различных источников, редактируют их для обеспечения качества и согласованности, обеспечивают доверие к опубликованной информации. Их успех оценивается конечными бизнес-пользователями: аналитиками, менеджерами различных уровней и руководством организации.
ХД поддерживает системы бизнес-аналитики, являясь ее информационным фундаментом.
С этой точки зрения ХД помогает решать основные задачи поддержки систем бизнес-аналитики.
На рис. 1.7 показано, как хранилища данных управляют системами бизнес-аналитики.
На практике ХД функционируют в соответствии с нижеприведенными условиями.
Таким образом, ХД через хранимые в них данные управляют системами бизнес-аналитики и влияют на качество и эффективность принимаемых решений. Чтобы данные способствовали принятию качественных решений, они должны быть хорошо организованы. Организацию данных в ХД обеспечивает модель данных. Разработке таких моделей данных будут посвящены следующие лекции, а сейчас кратко подведем итоги настоящей лекции.
Сфера систем бизнес-аналитики развивается быстро и динамично. Это объясняется тем, что в современных условиях информация становится реальным производственным ресурсом. К настоящему времени можно выделить следующие основные типы систем бизнес-аналитики.
Системы бизнес-аналитики и хранилища данных обеспечивают полноту, достоверность и актуальность информации, необходимой для принятия управленческих решений, снижают нагрузку на транзакционные системы за счет перераспределения функций формирования отчетности.