Сравнение современных зарубежных информационных систем управления базами данных (DBMS)

Автор работы: Пользователь скрыл имя, 18 Декабря 2013 в 22:42, реферат

Описание работы

Цель работы – сравнительный анализ отечественных систем DM.
Для достижения поставленной цели были выполнены следующие задачи:
Рассмотрены теоретические аспекты технологий интеллектуального анализа данных;
Подробно рассмотрены семь самых известных российских программ data mining
Сравнительная оценка рассмотренных систем.

Содержание работы

Введение 3
Глава 1. Общие сведения о системах Data Mining 4
1.1. Что такое Data Mining 4
1.2. Классы систем Data Mining 6
Глава 2. Российские пакеты интеллектуального анализа данных 11
2.1. Система PolyAnalyst 11
2.2. Аналитическая платформа Deductor 13
2.3. Excel Neural Package 16
2.4. Модульный анализ и конструирование социума (МАКС) 17
2.5. Контент - Анализ Про 18
2.6. STADIA 19
2.7. NeuroShell 21
Заключение 23
Список литературы 24

Файлы: 1 файл

СУБД.doc

— 281.50 Кб (Скачать файл)

По сравнению  с аналогичными версиями dBase, FoxBase и  более поздняя версия этого продукта, получившая название FoxPro, предоставляли своим пользователям несколько более широкие возможности, такие как использование деловой графики, генерация кода приложений, автоматическая генерация документации к приложениям и т.д.

Visual FoxPro является  системой управления реляционными  базами данных, которые в настоящее  время являются наиболее распространенными.  В данной версии реализованы  все атрибуты реляционных СУБД. В Visual FoxPro существует понятие  базы данных, которая содержит совокупность таблиц. В базе данных можно определить условия целостности данных с помощью первичных и внешних ключей таблиц. В Visual FoxPro реализованы триггеры и хранимые процедуры, которые позволяют централизованно обрабатывать события, возникающие при любых изменениях в базе данных.

Последняя версия этого продукта - Visual FoxPro 9.0, доступна и отдельно, и как составная  часть Microsoft Visual Studio 9.0. Отличительной  особенностью этой настольной СУБД от двух рассмотренных выше является интеграция этого продукта с технологиями Microsoft, в частности поддержка COM (Component Object Model - компонентная объектная модель, являющаяся основой функционирования 32-разрядных версий Windows и организации распределенных вычислений в этой операционной системе), интеграция с Microsoft SQL Server, возможности создания распределенных приложений, основанных на концепции Windows DNA (Distributed interNet Applications).

Visual Fox Pro 9.0 предоставляет  следующие возможности: 

• средства публикации данных в Internet и создания Web-клиентов;

• средства создания ASP-компонентов и Web-приложений;

• средства создания COM-объектов и объектов для Microsoft Transaction Server, позволяющих создавать масштабируемые многозвенные приложения для обработки  данных;

• средства доступа к данным серверных СУБД, базирующиеся на использовании OLE DB (набор COM-интерфейсов, позволяющий осуществить унифицированный доступ к данным из разнообразных источников, в том числе из нереляционных баз данных и иных источников, например Microsoft Exchange);

• средства доступа  к данным Microsoft SQL Server и Oracle, включая  возможность создания и редактирования таблиц, триггеров, хранимых процедур;

• средства отладки  хранимых процедур Microsoft SQL Server;

• средство визуального  моделирования компонентов и объектов, являющиеся составными частями приложения - Visual Modeller;

• средство для  управления компонентами приложений, позволяющее осуществлять их повторное  использование.

Итак, тенденции  развития этого продукта очевидны: из настольной СУБД Visual FoxPro постепенно превращается в средство разработки приложений в архитектуре <клиент/сервер> и распределенных приложений в архитектуре Windows DNA. Впрочем, эти тенденции в определенной степени характерны для всех наиболее популярных настольных СУБД - мы уже убедились, что и dBase, и Paradox также позволяют осуществлять доступ к наиболее популярным серверным СУБД.

2.3.  Borland  dBASE

dBASE для Windows представляет собой систему управления базами данных, доступную для пользователей любого уровня. Эта система обладает ориентированным на пользователя развитым диалоговым интерфейсом. В версии 5.0 этого продукта появилась возможность выполнение запроса по образцу. Запрос предоставляет пользователю возможность быстро и эффективно осуществить выборку требуемых данных и обработать их.

dBASE для Windows содержит как интерактивные средства так и интегрированную среду программирования на объектно-ориентированном языке dBASE. Многочисленные интерактивные средства отличает простота использования, которая достигается за счет интуитивного интерфейса. Эти средства предоставляют вам широчайшие возможности по обработке информации, не прибегая к программированию. Язык dBase является объектно-ориентированным, управляемым по событиям, визуально-программируеммым языком, с помощью которого вы сможете добавить программные коды к отдельным объектам форм и сами формам, а также создать отдельные библиотеки и законченные предложения (как сетевые, так и автономные).

Среди СУБД для ПК наиболее распространенным в мире является семейство dBASE фирмы "Ashton-Tate". Такая популярность объясняется отчасти исторически, так как эта СУБД появилась одной из первых на рынке программных продуктов данного профиля; не в меньшей степени этому способствовала удачность заложенных основ конструкции СУБД и командного языка. Одна из наиболее широко используемых (в настоящее время устаревших) версий этого семейства - dBASE III+.

В новой версии dBASE IV концепция СУБД и командный язык получили значительное развитие, позволившее устранить недостатки предыдущей версии, а также существенно обогатить палитру средств обработки данных и улучшить интерфейс пользователя.

В языке dBASE IV используются также функции, которые (наряду с командами) позволяют обрабатывать данные (в том числе, выполнять вычисления), а также определять состояния, например, находится ли указатель записей в конце файла: 7EOF0 - После имени функции обычно стоят круглые скобки, в которых могут помещаться аргументы. Функции нельзя использовать самостоятельно, а только вместе с какой-либо командой.

Кроме системных функций в dBASE IV можно использовать функции, созданные самим пользователем. В языке dBASE используются переменные, тип которых автоматически определяется первым в данной программе присвоением им значения. Возможные типы: символьный, логический, числовой, дата.

2.4. Модульный анализ и конструирование социума (МАКС)

В 1998 г. А.А. Давыдов и А.Н. Чураков разработали МАКС-3.0 – экспертно-диагностическую систему для анализа, диагностики, моделирования и прогнозирования строения и динамики социальных систем (данные опросов общественного мнения, электоральное поведение избирателей, поведение потребителей, города, страны мира, тексты и т.д.), созданная на основе Модульной Теории Социума (МТС). [8]

В данном программном продукте есть два режима модульного анализа и моделирования: ручной и автоматический. Для автоматического поиска закономерностей в данных в систему МАКС встроен блок ALEX.

Методология МАКС основана на идеях  Пифагора, структурно-функционального  анализа Т. Парсонса, теории самоорганизации Хакена.[9]

В МАКС так же есть возможность моделирования, предназначенная для проектирования социальных модулей и систем с заданными свойствами. Конструирование осуществляется с помощью уменьшения или увеличения числа элементов и/или частей в каком-либо модуле или во многих модулях одновременно. Различают два вида конструирования: а) теоретическое, б) эмпирическое.

Теоретическое конструирование применяется в том случае, если по каким-либо модулям нет эмпирической информации. Полученные модели выступают как количественные гипотезы для последующей эмпирической верификации.

Эмпирическое – используется для построения моделей различных социальных систем, по которым имеются эмпирические данные.

На основании дополнительных аналитических  средств, содержащихся в пакете, можно  анализировать вторичные данные и вводить дополнительные коэффициенты проверки.

Таблица 2. Проблемы, исследуемые с помощью МАКС

Криминология
  • преступность в мире, в регионах мира и в РФ;
  • уровень латентной преступности в РФ в целом и в отдельных регионах;
  • незаконный оборот наркотиков;
  • структура организованной преступности.

Политика

  • электоральное поведение населения РФ в целом и субьектов РФ;
  • голосование депутатов различных уровней.

Право

  • соблюдение прав человека в РФ;
  • экспертиза принимаемых законопроектов.

Экономика

  • оптимальная структура экономики России;
  • доля теневой экономики в РФ.

Бизнес

  • оптимизация управления в коммерческих структурах;
  • маркетинг различных товарных рынков;
  • поддержка систем принятия решения;
  • управление в кризисных ситуациях.

Безопасность

  • оптимальная структура Вооруженных Сил РФ;
  • место ВС РФ в мировой системе безопасности.

Рисунок 11 – Моделирование в программе МАКС

2.5. Контент - Анализ Про

Контент-Aнализ Про предназначен для анализа различных текстов: рекламы, прессы, листовок, речей, интервью, материалов групповой дискуссии и т.д. В систему Контент-анализ Про встроен блок ALEX для автоматического поиска закономерностей в данных.

Некоторые решаемые задачи с помощью  Контент-анализа Про:

  • изучение социально-психологических портретов аудиторий СМИ;
  • выявление глубинных установок респондентов;
  • выявление болевых точек при анализе писем;
  • выявление политической ориентации СМИ;
  • изучение логических противоречий в законах и постановлениях;
  • установление авторства текста;
  • автоматическое реферирование текстов;
  • выявление рекламной стратегии фирм.

В данном продукте реализованы два  вида контент-анализа: смысловой и  частотный.  Смысловой контент-анализ позволяет  анализировать смысловое содержание текста; подтекст, включенный автором текста и неосознаваемый автором подтекст. Частотный контент-анализ позволяет анализировать частоту встречаемости различных фрагментов текста (слова, группы слов, предложения, абзацы, тексты в целом), что также необходимо для исследования структуры текста и выявления его смыслов.[10]

Основные возможности Контент-анализа:

  • частотный анализ текста, построение смысловых групп;
  • смысловой анализ текста, нахождение синонимичных выражений;
  • создание пользовательских тематических и грамматических словарей;
  • поиск связей в тексте для заданных слов;
  • создание и ведение баз текстовых данных;
  • построение карт текстов и сравнение их между собой;
  • вычисление стандартных коэффициентов (число слов, предложений, средняя длина  предложения и т.п.);
  • вычисление интегральных характеристик текста (лексическое разнообразие, структурная и грамматическая сложность);
  • сравнение текстов между собой различными методами и вычисление интегральных индексов сходства текстов по результатам сравнения;
  • нахождение функциональных зависимостей между характеристиками текста и проверка этих зависимостей на других текстах.

2.6. STADIA

Пакет STADIA разработан и поддерживается НПО «Информатика и компьютеры». Содержит в себе широкий набор методов анализа данных из всех областей статистики и доступен широкому кругу прикладных специалистов, менеджеров и студентов. Позволяет провести анализ выборочных распределений, временных рядов, парной корреляции и регрессии, получить прогноз развития объекта, построить и вывести на печать соответствующие графики и диаграммы. Кроме этого имеет средства и для углубленного анализа данных: регрессионный, кластерный, факторный, дискриминантный, параметрический и непараметрический дисперсионный анализ.

Система STADIA имеет достаточно полную документацию, а встроенный справочник содержит краткое описание основных теоретических положений, примеры расчета, формулы. Последние версии программы STADIA имеют увеличенный объем матрицы данных – до 12800 и 20000 чисел, расширенные возможности статистических процедур для их обработки по сравнению с базовыми версиями.

Пакет может появляться в трех вариантах: study, basе и рrоf, различающихся лишь объемами обрабатываемых массивов и ценой.

Универсальный российский статистический пакет STADIA - за 12 лет существования и развития стал аналитическим инструментом для многих тысяч пользователей в различных областях науки, техники, планирования, управления, производства, сельского хозяйства, экономики, бизнеса, маркетинга, образования, медицины по всей русскоязычной Евразии. По своим базовым возможностям сопоставим с наиболее известными западными статистическими пакетами. Отличается простотой использования применительно к отечественной аудитории.[11]

 Возможности:

  • набор самых современных и эффективных методов анализа: описательная статистика, дисперсионный, корреляционный и спектральный анализ, сглаживание, прогнозирование, простая, нелинейная регрессия, кластерный и факторный анализ, методы контроля качества, анализ и замена пропущенных значений;
  • полный комплект деловой и научной, 2-х, 3-х и многомерной графики: функции, зависимости, прогнозы, диаграммы рассеяния, карты, гистограммы, и проч.;
  • развитая экранная помощь, понятная интерпретация результатов.

Demo-версия программы обладает всеми возможностями пакета и позволяет обрабатывать данные небольшого объема (до 400 чисел). Тем самым она позволяет самостоятельно овладеть всеми современными методами прикладной статистики, а в некоторых областях исследования ещё и получить научные и практически значимые результаты.

Информация о работе Сравнение современных зарубежных информационных систем управления базами данных (DBMS)