Автор работы: Пользователь скрыл имя, 26 Октября 2012 в 22:41, курсовая работа
Объект исследования (разработки): электронное пособие по спецкурсу «Классификация экспериментальных данных».
Цель курсовой работы: разработка электронного пособия по спецкурсу «Классификация экспериментальных данных».
Задачи курсовой работы: изучение основ теории классификации, освоение основных приемов работы в среде системы Statistica, изучение принципов работы языка HTML, организация и реализация web-пособия.
ВВЕДЕНИЕ
1 ПРИКЛАДНАЯ СТАТИСТИКА
1.1 Прикладная статистика
1.2 Пакет Statistica
2 ИНСТРУМЕНТ HTML
2.1 Общие сведения о HTML
2.2 Создание web–приложения поддержки процесса изучения спецкурса
3 АПРОБАЦИЯ
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ А
<ol>
<b><left><br><li><a href="Введение.html "target="content"> Введение </a></left></b>
<ol>
<left><li><a href="Введение.html#1.1" target="content">Примеры создания файлов данных</a></left>
<left><br><li><a href="Введение.html#1.2" target="content"> Описательные статистики </a></left>
<left><br><li><a href="Введение.html#1.3" target="content"> Вычисление корреляций </a></left>
<left><br><li><a href="Введение.html#1.4" target="content"> Построение простейших статистических графиков </a></left></ol>
В правом фрейме будет содержаться информация по каждому из разделов учебного пособия. Например:
<a name="#3.6"><b><h3>3.6. Дополнительные возможности системы STATISTICA по оцениванию параметров регрессионных моделей</h3></b></a>
<p align="justify">В
STATISTICA имеется несколько программ,
написанных на языке STATISTICA BASIC,
реализующих следующие методы:<
<ul>
<li>взвешенный метод наименьших квадратов – программа Wls.stb;
<li>двухшаговый метод наименьших квадратов – программа 2stls.stb;
<li>преобразование Бокса–Кокса – программа Boxcox.stb, a также преобразование Бокса–Тидвелла – программа Boxtid.stb.
</ul>
<p align="justify">Кроме того, имеется программа оценивания параметров в моделях с очень большим количеством предикторов – программа Regression.stb. Вы можете создать для этих программ кнопки и вывести их на панель управления системы.</p>
Таким образом, с помощью данного кода была создана страница, в которой представлена информация для знакомства с программой Statistica.
Рассмотрим процесс создания страницы, в которую будут помещены задания лабораторных работ. Для каждой лабораторной работы указаны: цель работы, постановка задачи, задания, комментарии по выполнению лабораторных работ и контрольные вопросы.
В лабораторной работе №1 необходимо изучить подходы по унификации признаковых описаний. В данной работе три задания. Пропишем HTML–код для вывода заданий:
<p align="justify">Задание1. Разработать алгоритм унификации к качественным, порядковым и количественным шкалам.</p>
<p align="justify">Задание2.
Построить унифицированное
<p align="justify">Задание 3. Оформить отчет.</p>
В лабораторной работе №2 необходимо освоить простейшие приемы работы в системе Statistica. В данной работе пять заданий. На web–странице будет показан пример создания файла в системе Statistica, построение описательных статистик, вычисление корреляций и построение простейших статистических графиков:
<p align="justify">2.1 Создание файла</p>
<center><img src="Рисунки/lab2/рис.1.png"><
<p align="justify">Создаем таблицу «Цена рекламы», которая имеет 4 столбца: Длина, Ширина, Площадь, Цена; и 8 строк. Заполняем таблицу числовыми данными.</p>
<p align="justify">2.2 Описательные статистики</p>
<center><img src="Рисунки/lab2/рис.2.png"><
<p align="justify">По столбцу «
<ul> <li>Mean – среднее выборочное;
<li>Median – медиана;
<li>Sum – сумма;
<li>Minimum – минимум;
<li>Maximum – максимум;
<li>Variance – выборочная дисперсия;
<li>Std.Dev. – стандартное отклонение;
<li>Skewness – выборочный коэффициент асимметрии;
<li>Kurtosis – выборочный коэффициент эксцесса. </ul>
<p align="justify">2.3 Вычисление корреляций</p>
<center><img src="Рисунки/lab2/рис.3.png"><
<p align="justify">Вычисляем
<p align="justify">2.4 Построение простейших статистических графиков</p>
<p align="justify">Строим
<center><img src="Рисунки/lab2/рис.4.png"><
<p align="justify">Строим
диаграмму рассеяния по
<center><img src="Рисунки/lab2/рис.5.png"><
В лабораторной работе №3 необходимо освоить первичный анализ данных в системе Statistica. А именно: освоить вероятностный калькулятор, изучить поведение графика нормального закона распределения при изменении его параметров, изучить правила 2 и 3 сигма, познакомиться с возможностями Statistica по работе с распределением хи–квадрат, t–распределением Стьюдента, F– распределением, с логарифмически–нормальным распределением, изучить на примере частотный анализ в Statistica.
В лабораторной работе №4 необходимо освоить регрессионный анализ данных в системе Statistica. В данной работе восемь заданий. На примерах будет показано, как построить множественную линейную модель в модуле Множественная регрессия, а также будет показано использование инструмента «кисть»: точечной, прямоугольной и лассо для анализа данных в Statistica:
<p align="justify">4.4 Использование инструмента КИСТЬ для анализа данных: точечной, прямоугольной и лассо в STATISTICA</p>
<center><img src="Рисунки/lab4/рис.1.png"><
<center><img src="Рисунки/lab4/рис.2.png"><
<p align="center"><b>Точечная кисть</b></p>
<center><img src="Рисунки/lab4/рис.3.png"><
<p align="center"><b>Прямоугольна
<center><img src="Рисунки/lab4/рис.4.png"><
<p align="center"><b>Лассо</b></
В лабораторной работе №5 необходимо освоить дискриминантный анализ данных в системе Statistica.
Дискриминантный анализ является одним из методов многомерного статистического анализа. Цель дискриминантного анализа состоит в том, чтобы на основе измерения различных характеристик (признаков, параметров) объекта классифицировать его, то есть отнести к одной из нескольких групп (классов) некоторым оптимальным способом. Типичные области применения дискриминантного анализа – медицина, управление производством, экономика, геология, контроль качества [6].
Широкий круг задач, возникающих на практике и связанных с классификацией, можно решить методами дискриминантного анализа. В модуле Discriminant analysis (Дискриминантный анализ) системы Statistica имеется широкий набор средств, обеспечивающих проведение дискриминантного анализа данных, визуализации и интерпретации результатов.
В данной работе будет рассмотрен пример классификации цветов ириса:
<p align="justify"><b>Шаг 1.</b> Из Переключателя модулей STATISTICA открываем стартовую панель модуля Discriminant function analysis (Дискриминантный функциональный анализ).</p>
<center><img src="Рисунки/lab5/рис.1.png"><
<p align="center"><b>Рис. 5.4.1. Стартовая панель модуля Дискриминантный анализ</b></p>
С помощью данного кода на страницу web–приложения помещаем информацию о модуле Discriminant function analysis (Дискриминантный функциональный анализ).
В лабораторной работе №6 необходимо освоить кластерный анализ данных в системе Statistica.
Кластерный анализ – это задача разбиения заданной выборки объектов на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались. Задача кластеризации относится к статистической обработке. Кластер – группа элементов, характеризуемых общим свойством, главная цель кластерного анализа – нахождение групп схожих объектов в выборке [7].
Спектр применений кластерного анализа очень широк: его используют в археологии, медицине, психологии, химии, биологии, государственном управлении, филологии, антропологии, маркетинге, социологии и других дисциплинах.
В данной работе на примере будет показано выполнение кластерного анализа для некоторой предметной области:
<center><img src="Рисунки/lab6/рис.11.png">
<p align="center"><b>Рис. 6.4.6. График средних значений для каждого кластера</b></p>
С помощью данного кода на страницу web–приложения помещаем график средних значений для каждого кластера.
В лабораторной работе №7 необходимо провести комплексное статистическое исследование по обработке экспериментальных данных в системе Statistica, то есть реализовать весь комплекс работ обработки экспериментальных данных, изученный в лабораторных работах 2–6.
Полный текст программы приведен в Приложении А.
На начальном этапе разработки пользовательского интерфейса необходимо создать главную страничку, которая будет появляться при открытии файла. На данной странице размещаются две ссылки: «Учебное пособие», предназначенное для знакомства с программой Statistica, и «Лабораторные работы», предназначенные для просмотра заданий лабораторных работ (см. рисунок 3.1).
Рисунок 3.1 – Главная страница
Интерфейс построен таким образом, чтобы пользователь мог выбрать на главной странице интересующую его информацию и работать непосредственно с этой информации. В зависимости от информации, которую необходимо получить, нужно нажать на ссылку «Учебное пособие» или «Лабораторные работы».
При нажатии на ссылку «Учебное пособие» переходим на следующую страницу (см. рисунок 3.2).
Рисунок 3.2 – Содержание учебного пособия
На этой странице представлено содержание учебного пособия, которое представляет собой ссылки на соответствующие разделы данного пособия.
При нажатии на ссылку «Введение» можно получить вводную информацию о системе Statistica. Например, как создаются файлы данных, как построить описательные статистики, как вычислить корреляции, а также как строятся простейшие статистические графики (см. рисунок 3.3).
Рисунок 3.3 – Введение
При нажатии на ссылку «Первичный анализ в системе Statistica – модуль Basic Statistics/Tables (Основные статистики/Таблицы)» переходим на страницу (см. рисунок 3.4):
Рисунок 3.4 – Первичный анализ в системе Statistica – модуль Basic Statistics/Tables (Основные статистики/Таблицы)
На этой странице можно получить сведения о первичном статистическом анализе, то есть познакомиться с возможностями Statistica по работе с вероятностным калькулятором, с распределением хи–квадрат, с t–распределением Стьюдента, с F– распределением, с логарифмически–нормальным распределением, по генерации псевдослучайных чисел, а также познакомиться с правилами 2 3 сигма.
Если нажать на ссылку «Регрессионный анализ в системе Statistica – модуль Multiple Regression (Множественная регрессия)», то можно получить информацию о множественной линейной модели в модуле Множественная регрессия (см. рисунок 3.5).
Рисунок 3.5 – Регрессионный анализ в системе Statistica – модуль Multiple Regression (Множественная регрессия)
При нажатии на главной странице на ссылку «Лабораторные работы», переходим на следующую страницу (см. рисунок 3.6).
Рисунок 3.6 – Список лабораторных работ
На этой странице представлен список лабораторных работ.
При нажатии на ссылку «Лабораторная работа №1», можно познакомиться с заданием лабораторной работы №1 (см. рисунок 3.7).
Рисунок 3.7 – Лабораторная работа №1
Аналогичным образом можно посмотреть задания остальных работ.
При реализации курсовой работы были выполнены все поставленные задачи, то есть были изучены основы теории классификации, основные приемы работы в среде системы Statistica, принципы работы языка HTML и разработано электронное пособие по спецкурсу «Классификация экспериментальных данных».
В разработанное электронное пособие был включен лекционный материал, обучающие примеры для работы в среде системы Statistica, а также задания и примеры лабораторных работ.
Интерфейс был разработан таким образом, чтобы пользователю предлагалась возможность самому выбрать интересующую его информацию и работать непосредственно с этой информации.
Планируется в следующей курсовой работе сделать детализацию по работе в среде системы Statistica.
1 Айвазян, С.А. Прикладная статистика: основы моделирования и первичная обработка данных: Справочное изд. / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин. – М.: Финансы и статистика. 1983. –472c.
2 Айвазян, С.А. Прикладная статистика: исследование зависимостей: Справочное изд. / С.А Айвазян, И.С. Енюков, Л.Д. Мешалкин. – М.: Финансы и статистика. 1985. –488с
3 Боровиков, В.П. Популярное введение в программу STATISTICA: Справочное изд. / В.П. Боровиков. - М.: Финансы и статистика. 1999. -239с.
4 Соколов, С.А.. HTML и CSS в примерах, типовых решениях и задачах: Справочное изд. / С.А. Соколов. – М.: Вильямс, 2007. –416с.
5 Титтел, Э. HTML 4: Справочное изд./ Э. Титтел, М. Бурмейстер. – М.: «Диалектика», 2006. –368с.
6 Айвазян, С.А.. Прикладная статистика: Классификация и снижение размерности: Справочное изд. / С.А. Айвазян, В.М. Бухштабер, И.С. Енюков. –М.: Финансы и статистика. 1989. –605с.