Разработка электронного пособия по спецкурсу «Классификация экспериментальных данных»

Автор работы: Пользователь скрыл имя, 26 Октября 2012 в 22:41, курсовая работа

Описание работы

Объект исследования (разработки): электронное пособие по спецкурсу «Классификация экспериментальных данных».
Цель курсовой работы: разработка электронного пособия по спецкурсу «Классификация экспериментальных данных».
Задачи курсовой работы: изучение основ теории классификации, освоение основных приемов работы в среде системы Statistica, изучение принципов работы языка HTML, организация и реализация web-пособия.

Содержание работы

ВВЕДЕНИЕ
1 ПРИКЛАДНАЯ СТАТИСТИКА
1.1 Прикладная статистика
1.2 Пакет Statistica
2 ИНСТРУМЕНТ HTML
2.1 Общие сведения о HTML
2.2 Создание web–приложения поддержки процесса изучения спецкурса
3 АПРОБАЦИЯ
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ А

Файлы: 1 файл

курсовая работа(2003).doc

— 995.00 Кб (Скачать файл)

 

<ol>

<b><left><br><li><a href="Введение.html "target="content"> Введение </a></left></b>

<ol> 

<left><li><a href="Введение.html#1.1" target="content">Примеры создания файлов данных</a></left>

<left><br><li><a href="Введение.html#1.2" target="content"> Описательные статистики </a></left>

<left><br><li><a href="Введение.html#1.3" target="content"> Вычисление корреляций </a></left>

<left><br><li><a href="Введение.html#1.4" target="content"> Построение простейших статистических графиков </a></left></ol>

В правом фрейме будет содержаться информация по каждому из разделов учебного пособия. Например:

 

<a name="#3.6"><b><h3>3.6. Дополнительные возможности системы STATISTICA по оцениванию параметров регрессионных моделей</h3></b></a>

<p align="justify">В  STATISTICA имеется несколько программ, написанных на языке STATISTICA BASIC, реализующих следующие методы:</p>

<ul>

<li>взвешенный метод  наименьших квадратов – программа Wls.stb;

<li>двухшаговый метод  наименьших квадратов – программа 2stls.stb;

<li>преобразование  Бокса–Кокса – программа Boxcox.stb, a также преобразование Бокса–Тидвелла – программа Boxtid.stb.

</ul>

<p align="justify">Кроме  того, имеется программа оценивания параметров в моделях с очень большим количеством предикторов – программа Regression.stb. Вы можете создать для этих программ кнопки и вывести их на панель управления системы.</p>

 

Таким образом, с помощью данного кода была создана  страница, в которой представлена информация для знакомства с программой Statistica.

 Рассмотрим процесс создания страницы, в которую будут помещены задания лабораторных работ. Для каждой лабораторной работы указаны: цель работы, постановка задачи, задания, комментарии по выполнению лабораторных работ и контрольные вопросы.

В лабораторной работе №1 необходимо изучить подходы по унификации признаковых описаний. В данной работе три задания. Пропишем HTML–код для вывода заданий:

 

 <p align="justify">Задание1. Разработать алгоритм унификации к качественным, порядковым и количественным шкалам.</p>

<p align="justify">Задание2. Построить унифицированное описание  в качественной, порядковой и  количественной шкалах.</p>

<p align="justify">Задание  3. Оформить отчет.</p>

 

В лабораторной работе №2 необходимо освоить простейшие приемы работы в системе Statistica. В данной работе пять заданий. На web–странице будет показан пример создания файла в системе Statistica, построение описательных статистик, вычисление корреляций и построение простейших статистических графиков:

 

<p align="justify">2.1 Создание  файла</p>

<center><img src="Рисунки/lab2/рис.1.png"></center>

<p align="justify">Создаем  таблицу «Цена рекламы», которая  имеет 4 столбца: Длина, Ширина, Площадь, Цена; и 8 строк. Заполняем таблицу числовыми данными.</p>

<p align="justify">2.2  Описательные статистики</p>

<center><img src="Рисунки/lab2/рис.2.png"></center>

<p align="justify">По столбцу «Площадь»  рассчитываем основные описательные  статистики:</p>

<ul> <li>Mean – среднее выборочное;

     <li>Median – медиана;

     <li>Sum – сумма;

     <li>Minimum – минимум;

     <li>Maximum – максимум;

     <li>Variance – выборочная дисперсия;

     <li>Std.Dev. – стандартное отклонение;

     <li>Skewness – выборочный коэффициент асимметрии;

     <li>Kurtosis – выборочный коэффициент эксцесса. </ul>

<p align="justify">2.3 Вычисление корреляций</p>

<center><img src="Рисунки/lab2/рис.3.png"></center>

<p align="justify">Вычисляем коэффициент  корреляции между величинами  Ширина и Площадь. Он равен 1 – т.к. наблюдается тенденция возрастания одной величины при росте другой.</p>

<p align="justify">2.4 Построение простейших  статистических графиков</p>

<p align="justify">Строим гистограмму  по столбцу Ширина:</p>

<center><img src="Рисунки/lab2/рис.4.png"></center>

<p align="justify">Строим  диаграмму рассеяния по столбцам  Ширина  и Цена:</p>

<center><img src="Рисунки/lab2/рис.5.png"></center>

 

В лабораторной работе №3 необходимо освоить первичный  анализ данных в системе Statistica. А именно: освоить вероятностный калькулятор, изучить поведение графика нормального закона распределения при изменении его параметров, изучить правила 2 и 3 сигма, познакомиться с возможностями Statistica по работе с распределением хи–квадрат, t–распределением Стьюдента, F– распределением, с логарифмически–нормальным распределением, изучить на примере частотный анализ в Statistica.

В лабораторной работе №4 необходимо освоить регрессионный  анализ данных в системе Statistica. В данной работе восемь заданий. На примерах будет показано, как построить множественную линейную модель в модуле Множественная регрессия, а также будет показано использование инструмента «кисть»: точечной, прямоугольной и лассо для анализа данных в Statistica:

 

<p align="justify">4.4 Использование  инструмента КИСТЬ для анализа данных: точечной, прямоугольной и лассо в STATISTICA</p>

<center><img src="Рисунки/lab4/рис.1.png"></center>

<center><img src="Рисунки/lab4/рис.2.png"></center>

<p align="center"><b>Точечная кисть</b></p>

<center><img src="Рисунки/lab4/рис.3.png"></center>

<p align="center"><b>Прямоугольная кисть</b></p>

<center><img src="Рисунки/lab4/рис.4.png"></center>

<p align="center"><b>Лассо</b></p>

 

В лабораторной работе №5 необходимо освоить дискриминантный анализ данных в системе Statistica.

Дискриминантный анализ является одним из методов многомерного статистического анализа. Цель дискриминантного анализа состоит в том, чтобы на основе измерения различных характеристик (признаков, параметров) объекта классифицировать его, то есть отнести к одной из нескольких групп (классов) некоторым оптимальным способом. Типичные области применения дискриминантного анализа – медицина, управление производством, экономика, геология, контроль качества [6].

Широкий круг задач, возникающих на практике и связанных с классификацией, можно решить методами дискриминантного анализа. В модуле Discriminant analysis (Дискриминантный анализ) системы Statistica имеется широкий набор средств, обеспечивающих проведение дискриминантного анализа данных, визуализации и интерпретации результатов.

В данной работе будет рассмотрен пример классификации  цветов ириса:

 

<p align="justify"><b>Шаг  1.</b> Из Переключателя модулей  STATISTICA открываем стартовую панель  модуля Discriminant function analysis (Дискриминантный  функциональный анализ).</p>

<center><img src="Рисунки/lab5/рис.1.png"></center>

<p align="center"><b>Рис. 5.4.1. Стартовая панель модуля Дискриминантный анализ</b></p>

 

С помощью данного  кода на страницу web–приложения помещаем информацию о модуле Discriminant function analysis (Дискриминантный функциональный анализ).

В лабораторной работе №6 необходимо освоить кластерный анализ данных в системе Statistica.

Кластерный  анализ – это задача разбиения заданной выборки объектов на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались. Задача кластеризации относится к статистической обработке. Кластер – группа элементов, характеризуемых общим свойством, главная цель кластерного анализа – нахождение групп схожих объектов в выборке [7].

Спектр применений кластерного анализа очень широк: его используют в археологии, медицине, психологии, химии, биологии, государственном управлении, филологии, антропологии, маркетинге, социологии и других дисциплинах.

В данной работе на примере будет показано выполнение кластерного анализа для некоторой предметной области:

 

<center><img src="Рисунки/lab6/рис.11.png"></center>

<p align="center"><b>Рис. 6.4.6. График средних значений для каждого кластера</b></p>

С помощью данного  кода на страницу web–приложения помещаем график средних значений для каждого кластера.

В лабораторной работе №7 необходимо провести комплексное статистическое исследование по обработке экспериментальных данных в системе Statistica, то есть реализовать весь комплекс работ обработки экспериментальных данных, изученный в лабораторных работах 2–6.

Полный текст  программы приведен в Приложении А.

 

3 АПРОБАЦИЯ

 

На начальном  этапе разработки пользовательского  интерфейса необходимо создать главную  страничку, которая будет появляться при открытии файла. На данной странице размещаются две ссылки: «Учебное пособие», предназначенное для знакомства с программой Statistica, и «Лабораторные работы», предназначенные для просмотра заданий лабораторных работ (см. рисунок 3.1).

 

Рисунок 3.1 – Главная страница

 

Интерфейс построен таким образом, чтобы пользователь мог выбрать на главной странице интересующую его информацию и работать непосредственно с этой информации. В зависимости от информации, которую  необходимо получить, нужно нажать на ссылку «Учебное пособие» или «Лабораторные работы».

При нажатии  на ссылку «Учебное пособие» переходим  на следующую страницу (см. рисунок 3.2).

 

Рисунок 3.2 – Содержание учебного пособия

 

На этой странице представлено содержание учебного пособия, которое представляет собой ссылки на соответствующие разделы данного пособия.

При нажатии  на ссылку «Введение» можно получить вводную информацию о системе Statistica. Например, как создаются файлы данных, как построить описательные статистики, как вычислить корреляции, а также как строятся простейшие статистические графики (см. рисунок 3.3).

 

Рисунок 3.3 – Введение

При нажатии  на ссылку «Первичный анализ в системе Statistica – модуль Basic Statistics/Tables (Основные статистики/Таблицы)» переходим на страницу (см. рисунок 3.4):

 

Рисунок 3.4 – Первичный анализ в системе Statistica – модуль Basic Statistics/Tables (Основные статистики/Таблицы)

 

На этой странице можно  получить сведения о первичном статистическом анализе, то есть познакомиться с  возможностями Statistica по работе с вероятностным калькулятором, с распределением хи–квадрат, с t–распределением Стьюдента, с F– распределением, с логарифмически–нормальным распределением, по генерации псевдослучайных чисел, а также познакомиться с правилами 2 3 сигма.

Если нажать на ссылку «Регрессионный анализ в системе Statistica – модуль Multiple Regression (Множественная регрессия)», то можно получить информацию о множественной линейной модели в модуле Множественная регрессия (см. рисунок 3.5).

 

Рисунок 3.5 – Регрессионный анализ в системе Statistica – модуль Multiple Regression (Множественная регрессия)

 

При нажатии  на главной странице на ссылку «Лабораторные  работы», переходим на следующую  страницу (см. рисунок 3.6).

 

Рисунок 3.6 – Список лабораторных работ

На этой странице представлен список лабораторных работ.

При нажатии  на ссылку «Лабораторная работа №1», можно познакомиться с заданием лабораторной работы №1 (см. рисунок 3.7).

 

Рисунок 3.7 – Лабораторная работа №1

 

Аналогичным образом  можно посмотреть задания остальных  работ.

 

ЗАКЛЮЧЕНИЕ

 

При реализации курсовой работы были выполнены все  поставленные задачи, то есть были изучены основы теории классификации, основные приемы работы в среде системы Statistica, принципы работы языка HTML и разработано электронное пособие по спецкурсу «Классификация экспериментальных данных».

В разработанное электронное пособие был включен лекционный материал, обучающие примеры для работы в среде системы Statistica, а также задания и примеры лабораторных работ.

Интерфейс был  разработан таким образом, чтобы пользователю предлагалась возможность самому выбрать интересующую его информацию и работать непосредственно с этой информации.

Планируется в  следующей курсовой работе сделать  детализацию по работе в среде  системы Statistica.

 

СПИСОК ЛИТЕРАТУРЫ

 

1 Айвазян, С.А. Прикладная статистика: основы моделирования и первичная обработка данных: Справочное изд. / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин. – М.: Финансы и статистика. 1983. –472c.

2 Айвазян, С.А. Прикладная статистика: исследование зависимостей: Справочное изд. / С.А Айвазян, И.С. Енюков, Л.Д. Мешалкин. – М.: Финансы и статистика. 1985. –488с

3 Боровиков, В.П. Популярное введение в программу STATISTICA: Справочное изд. / В.П. Боровиков. - М.: Финансы и статистика. 1999. -239с.

4 Соколов, С.А.. HTML и CSS в примерах, типовых решениях и задачах: Справочное изд. / С.А. Соколов. – М.: Вильямс, 2007. –416с.

5 Титтел, Э. HTML 4: Справочное изд./ Э. Титтел, М. Бурмейстер. – М.: «Диалектика», 2006. –368с.

6 Айвазян, С.А.. Прикладная статистика: Классификация и снижение размерности: Справочное изд. / С.А. Айвазян, В.М. Бухштабер, И.С. Енюков. –М.: Финансы и статистика. 1989. –605с.

Информация о работе Разработка электронного пособия по спецкурсу «Классификация экспериментальных данных»