Автор работы: Пользователь скрыл имя, 26 Октября 2012 в 22:41, курсовая работа
Объект исследования (разработки): электронное пособие по спецкурсу «Классификация экспериментальных данных».
Цель курсовой работы: разработка электронного пособия по спецкурсу «Классификация экспериментальных данных».
Задачи курсовой работы: изучение основ теории классификации, освоение основных приемов работы в среде системы Statistica, изучение принципов работы языка HTML, организация и реализация web-пособия.
ВВЕДЕНИЕ
1 ПРИКЛАДНАЯ СТАТИСТИКА
1.1 Прикладная статистика
1.2 Пакет Statistica
2 ИНСТРУМЕНТ HTML
2.1 Общие сведения о HTML
2.2 Создание web–приложения поддержки процесса изучения спецкурса
3 АПРОБАЦИЯ
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ А
<p align="justify">Интерпретация данной таблицы очень проста. В первом столбце указан тип ириса для каждого случая. Во втором, третьем, четвертом столбце даны апостериорные вероятности отнесения каждого цветка к определенному типу. Цветок относится к группе с максимальной апостериорной вероятностью. Знаком * отмечаются неправильно классифицированные при использовании данного правила случаи.</p>
<p align="justify"><b>Шаг 5.</b> Классификация новых случаев. Не закрывая диалога Результаты днскриминантного анализа (рисунок 5.4.4), добавим в таблицу исходных данных новый случай, например, так:</p>
<center><img src="Рисунки/lab5/рис.10.png">
<p align="center"><b>Рис. 5.4.10. Новое наблюдение в данных iris.sta</b></p>
<center><img src="Рисунки/lab5/рис.11.png">
<p align="center"><b>Рис. 5.4.11. Классификация нового наблюдения </b></p>
<p align="justify">Итак, новое наблюдение с вероятностью 0.999874 можно отнести к ти-пу SETOSA.</p>
Lab6.html
<html><body bgcolor="F0FFFF" text="000080">
<h2>Лабораторная работа № 6. КЛАСТЕРНЫЙ АНАЛИЗ В СИСТЕМЕ STATISTICA</h2>
<p align="justify"><u>Цель работы:</u> <i>освоить кластерный анализ в системе STATISTICA </i></p>
<p align="justify"><u>Постановка задачи:</u>Для предметной области и соответствующего признакового описания объектов выполнить кластерный анализ. Заметим, что результаты классификации описываются перечнем объектов каждого класса.</p>
<p align="justify">Задание 1. Для задачи: классификация машин из файла cars.sta выпол-нить кластерный анализ методом к-средних: по всем пяти признакам, по трем (1,2,5) признакам. Сравнить результаты классификации.</p>
<p align="justify">Задание 2. С помощью корреляционного анализа определить степень тесноты зависимости признаков. Выбрать информативное описание 22 ма-шин из файла cars.sta. Для задачи: классификация машин выполнить кластерный анализ методом к-средних: по информативному набору признаков.</p>
<p align="justify">Задание 3. Для задачи: классификация машин из файла cars.sta выпол-нить кластерный анализ методом two-way joining по всем пяти признакам, по трем (1,2,5) признакам, по информативному набору признаков, полученному в задании 2. Сравнить результаты классификации, по-лученные в задании 1 и 3.</p>
<p align="justify">Задание 4. Для задачи: классификация машин из файла cars.sta выпол-нить кластерный анализ иерархическим методом joining (tree clustering) по всем пяти признакам, по трем (1,2,5) признакам, по информативному набору признаков, полученному в задании 2. Сравнить результаты классификации, полученные в задании 1, 3 и 4.</p>
<p align="justify">Задание 5. Оформить отчет.</p>
<p align="center"><b>1 Пояснительная записка</b></p>
<p align="justify">6.1 Классификация в STATISTICA</p>
<p align="justify">Выбираем на панели инструментов Статистика – Многомерные исследова-тельские методы - Анализ кластера.</p>
<center><img src="Рисунки/lab6/рис.1.png"><
<p align="center"><b>Рис. 6.1.1. Запуск модуля Кластерный анализ</b></p>
<center><img src="Рисунки/lab6/рис.2.png"><
<p align="center"><b>Рис. 6.1.2. Стартовая панель модуля Кластерный анализ</b></p>
<center><img src="Рисунки/lab6/рис.3.png"><
<p align="center"><b>Рис. 6.1.3. Файл данных cars.sta</b></p>
<p align="justify">6.2 Выбор метода классификации в STATISTICA</p>
<p align="center"><b>Рис. 6.2.1. Диалоговое окно метода k-means</b></p>
<p align="justify">6.3 Выбор переменных, установка начальных значений, запуск вычислительной процедуры метода к-средних</p>
<center><img src="Рисунки/lab6/рис.5.png"><
<p align="center"><b>Рис. 6.3.1. Выбор переменных для кластерного анализа</b></p>
<p align="justify">6.4 Просмотр результатов кластеризации в STATISTICA</p>
<center><img src="Рисунки/lab6/рис.6.png"><
<p align="center"><b>Рис. 6.4.1. Окно результатов кластеризации машин по методу средних</b></p>
<center><img src="Рисунки/lab6/рис.7.png"><
<p align="center"><b>Рис. 6.4.2. Первый кластер</b></p>
<center><img src="Рисунки/lab6/рис.8.png"><
<p align="center"><b>Рис. 6.4.3. Второй кластер</b></p>
<center><img src="Рисунки/lab6/рис.9.png"><
<p align="center"><b>Рис. 6.4.4. Третий кластер</b></p>
<center><img src="Рисунки/lab6/рис.10.png">
<p align="center"><b>Рис. 6.4.5. Расстояния между кластерами</b></p>
<center><img src="Рисунки/lab6/рис.11.png">
<p align="center"><b>Рис. 6.4.6. График средних значений для каждого кластера</b></p>
<center><img src="Рисунки/lab6/рис.12.png">
<p align="center"><b>Рис. 6.4.7. Выбор части переменных для кластерного анализа ме-тодом к-средних</b></p>
<center><img src="Рисунки/lab6/рис.13.png">
<p align="center"><b>Рис. 6.4.8. График средних для новых кластеров</b></p>
Lab7.html
<html><body bgcolor="F0FFFF" text="000080">
<h2>Лабораторная работа № 7. АНАЛИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ В СИСТЕМЕ STATISTICA</h2>
<p align="justify"><u>Цель работы:</u> <i>провести комплексное статистическое исследование по обработке экспериментальных данных в системе STATISTICA</i></p>
<p align="justify"><u>Постановка задачи:</u>Для исходных данных (файлы ИД_оперир и ИД-здоров) практически реализовать весь комплекс работ обработки экспериментальных данных, изученный в лабораторных работах 2-6, в системе STATISTICA.</p>
<p align="justify">Задание 1. Подготовить исходные данные и создать файл в системе STATISTICA.</p>
<p align="justify">Задание 2. Построить описательные статистики.</p>
<p align="justify">Задание 3. Вычислить корреляции.</p>
<p align="justify">Задание 4. Построить простейшие статистические графики.</p>
<p align="justify">Задание 5. Отнормировать исходные данные.</p>
<p align="justify">Задание 6. Для полученных данных в п.5 выполнить дискриминантный анализ.</p>
<p align="justify">Задание 7. Провести проверку полученных результатов в п.6 методом скользящего анализа.</p>
<p align="justify">Задание 8. Для полученных данных в п.5 выполнить кластерный анализ. Для этого выбрать информативное описание объектов (с помощью корреляционного анализа) и по информативному набору признаков методом к-средних выполнить кластерный анализ.</p>
<p align="justify">Задание 9. Для полученных данных в п.5 построить множественную линейную модель в модуле Множественная регрессия.</p>
<p align="justify">Задание 10. Оформить отчет (отразить всю последовательность действий ).</p>
<p align="center"><b>1 Пояснительная записка</b></p>
<p align="justify">7.6 Дискриминантный анализ</p>
<center><img src="Рисунки/lab7/рис.11.png">
<p align="center"><b>Окно дискриминантного анализа</b></p>
<center><img src="Рисунки/lab7/рис.12.png">
<p align="center"><b>Основные результаты дискриминантного анализа</b></p>
<center><img src="Рисунки/lab7/рис.13.png">
<p align="center"><b>Разделение четырех переменных</b></p>
<center><img src="Рисунки/lab7/рис.14.png">
<p align="center"><b>Функции классификации, построенные пошаговым методом вперед</b></p>
<center><img src="Рисунки/lab7/рис.15.png">
<p align="center"><b>
<p align="justify">7.7 Проверка полученных результатов в п.6 методом скользящего анализа</p>
<center><img src="Рисунки/lab7/!!!.png"></
<p align="justify">Вероятности ошибки отнесения к классам:</p>
<ul> <li>ТТЭ1:р= 0.14352+0.24074=0.38426 <li>ГТЭ0: р=0,36111 <li>ТТЭ0: р=0 <li>Здоров: р=0 </ul>
<p align="justify">7.8 Кластерный анализ</p>
<center><img src="Рисунки/lab7/рис.16.png">
<p align="center"><b>Расстояние между классами</b></p>
<center><img src="Рисунки/lab7/рис.17.png">
<p align="center"><b>Объекты класса</b></p>
<center><img src="Рисунки/lab7/рис.18.png">
<p align="justify">Исходя из визуального анализа, можно сделать вывод о неинформативности задания 4-х классов. Правильным будет задание 2-х классов разбиения.</p>
<p align="justify">7.9 Построение множественной линейной модели</p>
<center><img src="Рисунки/lab7/рис.19.png">
<p align="center"><b>Основные результаты анализа</b></p>
<center><img src="Рисунки/lab7/рис.20.png">
<p align="center"><b>Результаты регрессионного анализа</b></p>
<p align="justify">Получаем уравнение регрессии:</p>
<img src="Рисунки/lab7/!!!!!.png">
<center><img src="Рисунки/lab7/рис.21.png">
<p align="center"><b>График остатков на нормальной вероятностной бумаге</b></p>
<center><img src="Рисунки/lab7/рис.22.png">
<p align="center"><b>График остатков</b></p>
<p align="center"><b>2 Контрольные вопросы</b></p>
<ol> <li>Подходы к выделению однородных групп <li>Типологические и структурные группировки <li>Подходы к нормировке </ol>
</body></html>