Автор работы: Пользователь скрыл имя, 26 Октября 2012 в 22:41, курсовая работа
Объект исследования (разработки): электронное пособие по спецкурсу «Классификация экспериментальных данных».
Цель курсовой работы: разработка электронного пособия по спецкурсу «Классификация экспериментальных данных».
Задачи курсовой работы: изучение основ теории классификации, освоение основных приемов работы в среде системы Statistica, изучение принципов работы языка HTML, организация и реализация web-пособия.
ВВЕДЕНИЕ
1 ПРИКЛАДНАЯ СТАТИСТИКА
1.1 Прикладная статистика
1.2 Пакет Statistica
2 ИНСТРУМЕНТ HTML
2.1 Общие сведения о HTML
2.2 Создание web–приложения поддержки процесса изучения спецкурса
3 АПРОБАЦИЯ
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ А
<p align="justify"><u>Цель работы:</u> <i>освоить первичный анализ данных в системе STATISTICA </i></p>
<p align="justify"><u>Постановка задачи:</u>Для предметной области и соответствующего признакового описания объектов (из лабораторной работы 1) выполнить первичный статистический анализ.</p>
<p align="justify">Задание 1. Освоить вероятностный калькулятор и простейшие приемы работы с ним (см. п. 2.1).</p>
<p align="justify">Задание 2. Изучить поведение графика нормального закона распределения при изменении его параметров (см. п. 2.1).</p>
<p align="justify">Задание 3. Изучить правила 2 и 3 сигма (см. п. 2.1).</p>
<p align="justify">Задание 4. Познакомиться с возможностями STATISTICA по работе с распределением хи-квадрат (см. п. 2.1).</p>
<p align="justify">Задание 5. Познакомиться с возможностями STATISTICA по работе с t-распределением Стьюдента. График его плотности. Сравнение с нормальным распределением (см. п. 2.1).</p>
<p align="justify">Задание 6. Познакомиться с возможностями STATISTICA по работе с F- распределением (см. п. 2.1).</p>
<p align="justify">Задание 7. Познакомиться с возможностями STATISTICA по работе с логарифмически-нормальным распределением (см. п. 2.1).</p>
<p align="justify">Задание 8. Познакомиться с возможностями STATISTICA по генерации псевдослучайных чисел (см. п. 2.2).</p>
<p align="justify">Задание 9. Визуализация данных и настройка графика в STATISTICA (см. п. 2.3).</p>
<p align="justify">Задание 10. Изучить на примере частотный анализ в STATISTICA (см. п. 2.3). Выполнить исследование эффективности рекламы для данных из упражнения в п. 2.3.</p>
<p align="justify">Задание 11. Оформить отчет.</p>
<p align="center"><b>1 Пояснительная записка</b></p>
<p align="justify">3.1 Вероятностный калькулятор</p>
<center><img src="Рисунки/lab3/рис.1.png"><
<p align="center">Mean – 0,5 </p>
<center><img src="Рисунки/lab3/рис.2.png"><
<p align="center">Mean – 2,5</p>
<center><img src="Рисунки/lab3/рис.3.png"><
<p align="center">St. dev -1</p>
<center><img src="Рисунки/lab3/рис.4.png"><
<p align="center">St. dev - 4 </p>
<center><img src="Рисунки/lab3/рис.5.png"><
<p align="justify">3.3 Правила 2 и 3 сигма</p>
<p align="center">95,45 %</p>
<center><img src="Рисунки/lab3/рис.6.png"><
<p align="center">99,73%</p>
<center><img src="Рисунки/lab3/рис.7.png"><
<p align="justify">3.4 Распределение хи-квадрат</p>
<center><img src="Рисунки/lab3/рис.8.png"><
<p align="justify">3.5 t-распределение Стьюдента. График его плотности./p>
<center><img src="Рисунки/lab3/рис.9.png"><
<p align="justify">3.6 F- распределение</p>
<center><img src="Рисунки/lab3/рис.10.png">
<p align="justify">3.7 Логарифмически-нормальное распределение</p>
<center><img src="Рисунки/lab3/рис.11.png">
<p align="justify">3.8 Генерация псевдослучайных чисел</p>
<center><img src="Рисунки/lab3/рис.12.png">
<p align="center"><b>Визуализация данных и настройка графика в STATISTICA</b></p>
<center><img src="Рисунки/lab3/рис.13.png">
<p align="center"><b>Зависимость цены от ширины</b></p>
<center><img src="Рисунки/lab3/рис.14.png">
<p align="center"><b>Настроенный график зависимости цены от ширины</b></p>
<center><img src="Рисунки/lab3/рис.15.png">
<p align="center"><b>Таблица с новыми значениями цены</b></p>
<p align="justify">3.10
Частотный анализ в STATISTICA.
<p align="justify">Рассмотрим следующие данные об обороте фирмы до и после публикации рекламы.</p>
<center><img src="Рисунки/lab3/рис.16.png">
<center><img src="Рисунки/lab3/рис.17.png">
<p align="center"><b>График для переменных «Оборот фирмы» До и ПОСЛЕ рекламы</b></p>
<center><img src="Рисунки/lab3/рис.18.png">
<p align="center"><b>Электронная таблица результатов</b></p>
<ol> <li>Правила 2 и 3 сигма <li>Особенности распределения хи-квадрат <li>Особенности t- распределения Стьюдента <li>Особенности F- распределения <li>Особенности логарифмически-нормального распределения </ol>
</body></html>
Lab4.html
<html><body bgcolor="F0FFFF" text="000080">
<h2>Лабораторная работа № 4. РЕГРЕССИОННЫЙ АНАЛИЗ В СИСТЕМЕ STATISTICA</h2>
<p align="justify"><u>Цель работы:</u> <i>освоить регрессионный анализ данных в системе STATISTICA </i></p>
<p align="justify"><u>Постановка задачи:</u>Для предметной области и соответствующего признакового описания объектов выполнить регрессионный анализ.</p>
<p align="justify">Задание 1. Для задачи: курсы акций Иркутскэнерго и Красноярскэнерго (см. п. 3.2) построить множественную линейную модель в модуле Множественная регрессия, освоить простейшие приемы работы с ним. Для этого выполнить действия: создать файл с данными и выполнить последовательность шагов для получения итоговых результатов, прокомментировать полученные результаты.</p>
<p align="justify">Задание 2. Для задачи: стоимость эксплуатация самолетов (см. п. 3.3) построить множественную линейную модель в модуле Множественная регрессия аналогично, как и в задании 1.</p>
<p align="justify">Задание 3. Для задачи: цена жилого дома (см. п. 3.4) построить множественную линейную модель в модуле Множественная регрессия аналогично, как и в задании 1.</p>
<p align="justify">Задание 4. Познакомиться с использованием инструмента КИСТЬ для анализа данных: точечной, прямоугольной и лассо в STATISTICA.</p>
<p align="justify">Задание 5. Для задачи: цена марочного портвейна (см. п. 3.7) построить множественную линейную модель в модуле Множественная регрессия аналогично, как и в задании 1.</p>
<p align="justify">Задание 6. Для задачи: душевой доход и потребление (см. п. 3.7) построить множественную линейную модель в модуле Множественная регрессия аналогично, как и в задании 1.</p>
<p align="justify">Задание 7. Для задачи: расходы на строительство атомных станций (см. п. 3.7) построить множественную линейную модель в модуле Множественная регрессия аналогично, как и в задании 1.</p>
<p align="justify">Задание 8. Оформить отчет.</p>
<p align="center"><b>2 Контрольные вопросы</b></p>
<ol> <li>Постановка задачи в рамках классической регрессионной модели
<li>Схема математического решения задачи в рамках классической регрессионной модели <li>Коэффициент детерминации. Определение и значение в регрессионном анализе. <li>Структура и значение компонентов информационной части результатов регрессионного анализа в STATISTICA.
<li>Диалоговое окно Анализ остатков и анализ адекватности построенной модели. </ol>
</body></html>
Lab5.html
<html><body bgcolor="F0FFFF" text="000080">
<h2>Лабораторная работа № 5. ДИСКРИМИНАНТНЫЙ АНАЛИЗ В СИСТЕМЕ STATISTICA</h2>
<p align="justify"><u>Цель работы:</u> <i>освоить дискриминантный анализ данных в системе STATISTICA </i></p>
<p align="justify"><u>Постановка задачи:</u>Для предметной области и соответствующего признакового описания объектов выполнить дискриминантный анализ.</p>
<p align="justify">Задание 1. Для задачи: классификация цветов ириса (см. 5.4 в поясни-тельной записке) выполнить дискриминантный анализ.</p>
<p align="justify">Задание 2. Оформить отчет.</p>
<p align="center"><b>1 Пояснительная записка</b></p>
<p align="justify">5.1 Введение в дискриминантный анализ</p>
<p align="justify">
<p align="justify">5.2 Постановка задачи дискриминантного анализа</p>
<p align="justify">Предположим, имеется n объектов с m характеристиками. В результате измерений каждый объект характеризуется вектором х1, ... хm, m >1. Задача состоит в том, чтобы по результатам измерений отнести объект к одной из нескольких групп (классов) G1, ... Gk, k >=2. Иными словами, нужно построить решающее правило, позволяющее по результатам измерений параметров объекта указать группу, к которой он принадлежит. Число групп заранее известно, также известно, что объект заведомо принадлежит к определенной группе.</p>
<p align="justify">5.3 Предположения и ограничения в дискриминантом анализе</p>
<p align="justify">
<p align="justify">5.4 Классификация цветов ириса в STATISTICA</p>
<p align="justify"><b>Шаг 1.</b> Из Переключателя модулей STATISTICA открываем стартовую панель модуля Discriminant function analysis (Дискриминантный функциональный анализ).</p>
<center><img src="Рисунки/lab5/рис.1.png"><
<p align="center"><b>Рис. 5.4.1. Стартовая панель модуля Дискриминантный анализ</b></p>
<p align="justify"><b>Шаг 2.</b> Нажимаем кнопку Open Data (Открыть данные) и открываем файл данных Irisdat.sia из каталога Examples. Следующий файл данных появится на экране:</p>
<center><img src="Рисунки/lab5/рис.2.png"><
<p align="center"><b>Рис. 5.4.2. Файл данных Iris.sta</b></p>
<p align="justify"><b>Шаг З.</b> Нажимаем кнопку Variables (Переменные) и выбираем переменные, для анализа. В качестве Группирующей переменной – Grouping variable выбираем переменную IRISTYPE – ТИПИРИСА. В качестве Независимых переменных – Independent variables выбираем переменные SEPALLEN - ДЛИНА ЧАШЕЛИСТИКА, SEPALWD - ШИРИНА ЧАШЕЛИСТИКА, PETALLEN -ДЛИНА ПЕСТИКА, PETALWD - ШИРИНА ПЕСТИКА.</p>
<p align="justify"><b>Шаг 4.</b> Нажимаем кнопку ОК и открываем диалоговое окно Model Definition (Определение модели).</p>
<center><img src="Рисунки/lab5/рис.3.png"><
<p align="center"><b>Рис. 5.4.3. Окно определения модели дискриминантного анализа</b></p>
<p align="justify">Делаем установки, как показано на рисунке 5.4.3. Нажимаем кнопку ОК и запускаем вычислительную процедуру, реализующую пошаговый метод включения.</p>
<p align="justify"><b>Шаг 5.</b> Всесторонне просмотрим итоги в диалоговом окне Результаты днскриминантного анализа.</p>
<center><img src="Рисунки/lab5/рис.4.png"><
<p align="center"><b>Рис. 5.4.4. Окно результатов дискриминантного анализа данных из файла Iris.sta</b></p>
<p align="justify">Нажимаем кнопку Variables in the model (Переменные, включенные в модель).</p>
<center><img src="Рисунки/lab5/рис.5.png"><
<p align="center"><b>Рис. 5.4.5. Итоговая таблица анализа данных из файла Iris.sta</b></p>
<center><img src="Рисунки/lab5/рис.6.png"><
<p align="center"><b>Рис. 5.4.6. Разделение трех типов ириса</b></p>
<p align="justify">Просмотрим функции классификации. В диалоговом окне Результаты (рис. 5.4.4) дискриминантного анализа нажимаем кнопку Classification functions (Функции классификации).</p>
<center><img src="Рисунки/lab5/рис.7.png"><
<p align="center"><b>Рис. 5.4.7. Функции классификации, построенные пошаговым методом вперед</b></p>
<center><img src="Рисунки/lab5/рис.8.png"><
<p align="center"><b>Рис. 5.4.8. Расстояния Махаланобиса для данных из файла iris.sta</b></p>
<center><img src="Рисунки/lab5/рис.9.png"><
<p align="center"><b>Рис. 5.4.9. Таблица апостериорных вероятностей</b></p>