Разработка электронного пособия по спецкурсу «Классификация экспериментальных данных»

Автор работы: Пользователь скрыл имя, 26 Октября 2012 в 22:41, курсовая работа

Описание работы

Объект исследования (разработки): электронное пособие по спецкурсу «Классификация экспериментальных данных».
Цель курсовой работы: разработка электронного пособия по спецкурсу «Классификация экспериментальных данных».
Задачи курсовой работы: изучение основ теории классификации, освоение основных приемов работы в среде системы Statistica, изучение принципов работы языка HTML, организация и реализация web-пособия.

Содержание работы

ВВЕДЕНИЕ
1 ПРИКЛАДНАЯ СТАТИСТИКА
1.1 Прикладная статистика
1.2 Пакет Statistica
2 ИНСТРУМЕНТ HTML
2.1 Общие сведения о HTML
2.2 Создание web–приложения поддержки процесса изучения спецкурса
3 АПРОБАЦИЯ
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ А

Файлы: 1 файл

курсовая работа(2003).doc

— 995.00 Кб (Скачать файл)

<p align="justify"><u>Цель работы:</u> <i>освоить первичный анализ данных в системе STATISTICA  </i></p>

<p align="justify"><u>Постановка задачи:</u>Для предметной области и соответствующего признакового описания объектов (из лабораторной работы 1) выполнить первичный статистический анализ.</p>

<p align="justify">Задание 1. Освоить вероятностный калькулятор и простейшие приемы работы с ним (см. п. 2.1).</p>

<p align="justify">Задание 2. Изучить поведение графика нормального закона распределения при изменении его параметров (см. п. 2.1).</p>

<p align="justify">Задание 3. Изучить правила 2 и 3 сигма (см. п. 2.1).</p>

<p align="justify">Задание 4. Познакомиться с возможностями STATISTICA  по работе с распределением хи-квадрат (см. п. 2.1).</p>

<p align="justify">Задание 5. Познакомиться с возможностями STATISTICA  по работе с t-распределением Стьюдента. График его плотности. Сравнение с нормальным распределением (см. п. 2.1).</p>

<p align="justify">Задание 6. Познакомиться с возможностями STATISTICA  по работе с F- распределением (см. п. 2.1).</p>

<p align="justify">Задание 7. Познакомиться с возможностями STATISTICA  по работе с логарифмически-нормальным распределением (см. п. 2.1).</p>

<p align="justify">Задание 8. Познакомиться с возможностями STATISTICA  по генерации псевдослучайных чисел (см. п. 2.2).</p>

<p align="justify">Задание 9. Визуализация данных и настройка графика в STATISTICA   (см. п. 2.3).</p>

<p align="justify">Задание 10. Изучить на примере частотный анализ в STATISTICA (см. п. 2.3).  Выполнить исследование эффективности рекламы для данных из упражнения в п. 2.3.</p>

<p align="justify">Задание 11.  Оформить отчет.</p>

<p align="center"><b>1 Пояснительная записка</b></p>

<p align="justify">3.1 Вероятностный калькулятор</p>

<center><img src="Рисунки/lab3/рис.1.png"></center>

<p align="center">Mean – 0,5 </p>

<center><img src="Рисунки/lab3/рис.2.png"></center>

<p align="center">Mean – 2,5</p>

<center><img src="Рисунки/lab3/рис.3.png"></center>

<p align="center">St. dev -1</p>

<center><img src="Рисунки/lab3/рис.4.png"></center>

<p align="center">St. dev - 4 </p>

<center><img src="Рисунки/lab3/рис.5.png"></center>

<p align="justify">3.3 Правила 2 и 3 сигма</p>

<p align="center">95,45 %</p>

<center><img src="Рисунки/lab3/рис.6.png"></center>

<p align="center">99,73%</p>

<center><img src="Рисунки/lab3/рис.7.png"></center>

<p align="justify">3.4 Распределение хи-квадрат</p>

<center><img src="Рисунки/lab3/рис.8.png"></center>

<p align="justify">3.5 t-распределение Стьюдента. График его плотности./p>

<center><img src="Рисунки/lab3/рис.9.png"></center>

<p align="justify">3.6 F- распределение</p>

<center><img src="Рисунки/lab3/рис.10.png"></center>

<p align="justify">3.7 Логарифмически-нормальное распределение</p>

<center><img src="Рисунки/lab3/рис.11.png"></center>

<p align="justify">3.8 Генерация псевдослучайных чисел</p>

<center><img src="Рисунки/lab3/рис.12.png"></center>

<p align="center"><b>Визуализация данных и настройка графика в STATISTICA</b></p>

<center><img src="Рисунки/lab3/рис.13.png"></center>

<p align="center"><b>Зависимость цены от ширины</b></p>

<center><img src="Рисунки/lab3/рис.14.png"></center>

<p align="center"><b>Настроенный график зависимости цены от ширины</b></p>

<center><img src="Рисунки/lab3/рис.15.png"></center>

<p align="center"><b>Таблица с новыми значениями цены</b></p>

<p align="justify">3.10 Частотный анализ в STATISTICA.  Исследование эффективности рекламы.</p>

<p align="justify">Рассмотрим следующие данные об обороте фирмы до и после публикации рекламы.</p>

<center><img src="Рисунки/lab3/рис.16.png"></center>

<center><img src="Рисунки/lab3/рис.17.png"></center>

<p align="center"><b>График для переменных «Оборот фирмы» До и ПОСЛЕ рекламы</b></p>

<center><img src="Рисунки/lab3/рис.18.png"></center>

<p align="center"><b>Электронная таблица результатов</b></p>

<ol> <li>Правила 2 и 3 сигма      <li>Особенности распределения хи-квадрат <li>Особенности t- распределения Стьюдента <li>Особенности F- распределения <li>Особенности логарифмически-нормального распределения </ol>

</body></html>

 

Lab4.html

<html><body bgcolor="F0FFFF" text="000080">

<h2>Лабораторная работа № 4. РЕГРЕССИОННЫЙ АНАЛИЗ В СИСТЕМЕ STATISTICA</h2>

<p align="justify"><u>Цель работы:</u> <i>освоить регрессионный анализ данных в системе STATISTICA  </i></p>

<p align="justify"><u>Постановка задачи:</u>Для предметной области и соответствующего признакового описания объектов выполнить регрессионный анализ.</p>

<p align="justify">Задание 1. Для задачи: курсы акций Иркутскэнерго и Красноярскэнерго  (см. п. 3.2) построить множественную линейную модель в модуле Множественная регрессия, освоить простейшие приемы работы с ним. Для этого выполнить действия: создать файл с данными и выполнить последовательность шагов для получения итоговых результатов, прокомментировать полученные результаты.</p>

<p align="justify">Задание 2. Для задачи: стоимость эксплуатация самолетов (см. п. 3.3) построить множественную линейную модель в модуле Множественная регрессия аналогично, как и в задании 1.</p>

<p align="justify">Задание 3. Для задачи: цена жилого дома (см. п. 3.4) построить множественную линейную модель в модуле Множественная регрессия аналогично, как и в задании 1.</p>

<p align="justify">Задание 4. Познакомиться с использованием инструмента КИСТЬ для анализа данных: точечной, прямоугольной и лассо в STATISTICA.</p>

<p align="justify">Задание 5. Для задачи: цена марочного портвейна (см. п. 3.7) построить множественную линейную модель в модуле Множественная регрессия аналогично, как и в задании 1.</p>

<p align="justify">Задание 6. Для задачи: душевой доход и потребление (см. п. 3.7) построить множественную линейную модель в модуле Множественная регрессия аналогично, как и в задании 1.</p>

<p align="justify">Задание 7. Для задачи: расходы на строительство атомных станций (см. п. 3.7) построить множественную линейную модель в модуле Множественная регрессия аналогично, как и в задании 1.</p>

<p align="justify">Задание 8.  Оформить отчет.</p>

<p align="center"><b>2 Контрольные вопросы</b></p>

<ol> <li>Постановка задачи в рамках классической регрессионной модели

<li>Схема математического решения задачи в рамках классической регрессионной модели <li>Коэффициент детерминации. Определение и значение в регрессионном анализе. <li>Структура и значение компонентов информационной части результатов регрессионного анализа в STATISTICA.

<li>Диалоговое окно Анализ остатков и анализ адекватности построенной модели. </ol>

</body></html>

 

Lab5.html

<html><body bgcolor="F0FFFF" text="000080">

<h2>Лабораторная работа № 5. ДИСКРИМИНАНТНЫЙ АНАЛИЗ В СИСТЕМЕ STATISTICA</h2>

<p align="justify"><u>Цель работы:</u> <i>освоить дискриминантный анализ данных в системе STATISTICA  </i></p>

<p align="justify"><u>Постановка задачи:</u>Для предметной области и соответствующего признакового описания объектов выполнить дискриминантный анализ.</p>

<p align="justify">Задание 1. Для задачи: классификация цветов ириса (см. 5.4 в поясни-тельной записке) выполнить дискриминантный анализ.</p>

<p align="justify">Задание 2.  Оформить отчет.</p>

<p align="center"><b>1 Пояснительная записка</b></p>

<p align="justify">5.1 Введение в дискриминантный анализ</p>

<p align="justify">Дискриминантный анализ является одним из методов многомерного статистического анализа. Цель дискриминантного анализа состоит в том, чтобы на основе измерения различных характеристик (признаков, параметров) объекта классифицировать его, то есть отнести к одной из нескольких групп (классов) некоторым оптимальным способом. Под оптимальным способом понимается либо минимум математического ожидания потерь, либо минимум вероятности ложной классификации. Этот вид анализа является многомерным, так как измеряется несколько параметров объекта, по крайней мере больше одного, например, температура, влажность в технологическом процессе, давление, состав крови, температура больного и т.д.</p>

<p align="justify">5.2 Постановка задачи дискриминантного анализа</p>

<p align="justify">Предположим, имеется n объектов с m характеристиками. В результате измерений каждый объект характеризуется вектором х1, ... хm, m >1. Задача состоит в том, чтобы по результатам измерений отнести объект к одной из нескольких групп (классов) G1, ... Gk, k >=2. Иными словами, нужно построить решающее правило, позволяющее по результатам измерений параметров объекта указать группу, к которой он принадлежит. Число групп заранее известно, также известно, что объект заведомо принадлежит к определенной группе.</p>

<p align="justify">5.3 Предположения и ограничения в дискриминантом анализе</p>

<p align="justify">Дискриминантный анализ «работает» при выполнении ряда предположений. Предположение о том, что наблюдаемые величины — измеряемые ха-рактеристики объекта — имеют нормальное распределение. Это предположение следует проверять </p>

<p align="justify">5.4 Классификация цветов ириса в STATISTICA</p>

<p align="justify"><b>Шаг 1.</b> Из Переключателя модулей STATISTICA открываем стартовую панель модуля Discriminant function analysis (Дискриминантный функциональный анализ).</p>

<center><img src="Рисунки/lab5/рис.1.png"></center>

<p align="center"><b>Рис. 5.4.1. Стартовая панель модуля Дискриминантный анализ</b></p>

<p align="justify"><b>Шаг 2.</b> Нажимаем кнопку Open Data (Открыть данные) и открываем файл данных Irisdat.sia из каталога Examples. Следующий файл данных появится на экране:</p>

<center><img src="Рисунки/lab5/рис.2.png"></center>

<p align="center"><b>Рис. 5.4.2. Файл данных Iris.sta</b></p>

<p align="justify"><b>Шаг З.</b> Нажимаем кнопку Variables (Переменные) и выбираем переменные, для анализа. В качестве Группирующей переменной – Grouping variable выбираем переменную IRISTYPE – ТИПИРИСА. В качестве Независимых переменных – Independent variables выбираем переменные SEPALLEN - ДЛИНА ЧАШЕЛИСТИКА, SEPALWD - ШИРИНА ЧАШЕЛИСТИКА, PETALLEN -ДЛИНА ПЕСТИКА, PETALWD - ШИРИНА ПЕСТИКА.</p>

<p align="justify"><b>Шаг 4.</b> Нажимаем кнопку ОК и открываем диалоговое окно Model Definition (Определение модели).</p>

<center><img src="Рисунки/lab5/рис.3.png"></center>

<p align="center"><b>Рис. 5.4.3. Окно определения модели дискриминантного анализа</b></p>

<p align="justify">Делаем установки, как показано на рисунке 5.4.3. Нажимаем кнопку ОК и запускаем вычислительную процедуру, реализующую пошаговый метод включения.</p>

<p align="justify"><b>Шаг 5.</b> Всесторонне просмотрим итоги в диалоговом окне Результаты днскриминантного анализа.</p>

<center><img src="Рисунки/lab5/рис.4.png"></center>

<p align="center"><b>Рис. 5.4.4. Окно результатов дискриминантного анализа данных из файла Iris.sta</b></p>

<p align="justify">Нажимаем кнопку Variables in the model (Переменные, включенные в модель).</p>

<center><img src="Рисунки/lab5/рис.5.png"></center>

<p align="center"><b>Рис. 5.4.5. Итоговая таблица анализа данных из файла Iris.sta</b></p>

<center><img src="Рисунки/lab5/рис.6.png"></center>

<p align="center"><b>Рис. 5.4.6. Разделение трех типов ириса</b></p>

<p align="justify">Просмотрим функции классификации. В диалоговом окне Результаты (рис. 5.4.4) дискриминантного анализа нажимаем кнопку Classification functions (Функции классификации).</p>

<center><img src="Рисунки/lab5/рис.7.png"></center>

<p align="center"><b>Рис. 5.4.7. Функции классификации, построенные пошаговым методом вперед</b></p>

<center><img src="Рисунки/lab5/рис.8.png"></center>

<p align="center"><b>Рис. 5.4.8. Расстояния Махаланобиса для данных из файла iris.sta</b></p>

<center><img src="Рисунки/lab5/рис.9.png"></center>

<p align="center"><b>Рис. 5.4.9. Таблица апостериорных вероятностей</b></p>

Информация о работе Разработка электронного пособия по спецкурсу «Классификация экспериментальных данных»