Автор работы: Пользователь скрыл имя, 26 Октября 2012 в 22:41, курсовая работа
Объект исследования (разработки): электронное пособие по спецкурсу «Классификация экспериментальных данных».
Цель курсовой работы: разработка электронного пособия по спецкурсу «Классификация экспериментальных данных».
Задачи курсовой работы: изучение основ теории классификации, освоение основных приемов работы в среде системы Statistica, изучение принципов работы языка HTML, организация и реализация web-пособия.
ВВЕДЕНИЕ
1 ПРИКЛАДНАЯ СТАТИСТИКА
1.1 Прикладная статистика
1.2 Пакет Statistica
2 ИНСТРУМЕНТ HTML
2.1 Общие сведения о HTML
2.2 Создание web–приложения поддержки процесса изучения спецкурса
3 АПРОБАЦИЯ
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ А
<p align="justify">Если быть более точным, то следует сказать так: при нечетном N медиана есть значение ряда с номером (N-l)/2, при четном N медиана есть полусумма значений с номерами N/2 И N/2+1. Х(1) — минимальное значение выборки, X(N) — максимальное значение. Разность между максимальным и минимальным значением называется <b>размахом.</b></p>
<a name="#1.3"><b><h3>1.3. Вычисление корреляций</h3></b></a>
<p align="justify">В примере 3 создан файл с курсами валют. Покажем на основе этих данных, как вычисляются корреляции в STATISTICA. Вычислим корреляции между переменными ДОЛЛАР и МАРКА.</p>
<center><img src="Рисунки/1/рис.1.16.bmp"><
<p align="center"><b>Рис. 1.16. Таблица с коэффициентами корреляции</b></p>
<p align="justify">Выделите блок данных ДОЛЛАР-ФРАНК. Нажмите кнопку Basic Statistics/Tables (Основные статистики/Таблицы) на панели инструментов электронной таблицы. В появившемся на экране меню выберите строку: Correlation of ДОЛЛАР — ФРАНК (Корреляции ДОЛЛАР - ФРАНК). Следующая таблица с коэффициентами корреляции появится на экране (рис. 1.17):</p>
<center><img src="Рисунки/1/рис.1.17.bmp"><
<p align="center"><b>Рис. 1.17. Матрица корреляций переменных ДОЛЛАР —ФРАНК</b></p>
<a name="#1.4"><b><h3>1.4. Построение простейших статистических графиков</h3></b></a>
<p align="justify">Покажем, как в системе строятся простейшие статистические графики: диаграмма рассеяния и гистограмма. Будем работать с файлом olimpic.sta, в котором собраны результаты олимпийских чемпионов в беге на 100 м.</p>
<p align="justify"><b>Диаграмма рассеяния</b></p>
<p align="justify"><b>Шаг 1.</b> Выделите какое-нибудь значение переменной ГОД в таблице «Результаты олимпийских чемпионов в беге па 100-м». </p>
<p align="justify"><b>Шаг 2.</b> Нажмите кнопку Graphs (Графики) на панели инструментов электронной табли¬цы. В выпадающем меню выберите пункт Graphs by (Графики рассеяния) и далее пункт Regular (Регулярный). На эк¬ране появится диалоговое окно: Select Variables for Scatterplots (Выбрать переменные для диаграммы). Выберите переменные, как показано на рисунке 1.18.</p>
<center><img src="Рисунки/1/рис.1.18.bmp"><
<p align="center"><b>Рис. 1.18. Окно выбора переменных для диаграммы рассеяния</b></p>
<p align="justify">В результате мы получим следующую диаграмму (рис. 1.19):</p>
<center><img src="Рисунки/1/рис.1.19.bmp"><
<p align="center"><b>Рис. 1.19. Диаграмма рассеяния результатов олимпийских чемпионов в беге на 100 м</b></p>
<p align="justify"><b> Гистограмма</b></p>
<p align="justify"><b>Шаг 1.</b> Выделите какое-нибудь значение переменной ВРЕ¬МЯ в файле olimpic.sta.</p>
<p align="justify"><b>Шаг 2.</b> Нажмите кнопку Graphs (Графики) на панели инструментов электронной табли¬цы. В выпадающем меню выберите пункт Histograms (Гистограммы) и далее пункт Regular (Регулярный). На экране появится график:</p>
<center><img src="Рисунки/1/рис.1.20.bmp"><
<p align="center"><b>Рис. 1.20. Гистограмма значений переменной ВРЕМЯ чемпионов в беге на 100 м</b></p>
</body></html>
Первичный анализ.html
<html><body bgcolor="F0FFFF" text="000080">
<b><h2>2. Первичный анализ в системе Statistica - модуль Basic Statistics/Tables (Основные статистики/Таблицы)</h2></b>
<a name="#2.1"><b><h3>2.1. Вероятностный калькулятор</h3></b></a>
<p align="justify">Запустите модуль Basic Statistics/Tables (Основные статистики/таблицы) из Переключателя модулей. Высветите в стартовой панели модуля Basic Statistics/Tables (Основные статистики/таблицы) строку Probability calculator (Вероятностный калькулятор).</p>
<center><img src="Рисунки/2/рис.2.png"></
<p align="justify">Нажмите кнопку ОК. Перед вами откроется окно Probability Distribution Calculator (Калькулятор вероятностных распределений) (рис. 2.1):</p>
<center><img src="Рисунки/2/рис.2.1.png"></
<p align="center"><b>Рис. 2.1. Начальное окно диалога Калькулятор вероятностных распределений</b></p>
<p align="justify">Если пометить опцию Create graph (Создать график) и нажать далее кнопку <b>Compute (Вычислить)</b>, то на экране появится график плотности и функции распределения (задайте в строке р какое-либо значение, например, 0) (рис. 2.2).</p>
<center><img src="Рисунки/2/рис.2.2.png"></
<p align="center"><b>Рис. 2.2. Плотность и функция распределения стандартной нормальной величины</b></p>
<p align="justify">Вероятностный калькулятор заменяет многие таблицы. Теперь, вместо того чтобы использовать таблицы распределений, вы можете использовать данный калькулятор.</p>
<p align="justify"><i>Замечание:<
<p align="justify"><b>Нормальное распределение</b></p>
<p align="justify">Нормальное распределение — это наиболее часто встречающееся в статистике и в теории вероятностей распределение.</p>
<p align="justify">Известно, что случайные ошибки в экономических рядах, рядах, возникающих в промышленности, радиотехнике и т.д., имеют приблизительно нормальное распределение. Рост взрослых людей так же можно приближенно описать нормальным распределением.</p>
<p align="justify">Нормальное распределение имеет два параметра:</p>
<ul> <li>mean — среднее;
<li>stantard deviation — стандартное отклонение. </ul>
<p align="justify">Эти параметры задаются в окне вероятностного калькулятора.</p>
<p align="justify">Перечислим некоторые признаки нормального распределения:</p>
<ul> <li>плотность нормального распределения симметрична относительно среднего;
<li>среднее значение определяет меру расположения плотности;
<li>cреднее значение нормального распределения совпадает с медианой и модой. </ul>
<p align="justify">Зададим различные значения среднего, оставив пока без изменения стандартное отклонение. Будем считать, что оно равно 1.</p>
<center><img src="Рисунки/2/рис.2.3.png"></
<p align="center"><b>Рис. 2.3. Плотность нормального распределения со средним 1</b></p>
<p align="justify">Повторите те же действия, задав в поле mean (среднее) значение 2.5. Вы увидите следующий график (рис. 2.4):</p>
<center><img src="Рисунки/2/рис.2.4.png"></
<p align="center"><b>Рис. 2.4. Плотность нормального распределения со средним 2.5</b></p>
<p align="justify">Посмотрим, как меняется плотность распределения при изменении другого параметра — стандартного отклонения. Зададим различные значения стандартного отклонения, считая, что среднее фиксированно и равно 0. Покажем на графиках, как изменяется плотность нормального распределения при уменьшении и увеличении дисперсии (рис. 2.5, 2.6). </p>
<center><img src="Рисунки/2/рис.2.5.png"></
<p align="center"><b>Рис. 2.5. Плотность нормального распределения со средним О и дисперсией 0.01</b></p>
<center><img src="Рисунки/2/рис.2.6.png"></
<p align="center"><b>Рис. 2.6. Плотность нормального распределения со средним 0 и дисперсией 4</b></p>
<p align="justify">Итак, при увеличении дисперсии плотность нормального распределения расплывается или рассеивается относительно среднего значения, при уменьшении дисперсии она, наоборот, сжимается, концентрируясь возле одной точки — точки максимального значения.</p>
<p align="justify">Рассмотрим пример использования нормального распределения</p>
<p align="justify"><b>Пример:</b> Известно, что в некоторой стране рост взрослых мужчин приближенно имеет нормальное распределение со средним 176.6 см и стандартным отклонением 7.63 см. Произвольным образом выбирается взрослый мужчина, например, первый встреченный после поворота за угол. Какова вероятность, что рост этого наугад выбранного мужчины не больше 185 см и не меньше 175 см?</p>
<p align="justify"><i>Решение.</
<p align="justify"><i>Шаг 1.</i> Откройте вероятностный калькулятор. Выберите в списке распределенийZ(Normal) (Нормальное распределение).</p>
<p align="justify"><i>Шаг 2.</i> Задайте:</p>
<ul> <li>в поле mean — среднее 175.6;
<li>в поле st.dev. — стандартное отклонение 7.63. </ul>
<p align="justify"><i>Шаг 3.</i> В поле Z задайте 185. Нажмите кнопку <b>Compute (Вычислить)</b>. В поле р появилось значение 0.891022. 3апомните это значение как p1.</p>
<p align="justify"><i>Шаг 4.</i> В поле Z задайте 175. Нажмите кнопку <b>Compute (Вычислить)</b>. В поле р появилось значение 0.468661. Запомните это значение как р2.</p>
<p align="justify"><i>Шаг 5.</i> Вычтите р2 из p1. Вы получите 0.422361.</p>
<p align="justify">Итак, с вероятностью 0.422361 встреченный вами мужчина имеет рост не ниже 175 и не выше 185 сантиметров.</p>
<p align="justify"><b>Правила 2 и 3 сигма</b></p>
<center><img src="Рисунки/2/рис.2.7.png"></
<p align="center"><b>Рис. 2.7. Иллюстрация к правилу 2 сигм</b></p>
<p align="justify">В поле Density Function (Функция плотности) вероятностного калькулятора показана заштрихованная площадь под графиком плотности, в поле р показано значение 0.9545. Переходя к процентам, имеем 95.45%. Заштрихованная площадь составляет 95.45% всей площади под графиком.</p>
<center><img src="Рисунки/2/рис.2.8.png"></
<p align="center"><b>Рис. 2.8. Иллюстрация к правилу 3 сигм</b></p>
<p align="justify"><b>
<center><img src="Рисунки/2/рис.2.9.png"></
<p align="center"><b>Рис. 2.9. Задание хи-квадрат - распределения в вероятностном калькуляторе</b></p>
<p align="justify">В строке df задайте 7 — число степеней свободы. В поле р задайте 0.95. Нажмите кнопку Compute (Вычислить), в строке Chi I вы увидите 0.95 — квантиль хи-квадрат-распределения с 7 степенями свободы. Выберите далее опцию Создать график и вновь щелкните на кнопке Compute (Вычислить) либо просто нажмите ENTER на клавиатуре, вы увидите график плотности и функции распределения хи-квадрат с 7 степенями свободы (рис. 2.10).</p>
<center><img src="Рисунки/2/рис.2.10.png"><
<p align="center"><b>Рис. 2.10. График плотности и функции распределения случайной величины хи-квадрат с 7 степенями свободы</b></p>
<p align="justify">Обратите внимание на то, что это распределение несимметрично и сосредоточено только на положительной полуоси. Распределение хи-квадрат играет важную роль при исследовании оценки дисперсии нормальной выборки, а также при проверке зависимостей в таблицах сопряженности и в критериях согласия. При увеличении числа степеней свободы пик плотности распределения уменьшается и смещается вправо, распределение как будто расплывается по положительной полуоси.</p>
<p align="justify"><b>t-
<center><img src="Рисунки/2/рис.2.12.png"><
<p align="center"><b>Рис. 2.12. Задание распределения Стьюдента в вероятностном калькуляторе</b></p>
<p align="justify">В строке df задайте 5 - число степеней свободы Пометьте опцию Create Graph (Создать график). В поле р задайте 0.5. Нажмите кнопку Compute (Вычислить), на экране вы увидите следующий гра фик (рис. 2.13):</p>
<center><img src="Рисунки/2/рис.2.13.png"><
<p align="center"><b>Рис. 2.13. Плотность и функция t-распределения Стьюдента с 5 степенями свободы</b></p>
<center><img src="Рисунки/2/рис.2.14.png"><
<p align="center"><b>Рис. 2.14. Плотность и функция распределения Стьюдента с 50 степенями свободы</b></p>
<p align="justify"><b>F-
<center><img src="Рисунки/2/рис.2.15.png"><
<p align="center"><b>Рис. 2.15. Задание F-распределения в вероятностном калькуляторе</b></p>
<center><img src="Рисунки/2/рис.2.16.png"><
<p align="center"><b>Рис. 2.16. Плотность и функция F-распределения со степенями свободы 11,12</b></p>
<a name="#2.3"><b><h3>2.3. Анализ данных: ЦЕНА РЕКЛАМЫ</h3></b></a>
<p align="justify">Исследуем, как цена рекламы зависит от размеров объявления: файл с данными уже подготовлен нами (см. гл. 1. Примеры создания файлов данных).</p>
<p align="justify"><i>Шаг 1.</i> Нажмите кнопку Graphs Gallery (Галереи графиков) на панели инструментов или из меню Graphs (Графики).</p>
<center><img src="Рисунки/2/рис.2.25.png"><
<p align="center"><b>Рис. 2.25. Галерея графиков STATISTICA</b></p>
<p align="justify"><i>Шаг 2.</i> В левой части окна высветите строку rjp Stats 2D Graphs (Статистические двухмерные графики). В правой части окна появится список двухмерных графиков STATISTICA.</p>