Разработка электронного пособия по спецкурсу «Классификация экспериментальных данных»

Автор работы: Пользователь скрыл имя, 26 Октября 2012 в 22:41, курсовая работа

Описание работы

Объект исследования (разработки): электронное пособие по спецкурсу «Классификация экспериментальных данных».
Цель курсовой работы: разработка электронного пособия по спецкурсу «Классификация экспериментальных данных».
Задачи курсовой работы: изучение основ теории классификации, освоение основных приемов работы в среде системы Statistica, изучение принципов работы языка HTML, организация и реализация web-пособия.

Содержание работы

ВВЕДЕНИЕ
1 ПРИКЛАДНАЯ СТАТИСТИКА
1.1 Прикладная статистика
1.2 Пакет Statistica
2 ИНСТРУМЕНТ HTML
2.1 Общие сведения о HTML
2.2 Создание web–приложения поддержки процесса изучения спецкурса
3 АПРОБАЦИЯ
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ А

Файлы: 1 файл

курсовая работа(2003).doc

— 995.00 Кб (Скачать файл)

<p align="justify">Выберите в этом списке Scatterplot (Диаграмма рассеяния). Нажмите кнопку ОК. На экране появится окно 2D Scatterplots (Двухмерные диаграммы рассеяния) (рис. 2.26).</p>

<center><img src="Рисунки/2/рис.2.26.png"></center>

<p align="center"><b>Рис. 2.26. Окно Двухмерные диаграммы рассеяния</b></p>

<p align="justify"><i>Шаг 3.</i> Выбор переменных. Нажмите кнопку Variables (Переменные) в левом верхнем углу диалогового окна 2D Scatterplots (Двухмерные диаграммы рассеяния) и откройте окно выбора переменных для диаграммы рассеяния (рис. 2.27).</p>

<center><img src="Рисунки/2/рис.2.27.png"></center>

<p align="center"><b>Рис. 2.27. Окно выбора переменных для диаграммы рассеяния</b></p>

<p align="justify">Так как исследуется зависимость цены от длины прямоугольной рекламы, то в левой части окна высветите имя ДЛИНА, в правой части - ЦЕНА. Нажмите кнопку ОК. Вы вновь вернетесь в окно 2D Scatterplots. В окне 2D Scatterplots сделайте следующие установки:</p>

<ul> <li>Fit (Подгонка): Linear (Линейный);

<li>Graph Туре (Тип графика): Regular (Регулярный). </ul>

<p align="justify">Все остальные установки сделайте, как показано на рисунке. Нажмите кнопку ОК. На экране появится график:</p>

<center><img src="Рисунки/2/рис.2.28.png"></center>

<p align="center"><b>Рис. 2.28. Зависимость цены рекламного объявления от длины</b></p>

<p align="justify"><i>Шаг 4.</i> Настройка графика. Этому графику можно придать более удобный вид. Установим новую начальную точку отсчета по оси X и выберем новый шаг, равный 38 (длина рекламы увеличивается на 38 мм, см. исходные данные). Щелкните мышью на любой точке оси X, откроется следующее окно Scale option X (Опции шкалы X) (рис. 2.29).</p>

<center><img src="Рисунки/2/рис.2.29.png"></center>

<p align="center"><b>Рис. 2.29. Опции настройки шкалы X графика</b></p>

<p align="justify">Сделайте установки в опции Scaling (Шкалирование), как показано на рисунке (см. нижнюю правую часть окна). Нажмите кнопку ОК.  На экране появится график (рис. 2.30).</p>

<center><img src="Рисунки/2/рис.2.30.png"></center>

<p align="center"><b>Рис. 2.30. График с настроенной шкалой</b></p>

<p align="justify">Продолжим настройку графика. Полезно указать единицы измерения на графике. Сделайте это, например, следующим образом: подведите курсор мыши на графике к слову ДЛИНА и дважды щелкните мышью. На экране появится окно Edit Titles (Редактировать Титлы). В этом окне можно написать любые названия осей, единицы измерений, заголовки. Напишите, например, как показано на рисунке ниже:</p>

<center><img src="Рисунки/2/рис.2.31.png"></center>

<p align="center"><b>Рис. 2.31. Окно редактирования титлов</b></p>

<p align="justify">На экране появится график, который в увеличенном виде выглядит так:</p>

<center><img src="Рисунки/2/рис.2.32.png"></center>

<p align="center"><b>Рис. 2.32.. Полностью настроенный график зависимости цены прямоугольника рекламы от длины (ширина 47 мм)</b></p>

<p align="justify"><i>Шаг 5.</i> Анализ зависимости на графике. Прямая линия, проведенная на графике, лежит максимально близко к наблюдаемым точкам, но не точно на них.

Уравнение прямой имеет следующий вид: у=3.165е5+32528.195*х. В других обозначениях это уравнение  можно переписать так: ЦЕНА= 316500 + 32528.195*ДЛИНА</p>

<p align="justify">При фиксированной ширине цена прямоугольной рекламы прямо пропорциональна длине. Это общий закон, по которому берется плата за рекламу. Конечно, этот закон общеизвестен, но обратите внимание на то, что одни точки лежат чуть ниже, а другие чуть выше прямой линии. Это значит, что для одного размера рекламного объявления коэффициент пропорциональности чуть больше, для другого — чуть меньше. А этот вывод уже не очевиден. Если совместить его с выбором цвета рекламы и букв, то можно добиться очень большого эффекта при тех же затратах. При прочих равных условиях, очевидно, следует выбрать точку, лежащую ниже всех от построенной прямой, и заказать прямоугольник рекламы соответствующего размера. Полученная формула может быть использована также при прогнозировании цены рекламы. Предположим, вы захотите заказать рекламу нестандартного размера. Используя эту формулу, найдете ту цену, которую с вас запросят в газете. Рассчитать это можно в той же таблице следующим образом.</p>

<p align="justify"><i>Шаг 6.</i> Добавьте в таблицу еще одну переменную. Нажмите кнопку Varef — Variables (Переменные) и выберите команду Add... (Добавить). В диалоговом окне Add Variables (Добавить переменные) укажите диапазон новых переменных.Нажмите кнопку ОК.</p>

<center><img src="Рисунки/2/рис.2.33.png"></center>

<p align="center"><b>Рис. 2.33. Окно добавления переменных</b></p>

<p align="justify">Одна переменная будет добавлена в таблицу после переменной ЦЕНА. Таблица примет вид:</p>

<center><img src="Рисунки/2/рис.2.34.png"></center>

<p align="center"><b>Рис. 2.34. Таблица с новой переменной NEWVAR</b></p>

<p align="justify">Дважды щелкните мышью по имени NEWVAR в электронной таблице. На экране появится окно спецификации переменной NEWVAR. В поле Long name запишите формулу = 316500 + 32528.195*V2.</p>

<center><img src="Рисунки/2/рис.2.35.png"></center>

<p align="center"><b>Рис. 2.35. Задание формулы вычисления цены</b></p>

<p align="justify">Эта запись дает программе инструкцию вычислить цену. Нажмите кнопку ОК. Таблица выглядит следующим образом:</p>

<center><img src="Рисунки/2/рис.2.36.png"></center>

<p align="center"><b>Рис. 2.36. Таблица с новыми значениями цены</b></p>

<p align="justify">Введите теперь какое угодно значение длины, например, запишите в 5-м случае переменной ДЛИНА значение 209, в пятой ячейке переменной NEWVAR автоматически получите значение цены рекламы, имеющей форму прямоугольника с шириной 47 и длиной 209 мм. Задавая любые значения длины, вы получите в ячейках переменной NEWVAR прогнозируемую цену рекламы.</p>

<center><img src="Рисунки/2/рис.2.37.png"></center>

<p align="center"><b>Рис. 2.37. Таблица с подсчитанной ценой для рекламы длиной 209 мм</b></p>

<p align="justify"><b>Пример: исследование эффективности рекламной кампании</b></p>

<p align="justify">Рассмотрим следующие данные об обороте фирмы до и после публикации рекламы (рис. 2.38).</p>

<center><img src="Рисунки/2/рис.2.38.png"></center>

<p align="center"><b>Рис. 2.38. Ежедневный оборот фирмы в млн. руб. до рекламы и после рекламы</b></p>

<p align="justify">В первой колонке приведены данные ежедневного оборота фирмы за 15 дней до публикации рекламы. Во второй — данные о ежедневном обороте фирмы в течение 15 дней после публикации. Вопрос в том, есть ли значимый эффект от рекламы. Или, другими словами, увеличился ли оборот после проведения рекламной кампании.</p>

<p align="justify">Создайте файл данных, как рассказано во Введении, и назовите его reklama3.sta.</p>

<p align="justify"><i>Шаг 1.</i> Откройте модуль Basic Statistics/Tables (Основные статистики/таблицы). Откройте из Windows переключатель модулей системы STATISTICA и выделите в нем строку Basic Statistics/Tables (Основные статистики/таблицы). Щелкните по ней мышью либо нажмите кнопку Switch То  (Переключиться в). Перед вами появится стартовая панель модуля, в которой предлагается меню методов и открывается файл данных, которые будут обрабатываться (рис. 2.39).</p>

<center><img src="Рисунки/2/рис.2.39.png"></center>

<p align="center"><b>Рис. 2.39. Стартовая панель модуля Основные статистики и таблицы</b></p>

<p align="justify"><i>Шаг 2.</i> Откройте файл данных, после чего инициируйте кнопку Open Data(Окрыть данные) в правом нижнем углу окна. Щелкнув по ней, вы увидите следующее окно выбора файла:</p>

<center><img src="Рисунки/2/рис.2.40.png"></center>

<p align="center"><b>Рис. 2.40. Окно выбора файла</b></p>

<p align="justify">Выберите файл reklama3.sta. После того как файл открыт, вы вновь окажетесь в стартовом окне модуля.</p>

<p align="justify"><i>Шаг 3.</i> Выберите в предлагаемом меню строчку t-test for dependent samples (t-критерий для зависимых выборок) и нажми те кнопку ОК. На экране появится диалоговое окно T-test for Dependent Samples (Т-критерий для зависимых выборок):</p>

<center><img src="Рисунки/2/рис.2.41.png"></center>

<p align="center"><b>Рис. 2.41. Окно t-критерия</b></p>

<p align="justify"><i>Шаг 4.</i> Выберите переменные для анализа. Нажмите кнопку Variables (Переменные). После нажатия кнопки Variables (Переменные) откроется окно Select one or two variable lists (Выбрать один или два списка переменных).</p>

<center><img src="Рисунки/2/рис.2.42.png"></center>

<p align="center"><b>Рис. 2.42. Выбор переменных для анализа</b></p>

<p align="justify">В левом списке выберите переменную ДО, в правом — переменную ПОСЛЕ. Нажмите кнопку ОК. Вы вновь вернулись в диалоговое окно t-test for dependent samples (t-крите-рий для зависимых выборок).</p>

<p align="justify"><i>Шаг 5.</i> Визуализация данных. В диалоговом окне t-test for dependent samples (t-критерий для зависимых выборок) нажмите кнопку Box & Wisker plots (Графики «ящики с усами»). В появившемся окне Box & Wisker Туре определите тип графика. Выберите Mean/SE/SD (Среднее/Стандартная ошибка/ Стандартное отклонение):</p>

<center><img src="Рисунки/2/рис.2.43.png"></center>

<p align="center"><b>Рис. 2.43. Определение типа графика «ящики с усами»</b></p>

<p align="justify">На экране появится график «ящики с усами» переменных для ДО и ПОСЛЕ.</p>

<center><img src="Рисунки/2/рис.2.44.png"></center>

<p align="center"><b>Рис. 2.44. График «ящики с усами» для переменных «оборот фирмы» ДО и ПОСЛЕ рекламы</b></p>

<p align="justify"><i>Шаг 6.</i> В окне t-test for dependent samples (t-критерий для зависимых выборок) выберите опцию Detailed table of results (Подробная таблица результатов). Нажмите далее кнопку Т-tests (Т-критерии). На экране появится следующая таблица результатов (рис. 2.45).</p>

<center><img src="Рисунки/2/рис.2.45.png"></center>

<p align="center"><b>Рис. 2.45. Электронная таблица результатов</b></p>

<p align="justify"><i>Шаг 7.</i> Вывод: результаты статистического анализа показали высокозначимое увеличение оборота фирмы после проведения рекламной кампании.</p>

<p align="justify"><i>Упражнение.</i> Ниже приведены данные ежедневного оборота фирмы за 10 дней до и в течение 10 дней после рекламной кампании.</p>

<center><img src="Рисунки/2/рис.2.46.png"></center>

<p align="center"><b>Рис. 2.46. Ежедневный оборот фирмы в млн. руб. до и после рекламной кампании</b></p>

<p align="justify">Ответьте на вопрос: имеется ли значимое увеличение оборота после проведения рекламной кампании? Уровень значимости принять 0.1.</p>

</body></html>

 

Регрессионный анализ.html

<html>

<body bgcolor="F0FFFF" text="000080">

<b><h2>3. Регрессионный анализ в системе Statistica - модуль Multiple Regression (Множественная регрессия)</h2></b>

<a name="#3.1"><b><h3>3.1. Введение</h3></b></a>

<p align="justify">Типичной практической задачей является задача определения зависимостей в системе данных. Предположим, вы наблюдаете значения пары переменных X и Y и хотите найти зависимость между ними.</p>

<p align="justify">Переменная X носит название независимой переменной, или предиктора, переменная Y называется зависимой переменной, или откликом. Данная терминология связана с тем, что мы хотим определить именно зависимость Y от X или предсказать, какими будут значения Y при данных значениях X. Значение переменной X в i-м опыте будем обозначать через X(i), соответствующее значение величины Y обозначим через Y(i), 0 < i <=n.</p>

<p align="justify">Итак, вы наблюдаете значения независимой X(i) и соответствующие им значения зависимой Y(i), 0 < i <=n, и хотите оценить зависимость Y от X. В статистике подобные задачи решаются в рамках регрессионной модели. Мы будем рассматривать самую простую регрессионную модель — линейную. Однако и в рамках этой модели могут быть решены самые разнообразные практические задачи. Регрессионный анализ в системе STATISTICA проводится в модуле Множественная регрессия (Multiple regression).</p>

<p align="justify"><b>Постановка задачи</b></p>

<p align="justify">Общая задача состоит в том, чтобы по наблюдениям:</p>

<ul> <li>оценить параметры модели В1, ВО наилучшим образом;

<li>построить доверительные интервалы для В1, ВО;

<li>проверить гипотезу о значимости регрессии;

<li>оценить степень адекватности модели и т.д. </ul>

<p align="justify"><b>Математическое решение задачи</b></p>

<p align="justify">Мы рассмотрим лишь первую часть задачи — оценивание неизвестных параметров В1, ВО наилучшим образом. Итак, пусть наблюдаемые данные на плоскости (X,Y) имеют вид (рис. 3.1.):</p>

Информация о работе Разработка электронного пособия по спецкурсу «Классификация экспериментальных данных»