Автор работы: Пользователь скрыл имя, 06 Ноября 2013 в 22:09, курсовая работа
Дисперсионный анализ – статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента. Он также позволяет планировать условия проведения последующих аналогичных экспериментов.
На практике дисперсионный анализ позволяет установить насколько существенным является влияние некоторого качественного или количественного фактора F, который имеет p уровней, на изучаемую величину X.
Введение 3
1 Постановка задачи 3
2 Теоретическая часть 5
3 Описание модулей Statistica 8
4 Проведение расчетов и анализ результатов 11
Выводы 14
Список литературы 15
Таблица 2 исходных данных.
Фактор B |
Фактор A A1 A2 ... Ak |
Средние по строкам (оценки вкладов B) |
B1 B2 ... Bn |
x1 x12 ... x1k x21 x22 ... x2k ... xn1 xn2 ... xnk |
x1·=(c+b1)^ x2·=(c+b2)^ ... xn·=(c+bn)^ |
Средние по столбцам (оценки вкладов A) |
x·1= x·2= x·k= (c+a1)^ (c+a2)^ c+ak)^ |
x··=c^ |
В таблице ( )^ означает оценку. По имеющимся наблюдениям требуется проверить предположение об отсутствии влияния фактора A (или B) на результат измерения, т.е. проверить гипотезу
HA: a1 = a2 = . . . = ak =
0
Основой процедуры проверки гипотезы является сравнение двух статистически независимых оценок дисперсии s2 . Одна из них, s2* оценивает дисперсию вне зависимости от того, верна или нет HA. Другая, s2** оценивает дисперсию, если HA верна; если же HA не верна, то она имеет тенденцию принимать увеличенные значения.
Выполнение в пакете STATiSTICA
Будем выполнять в модуле Basic Statistics and Tables (можно выполнять также в модуле ANOVA/MANOVA). Далее выполним:
Рис. 2. Дисперсионный анализ данных
One - Way ANOVA (Analys Of Variances) - Analysis: Detailed Analysis Of Individual tables, Variabbles:
В закладке Variables выбираются «Зависимые переменные» (Dependent variable) и «Группирующие переменные» (Grouping variables) (Рисунок 3).
Рис. 3. Окно выбора переменных
В закладке Codes for grouping variables выбираются группы факторов, в нашем примере переменная Technology разбивается на группы Т0, Т1 и Т2. Для выбора всех групп необходимо нажать на кнопку «All» (Рисунок 4).
Рис. 4. Выбор групп факторов
В окне настройки результирующих таблиц (рисунок 5) необходимо выбрать группирующие переменные (Grouping Variables) (рисунок 6), снять галочку с позиции Summary table of means и выбрать позицию Analysis of variance.
Рис. 5. Настройка результатов
Рис. 6. Выбор группирующих переменных
Двухфакторный дисперсионный анализ
Выполнение в пакете STATISTICA
Создадим таблицу с тремя столбцами (Х - урожайность, А - сорт пшеницы, в - тип удобрения) и 5´4 = 20 строками. В Х введем последовательно 4 столбца таблицы 3, в А и В - соответствующие значения А1 ¸ А4, В1 ¸ В5.
Анализ выполняем в модуле ANOVA/MANOVA:
Рис. 11. Дисперсионный анализ данных
Нажав кнопку ОК, получим следующее окно рис. 12:
Рис. 12 Окно многофакторного анализа.
В закладке Variables выбираем Dependent variable и Categorical predictors (factors) рис. 13:
Рис.13. Окно выбора переменных
Рис.14. Окно анализа
После данных действий нажав на кнопку «Ok», можно получить результаты анализа, которые представлены на рисунке 7.
Рис. 7. Результаты дисперсионного анализа
Полученные результаты:
Анализ резульатов:
Имея вероятность принятия гипотезы Н0 = 0,001496 можно утверждать, что она не подтверждается при 5% уровне значимости и следует принимать гипотезу Н1, т.е. технология влияет на производительность
Вывод: фактор Т (технология) влияет на Р (производительность).
(вероятность 0.0015 слишком мала, чтобы поверить в равенство средних по Т0 и Т1).
Возникает вопрос: какие технологии можно считать значимо различными? Для ответа на этот вопрос возвращаемся в окно Descriptive Stats and ... Results и выполняем Post - hoc comparasion of means (сравнение средних) по методу Шеффе Sheffe test.
Рис.8. Выбор метода сравнения данных
Рис.9. Результат сравнения по методу Шеффе
Наблюдаем таблицу, в которой указаны уровни значимости гипотез о равенстве средних для всех пар уровней фактора Т; видим, что технологии Т0 и Т1 следует считать различными
Наблюдаем таблицу Summery of All effects (итоги по всем влияниям); в столбце MS effects (средние квадраты) оценки sA = 9.51, sB = 11.55, s0 = 5.68. Указываются значения статистик Фишера F (дисперсионные отношения) и уровни значимости p.
Результаты анализа представлены на рис. 15.
Рис. 15. Результаты дисперсионного анализа
SS (Sum of Squares) Effect – сумма квадратов факторов;
Degr. of Freedom – число степеней свободы фактора;
MS (Mean Square) Effect – средний квадрат фактора;
F – значение критерия Фишера; р – вероятность нулевой гипотезы.
Intersept – учитывает в исходной модели влияние двух факторов;
Error – остатки, обусловленные разностью исходных данных и модели
Результаты двухфакторного дисперсионного анализа приведены в таблице 4. Вычисленные уровни значимости 0.225 и 0.153 говорят о том, что дисперсионный анализ не обнаруживает влияния сорта и типа удобрения на урожайность.
Таблица 4
Источник рассеяния (вариации) |
Сумма квадратов |
Степени Свободы |
Средний квадрат (оценка дисперсии) |
F - отношение |
Уровень Значимости |
Фактор A Фактор B Случайность (остатки) |
QA= 28.55 QB= 46.20 Q0= 68.20 |
3 4 12 |
sA2**= 9.52 sB2**= 11.55 s2* = 5.68 |
1.674 2.032 |
0.225 0.153 |
Выводы
Дисперсионный анализ предназначен для оценки влияния различных, но контролируемых факторов на результат эксперимента. Пусть результатом эксперимента является некоторая случайная величина Y, называемая также откликом. На значения случайной величины Y влияет фактор Х, состоящий из n-уровней. В зависимости от количества факторов, включенных в анализ, различают однофакторный, двухфакторный и многофакторный дисперсионный анализ.
Проведение дисперсионного анализа возможно, если результаты измерений являются независимыми случайными величинами, подчиняющимися нормальному закону распределения с одинаковыми дисперсиями. При однофакторном дисперсионном анализе выявляется степень влияния одного фактора Х на математическое ожидание отклика М(Y). Фактор может быть количественным (скорость резания, размер заготовки, и т.п.) или качественным (модель станка, марка инструментального материала и т.п.).
В процессе эксперимента фактор Х поддерживают на n-уровнях. На каждом уровне фактора проводится m дублирующих опытов. Значение m может быть одинаковым или разным для каждого из уровней. Результаты всех измерений представляют в виде таблицы, которую называют матрицей наблюдений.
4. Список литературы
Информация о работе Однофакторный и двухфакторный дисперсионный анализ