Однофакторный и двухфакторный дисперсионный анализ

Автор работы: Пользователь скрыл имя, 06 Ноября 2013 в 22:09, курсовая работа

Описание работы

Дисперсионный анализ – статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента. Он также позволяет планировать условия проведения последующих аналогичных экспериментов.
На практике дисперсионный анализ позволяет установить насколько существенным является влияние некоторого качественного или количественного фактора F, который имеет p уровней, на изучаемую величину X.

Содержание работы

Введение 3
1 Постановка задачи 3
2 Теоретическая часть 5
3 Описание модулей Statistica 8
4 Проведение расчетов и анализ результатов 11
Выводы 14
Список литературы 15

Файлы: 1 файл

КурсовойОтчет.doc

— 524.00 Кб (Скачать файл)

 

Таблица 2 исходных данных.

Фактор B

Фактор A

A1     A2     ...       Ak

Средние по строкам (оценки вкладов B)

B1

B2

...

Bn

x1     x12    ...       x1k

x21    x22    ...       x2k

      ... 

xn1    xn2    ...       xnk

x1·=(c+b1)^

x2·=(c+b2)^

...

xn·=(c+bn)^

Средние по столбцам

(оценки вкладов A)

 x·1=      x·2=          x·k=

(c+a1)^   (c+a2)^   c+ak)^

x··=c^


 

В таблице ( )^ означает оценку. По имеющимся наблюдениям требуется проверить предположение об отсутствии влияния фактора A (или B) на результат измерения, т.е. проверить гипотезу

                      HA:  a1 = a2 = .  .  . = ak = 0                                              (13)

Основой процедуры проверки гипотезы является сравнение двух статистически независимых оценок дисперсии s2 . Одна из них, s2* оценивает дисперсию вне зависимости от того, верна или нет HA. Другая, s2** оценивает дисперсию, если HA верна; если же HA не верна, то она имеет тенденцию принимать увеличенные значения.

 

 

 

 

    1. Описание модулей Statistica

Однофакторный дисперсионный  анализ

 

Выполнение  в пакете STATiSTICA

Будем выполнять в  модуле Basic Statistics and Tables (можно выполнять также в модуле ANOVA/MANOVA). Далее выполним:

 

Рис. 2. Дисперсионный анализ данных

 

One - Way ANOVA (Analys Of Variances) - Analysis: Detailed Analysis Of Individual tables, Variabbles:

В закладке Variables выбираются «Зависимые переменные» (Dependent variable) и «Группирующие переменные» (Grouping variables) (Рисунок 3).

 

Рис. 3. Окно выбора переменных

 

 

В закладке Codes for grouping variables выбираются группы факторов, в нашем примере переменная Technology разбивается на группы Т0, Т1 и Т2. Для выбора всех групп необходимо нажать на кнопку «All» (Рисунок 4).

 

Рис. 4. Выбор групп факторов

 

В окне настройки результирующих таблиц (рисунок 5) необходимо выбрать группирующие переменные (Grouping Variables) (рисунок 6), снять галочку с позиции Summary table of means и выбрать позицию Analysis of variance.

 

Рис. 5. Настройка результатов

 

Рис. 6. Выбор группирующих переменных

 

Двухфакторный дисперсионный анализ

 

Выполнение  в пакете  STATISTICA

Создадим таблицу с  тремя столбцами (Х - урожайность, А - сорт пшеницы, в - тип удобрения) и 5´4 = 20 строками. В Х введем последовательно 4 столбца таблицы 3, в А и В - соответствующие значения А1 ¸ А4, В1 ¸ В5.

Анализ выполняем в  модуле ANOVA/MANOVA:

 

Рис. 11. Дисперсионный анализ данных

 

Нажав кнопку ОК, получим следующее окно рис. 12:

Рис. 12 Окно многофакторного анализа.

В закладке Variables выбираем Dependent variable и Categorical predictors (factors) рис. 13:

Рис.13. Окно выбора переменных

 

 

Рис.14. Окно анализа

 

    1. Проведение расчетов и анализ результатов

Однофакторный дисперсионный  анализ

 

После данных действий нажав на кнопку «Ok», можно получить результаты анализа, которые представлены на рисунке 7.

 

 

Рис. 7. Результаты дисперсионного анализа

 

Полученные результаты:

 

  • SS (Sum of Squares) Effect – сумма квадратов факторов;
  • df Effect – число степеней свободы фактора;
  • MS (Mean Square) Effect – средний квадрат фактора;
  • SS Error – сумма квадратов ошибки;
  • df Error – число степеней свободы ошибки;
  • MS Error – средний квадрат ошибки;
  • F – значение статистики Фишера.
  • р – вероятность нулевой гипотезы.

 

Анализ резульатов:

 

Имея вероятность принятия гипотезы Н0 = 0,001496 можно утверждать, что она не подтверждается при 5% уровне значимости и следует принимать гипотезу Н1, т.е. технология влияет на производительность

Вывод: фактор Т (технология) влияет на Р (производительность).

(вероятность 0.0015 слишком  мала, чтобы поверить в равенство  средних по Т0 и Т1).

 

Возникает вопрос: какие технологии можно считать значимо различными? Для ответа на этот вопрос возвращаемся в окно Descriptive Stats and  ... Results и выполняем Post - hoc comparasion of means  (сравнение средних) по методу Шеффе Sheffe test.

 

 

Рис.8. Выбор метода сравнения данных

 

Рис.9. Результат сравнения по методу Шеффе

 

Наблюдаем таблицу, в  которой указаны уровни значимости гипотез о равенстве средних для всех пар уровней фактора Т; видим, что технологии Т0 и Т1 следует считать различными

 Двухфакторный дисперсионный анализ

Наблюдаем таблицу Summery of All effects (итоги по всем влияниям); в столбце MS effects (средние квадраты) оценки  sA = 9.51, sB = 11.55, s0  = 5.68. Указываются значения статистик Фишера F (дисперсионные отношения) и уровни значимости p.

Результаты анализа  представлены на рис. 15.

 

Рис. 15. Результаты дисперсионного анализа

 

SS (Sum of Squares) Effect – сумма квадратов факторов;

Degr. of Freedom – число степеней свободы фактора;

MS (Mean Square) Effect – средний квадрат фактора;

F – значение критерия Фишера;  р – вероятность нулевой гипотезы.

Intersept – учитывает в исходной модели  влияние двух факторов;

Error – остатки, обусловленные разностью исходных данных и модели

 

Результаты двухфакторного дисперсионного анализа приведены  в таблице 4. Вычисленные уровни значимости  0.225 и 0.153  говорят о том, что  дисперсионный анализ не обнаруживает влияния сорта и типа удобрения на урожайность.

Таблица 4

Источник

рассеяния

(вариации)

Сумма

квадратов

Степени

Свободы

Средний

квадрат

(оценка

дисперсии)

F - отношение

Уровень

Значимости

Фактор A

Фактор B

Случайность

(остатки)

QA= 28.55

QB= 46.20

Q0= 68.20

3

4

12

sA2**=  9.52

sB2**= 11.55

s2*   =   5.68  

    1.674

    2.032

   0.225

   0.153   


 

Выводы

Дисперсионный анализ предназначен для оценки влияния различных, но контролируемых факторов на результат эксперимента. Пусть результатом эксперимента является некоторая случайная величина Y, называемая также откликом. На значения случайной величины Y влияет фактор Х, состоящий из n-уровней. В зависимости от количества факторов, включенных в анализ, различают однофакторный, двухфакторный и многофакторный дисперсионный анализ.

Проведение дисперсионного анализа возможно, если результаты измерений являются независимыми случайными величинами, подчиняющимися нормальному закону распределения с одинаковыми дисперсиями. При однофакторном дисперсионном анализе выявляется степень влияния одного фактора Х на математическое ожидание отклика М(Y). Фактор может быть количественным (скорость резания, размер заготовки, и т.п.) или качественным (модель станка, марка инструментального материала и т.п.).

В процессе эксперимента фактор Х поддерживают на n-уровнях. На каждом уровне фактора проводится m дублирующих опытов. Значение m может быть одинаковым или разным для каждого из уровней. Результаты всех измерений представляют в виде таблицы, которую называют матрицей наблюдений.

 

 

 

 

 

4. Список литературы

  1. Шеффе Г. Дисперсионный анализ. — М., 1980.
  2. Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006.
  3. Лагутин М. Б. Наглядная математическая статистика. В двух томах. — М.: П-центр, 2003.
  4. Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ

Информация о работе Однофакторный и двухфакторный дисперсионный анализ