Контрольная работа по "Математическая статистика"

Автор работы: Пользователь скрыл имя, 12 Декабря 2013 в 22:40, контрольная работа

Описание работы

Из генеральной совокупности , распределенной по нормальному закону, извлечена выборка. Требуется:
1. Составить вариационный, статистический и выборочный ряды распределения; найти размах выборки;
По полученному распределению выборки:
2. Построить полигон относительных частот;
3. Построить график эмпирической функции распределения;
4. Вычислить выборочную среднюю, выборочную дисперсию, выборочное исправленное среднее квадратическое отклонение, моду и медиану;

Содержание работы

Задача 1 3
Задача 2 7
Задача 3 13
Задача 4 15
Задача 5 24
Задача 6 27

Файлы: 1 файл

статистика.docx

— 384.31 Кб (Скачать файл)

С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

Проверка гипотез относительно коэффициентов линейного уравнения регрессии.

1) t-статистика. Критерий  Стьюдента. 

С помощью МНК мы получили лишь оценки параметров уравнения регрессии, которые характерны для конкретного  статистического наблюдения (конкретного  набора значений x и y).

Для оценки статистической значимости коэффициентов регрессии  и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы  каждого из показателей. Выдвигается  гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.

Чтобы проверить, значимы  ли параметры, т.е. значимо ли они  отличаются от нуля для генеральной  совокупности используют статистические методы проверки гипотез.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля  параметра или  статистической характеристики в генеральной  совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве  нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости α=0.05.

В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.

Найденное по данным наблюдений значение  t-критерия (его еще называют наблюдаемым или фактическим) сравнивается с табличным (критическим) значением, определяемым по таблицам распределения  Стьюдента (которые обычно приводятся в конце учебников и практикумов по статистике или эконометрике).

Табличное значение определяется в зависимости от уровня значимости (α) и числа степеней свободы, которое  в случае линейной парной регрессии  равно (n-2), n-число наблюдений.

Если фактическое значение  t-критерия больше табличного (по модулю), то основную гипотезу отвергают и  считают, что с вероятностью (1-α) параметр или статистическая характеристика в генеральной совокупности значимо  отличается от нуля.

Если фактическое значение  t-критерия меньше табличного (по модулю), то нет оснований отвергать основную гипотезу, т.е. параметр или статистическая характеристика в генеральной совокупности незначимо отличается от нуля при  уровне значимости α.

tкрит (n-m-1;α/2) = (12;0.025) = 2.179

 

 

Поскольку 13.51  >  2.179, то статистическая значимость коэффициента регрессии b подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

 

 

Поскольку 3.97  >  2.179, то статистическая значимость коэффициента регрессии a подтверждается (отвергаем гипотезу о равенстве нулю этого коэффициента).

Доверительный интервал для коэффициентов уравнения  регрессии.

Определим доверительные  интервалы коэффициентов регрессии, которые с надежность 95%  будут  следующими:

(b - tкрит Sb; b + tкрит Sb)

(0.54 - 2.179 • 0.0402; 0.54 + 2.179 •  0.0402)

(0.46;0.63)

С вероятностью 95% можно утверждать, что значение данного параметра  будут лежать в найденном интервале.

(a - tкрит Sa; a + tкрит Sa)

(9.32 - 2.179 • 2.35; 9.32 + 2.179 •  2.35)

(4.2;14.43)

С вероятностью 95% можно утверждать, что значение данного параметра  будут лежать в найденном интервале.

2) F-статистика. Критерий  Фишера.

Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.

Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение  дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной  оценки дисперсии остаточной последовательности для данной модели.

Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.

 

где m – число факторов в модели.

Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:

1. Выдвигается нулевая  гипотеза о том, что уравнение  в целом статистически незначимо: H0: R2=0 на уровне значимости α.

2. Далее определяют фактическое  значение F-критерия:

 

 

где m=1 для парной регрессии.

3. Табличное значение  определяется по таблицам распределения  Фишера для заданного уровня  значимости, принимая во внимание, что число степеней свободы  для общей суммы квадратов  (большей дисперсии) равно 1 и  число степеней свободы остаточной  суммы квадратов (меньшей дисперсии)  при линейной регрессии равно  n-2.

Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости α. Уровень значимости α - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно α принимается равной 0,05 или 0,01.

4. Если фактическое значение F-критерия меньше табличного, то  говорят, что нет основания  отклонять нулевую гипотезу.

В противном случае, нулевая  гипотеза отклоняется и с вероятностью (1-α) принимается альтернативная гипотеза о статистической значимости уравнения  в целом.

Табличное значение критерия со степенями свободы k1=1 и k2=12, Fтабл = 4.75

Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

Задача 5

Предположим, что в педагогическом эксперименте участвовали три группы студентов по 10 человек в каждой. В группах применили различные методы обучения: в первой – традиционный , во второй – основанный на компьютерных технологиях , в третьей – метод, широко использующий задания для самостоятельной работы . Знания оценивались по десятибалльной системе.

Требуется обработать полученные данные об экзаменах и сделать  заключение о том, значимо ли влияние метода преподавания, приняв за уровень значимости .

Результаты экзаменов  заданы таблицей, – уровень фактора – оценка -го учащегося обучающегося по методике .

5.10.

 

1

2

3

4

5

6

7

8

9

10

Уровень фактора

3

6

5

6

8

3

5

4

5

3

6

8

5

10

9

9

8

7

9

10

5

4

4

6

6

6

8

6

7

8


 

Решение

Поместим в таблице  экзаменационные оценки  ( ), их отклонения от общей средней ( ) и квадраты этих отклонений . Уровни фактора означают: - традиционный метод, - применение компьютерной технологии, - увеличение доли самостоятельной работы.

Номер испытан.1

Уровни фактора  (различные методы преподавания)

Оценки

Оценки

Оценки

1

3

-2

4

6

-2

4

5

-1

1

2

6

1

1

8

0

0

4

-2

4

3

5

0

0

5

-3

9

4

-2

4

4

6

1

1

10

2

4

6

0

0

5

8

3

9

9

1

1

6

0

0

6

3

-2

4

9

1

1

6

0

0

7

5

0

0

8

0

0

8

2

4

8

4

-1

1

7

-1

1

6

0

0

9

5

0

0

9

1

1

7

1

1

10

3

-2

4

10

2

4

8

2

4

Груп. сред.2

4,8

   

8,1

   

6,0

   

S

 

24

 

25

 

18


1 Номер испытания (порядковый номер студента группы).

2 Групповая средняя (средний балл группы).

Общая средняя равна

.

; .

.

В нашем примере p=3 (p - количество факторов), q=10 (q - количество студентов), поэтому для степеней свободы получаются следующие значения:      pq-1=29, p-1=2, p(q-1)=27.

Находим выборочные дисперсии: ; ; .

Примем в качестве нулевой  гипотезу о том, что выявленное различие групповых средних (средних баллов) случайно, т.е. при уровне значимости a=0,05 средние баллы совпадают.

Для проверки этой гипотезы следует воспользоваться F-критерием  Фишера-Снедекора. Вычисляется .

По таблицам находится  критическая точка  . Здесь a - уровень значимости, - число степеней свободы для дисперсии (в числитель формулы вписывается большая из дисперсий), - число степеней свободы для меньшей дисперсии . В случае нулевая гипотеза принимается, в случае она отвергается.

В примере  .

Таким образом, нулевая гипотеза отвергается, и следует считать, что средние баллы групп различаются "значимо". В частности, повышение качества знаний под воздействием уровня фактора F нельзя считать случайным.

Задача 6

По промышленным предприятиям города имеются следующие данные за отчетный год:

№ предприятия

Объем продукции, млн.руб.

Среднегодовая стоимость  Основных средств, млн.руб.

Среднесписочное число работников, чел.

Прибыль, млн.руб.

1

197,7

10,0

900

13,5

2

592,0

22,8

1500

136,2

3

465,5

18,4

1412

97,6

4

296,2

12,6

1200

44,4

5

584,1

22,0

1485

146,0

6

480,0

19,0

1420

110,4

7

578,5

21,6

1390

138,7

8

204,7

9,4

817

30,6

9

466,8

19,4

1375

111,8

10

292,2

13,6

1200

49,6

11

423,1

17,6

1365

105,8

12

192,6

8,8

850

30,7

13

360,5

14,0

1290

64,8

14

208,3

10,2

900

33,3

Информация о работе Контрольная работа по "Математическая статистика"