Статистическая обработка выборки

Автор работы: Пользователь скрыл имя, 08 Декабря 2012 в 08:24, лабораторная работа

Описание работы

работа содержит 7 заданий с решениями по "Статистике"

Файлы: 1 файл

Лабораторная работа тервер.doc

— 1.39 Мб (Скачать файл)

Поскольку  , и   при  , то и  , что означает состоятельность оценки  .► 

 

Замечание. Можно доказать, что все выборочные начальные и центральные моменты являются состоятельными оценками соответствующих моментов генеральной совокупности, если последние существуют. Однако все эти оценки, кроме  , являются смещёнными (они асимптотически не смещены).

 

 

4.5. Эффективность статистической оценки.

Пусть имеются две несмещённые  оценки   и   одного и того же параметра  . Если дисперсии этих оценок удовлетворяют неравенству   для любого фиксированного  , то следует предпочесть оценку  , поскольку разброс этой оценки относительно значения   меньше и, следовательно, она при одном и том же   даёт более точное значение искомого параметра. В таких случаях говорят, что оценка   эффективнее оценки  .

Если существует такая несмещённая  оценка   параметра  , что для любой другой несмещённой оценки   того же параметра выполняется неравенство  , то оценка   называется эффективной оценкой параметра 

При проверке эффективности оценок используют неравенство Крамера-Рао: для любой несмещённой оценки   параметра   выполняется условие                                                            

                                                          (16)

где

.

Пусть для некоторой несмещённой  оценки   неравенство (16) превращается в равенство. Это означает, что дисперсия   достигла нижней границы для дисперсий всех несмещённых оценок параметра  , т.е. оценка   является эффективной.

 

Исследуем эффективность несмещённой  оценки   параметра  .

Левая часть неравенства (16) была найдена  ранее:                                                               

.                                                              (17)

Подсчитаем выражение в правой части (16). В данном случае генеральная  совокупность   непрерывна и 

.

Поэтому

.

Таким образом, правая часть (16) равна                                                                

.                                                     (18)

Сравнивая (17) и (18), убеждаемся в том, что соотношение (16) превращается в  равенство. Это означает эффективность  выборочного среднего   как оценки математического ожидания нормальной генеральной совокупности  .

 

 

 

5. Интервальное оценивание параметров.

5.1. Построение доверительного интервала для математического ожидания нормально распределеной случайной величины при известной дисперсии.

Для начала представим теоретическую  справку.

1. Пусть для оценки т извлечена выборка  х1, х2, ..., хп объема n. Пусть .

2. Составим случайную величину  . Нетрудно показать, что случайная величина  u  имеет стандартизированное нормальное распределение, т.е. u~N(0,1) ( ).

3. Зададим уровень значимости  α.

4. Применяя формулу нахождения вероятности отклонения нормальной величины от математического ожидания, имеем:

. (10)

Это означает, что доверительный  интервал накрывает неизвестный параметр т (мат. ожидание) с надежностью 1 – α. Точность оценки определяется величиной . Отметим, что число  определяется по таблице значений функции Лапласа из равенства .

В нашем случае , , n=150.

Для определения 95%-го доверительного интервала найдем критическую точку   = u0,025  по таблице значений функции Лапласа

.

Тогда по формуле (1) построим доверительный  интервал:

.

Для определения 99%-го доверительного интервала найдем критическую точку   = u0,005  по таблице значений функции Лапласа

.

Тогда по формуле (1) построим доверительный  интервал:

.

 

5.2. Построение доверительного интервала для дисперсии нормально распределенной случайной величины.

Представим теоретическую справку.

1. В качестве точечной оценки дисперсии D(X) используется исправленная выборочная дисперсия

,

которой соответствует стандартное  отклонение .

2. При нахождении доверительного интервала для дисперсии в этом случае вводится статистика  ,  имеющая –распределение с числом степеней свободы v = п – 1.

3. Задается требуемый уровень  значимости α.

4. Тогда, используя таблицу критических  точек  распределения,  нетрудно указать критические точки , для которых будет выполняться следующее равенство:

.                          (19)

После некоторых несложных преобразований получаем, что

.                             (20)

Таким образом, доверительный интервал

накрывает дисперсию  с надежностью 1– α. А доверительный интервал

с надежностью 1 – α накрывает среднеквадратичное отклонение .

 

Для нашего примера рассмотрим сначала . Число степеней свободы равно n–1=150–1=149. Тогда

,
.

Следовательно, . Откуда получаем, что доверительный интервал для дисперсии данной генеральной совокупности принимает вид .

Из представленных рассуждений  несложно получить доверительный интервал для среднеквадратичного отклонения данной генеральной совокупности: или .

Рассмотрим также случай, что  уровень значимости . Число степеней свободы по-прежнему равно n–1=150–1=149. Тогда

,
.

Следовательно, . Откуда получаем, что доверительный интервал для дисперсии данной генеральной совокупности принимает вид .

Аналогично примеру выше получим  доверительный интервал для среднеквадратичного отклонения данной генеральной совокупности: или .

 

6. Проверка гипотез.

6.1. Применим критерий согласия Пирсона для проверки гипотезы о виде распределения. Критерий согласия Пирсона (χ2) применяют для проверки гипотезы о соответствии эмпирического распределения предполагаемому теоретическому распределению F(x) при большом объеме выборки (n ≥ 100). Критерий применим для любых видов функции F(x), даже при неизвестных значениях их параметров, что обычно имеет место при анализе результатов механических испытаний. В этом заключается его универсальность.

Статистикой критерия Пирсона служит величина

                                                     (21)

где pj – вероятность попадания изучаемой случайной величины в j-й интервал, вычисляемая в соответствии с гипотетическим законом распределением F(x).

Нулевую гипотезу о соответствии выборочного  распределения теоретическому закону F(x) проверяют путем сравнения вычисленной по формуле (21) величины с критическим значением , найденным по таблице для уровня значимости α и числа степеней свободы k = L – m – 1. Здесь L – число интервалов после объединения; m – число параметров, оцениваемых по рассматриваемой выборке. Если выполняется неравенство

                                                           (22)

 то нулевую гипотезу не  отвергают. При несоблюдении указанного  неравенства принимают альтернативную гипотезу о принадлежности выборки неизвестному распределению.

Итак, воспользуемся критерием  Пирсона для проверки гипотезы о  нормальности распределения генеральной  совокупности. Промежуточные данные занесем в таблицу 3.

 

Таблица 3: Промежуточные данные вычислений по критерию Пирсона.

 

 

Интервалы

[xi-1,xi]

nk

ti-1=

(xi-1-0,134)/

5,12

ti

(xi-1-0,134)/

5,12

Ф(ti-1)

Ф(ti)

Оценка вероятности  попадания в интервал pj=

Ф(ti)- Ф(ti-1)

nj=n*pj

nj-n*pj

(nj-n*pj)2

(nj-n*pj)2/

n*pj

-17,51

-13,63

1

-3,41

-2,65

0,00030

0,004

0,004

0,555

0,44

0,20

0,36

-13,63

-9,75

3

-2,65

-1,89

0,004

0,03

0,025

3,81

-0,81

0,66

0,17

-9,75

-5,88

13

-1,89

-1,13

0,03

0,13

0,1

14,97

-1,97

3,88

0,26

-5,88

-2,00

34

-1,13

-0,37

0,13

0,36

0,227

33,98

0,02

0,00

0,00

-2,00

1,88

53

-0,37

0,40

0,36

0,66

0,3

44,96

8,05

64,72

1,44

1,88

5,76

28

0,40

1,16

0,66

0,88

0,222

33,24

-5,24

27,46

0,83

5,76

9,64

12

1,16

1,92

0,88

0,97

0,096

14,34

-2,34

5,48

0,38

9,64

13,761

6

1,92

2,68

0,97

0,996

0,024

3,56

2,45

5,98

1,68

Сумма

150

       

1

     

χ2=

5,12


 

Итак, . По таблице критических точек распределения χ2 найдем критическую точку, используя известные значения уровня значимости α=0,05 и k = 8 – 2 – 1 = 5: . Так как , то гипотезу о нормальном распределении генеральной совокупности принимаем.

 Если α=0,01, то . И, очевидно, что по-прежнему . Таким образом, гипотеза о нормальном распределении генеральной совокупности, бесспорно, принимается.

6.2. Проверка статистической гипотезы о математическом ожидании нормального распределения при известной дисперсии.

Известно, что Dx = s 2 = 25,98. Математическое ожидание Mx неизвестно. Допустим, что имеются основания предполагать, что Mx = a. Пусть a1 < a.

I. Выдвигаем нулевую  гипотезу H0: Mx=a; при конкурирующей гипотезе H1: Mx=a1.

В нашем случае сделана выборка объема n=150: x1, x2,..., x150 . В основе проверки лежит тот факт, что случайная величина (выборочная средняя) распределена по нормальному закону с дисперсией s 2/n и математическим ожиданием, равным a в случае справедливости H0, и равным a1 в случае справедливости H1.

Очевидно, что если величина оказывается достаточно малой, то это дает основание предпочесть гипотезу H0 гипотезе H1. При достаточно большом значении более вероятна справедливость гипотезы H1. Задачу можно было бы поставить так: требуется найти некоторое критическое число, которое разбивало бы все возможные значения выборочной средней (в условиях данной задачи это все действительные числа) на два полубесконечных промежутка. При попадании в левый промежуток следовало бы принимать гипотезу H0, а при попадании в правый промежуток предпочтение следовало бы оказать гипотезе H1. Однако на самом деле поступают несколько иначе.

В качестве статистического  критерия выбирается случайная величина , распределенная по нормальному закону , причем Mz = 0 и Dz = 1 ( это следует из свойств математического ожидания и дисперсии ) в случае справедливости гипотезы H0. Если справедлива гипотеза H1, то  
Mz = a* = ( a1 – a ) /s, Dz = 1.

Если величина , полученная из выборочных данных, относительно велика, то и величина z велика, что является свидетельством в пользу гипотезы H1. Относительно малые значения приводят к малым значениям z, что свидетельствует в пользу гипотезы H0. Отсюда следует, что должна быть выбрана правосторонняя критическая область. По принятому уровню значимости a (например a = 0,05), используя то, что случайная величина z распределена по нормальному закону, определим значение Kкр из формулы

a = P(Kкр < z <¥) = F(¥) – F(Kкр) = 0,5 – F(Kкр).

Информация о работе Статистическая обработка выборки