Статистическая обработка выборки

Автор работы: Пользователь скрыл имя, 08 Декабря 2012 в 08:24, лабораторная работа

Описание работы

работа содержит 7 заданий с решениями по "Статистике"

Скачать архив (472.71 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

Лабораторная работа тервер.doc

Поскольку , и при , то и , что означает состоятельность оценки .►

Замечание. Можно доказать, что все выборочные начальные и центральные моменты являются состоятельными оценками соответствующих моментов генеральной совокупности, если последние существуют. Однако все эти оценки, кроме , являются смещёнными (они асимптотически не смещены).

4.5. Эффективность статистической оценки.

Пусть имеются две несмещённые оценки и одного и того же параметра . Если дисперсии этих оценок удовлетворяют неравенству для любого фиксированного , то следует предпочесть оценку , поскольку разброс этой оценки относительно значения меньше и, следовательно, она при одном и том же даёт более точное значение искомого параметра. В таких случаях говорят, что оценка эффективнее оценки .

Если существует такая несмещённая оценка параметра , что для любой другой несмещённой оценки того же параметра выполняется неравенство , то оценка называется эффективной оценкой параметра

При проверке эффективности оценок используют неравенство Крамера-Рао: для любой несмещённой оценки параметра выполняется условие

(16)

где

Пусть для некоторой несмещённой оценки неравенство (16) превращается в равенство. Это означает, что дисперсия достигла нижней границы для дисперсий всех несмещённых оценок параметра , т.е. оценка является эффективной.

Исследуем эффективность несмещённой оценки параметра .

Левая часть неравенства (16) была найдена ранее:

. (17)

Подсчитаем выражение в правой части (16). В данном случае генеральная совокупность непрерывна и

Поэтому

Таким образом, правая часть (16) равна

. (18)

Сравнивая (17) и (18), убеждаемся в том, что соотношение (16) превращается в равенство. Это означает эффективность выборочного среднего как оценки математического ожидания нормальной генеральной совокупности .

5. Интервальное оценивание параметров.

5.1. Построение доверительного интервала для математического ожидания нормально распределеной случайной величины при известной дисперсии.

Для начала представим теоретическую справку.

1. Пусть для оценки т извлечена выборка х₁, х₂, ..., х_п объема n. Пусть .

2. Составим случайную величину . Нетрудно показать, что случайная величина u имеет стандартизированное нормальное распределение, т.е. u~N(0,1) ().

3. Зададим уровень значимости α.

4. Применяя формулу нахождения вероятности отклонения нормальной величины от математического ожидания, имеем:

. (10)

Это означает, что доверительный интервал накрывает неизвестный параметр т (мат. ожидание) с надежностью 1 – α. Точность оценки определяется величиной. Отметим, что число определяется по таблице значений функции Лапласа из равенства .

В нашем случае , , n=150.

Для определения 95%-го доверительного интервала найдем критическую точку = u_0,025 по таблице значений функции Лапласа

Тогда по формуле (1) построим доверительный интервал:

Для определения 99%-го доверительного интервала найдем критическую точку = u_0,005 по таблице значений функции Лапласа

Тогда по формуле (1) построим доверительный интервал:

5.2. Построение доверительного интервала для дисперсии нормально распределенной случайной величины.

Представим теоретическую справку.

1. В качестве точечной оценки дисперсии D(X) используется исправленная выборочная дисперсия

которой соответствует стандартное отклонение .

2. При нахождении доверительного интервала для дисперсии в этом случае вводится статистика , имеющая –распределение с числом степеней свободы v = п – 1.

3. Задается требуемый уровень значимости α.

4. Тогда, используя таблицу критических точек распределения, нетрудно указать критические точки , для которых будет выполняться следующее равенство:

. (19)

После некоторых несложных преобразований получаем, что

. (20)

Таким образом, доверительный интервал

накрывает дисперсию с надежностью 1– α. А доверительный интервал

с надежностью 1 – α накрывает среднеквадратичное отклонение .

Для нашего примера рассмотрим сначала . Число степеней свободы равно n–1=150–1=149. Тогда

, .

Следовательно, . Откуда получаем, что доверительный интервал для дисперсии данной генеральной совокупности принимает вид .

Из представленных рассуждений несложно получить доверительный интервал для среднеквадратичного отклонения данной генеральной совокупности: или .

Рассмотрим также случай, что уровень значимости . Число степеней свободы по-прежнему равно n–1=150–1=149. Тогда

, .

Аналогично примеру выше получим доверительный интервал для среднеквадратичного отклонения данной генеральной совокупности: или .

6. Проверка гипотез.

6.1. Применим критерий согласия Пирсона для проверки гипотезы о виде распределения. Критерий согласия Пирсона (χ²) применяют для проверки гипотезы о соответствии эмпирического распределения предполагаемому теоретическому распределению F(x) при большом объеме выборки (n ≥ 100). Критерий применим для любых видов функции F(x), даже при неизвестных значениях их параметров, что обычно имеет место при анализе результатов механических испытаний. В этом заключается его универсальность.

Статистикой критерия Пирсона служит величина

(21)

где p_j – вероятность попадания изучаемой случайной величины в j-й интервал, вычисляемая в соответствии с гипотетическим законом распределением F(x).

Нулевую гипотезу о соответствии выборочного распределения теоретическому закону F(x) проверяют путем сравнения вычисленной по формуле (21) величины с критическим значением , найденным по таблице для уровня значимости α и числа степеней свободы k = L – m – 1. Здесь L – число интервалов после объединения; m – число параметров, оцениваемых по рассматриваемой выборке. Если выполняется неравенство

(22)

то нулевую гипотезу не отвергают. При несоблюдении указанного неравенства принимают альтернативную гипотезу о принадлежности выборки неизвестному распределению.

Итак, воспользуемся критерием Пирсона для проверки гипотезы о нормальности распределения генеральной совокупности. Промежуточные данные занесем в таблицу 3.

Таблица 3: Промежуточные данные вычислений по критерию Пирсона.

Интервалы [x_i-1,x_i]		n_k	t_i-1= (x_i-1-0,134)/ 5,12	t_i (x_i-1-0,134)/ 5,12	Ф(t_i-1)	Ф(t_i)	Оценка вероятности попадания в интервал p_j= Ф(t_i)- Ф(t_i-1)	nj=n*p_j	nj-n*pj	(nj-n*pj)²	(nj-npj)²/ npj
-17,51	-13,63	1	-3,41	-2,65	0,00030	0,004	0,004	0,555	0,44	0,20	0,36
-13,63	-9,75	3	-2,65	-1,89	0,004	0,03	0,025	3,81	-0,81	0,66	0,17
-9,75	-5,88	13	-1,89	-1,13	0,03	0,13	0,1	14,97	-1,97	3,88	0,26
-5,88	-2,00	34	-1,13	-0,37	0,13	0,36	0,227	33,98	0,02	0,00	0,00
-2,00	1,88	53	-0,37	0,40	0,36	0,66	0,3	44,96	8,05	64,72	1,44
1,88	5,76	28	0,40	1,16	0,66	0,88	0,222	33,24	-5,24	27,46	0,83
5,76	9,64	12	1,16	1,92	0,88	0,97	0,096	14,34	-2,34	5,48	0,38
9,64	13,761	6	1,92	2,68	0,97	0,996	0,024	3,56	2,45	5,98	1,68
Сумма		150					1				χ²= 5,12

Итак, . По таблице критических точек распределения χ² найдем критическую точку, используя известные значения уровня значимости α=0,05 и k = 8 – 2 – 1 = 5: . Так как , то гипотезу о нормальном распределении генеральной совокупности принимаем.

Если α=0,01, то . И, очевидно, что по-прежнему . Таким образом, гипотеза о нормальном распределении генеральной совокупности, бесспорно, принимается.

6.2. Проверка статистической гипотезы о математическом ожидании нормального распределения при известной дисперсии.

Известно, что Dx = s ² = 25,98. Математическое ожидание Mx неизвестно. Допустим, что имеются основания предполагать, что Mx = a. Пусть a₁<a.

I. Выдвигаем нулевую гипотезу H₀: Mx=a; при конкурирующей гипотезе H₁: Mx=a₁_.

В нашем случае сделана выборка объема n=150: x₁, x₂,..., x₁₅₀ . В основе проверки лежит тот факт, что случайная величина (выборочная средняя) распределена по нормальному закону с дисперсией s ²/n и математическим ожиданием, равным a в случае справедливости H₀, и равным a₁ в случае справедливости H₁.

Очевидно, что если величина оказывается достаточно малой, то это дает основание предпочесть гипотезу H₀ гипотезе H₁. При достаточно большом значении более вероятна справедливость гипотезы H₁. Задачу можно было бы поставить так: требуется найти некоторое критическое число, которое разбивало бы все возможные значения выборочной средней (в условиях данной задачи это все действительные числа) на два полубесконечных промежутка. При попадании в левый промежуток следовало бы принимать гипотезу H₀, а при попадании в правый промежуток предпочтение следовало бы оказать гипотезе H₁. Однако на самом деле поступают несколько иначе.

В качестве статистического критерия выбирается случайная величина , распределенная по нормальному закону , причем Mz = 0 и Dz = 1 ( это следует из свойств математического ожидания и дисперсии ) в случае справедливости гипотезы H₀. Если справедлива гипотеза H₁, то
Mz = a* = ( a₁ – a )/s, Dz = 1.

Если величина , полученная из выборочных данных, относительно велика, то и величина z велика, что является свидетельством в пользу гипотезы H₁. Относительно малые значения приводят к малым значениям z, что свидетельствует в пользу гипотезы H₀. Отсюда следует, что должна быть выбрана правосторонняя критическая область. По принятому уровню значимости a (например a = 0,05), используя то, что случайная величина z распределена по нормальному закону, определим значение K_кр из формулы

a = P(K_кр< z <¥) = F(¥) – F(K_кр) = 0,5 – F(K_кр).

Статистическая обработка выборки

Описание работы

Файлы: 1 файл

Лабораторная работа тервер.doc

6.2. Проверка статистической гипотезы о математическом ожидании нормального распределения при известной дисперсии.

Информация о работе Статистическая обработка выборки