Автор работы: Пользователь скрыл имя, 28 Мая 2013 в 20:48, контрольная работа
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных и результатов наблюдений.
Первая задача математической статистики - указать: способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.
Вторая задача математической статистики - разработать методы анализа статистических данных в зависимости от целей исследования.
10 Другие характеристики вариационного ряда
Кроме выборочной средней и выборочной дисперсии применяются и другие характеристики вариационного ряда.
Модой Мо называют варианту, которая имеет наибольшую частоту.
Медианой Ме называют варианту, которая делит вариационный ряд на две части, равные по числу вариант.
Размахом варьирования R называют разность между наибольшей и наименьшей вариантами.
Средним абсолютным отклонением d называют среднее арифметическое абсолютных отклонений: d= .
Коэффициентом вариации V называют выраженное в процентах отношение выборочного среднего квадратического отклонения к выборочной средней: V=σ/ *100%.
Коэффициент вариации служит для сравнения величин рассеяния по отношению к выборочной средней двух вариационных рядов: тот из рядов имеет большее рассеяние по отношению к выборочной средней, у которого коэффициент вариации больше.
11 Доверительные интервалы для оценки параметров распределения
Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальные оценки позволяют установить точность и надежность оценок (смысл этих понятий выясняется ниже).
Пусть найденная по данным выборки статистическая характеристика Θ* служит оценкой неизвестного параметра Θ. Будем считать Θ постоянным числом (Θ может быть и случайной величиной). Ясно, что Θ* тем точнее определяет параметр Θ, чем меньше абсолютная величина разности |Θ-Θ*|. Другими словами, если δ>0 и |Θ-Θ*|<δ, то чем меньше δ, тем оценка точнее. Таким образом, положительное число δ характеризует точность оценки.
Однако статистические методы не позволяют категорически утверждать, что оценка Θ* удовлетворяет неравенству |Θ-Θ*|<δ; можно лишь говорить о вероятности γ, с которой это неравенство осуществляется.
Надежностью (доверительной вероятностью) оценки Θ по Θ* называют вероятность γ, с которой осуществляется неравенство |Θ-Θ*|<δ. Обычно надежность оценки задается наперед, причем в качестве γ берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.
Пусть вероятность того, что |Θ-Θ*|<δ, равна γ: P[|Θ-Θ*|<δ]=γ. Заменив неравенство |Θ-Θ*|<δ равносильным ему двойным неравенством –δ<Θ-Θ*<δ, или Θ*-δ<Θ<Θ*+δ, имеем P[Θ*-δ<Θ<Θ*+δ]=γ. Это соотношение следует понимать так: вероятность того, что интервал (Θ*-δ, Θ*+δ) заключает в себе (покрывает) неизвестный параметр Θ, равна γ.
Доверительным называют интервал (Θ*-δ, Θ*+δ), который покрывает неизвестный параметр Θ с заданной надежностью γ.
11.1 Доверительные интервалы для оценки математического ожидания нормального распределения при известном σ
Пусть количественный признак Х генеральной совокупности распределен нормально, причем среднее квадратическое отклонение σ этого распределения известно. Требуется оценить неизвестное математическое ожидание «а» по выборочной средней . Поставим своей задачей найти доверительные интервалы, покрывающие параметр а с надежностью γ.
Приняв во внимание, что вероятность Р задана и равна γ, получим формулу для нахождения доверительного интервала включающего в себя параметр а с надежностью γ: -tσ/ <a< +tσ/ .
Смысл полученного соотношения таков: с надежностью γ можно утверждать, что доверительный интервал ( -tσ/ , +tσ/ ) покрывает неизвестный параметр а; точность оценки δ = tσ/ .
Число t определяется из равенства 2Ф(t)=γ или Ф(t)=γ/2; по таблице функции Лапласа находят аргумент t, которому соответствует значение функции Лапласа, равное γ/2.
Пример 11.1.
Случайная величина Х имеет нормальное распределение со средним квадратическим отклонением σ=3 .
Найти доверительный интервал для оценки неизвестного математического ожидания а по выборочной средней =4,1 если n=36, γ=0,95.
Решение:
2Ф(t)=0,95;
Ф(t)=0,475;
t=1,96;
4,1-1,96·3/ <a<4,1+1,96·3/
3,12<a<5,08.
Вероятность γ=0,95 указывает, что если произведено достаточно большое число выборок, то 95% из них определяет такой доверительный интервал, в котором заключен параметр и лишь в 5% случаях он может выйти за его границы.
Если требуется оценить математическое ожидание с заданной точностью δ и надежностью γ, то минимальный объем выборки, которая обеспечит эту точность, находят по формуле: n=t2σ2/δ2.
11.2 Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном σ
Пусть количественный признак Х генеральной совокупности распределен нормально, причем среднее квадратическое отклонение σ этого распределения неизвестно. Требуется оценить неизвестное математическое ожидание «а» по выборочной средней . Поставим своей задачей найти доверительные интервалы, покрывающие параметр а с надежностью γ.
По данным выборки
можно построить случайную
Плотность распределение Стьюдента S(t,n)
Распределение Стьюдента определяется параметром n – объем выборки или тоже самое числом степеней свободы k=n-1 и не зависит от неизвестных параметров а и σ.
Пользуясь распределением Стьюдента можно получить доверительный интервал -tS/ <a< +tS/ , покрывающий неизвестный параметр а с надежностью γ. По таблице распределения Стьюдента по заданным n, γ можно найти t.
Пример 11.2.
Случайная величина Х имеет нормальное распределение с «исправленным» средним квадратическим отклонением S=0,8.
Найти доверительный интервал для оценки неизвестного математического ожидания а по выборочной средней =20,2, если n=16, γ=0,95.
Решение:
Пользуясь таблицей распределения Стьюдента по γ=0,95 и n=16 находим t=2,13
20,2-2,13·0,8/ <a<20,2+2,13·0,8/
19,774<a<20,626.
11.3 Доверительные интервалы для оценки среднего квадратического отклонения σ нормального распределения
Пусть количественный признак Х генеральной совокупности распределен нормально. Требуется оценить неизвестное среднее квадратическое отклонение σ по исправленному выборочному среднему отклонению S. Поставим своей задачей найти доверительные интервалы, покрывающие параметр σ с надежностью γ.
Доверительный интервал находим по формуле: S(1-q)<σ<S(1+q).
q находим по специальной таблице распределения χ=(S/σ) , где n объем выборки. Это распределение не зависит от оцениваемого параметра σ, а зависит лишь от объема выборки n.
Если q>1 то доверительный интервал принимает вид: 0<σ<S(1+q).
Пример 11.3.
Количественный признак X генеральной совокупности распределен нормально. По выборке объема n=25 найдено «исправленное» среднее квадратическое отклонение S=0,8. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение σ с надежностью 0,95.
Решение:
По таблице приложения 4 по данным γ=0,95 и n=25 найдем q=0,32.
Искомый доверительный интервал таков:
0,8·(1-0,32)<σ<0,8·(1+0,32), или 0,544<σ<1,056.
12 Статистическая проверка статистических гипотез
Часто необходимо знать
закон распределения
Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр Θ равен определенному значению Θ0, выдвигают гипотезу: Θ=Θ0. Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.
Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок и многие другие.
Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений.
Например, статистическими являются гипотезы:
В первой гипотезе сделано предположение о виде неизвестного распределения, во второй - о параметрах двух известных распределений.
Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая гипотеза. По этой причине эти гипотезы целесообразно различать.
Нулевой (основной) называют выдвинутую гипотезу H0.
Конкурирующей (альтернативной) называют гипотезу Н1, которая противоречит нулевой.
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание а нормального распределения равно 10, то конкурирующая гипотеза в частности, может состоять в предположении, что а≠10. Коротко это записывают так: Н0: а=10; Н1≠10.
Различают гипотезы, которые содержат только одно и более одного предположений.
Простой называют гипотезу, содержащую только одно предположение.
Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
Выдвинутая гипотеза
может быть правильной или неправильной,
поэтому возникает
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.
Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.
Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Обозначим эту величину через К.
Статистическим критерием (или просто критерием) называют случайную величину К, которая служит для проверки нулевой гипотезы.
Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.
Наблюдаемым значением Кнабл называют значение критерия, вычисленное по выборкам.
12.1 Критическая область. Область принятия гипотезы. Критические точки. Мощность критерия
После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая - при которых она принимается.
Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.
Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.
Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области - гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы - гипотезу принимают.
Поскольку критерий. К - одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.
Критическими точками (границами) kкр называют точки, отделяющие критическую область от области принятия гипотезы.
Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.
Правосторонней называют критическую область, определяемую неравенством К > kкр, где kкр - положительное число.
Левосторонней называют критическую область, определяемую неравенством К < kкр, где kкр - отрицательное число.
Односторонней называют правостороннюю или левостороннюю критическую область.
Двусторонней называют критическую область, определяемую неравенствами К<k1, К >k2, где k2>k1.
В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенством > kкр.
Найдем правостороннюю критическую область, которая определяется неравенством К>kкр, где kкр>0. Для отыскания правосторонней критической области достаточно найти критическую точку. Для ее нахождения задаются достаточной малой вероятностью - уровнем значимости . Затем ищут критическую точку kкр, исходя из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий К примет значение, большее kкр, была равна принятому уровню значимости: Р(К > kкр)=α.