Автор работы: Пользователь скрыл имя, 10 Мая 2013 в 21:15, реферат
Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Естественно возникает задача оценки параметров, которыми определяется это распределение. Например, если наперед известно, что изучаемый признак распределен в генеральной совокупности нормально, то необходимо оценить (приближенно найти) математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение; если же есть основания считать, что признак имеет, например, распределение П
Чем меньше дисперсия измерения, тем больше доверия этому измерению, т.е. измерения должны учитываться оценкой с разными весовыми коэффициентами. Исходя из этого, выберем следующую структуру оценки:
Чтобы оценка была несмещенной, необходимо выполнение условия:
т.е. . Коэффициенты bi нужно выбрать так, чтобы они минимизировали бы дисперсию оценки. Так как измерения статистически независимы, то . Коэффициенты bi должны определяться из условия , i=1,2,…n, при ограничении .
Проводя минимизацию, получим:
Итак, при неравноточных измерениях для оценки математического ожидания следует пользоваться формулой (1), подставляя в неё коэффициенты bi из (2).
Второй метод нахождения оценок - метод моментов. В этом методе используются теоретические формулы, которые связывают оцениваемый параметр с моментами случайной величины. Для получения оценки неизвестного параметра нужно в соответствующую формулу подставить вместо теоретических моментов эмпирические моменты. Предположим, например, что случайная величина X распределена по экспоненциальному закону: f(x) = lexp{-lx}, где l > 0, x > 0, причём параметр l неизвестен. Требуется оценить этот параметр. Пусть по выборке Xn получена оценка математического ожидания mx* исследуемой случайной величины. С другой стороны, известна формула, связывающая параметр l экспоненциального распределения с математическим ожиданием mx: l = = 1/ mx. Подставляя в эту формулу вместо mx оценку mx*, получим оценку параметра l: l* = 1/mх*. В некоторых случаях оценки, полученные этим простым способом, совпадают с оценками, полученными с помощью других, более сложных методов.
Третий метод - метод наибольшего правдоподобия. Этот метод требует знания закона распределения случайной величины с точностью до неизвестных параметров. Предположим, что плотность распределения вероятностей величины X равна fx(x, Q), где Q - неизвестный параметр, который требуется оценить. Тогда каждое измерение xi из выборки Xn = {x1, х2, ..., xn} будет иметь плотность распределения fx(xi,Q). Элементы выборки xi являются статистически независимыми, поэтому n - мерная плотность распределения вероятностей выборки равна произведению одномерных плотностей, т.е.
Эту плотность называют функцией правдоподобия. Можно предполагать, что в выборке чаще встречаются те возможные значения величины X, для которых плотность распределения имеет относительно большие значения. Из этого следует, что в качестве оценки параметра Q логично взять такое значение, которое максимизирует функцию правдоподобия. Однако с целью упрощения вычислений используют не функцию правдоподобия непосредственно, а её натуральный логарифм:
Доказано, что эта функция имеет максимум, причём значение Q = Q*(x1, х2, ..., хn), при котором достигается этот максимум, является оценкой параметра Q, обладающей наименьшей дисперсией. Таким образом, для определения оценки нужно решить уравнение
Решение этого уравнения Q*(x1, х2, ..., хn) и будет оценкой параметра Q. Оценки, найденные таким способом, называются оценками максимального (или наибольшего) правдоподобия. Оценки максимального правдоподобия всегда являются эффективными оценками.
Доверительные интервалы. Общие определения. Точечные оценки оценивают неизвестное значение параметра одним числом. Недостатком точечных оценок является то, что в них не указывается точность оценки параметра при выборках конечного объёма. Можно лишь сказать, что при n®¥ оценки параметров сходятся по вероятности к истинным значениям этих параметров. Иногда удобнее оценивать значение параметра с помощью интервала, в который это значение попадает с определённой вероятностью. Пусть Q - оцениваемый параметр, а Q1 и Q2 - две функции элементов выборки x1, x2, ..., xn, такие, что Q1 < Q2. Если выполняется соотношение
P{Q1 < Q < Q2} = g, (3)
то интервал (Q1, Q2) называется 100 g-процентным доверительным интервалом параметра Q. Другими словами, доверительный интервал - это интервал, в котором с заданной вероятностью находится значение неизвестного параметра. Значения Q1 и Q2 называют соответственно нижней и верхней границами доверительного интервала, a g - доверительной вероятностью или коэффициентом доверия. Неважно, каким образом были получены границы интервала Q1 и Q2, важен сам факт выполнения соотношения (3). Доверительный интервал даёт определённую информацию о точности оценки данного параметра.
Для построения доверительного интервала
необходимо знать тот или иной
закон распределения вероятност
Следовательно, из соотношения
можно определить границы Q1и Q2 доверительного интервала с доверительной вероятностью g.
Однако не всегда можно задать неизвестный параметр плотностью распределения вероятностей. Обычно неизвестный параметр является некоторой постоянной величиной. Поэтому при построении доверительного интервала пользуются не условной плотностью распределения f(Q | Q*), а условной плотностью f(Q* | Q). Рассмотрим один из возможных способов построения доверительного интервала с использованием этой плотности. Зададим некоторую доверительную вероятность g и рассмотрим соотношение Р{|Q* -Q | < d} = g.
Это соотношение определяет симметричный относительно Q доверительный интервал. Рассматривая это соотношение как уравнение относительно d, можно определить d, используя известную плотность f(Q* | Q)0. Тем самым доверительный интервал будет найден.
Величина d определяет ширину доверительного интервала. Для фиксированного значения доверительной вероятности g и для неизменной плотности f(Q* | Q) эта величина является постоянной. Границы доверительного интервала определяются равенствами Q = Q*-d и Q = Q* + . Если считать Q и Q* переменными, то эти два равенства являются уравнениями прямых линий. Вся область, заключённая между этими прямыми, называется доверительной областью. Располагая доверительной областью можно определить доверительный интервал для любого значения оценки Q*.
Для дискретных случайных величин не всегда можно найти доверительный интервал, имеющий коэффициент доверия, в точности равный g, если g задано произвольно. Это связано с тем, что закон распределения дискретной случайной величины имеет ступенчатый характер.
Установление доверительного интервала не означает того факта, что неизвестный параметр принадлежит этому интервалу. Можно лишь утверждать, что с вероятностью у этот параметр находится внутри интервала. При этом, разумеется, с вероятностью 1 - g данный параметр находится вне этого интервала. Доверительную вероятность у выбирают достаточно большой (g = 0,9 ¸ 0,99). Следует иметь в виду, что при увеличении доверительной вероятности увеличивается длина доверительного интервала. Таким образом, при выборе значения доверительной вероятности следует придерживаться разумного компромисса. Если есть необходимость повысить доверительную вероятность при сохранении длины доверительного интервала, то нужно увеличить объём выборки.
Информация о работе Статистические оценки параметров распределения