Автор работы: Пользователь скрыл имя, 10 Мая 2013 в 21:15, реферат
Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Естественно возникает задача оценки параметров, которыми определяется это распределение. Например, если наперед известно, что изучаемый признак распределен в генеральной совокупности нормально, то необходимо оценить (приближенно найти) математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение; если же есть основания считать, что признак имеет, например, распределение П
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РЕСПУБЛИКИ КАЗАХСТАН
Западно-Казахстанский аграрно-
Реферат
на тему: «Статистические оценки параметров распределения»
Выполнил: студент группы
БЭК-12(2)
Тулинова О.В
Проверила: ст.преподаватель
Савельева А.Н
Уральск-2013
Содержание
Пусть требуется изучить
Обычно в распоряжении исследователя имеются лишь данные выборки, например значения количественного признака x1, х2, . . ., хп, полученные в результате п наблюдений (здесь и далее наблюдения предполагаются независимыми). Через эти данные и выражают оцениваемый параметр. Рассматривая х1, х2, ..., хп как независимые случайные величины X1, Х2 ,…Хn, можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения — это значит найти функцию от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра. Например, как будет показано далее, для оценки математического ожидания нормального распределения служит функция (среднее арифметическое наблюдаемых значений признака)
Итак, статистической оценкой неизвестного параметра теоретического распределения называют функцию от наблюдаемых случайных величин.
Несмещенные, эффективные и состоятельные оценки. Для того чтобы статистические оценки давали «хорошие» приближения оцениваемых параметров, они должны удовлетворять определенным требованиям. Ниже указаны эти требования.
Пусть Q* —статистическая оценка неизвестного параметра Q теоретического распределения. Допустим, что по выборке объема n найдена оценка Q1. Повторим опыт, т. е. извлечем из генеральной совокупности другую выборку того же объема и по ее данным найдем оценку Q2. Повторяя опыт многократно, получим числа Q1*, Q2*, ..., Qk*, которые, вообще говоря, различны между собой. Таким образом, оценку Q* можно рассматривать как случайную величину, а числа Q1*, Q2*, ..., Qk*, —как ее возможные значения.
Представим себе, что оценка Q* дает приближенное значение Q с избытком; тогда каждое найденное по данным выборок число Qi* (i= 1, 2, ..k) больше истинного значения Q. Ясно, что в этом случае и математическое ожидание (среднее значение) случайной величины Q* больше, чем Q, т. е. М (Q*) > Q. Очевидно, что если Q* дает оценку с недостатком, то М (Q*) < Q.
Таким образом, использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, привело бы к систематическим (одного знака) ошибкам. По этой причине естественно потребовать, чтобы математическое ожидание оценки Q* было равно оцениваемому параметру. Хотя соблюдение этого требования не устранит ошибок (одни значения Q* больше, а другие меньше Q), однако ошибки разных знаков будут встречаться одинаково часто. Иными словами, соблюдение требований М (Q*) = Q гарантирует от получения систематических ошибок.
Несмещенной называют статистическую оценку Q*, математическое ожидание которой равно оцениваемому параметру Q при любом объеме выборки, т. е.
M (Q*) = Q.
Смененной называют оценку, математическое ожидание которой не равно оцениваемому параметру.
Однако было бы ошибочным считать, что несмещенная оценка всегда дает хорошее приближение оцениваемого параметра. Действительно, возможные значения Q* могут быть сильно рассеяны вокруг своего среднего значения, т е. дисперсия D (Q*) может быть значительной. В этом случае найденная по данным одной выборки оценка, например Q1, может оказаться весьма удаленной от среднего значения , а значит, и от самого оцениваемого параметра Q; приняв Q1 в качестве приближенного значения Q, мы допустили бы большую ошибку. Если же потребовать, чтобы дисперсия Q* была малой, то возможность допустить большую ошибку будет исключена. По этой причине к статистической оценке предъявляется требование эффективности.
Эффективной называют статистическую оценку, которая (при заданном объеме выборки п) имеет наименьшую возможную дисперсию.
При рассмотрении выборок большого объема (n велико!) к статистическим оценкам предъявляется требование состоятельности.
Состоятельной называют статистическую оценку, которая при n—»¥ стремится по вероятности к оцениваемому параметру. Например, если дисперсия несмещенной оценки при п—»¥о стремится к нулю, то такая оценка оказывается и состоятельной.
Генеральная средняя. Пусть изучается дискретная генеральная совокупность относительно количественного признака X.
Генеральной средней называют среднее арифметическое значений признака генеральной совокупности.
Если все значения x1, x2 ..., хN признака генеральной совокупности объема N различны, то
Если же значения x1, x2 ..., хk признака имеют соответственно частоты N1,N2….Nk, причем N1+N2….+Nk=N, то
т. е. генеральная средняя есть средняя взвешенная значений признака с весами, равными соответствующим частотам.
Выборочная средняя. Пусть для изучения генеральной совокупности относительно количественного признака X извлечена выборка объема п.
Выборочной средней называют среднее арифметическое значение признака выборочной совокупности.
Если все значения x1, x2, ..., хп признака выборки объема n различны, то
Если же значения признака x1, x2, . .., xk имеют cooтветственно частоты n1, n2..., nk, причем n1+n2.. ... + nk = n, то
т. е. выборочная средняя есть средняя взвешенная значений признака с весами, равными соответствующим частотам.
Заметим, что в теоретических рассуждениях выборочные значения x1, х2, ..., хn признака X, полученные в итоге независимых наблюдений, также рассматривают как случайные величины Х1, Х2, . . ., Хn, имеющие то же распределение и, следовательно, те же числовые характеристики, которые имеют X.
Оценка генеральной средней по выборочной средней. Устойчивость выборочных средних. Пусть из генеральной совокупности (в результате независимых наблюдений над количественным признаком X) извлечена повторная выборка объема n со значениями признака x1, х2, . .., хп. Не уменьшая общности рассуждений, будем считать эти значения признака различными. Пусть генеральная средняя хГ неизвестна и требуется оценить ее по данным выборки. В качестве оценки генеральной средней принимают выборочную
Убедимся, что — несмещенная оценка, т. е. покажем, что математическое ожидание этой оценки равно . Будем рассматривать как случайную величину и x1, х2, . .., хп как независимые, одинаково распределенные случайные величины Х1, Х2, . . ., Хn. Поскольку эти величины одинаково распределены, то они имеют одинаковые числовые характеристики, в частности одинаковое математическое ожидание, которое обозначим через а. Так как математическое ожидание среднего арифметического одинаково распределенных случайных величин равно математическому ожиданию каждой из величин , то
Приняв во внимание, что каждая из величин Х1, Х2, . . ., Хn имеет то же распределение, что и генеральная совокупность (которую мы также рассматриваем как случайную величину), заключаем, что и числовые характеристики этих величин и генеральной совокупности одинаковы. В частности, математическое ожидание а каждой из величин равно математическому ожиданию признака X генеральной совокупности, т. е.
Заменив в формуле (*) математическое ожидание а на , окончательно получим
Тем самым доказано, что выборочная средняя есть несмещенная оценка генеральной средней.
Легко показать, что выборочная средняя является и состоятельной оценкой генеральной средней. Действительно, допуская, что случайные величины Х1, Х2, . . ., Хn имеют ограниченные дисперсии, мы вправе применить к этим величинам теорему Чебышева (частный случай), в силу которой при увеличении n среднее арифметическое рассматриваемых величин, т. е. , стремится по вероятности к математическому ожиданию а каждой из величин, или, что то же, к генеральной средней (так как = а).
Итак, при увеличении объема выборки n выборочная средняя стремится по вероятности к генеральной средней, а это и означает, что выборочная средняя есть состоятельная оценка генеральной средней. Из сказанного следует также, что если по нескольким выборкам достаточно большого объема из одной и той же генеральной совокупности будут найдены выборочные средние, то они будут приближенно равны между собой. В этом и состоит свойство устойчивости выборочных средних.
Заметим, что если дисперсии двух одинаково распределенных совокупностей равны между собой, то близость выборочных средних к генеральным не зависит от отношения объема выборки к объему генеральной совокупности. Она зависит от объема выборки: чем объем выборки больше, тем меньше выборочная средняя отличается от генеральной. Например, если из одной совокупности отобран 1 % объектов, а из другой совокупности отобрано 4% объектов, причем объем первой выборки оказался большим, чем второй, то первая выборочная средняя будет меньше отличаться от соответствующей генеральной средней, чем вторая.
Групповая и общая средние. Допустим, что все значения количественного признака X совокупности, безразлично-генеральной или выборочной, разбиты на несколько групп. Рассматривая каждую группу как самостоятельную совокупность, можно найти ее среднюю арифметическую.
Групповой средней называют среднее арифметическое значений признака, принадлежащих группе.
Теперь целесообразно ввести специальный термин для средней всей совокупности.
Общей средней называют среднее арифметическое значений признака, принадлежащих всей совокупности.
Зная групповые средние и объемы групп, можно найти общую среднюю: общая средняя равна средней арифметической групповых средних, взвешенной по объемам групп.
Отклонение от общей средней и его свойство. Рассмотрим совокупность, безразлично — генеральную или выборочную, значений количественного признака X объема n:
При этом . Далее для удобства записи знак суммы заменен знаком .
Найдем общую среднюю
Отсюда .
Заметим, что поскольку - постоянная величина, то
Отклонением называют разность xi - между значением признака и общей средней.
Теорема. Сумма произведений отклонений на соответствующие частоты равна нулю:
Следствие. Среднее значение отклонения равно нулю.
Генеральная дисперсия. Для того чтобы охарактеризовать рассеяние значений количественного признака X генеральной совокупности вокруг своего среднего значения, вводят сводную характеристику — генеральную дисперсию.
Генеральной дисперсией Dг называют среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения .
Если все значения x1, х2, . .., хN признака генеральной совокупности объема N различны, то
Если же значения признака x1, х2, . .., хk имеют соответственно частоты N1, N2…Nk, причем N1 + N2+ ...+Nk = N, то
т. е. генеральная дисперсия есть средняя взвешенная квадратов отклонений с весами, равными соответствующим частотам.
Кроме дисперсии для характеристики рассеяния значений признака генеральной совокупности вокруг своего среднего значения пользуются сводной характеристикой— средним квадратическим отклонением.
Генеральным, средним квадратическим отклонением (стандартом) называют квадратный корень из генеральной дисперсии:
Выборочная дисперсия. Для того чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг своего среднего значения вводят сводную характеристику— выборочную дисперсию.
Выборочной дисперсией DB называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения .
Если все значения х1, х2, ..хn признака выборки объема n различны, то
Если же значения признака xl, х2, ..., хn имеют ответственно частоты п1, n2, .пk, причем п1 + п2 + пk = n. то
Информация о работе Статистические оценки параметров распределения