Автор работы: Пользователь скрыл имя, 16 Сентября 2014 в 14:42, шпаргалка
Работа содержит ответы на вопросы для экзамена по дисциплине "Математика".
Если тип выборки говорит о том, как попадают люди в выборочную совокупность, то объем выборки сообщает о том, какое количество попало в нее. Объем выборки – количество единиц выборочной совокупности. Поскольку выборочная совокупность (или выборка, что одно и то же) – это часть генеральной совокупности, отобранной с помощью специальных методов, - поскольку ее объем всегда меньше объема генеральной.
Расхождение между генеральной и выборочной совокупностью называется ошибкой репрезентативности, допустимое склонение – 5%.
Репрезентативность – свойство выборочной совокупности представляет характеристику генеральной. Если совпадения нет, говорят об ошибке репрезентативности – мере отклонения статистической структуры выборки от структуры соответствующей генеральной совокупности. Иными словами, ошибкой репрезентативности называется расхождение между двумя совокупностями – генеральной, на которую направлен теоретический интерес социолога, и выборочной, на которую направлен его практический интерес, выступающей одновременно и как объект обследования и как средство получить информацию о генеральной совокупности.
Для наглядного представления вариационного ряда большое значение имеют его графические изображения. Графически вариационный ряд может быть изображен в виде полигона, гистограммы и кумуляты.
Полигон распределения (дословно — многоугольник распределения) строится в прямоугольной системе координат. Величина признака откладывается на оси абсцисс, частоты или относительные частоты — по оси ординат. Чаще всего полигоны применяются для изображения дискретных вариационных рядов, но их можно применять также для интервальных рядов. В этом случае на оси абсцисс откладываются точки, соответствующие серединам данных интервалов.
Гистограмма распределения строится аналогично полигону в прямоугольной системе координат. В отличие от полигона при построении гистограммы на оси абсцисс выбирают не точки, а отрезки, изображающие интервал, а вместо ординат, соответствующих частотам или относительным частотам отдельных вариант, строят прямоугольники с высотой, пропорциональной частотам или относительным частотам интервала. В случае интервалов различной длины гистограмма распределения строится, не по частотам или относительным частотам, а по плотности интервалов (абсолютной или относительной). При этом общая площадь гистограммы равна численности совокупности, если построение проводится по абсолютной плотности, или единице, если гистограмма построена по относительной плотности.
Если соединить прямыми линиями середины верхних сторон прямоугольников, то получим полигоны распределения.
Разбивая интервалы на несколько частей и исходя из того, что вся — площадь гистограммы должна остаться при этом неизменной, можно получить мелкоступенчатую гистограмму, которая при уменьшении величины интервала будет приближаться к плавной кривой, называемой кривой распределения.
Билет 58
Пусть закон распределения генеральной совокупности Х известен с точностью до параметра θ. Построим точечную оценку параметра θ по выборке x1, x2,…, xn, как значение некоторой функции Например, среднее арифметическое выборочных значений служит оценкой математического ожидания. Так как выборочные значения случайны, то эту функцию можно рассматривать как случайную величину где X1, X2,…, Xn — независимые статистические копии случайной величины Х. Какими свойствами должна обладать случайная величина , чтобы полученная оценка была «хорошей»?
Желательным требованием к оценке является отсутствие систематической ошибки, т.е. при многократном использовании вместо параметра θ его оценки среднее значение ошибки приближения равно нулю — это свойство несмещенности оценки.
Определение. Оценка называется несмещенной, если ее математическое ожидание равно истинному значению оцениваемого параметра:
Выборочное среднее арифметическое является несмещенной оценкой математического ожидания, а выборочная дисперсия — смещенная оценка генеральной дисперсии D. Несмещенной оценкой генеральной дисперсии является оценка
Второе требование к оценке — ее состоятельность — означает улучшение оценки с увеличением объема выборки.
Определение. Оценка называется состоятельной, если она сходится по вероятности к оцениваемому параметру θ при n→∞.
Третье требование позволяет выбрать лучшую оценку из нескольких оценок одного и того же параметра.
Определение. Несмещенная оценка является эффективной, если она имеет наименьшую среди всех несмещенных оценок дисперсию.
Это означает, что эффективная оценка обладает минимальным рассеиванием относительно истинного значения параметра. Заметим, что эффективная оценка существует не всегда, но из двух оценок обычно можно выбрать более эффективную, т.е. с меньшей дисперсией. Например, для неизвестного параметра a нормальной генеральной совокупности N(a,σ) в качестве несмещенной оценки можно взять и выборочное среднее арифметическое, и выборочную медиану. Но дисперсия выборочной медианы примерно в 1.6 раза больше, чем дисперсия среднего арифметического. Поэтому более эффективной оценкой является выборочное среднее арифметическое.
Билет 59
Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение этого распределения известно. Требуется оценить неизвестное математическое ожидание а по выборочной средней . Поставим своей задачей найти доверительные интервалы, покрывающие параметр а с надежностью .
Примем без доказательства, что если случайная величина X распределена нормально, то выборочная средняя , найденная по независимым наблюдениям, также распределена нормально. Параметры распределения таковы: ,
Потребуем, чтобы выполнялось соотношение , где - заданная надежность.
,
, где .
Найдя из последнего равенства , можем написать
.
Приняв во внимание, что вероятность Р задана и равна , окончательно имеем (чтобы получить рабочую формулу, выборочную среднюю вновь обозначим через )
Смысл полученного соотношения таков: с надежностью можно утверждать, что доверительный интервал покрывает неизвестный параметр а; точность оценки .
Итак, поставленная выше задача полностью решена. Укажем еще, что число t определяется из равенства , или ; по таблице функции Лапласа (см. приложение 2) находят аргумент t, которому соответствует значение функции Лапласа, равное .
Пример 1. Случайная величина X имеет нормальное распределение с известным средним квадратическим отклонением . Найти доверительные интервалы для оценки неизвестного математического ожидания а по выборочным средним , если объем выборки n=36 и задана надежность оценки =0,95.
Решение: Найдем t. Из соотношения получим . По таблице приложения 2 находим t=1,96.
Найдем точность оценки: .
Доверительный интервал таков: ( - 0,98; + 0,98). Например, если =4,1, то доверительный интервал имеет следующие доверительные границы:
-0,98=4,1—0,98=3,12; +0,98=4,1+0,98=5,08.
Таким образом, значения неизвестного параметра а, согласующиеся с данными выборки, удовлетворяют неравенству 3,12< а <5,08.
Если среднее квадратическое отклонение неизвестно то доверительный интервал для оценки математического ожидания нормального распределения имеет вид: , покрывающий неизвестный параметр а с надежностью .
По таблице приложения 3 по заданным n и можно найти .
Пример. Количественный признак X генеральной совокупности распределен нормально. По выборке объема n=16 найдены выборочная средняя =20,2 и «исправленное» среднее квадратическое отклонение s=0,8. Оценить неизвестное математическое ожидание при помощи доверительного интервала с надежностью 0,95.
Решение: Найдем . Пользуясь таблицей приложения 3, по =0,95 и n=16 находим =2,13.
Найдем доверительные границы:
.
.
Итак, с надежностью 0,95 неизвестный параметр а заключен в доверительном интервале 19,774<а<20,626.
17.7 Доверительные интервалы для оценки среднего квадратического отклонения нормального распределения
Пусть количественный признак X генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение по «исправленному» выборочному среднему квадратическому отклонению s. Доверительные интервалы, покрывающие параметр с заданной надежностью таковы: