Автор работы: Пользователь скрыл имя, 28 Мая 2013 в 20:48, контрольная работа
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных и результатов наблюдений.
Первая задача математической статистики - указать: способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.
Вторая задача математической статистики - разработать методы анализа статистических данных в зависимости от целей исследования.
1 Задачи математической статистики
Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных и результатов наблюдений.
Первая задача математической статистики - указать: способы сбора и группировки статистических сведений, полученных в результате наблюдений или в результате специально поставленных экспериментов.
Вторая задача математической статистики - разработать методы анализа статистических данных в зависимости от целей исследования.
2 Генеральная и выборочная совокупность
Пусть требуется изучить совокупность
однородных объектов относительно некоторого
качественного или
Иногда проводят сплошное обследование, т.е. обследуют каждый из объектов совокупности относительно признака, которым интересуются. На практике, однако, сплошное обследование применяют сравнительно редко. Обычно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению.
Выборочной совокупностью или просто выборкой называют совокупность случайно отобранных объектов.
Генеральной совокупностью называют совокупность объектов, из которых производится выборка.
Объемом совокупности называют число объектов этой совокупности.
3 Виды выборки и способы отбора
При составлении выборки можно поступить двумя способами: после того как объект отобран и над ним произведено наблюдение, он может быть возвращен либо не возвращен в генеральную совокупность. В соответствии с этим выборки подразделяют на повторные и бесповторные.
Повторной называют выборку, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность.
Бесповторной называют выборку, при которой отобранный объект в генеральную совокупность не возвращается.
На практике обычно используют бесповторный случайный отбор.
Для того чтобы по данным
выборки можно было достаточно уверенно
судить об интересующем признаке генеральной
совокупности, необходимо, чтобы объекты
выборки правильно его
Если объем генеральной совокупности достаточно велик, а выборка составляет лишь незначительную часть этой совокупности, то различие между повторной и бесповторной выборками стирается.
На практике применяются различные способы отбора. Принципиально эти способы можно подразделить на два вида:
Простым случайным называют такой отбор, при котором объекты извлекают по одному из всей генеральной совокупности.
Типическим называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой ее «типической» части. Например, если детали изготовляют на нескольких станках, то отбор производят не из всей совокупности деталей, произведенных всеми станками, а из продукции каждого станка в отдельности. Типическим отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных типических частях генеральной совокупности. Например, если продукция изготовляется на нескольких машинах, среди которых есть более и менее изношенные, то здесь типический отбор целесообразен.
Механическим называют отбор, при котором генеральную совокупность «механически» делят на столько групп, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект.
Например, если нужно отобрать 20% изготовленных станком деталей, то отбирают каждую пятую деталь; если требуется отобрать 5% деталей, то отбирают каждую двадцатую деталь, и т. д.
Серийным называют отбор, при котором объекты отбирают из генеральной совокупности не по одному, а «сериями», которые подвергаются сплошному обследованию. Например, если изделия изготовляются большой группой станков-автоматов, то подвергают сплошному обследованию продукцию только нескольких станков. Серийным отбором пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно.
Подчеркнем, что на практике
часто применяется
4 Статистическое распределение выборки
Пусть из генеральной совокупности извлечена выборка, причем х1 наблюдалось п1 раз, х2 - п2 раз xk - nk раз и - объем выборки. Наблюдаемые значения хi называют вариантами, а последовательность вариант, записанных в возрастающем порядке - вариационным рядом. Числа наблюдений называют частотами, а их отношения к объему выборки ni/n=Wi - относительными частотами.
Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот. Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (в качестве частоты, соответствующей интервалу, принимают сумму частот, попавших в этот интервал).
Заметим, что в теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математической статистике - соответствие между наблюдаемыми вариантами и их частотами, или относительными частотами.
Пример 4.1. Задано распределение частот выборки объема n=20:
xi |
2 |
6 |
12 |
ni |
3 |
10 |
7 |
Написать распределение относительных частот.
Решение.
Найдем относительные частоты, для чего разделим частоты на объем выборки:
W1=3/20=0,15, W2=10/20=0,5, W3=7/20=0,35.
Напишем распределение относительных частот:
xi |
2 |
6 |
12 |
Wi |
0,15 |
0,50 |
0,35 |
Контроль: 0,15+0,50+0,35=1.
5 Эмпирическая функция распределения
Пусть известно статистическое распределение частот количественного признака X. Введем обозначения: пх - число наблюдений, при которых наблюдалось значение признака, меньшее х; п - общее число наблюдений (объем выборки). Ясно, что относительная частота события X<х равна пx/п. Если х изменяется, то, вообще говоря, изменяется и относительная частота, т.е. относительная частота пх/п есть функция от х. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.
Эмпирической функцией распределения (функцией распределения выборки) называют функцию F*(х), определяющую для каждого значения х относительную частоту события X < х.
Итак, по определению, F*(x) = nx/n, где пх - число вариант, меньших х; п - объем выборки. Таким образом, для того чтобы найти, например, F*(x2), надо число вариант, меньших х2, разделить на объем выборки: F*(x2)= /n.
В отличие от эмпирической функции распределения выборки функцию распределения F(х) генеральной совокупности называют теоретической функцией распределения. Различие между эмпирической и теоретической функциями состоит в том, что теоретическая функция F(х) определяет вероятность события X<х, а эмпирическая функция F*(х) определяет относительную частоту этого же события.
Эмпирическая функция
Итак, эмпирическая функция
распределения выборки служит для
оценки теоретической функции
Пример 5.1. Построить эмпирическую функцию по данному распределению выборки:
xi |
2 |
6 |
10 |
ni |
12 |
18 |
30 |
Решение.
Найдем объем выборки: 12+18+30=60. Наименьшая варианта равна 2, следовательно, F*(x)=0 при х≤2.
Значение X<6, а именно x1=2, наблюдалось 12 раз, следовательно, F*(x)=12/60=0,2 при 2<x≤6.
Значение X<10, а именно x1=2 и x2=6, наблюдалось 12+18=30 раз, следовательно, F*(x)=30/60=0,5 при 6<x≤10.
Так как х=10 - наибольшая варианта, то F*(x)=1 при х>10.
Искомая эмпирическая функция
F*(x)=0 при х≤2;
F*(x)=0,2 при 2<x≤6;
F*(x)=0,5 при 6<x≤10;
F*(x)=1 при х>10.
6 Графики статистического распределения
Для наглядности строят различные графики статистического распределения и, в частности, полигон и гистограмму.
Полигоном частот называют ломаную, отрезки которой соединяют точки (х1; п1), (х2; п2), ..., (хk; пk). Для построения полигона частот на оси абсцисс откладывают варианты хi, а на оси ординат - соответствующие им частоты ni. Точки (xi; пi) соединяют отрезками прямых и получают полигон частот.
Полигоном относительных частот называют ломаную, отрезки которой соединяют точки (х1;W1), (х2;W2), ..., (хk;Wk). Для построения полигона относительных частот на оси абсцисс откладывают варианты хi, а на оси ординат - соответствующие им относительные частоты Wi. Точки (xi; Wi) соединяют отрезками прямых и получают полигон относительных частот.
В случае непрерывного признака целесообразно строить гистограмму, для чего интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала пi - сумму частот вариант, попавших в i-й интервал.
Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению пi/h (плотность частоты).
Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии пi/h. Площадь i-го частичного прямоугольника равна hni/h=ni - сумме частот вариант i-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т. е. объему выборки.
Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению Wi/h (плотность относительной частоты).
Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии Wi/h. Площадь i-го частичного прямоугольника равна hWi/h =Wi - относительной частоте вариант, попавших в i-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, т. е. единице.
7 Статистические
оценки параметров
Пусть требуется изучить количественный признак генеральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распределение имеет признак. Естественно возникает задача оценки параметров, которыми определяется это распределение. Например, если наперед, известно, что изучаемый признак распределен в генеральной совокупности нормально, то необходимо оценить (приближенно найти) математическое ожидание и среднее квадратическое отклонение, так как эти два параметра полностью определяют нормальное распределение.
Обычно в распоряжении исследователя имеются лишь данные выборки, например значения количественного признака x1, х2, ..., хп, полученные в результате п наблюдений (здесь и далее наблюдения предполагаются независимыми). Через эти данные и выражают оцениваемый параметр. Рассматривая x1, х2, ..., хп как независимые случайные величины X1, Х2, ..., Хп, можно сказать, что найти статистическую оценку неизвестного параметра теоретического распределения - это значит найти функцию от наблюдаемых случайных величин, которая и дает приближенное значение оцениваемого параметра. Например, как будет показано далее, для оценки математического ожидания нормального распределения служит функция (среднее арифметическое наблюдаемых значений признака) Х = (Х1+Х2+...+Хп)/п.