Автор работы: Пользователь скрыл имя, 13 Января 2014 в 01:07, контрольная работа
Генеральной совокупностью называется совокупность объектов или наблюдений, все элементы которой подлежат изучению при статистическом анализе.
В математической статистике генеральная совокупность часто понимается как совокупность всех мыслимых наблюдений, которые могли быть произведены при выполнении данного комплекса условий. Понятие генеральной совокупности аналогично понятию случайной величины (закону распределения вероятностей), так как обе они полностью определяются заданным комплексом условий.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ КАЗАНСКИЙ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТЕХНОЛОГИЧЕСКИЙ
УНИВЕРСИТЕТ
Контрольная работа по предмету:
Методы анализа социологических данных
Вариационные ряды и
их характеристики
1.1 Генеральная и выборочная
совокупности
Генеральной совокупностью называется совокупность объектов или
наблюдений, все элементы которой подлежат изучению при статистическом
анализе.
В математической статистике генеральная
совокупность часто понимается как совокупность
всех мыслимых наблюдений, которые могли
быть произведены при выполнении данного
комплекса условий. Понятие генеральной
совокупности аналогично понятию случайной
величины (закону распределения вероятностей),
так как обе они полностью определяются
заданным комплексом условий. Так как
понятия генеральной совокупности и совокупности
всех значений случайной величины связаны
с испытаниями (наблюдениями) в неизменных
условиях, то в дальнейшем эти понятия
не будут различаться.
Понятие генеральной совокупности несколько
шире понятия случайной величины, так
как случайная величина может быть результатом
нескольких испытаний.
Генеральная совокупность может быть
конечной или бесконечной.
Число объектов (наблюдений) в генеральной
совокупности называется ее
объемом.
Изучение всего набора элементов генеральной
совокупности часто оказывается невозможным,
в таких случаях рассматривают некоторую
часть объема.
Часть объектов генеральной совокупности,
используемая для исследования, называется выборочной совокупностью или выборкой.
Пример. Число единиц товара N, произведенного
фирмой в течение года, есть конечная генеральная
совокупность. Для исследования качества
продукции на практике рассматривается
выборка, состоящая из п единиц товара. Признаком, или случайной
величиной, может быть число единиц товара,
удовлетворяющих сертификатным требованиям.
Сущность выборочного метода в математической
статистике заключается в том, чтобы по
определенной части генеральной совокупности
(выборке) судить о ее свойствах в целом.
Выборочный метод является единственно
возможным в случае бесконечной генеральной
совокупности или когда исследование
связано с уничтожением (гибелью) наблюдаемых
объектов (например, исследование предельных
режимов приборов, исследование действия
вирусов на подопытных животных и т.д.).
Для того чтобы по выборке можно было адекватно
судить о случайной величине, она должна
бытьпредставительной (репрезентативной).
Репрезентативность выборки обеспечивается
случайностью отбора ее элементов, так
как все элементы генеральной совокупности
должны иметь одинаковую вероятность
попадания в выборку.
Имеются два способа образования выборки:
1) повторная выборка, когда каждый элемент, случайно отобранный
и исследованный, возвращается в общую
совокупность и может быть отобран повторно;
2) бесповторная выборка, когда отобранный элемент не возвращается
в общую совокупность.
^ 1.2. Понятие вариационного ряда и его
графические изображения
Пусть некоторый признак генеральной
совокупности описывается случайной величиной X.
Рассмотрим выборку {х1,х2,...,хп} объема
На первом этапе статистической обработки
производят ранжирование выборк
Различные элементы выборки называются вариантами.
Частотой варианты
называется число
, показывающее, сколько раз эта варианта
встречается в выборке.
^ Частостью, относительной частотой или долей варианты называется число
(1.1)
Частоты и частости называются весами.
Пусть х некоторое число. Тогда количество вариант
, значения которых меньше х, называется накопленной частотой, т.е.
(1.2)
Отношение накопленной частоты к общему
числу наблюдений п называется накопл
Ряд вариант, расположенных в порядке
возрастания их значений, с соответствующими
им весами называется вариационным рядом.
Вариационные ряды бывают:
- дискретные;
- интервальные.
Вариационный ряд называется дискретным, если он представляет собой выборку значений
дискретной случайной величины.
Ряд называется непрерывным (интервальным), если он представляет выборку непрерывной
случайной величины.
Общий вид дискретного вариационного
ряда показан
в табл. 1.1.
Таблица 1.1
|
|
|
|
|
|
|
|
|
|
Построение интервального
вариационного ряда
1. Разбивают множество значений вариант
на полуинтервалы
т.е. производят их группировку.
Рекомендуется количество интервалов k выбирать по формуле Стерджерса
(1.4)
Длина интервала равна
Δ = xmax – xmin/ k
Замечание 1.
В литературе предлагается и такая форма
записи формулы Стерджерса
|
|
|
|
|
|
|
|
|
|
Замечание 2.
Если варианта находится на границе интервала,
то ее присоединяют к правому интервалу.
^ Графические изображения вариационных
рядов
Для наглядности представления используют
графические изображения вариационных
рядов в виде:
- полигона;
- гистограммы;
- кумулянты.
Полигон, как правило, служит для изображения
дискретного вариационного ряда.
Представляет собой ломаную, соединяющую
точки плоскости с координатами
.
Для интервального ряда также строится
полигон, только его ломаная проходит
через точки
, где
.
Гистограмма служит только для представления интервальных
вариационных рядов и имеет вид ступенчатой
фигуры из прямоугольников с основаниями,
равными длине интервалов Δ, и высотами,
равными частотам
интервалов.
Кумулянта представляет собой ломаную, соединяющую
точки с координатами
(где
— накопленные частоты) для дискретного
ряда, или точки с координатами
для интервального ряда.
Эмпирической функцией распределения
называется функция, значение которой
в точке х равно накопленной частоте, т.е.
(1.6)
Для интервального ряда указываются не
конкретные значения вариант, а только
их частоты на интервалах. В этом случае
эмпирическая функция распределения определена
только на концах интервалов. Ее можно
изобразить ломаной, проходящей через
точки
.
Эмпирической плотностью распределения непрерывного вариационного ряда называется
функция
,
если
, если
или
Функция
является аналогом плотности распределения
случайной величины. Площадь области под
графиком этой функции равна единице.
Пример 1.1. В магазине за день было продано 45 пар
мужской обуви.
Имеется выборка значений случайной величины X — размера обуви:
39, 41, 40, 42, 41, 40, 42, 44, 40, 43, 42, 41,
43, 39, 42,
41, 42, 39, 41, 37, 43, 41, 38, 43, 42, 41, 40,
41, 38, 44,
40, 39, 41, 40, 42, 40, 41, 42, 40, 43, 38, 39,
41, 41, 42.
Построить:
Решение.
Таблица 1.3
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
36 37 38 39 40 41 42 43 44 45 x
3. По данным табл. 1.3 находим накопленные
частоты и частости (табл. 1.4).
Таблица 1.4
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
На рис. 7.2 изображена кумулянта, а
на рис. 7.3 – эмпирическая функция
распределения.
Кумулянта
Эмпирическая функция распределения
Пример 1.2. Результаты измерений отклонений от
номинала диаметров 50 подшипников дали
численные значения (в мкм), приведенные
в табл. 1.5.
Таблица 1.5
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для данной выборки построить:
- число интервалов k = 7;
- начало первого интервала
;
- конец последнего, седьмого, интервала
.
4. Варианту
отнесем в первый интервал.
5. Длина каждого интервала будет равна
Таблица 1.6
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7. По данным табл. 1.6 строим полигон
и гистограмму (рис. 7.4).
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|