Сравнение двух случайных выборок

Автор работы: Пользователь скрыл имя, 17 Декабря 2013 в 16:18, курсовая работа

Описание работы

Распределение случайной величины Х характеризуется рядом параметров (математическое ожидание, дисперсия и т.д.). Эти параметры называют параметрами генеральной совокупности. Важной задачей математической статистики является нахождение по случайной выборке приближенных значений каждого из параметров, называемых точечными оценками параметров, или просто оценками. Таким образом, оценкой параметра β называется функция f(X1, X2, ... , Xn) от случайной выборки, значение которой принимается в качестве приближенного для данного параметра и обозначается

Содержание работы

Глава 1. Теоретическое введение 3
1.1 Точечные оценки параметров распределения 3
1.2 Доверительные интервалы параметров с нормальным распределением. 4
1.3 Проверка статистических гипотез 4
1.4 Проверка гипотезы о виде распределения генеральной совокупности 6
1.5 Построение гистограммы (эмпирической функции распределения) 7
1.6 Содержание типового расчета 7
Глава 2.Выполнение типового расчета 9
2.1 Первичная обработка результатов измерений 9
2.2Построение доверительных интервалов 11
2.3 Проверка гипотез о равенстве дисперсий и о равенстве математических ожиданий 11
Проверка гипотезы о виде распределения генеральной совокупности 12
2.5 Построение гистограммы (эмпирической функции распределении) 13
2.6 Вывод по результатам типового расчет 13

Файлы: 1 файл

Курсач.docx

— 75.88 Кб (Скачать файл)

Министерство  образования и науки российской федерации

Федеральное государственное автономное образовательное учреждение высшего  профессионального образования

Национальный исследовательский ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ

«МИСиС»

ИНСТИТУТ  ЭКОНОМИКИ И УПРАВЛЕНИЯ ПРОМЫШЛЕННЫМИ  ПРЕДПРИЯТИЯМИ

Кафедра экономической теории

 

 

 

Учебный курс

«Теория вероятностей и математическая статистика»

 

Курсовая  работа на тему:

«Сравнение двух случайных выборок»

 

 

 

 

 

 

 

 

 

Выполнил  студент группы

Э2-11-1/МЭ-11-3

      Горюнов Е.В

Проверил:

Доцент  Ким-Тян Л.Р.

 

 

 

Москва 2013

Содержание

Содержание 2

Глава 1. Теоретическое введение 3

1.1 Точечные оценки параметров распределения 3

1.2 Доверительные интервалы параметров с нормальным распределением. 4

1.3 Проверка статистических гипотез 4

1.4 Проверка гипотезы о виде распределения генеральной совокупности 6

1.5 Построение гистограммы (эмпирической функции распределения) 7

1.6 Содержание типового расчета 7

Глава 2.Выполнение типового расчета 9

2.1 Первичная обработка результатов измерений 9

2.2Построение доверительных интервалов 11

2.3 Проверка гипотез о равенстве дисперсий и о равенстве математических ожиданий 11

Проверка гипотезы о виде распределения генеральной совокупности 12

2.5 Построение гистограммы (эмпирической функции распределении) 13

2.6 Вывод по результатам типового расчет 13

 

 

 

 

 

 

Глава 1. Теоретическое введение

1.1 Точечные оценки параметров  распределения

 

Распределение случайной величины Х характеризуется рядом параметров (математическое ожидание, дисперсия и т.д.). Эти параметры называют параметрами генеральной совокупности. Важной задачей математической статистики является нахождение по случайной выборке приближенных значений каждого из параметров, называемых точечными оценками параметров, или просто оценками. Таким образом, оценкой параметра β называется функция f(X1, X2, ... , Xn) от случайной выборки, значение которой принимается в качестве приближенного для данного параметра и обозначается  :

β ≈ 

 = f(X1, X2, ... , Xn).

(1.1)


Пусть задана повторная случайная  выборка X1, X2, ... , Xn. За оценку математического ожидания a принимается среднее арифметическое элементов выборки:

(1.2)


Оценкой дисперсии σпри неизвестном математическом ожидании является величина S2, которую называют эмпирической дисперсией:

(1.3)


Оценкой среднего квадратического отклонения σ при этом является, соответственно, величина

(1.4)


Для практических расчетов формулу (1.3) целесообразно преобразовать к  следующему виду:

(1.5)


Вычисление среднего значения   и оценки дисперсии Sупрощается, если отсчет значений Xвести от подходящим образом выбранного начала отсчета С и в подходящем масштабе, т.е. сделать линейную замену (кодирование):

X= C + hU(i = 1, 2, ... , n).

(1.6)


При такой замене формулы (1.2), (1.3), (1.4) принимают следующий вид:

1.7)


(1.8)


Для контроля правильности вычислений весь расчет следует повторить при  другом начале отсчета С: результаты должны совпадать с точностью до величины возможных ошибок округления

1.2 Доверительные интервалы параметров  с нормальным распределением.

Доверительным интервалом параметра β называется интервал со случайными границами ( – ε1;  + ε2), который накрывает истинное значение параметра β с заданной вероятностью P, которая называется доверительной вероятностью. Величина α = 1 – P называется уровнем значимости. При этом обычно требуют, чтобы вероятности выхода за границы доверительного интервала в обе стороны были равны между собой, а именно:  
P(β <  – ε1) = P(β >   + ε2) = (1 – P)/2 = α/2.  
Это дополнительное требование обеспечивает единственность решения задачи.  
Пусть задана повторная случайная выборка X1, X2, ..., Xиз нормальной генеральной совокупности. Это означает, что результаты эксперимента независимы и подчиняются нормальному закону распределения с одинаковыми параметрами X~ N(a; σ).  
С вероятностью P математическое ожидание принадлежит интервалу 

a є (

 – ε, 
 + ε);

(1.9)


(1.10)


где   – оценка математического ожидания (1.2);   – оценка среднего квадратического отклонения σ (1.4);  
t1–α/2(k) – квантиль распределения Стьюдента с k степенями свободы; n – объем выборки; k – число степеней свободы при вычислении оценки S.  
Часто доверительный интервал для математического ожидания записывают символически:

α = 

 ± ε.

(1.11)


Доверительный интервал для среднего квадратического отклонения σ при доверительной вероятности P = 1 – α имеет следующий вид:

(3.12)


где S – оценка среднего квадратического отклонения σ (1.6) при неизвестном математическом ожидании; χP2(k) – квантиль распределения Пирсона с k степенями свободы; k – число степеней свободы оценки S.

1.3 Проверка статистических  гипотез

Пусть Х – наблюдаемая случайная величина. Статистической гипотезой Н называется предположение относительно параметров или вида распределения случайной величины Х. Проверяемая гипотеза называется нуль-гипотезой и обозначается Н0. При постановке нуль-гипотезы сразу ставится альтернативная гипотеза Н1, т.е. то предположение, которое следует принять, если нуль-гипотеза будет отвергнута.  
Правило, позволяющее принять или отвергнуть гипотезу Н– некоторая функция результатов эксперимента Q(X1, X2, ... , Xn), распределение которой вполне определено при условии истинности гипотезы Н0.  
Пусть заданы две независимые выборки из двух нормальных генеральных совокупностей. Первая выборка имеет объем n1, элементы выборки Хi(1) ~ N(a1; σ1); вторая – объем n2, элементы выборки Хi(2) ~ N(a2; σ2). Необходимо проверить гипотезу о равенстве дисперсий этих двух генеральных совокупностей, т.е. Н0: σ1= σ22. Математические ожидания aиaнеизвестны.  
В этом случае по каждой выборке находят несмещенные оценки дисперсий S1и S2с числами степеней свободы k= n– 1 и k= n– 1 соответственно. Гипотезу проверяют по критерию Фишера, функция критерия

F = S12/S22

(1.13)


имеет F-распределение Фишера с kи kстепенями свободы, т.е. F = F(k1,k2).  
Если альтернативная гипотеза Н1: σ1≠ σ22, то критерий Фишера рассчитывается как отношение большей по величине оценки дисперсии к меньшей:

F = (Sбол)2/(Sмен)> 1.

(1.14)


Гипотеза  принимается при выполнении неравенства

F < F1–α/2(kSбол,kSмен),

(1.15)


в противоположном случае гипотеза отвергается. Здесь kSбол – число степеней свободы большей оценки дисперсии; kSмен – число степеней свободы меньшей оценки дисперсии.  
Если гипотеза о равенстве дисперсий принимается, то за оценку общей σ может быть взята  , полученная по формуле для сводной оценки дисперсии:

(1.16)


где S12, S2– несмещенные оценки дисперсии первой и второй выборок соответственно.  
Пусть заданы две независимые выборки из двух нормальных генеральных совокупностей. Первая выборка имеет объем n1, элементы выборки Хi(1) ~ N(a1; σ1); вторая – объем n2, элементы выборки Хi(2) ~ N(a22). Математические ожидания aи aнеизвестны.  
Проверяем гипотезу о равенстве математических ожиданий этих двух генеральных совокупностей, т.е. Н0: a= a2. По каждой выборке находим оценки математических ожиданий  и  2. При этом дисперсии σ1и σ2неизвестны, но гипотеза о равенстве дисперсий принимается; S1и S2– несмещенные оценки дисперсий первой и второй выборок. Находим сводную оценку дисперсии (1.16).  
Гипотеза проверяется по критерию Стьюдента, функция критерия

(1.17)


имеет t-распределение Стьюдента с kCB степенями свободы, т.е. t = t(kCB );  kCB = k+ k– число степеней свободы при вычислении оценки  . При альтернативной гипотезе Н1: а≠ а2, гипотеза принимается при выполнении неравенства

|t| < t1–α/2(kCB ),

(1.18)


в противоположном случае гипотеза отвергается.  
Если гипотеза о равенстве математических ожиданий принимается, то за оценку общего математического ожидания может быть взята сводная оценка математического ожидания, которая определяется как средняя по обеим выборкам:

.

(1.19)


Доверительный интервал для математического ожидания при этом можно пересчитать, заменив  в формулах (1.10) – (1.11)   на  CB; S на SCB; k на kCB = kk2, n на n+ n2.

 

1.4 Проверка гипотезы  о виде распределения генеральной  совокупности

Если  распределение случайной величины Х не известно, можно рассмотреть гипотезу о том, что Х имеет функцию распределения F(x). Критерии значимости для проверки таких гипотез называются критериями согласия.  
Пусть X1, X2, ... , X– выборка наблюдений случайной величины Х. Проверяется гипотеза Н0, утверждающая, что Х имеет функцию распределения F(x).  
Проверку гипотезы Нпри помощи критерия χпроводят следующим образом. По выборке находят оценки неизвестных параметров предполагаемого закона распределения случайной величины Х. Область возможных значений случайной величины Х разбивают на l интервалов. Подсчитывают числа nпопаданий результатов экспериментов в каждый i-й интервал. Используя предполагаемый закон распределения случайной величины Х, находят вероятности ртого, что значение Х принадлежит i-му интервалу. Затем сравнивают полученные частоты n/n с вероятностями рi. Критерий согласия Пирсона требует принятия гипотезы о пригодности проверяемого распределения с уровнем значимости α, если значение взвешенной суммы квадратов отклонений

.

(1.20)


меньше  квантиля распределения χ2-распределения с k = l – 1 степенями свободы, т.е. χ< (χ1–α)2(k),  
в противоположном случае эта гипотеза отвергается, как противоречащая результатам эксперимента. Если при этом некоторые параметры распределения оценивают по результатам той же выборки, то квантиль χ2-распределения следует брать для k = l – 1 – m степеней свободы, где m – число оцениваемых параметров.

 

1.5 Построение гистограммы  (эмпирической функции распределения)

Для наглядного представления о выборке  часто используют график, называемый гистограммой. Для построения гистограммы интервал, содержащий все элементы выборки, разбивают на l непересекающихся интервалов (как правило, равной длины). Подсчитывают числа nпопаданий результатов экспериментов в каждый i-й интервал и строят столбиковую диаграмму, откладывая по оси ординат значения средней плотности n/(nhi), где h– длина i-го интервала. Площадь каждого столбика равна n/n, что соответствует относительной частоте попадания элементов выборки в i-й интервал. Площадь под всей ступенчатой фигурой равна единице.  
При увеличении объема выборки и уменьшении интервалов группировки гистограмма приближается к функции плотности генеральной совокупности. Гистограмма является эмпирической функцией плотности, она дает приближенную функцию плотности генеральной совокупности (ее оценку) по случайной выборке.

Информация о работе Сравнение двух случайных выборок