Автор работы: Пользователь скрыл имя, 04 Февраля 2013 в 08:49, контрольная работа
На основании исходных данных, выданных преподавателем, необходимо:
1. Построить интервальный ряд распределения, определив величину интервала с помощью формулы Стерджесса.
2. Определить показатели центра распределения.
3. Вычислить показатели вариации.
4. Рассчитать показатели формы распределения.
5. Проверить соответствие эмпирического распределения нормальному закону распределения с помощью критерия согласия Пирсона (или Романовского)
Задание 1.
На основании исходных данных, выданных преподавателем, необходимо:
Задание 2.
Считая первые 4 значения первой строки исходных данных уровнями интервального временного ряда, определить показатели динамики. При расчете базисных показателей в качестве базы сравнения принять первый уровень ряда.
Задание 3.
Считая исходные данные 10%-ой простой случайной бесповторной выборкой определить:
Вариант № 38
48 |
53 |
20 |
19 |
24 |
23 |
36 |
21 |
32 |
34 |
29 |
16 |
41 |
35 |
47 |
30 |
49 |
33 |
16 |
36 |
22 |
32 |
13 |
35 |
24 |
32 |
29 |
20 |
49 |
18 |
46 |
43 |
15 |
28 |
25 |
41 |
36 |
10 |
42 |
31 |
42 |
23 |
40 |
19 |
40 |
16 |
23 |
22 |
20 |
47 |
Задание 1.
Ряд распределения представляет собой таблицу, которая состоит из двух основных колонок. В первой указываются значения, которые принимает признак в изучаемой совокупности, а во второй – количество, того или иного значения, т.е. частота. Для признака, имеющего непрерывное изменение, строится интервальный ряд распределения. При его построении отдельные значения признака указываются в первой колонке в виде интервалов «от - до».
Для построения интервального ряда вначале определяем размер интервала:
где xmax – максимальное значение признака в совокупности =53
xmin - минимальное значение признака в совокупности =10
m – число интервалов =50
Количество интервалов определим с помощью формулы Стерджесса:
где n – объем совокупности (количество исходных значений). В нашем случае n=50.
Количество интервалов обязательно должно быть целым числом. Поскольку формула Стерджесса дает лишь приблизительную оценку количества интервалов, то можно принять либо m=6, либо m=7. Тогда размер интервала будет равен:
Для удобства дальнейших вычислений примем m=7.
Определяем границы интервалов. Нижняя граница первого интервала равна минимальному значению признака в совокупности, т.е. в нашем случае равна 10. Верхняя граница первого интервала равна нижней границе плюс размер интервала, т.е. 10+7=17. Нижняя граница второго интервала равна верхней границе первого, т.е. 17. Верхняя граница второго интервала равна нижней границе второго интервала плюс размер интервала, т.е. 10+7=17 и т.д. В итоге получаем границы для семи интервалов. Заносим границы интервалов в таблицу (табл. 1, колонка 2).
Далее подсчитываем количество значений признака из заданной совокупности, попавших в тот или иной интервал и заносим это число в колонку «Частота». Если значение попадает на границу между k-ым и (k+1)-ым интервалами, то его относят в (k+1)-ый интервал. Сумма всех частот обязательно должна совпадать с объемом совокупности (в нашем случае со значением 50).
Вычисляем частости, т.е. частоты, выраженные в процентах к общему объему совокупности:
;
; ;
; ;
; ;
Таблица 1.
Интервальный ряд распределения
№ Инт. |
Значение признака (х) от - до |
Частота (f) |
Частость (w), % |
Накопленная частота (S) |
Плотность распределения (ρ) |
1 |
10 – 17 |
6 |
12 |
6 |
0.857 |
2 |
17 – 24 |
12 |
24 |
18 |
1.714 |
3 |
24 – 31 |
7 |
14 |
25 |
1 |
4 |
31 – 38 |
11 |
22 |
36 |
1.571 |
5 |
38 – 45 |
7 |
14 |
43 |
1 |
6 |
45 – 52 |
6 |
12 |
49 |
0.857 |
7 |
52 – 59 |
1 |
2 |
50 |
0.143 |
итого: |
50 |
100 |
- |
- |
Накопленная частота вычисляется по формуле:
; ; ; ; ; ;
Последнее значение накопленной частоты должно быть равно объему совокупности.
Плотность распределения показывает сколько единиц совокупности приходятся на единицу длины интервала:
.
;
;
; ;
Строим графические
Рис. 1. Структурная диаграмма
Рис.2. Полигон распределения
Рис 2.Гистограмма распределения
Рис 4. Кумулятивная кривая
К показателям центра распределения относятся: средняя арифметическая, мода и медиана.
Средняя арифметическая
где xi –середина i-го интервала.
Для нахождения моды по интервальному ряду распределения в начале определяем модальный интервал, т.е. интервал с максимальной частотой. В нашем случае таким интервалом будет интервал от 31 до 38 (4-й интервал). Далее величину моды вычисляем по формуле
где – нижняя граница модального интервала = 31
- размер модального интервала = 7
- частота модального интервала = 11
- частота интервала, предществующего модальному =7
- частота интервала, следующего за модальным = 7
Для нахождения медианы по интервальному ряду распределения в начале определяем медианный интервал. Им будет первый сверху интервал, в котором накопленная частота больше или равна половине объема совокупности. В нашем случае половина объема совокупности n/2=50/2=25. Первый с верху интервал, в котором накопленная частота равна 25 – это интервал от 24до 31 (в нем накопленная частота равна 25), поэтому этот интервал является медианным.
Далее величина медианы вычисляется по формуле
где – нижняя граница медианного интервала = 24
- размер медианного интервала =7
- частота медианного интервала = 7
- накопленная частота интервала, предществующего медианному =18
Для характеристики изменчивости отдельных значений признака в статистике используют абсолютные и относительные показатели вариации.
Абсолютные показатели вариации:
Размах
Среднее линейное отклонение
Дисперсия
Среднее квадратическое отклонение
Относительные показатели вариации:
Коэффициент осцилляции
Относительное линейное отклонение
Коэффициент вариации
Показатель асимметрии
Если As < 0, то асимметрия левосторонняя.
Если |As|>0.5, то асимметрия значительная (существенная), т.е. распределение не может быть признано симметричным.
Показатель эксцесса (островершинности)
где μ4 – центральный момент 4-го порядка
Поскольку Ех <0, то распределение плосковершинное.
Теоретические частоты для нормального распределения вычисляются по формуле
Таблица 2
Вычисление теоретических частот
№ Инт. |
Середина интервала |
|||
1 |
13.5 |
- 1.178 |
0.307 |
3.4 |
2 |
20.5 |
- 0.450 |
0.637 |
7 |
3 |
27.5 |
- 0.07 |
0.932 |
10.3 |
4 |
34.5 |
- 0.025 |
0.975 |
10.7 |
5 |
41.5 |
- 0.328 |
0.720 |
7.9 |
6 |
48.5 |
- 0.974 |
0.377 |
4.1 |
7 |
55.5 |
- 1.964 |
0.140 |
1.5 |
По результатам вычислений строим график (рис. 5).
Рис. 5. Эмпирическое и теоретическое распределения
Для проверки соответствия эмпирического и теоретического
будем использовать критерий согласия Пирсона («хи-квадрат»)
Применение критерия Пирсона требует выполнения следующих условий:
1) число наблюдений должно быть достаточно большим (n≥50). Данное условие в нашем случае выполняется;
2) теоретические частоты в интервалах должны быть больше 5. Это условие в нашем случае не выполняется для последнего интервала. Поэтому прежде чем вычислять критерий Пирсона произведем объединение интервалов –последнего и предпоследнего. Таким образом из 7 интервалов, которые у нас были в начале, останутся 6.
Таблица 3
Расчет критерия Пирсона
№ Инт. |
fi |
||||
1 |
6 |
3.4 |
1.988 | ||
2 |
12 |
7 |
0.714 | ||
3 |
7 |
10.3 |
1.057 | ||
4 |
11 |
10.7 |
0.008 | ||
5 |
7 |
7.9 |
1 | ||
6 |
6 1 |
7 |
4.1 1.5 |
5.5 |
0.409 |
7 | |||||
χ2= |
4.176 |
Применение критерия согласия Пирсона требует использования специальных таблиц. Что бы избежать этого, вычислим на основе критерия Пирсона критерий Романовского
где γ=m*-l-1 – число степеней свободы;
m* - число интервалов после объединения (в нашем случае m* =6);
l – число параметров распределения (для нормального распределения l=2).