Автор работы: Пользователь скрыл имя, 23 Марта 2013 в 22:03, контрольная работа
Провести группировку с равными интервалами. При необходимости перегруппировать с неравными интервалами. Записать полученный интервальный ряд распределения и соответственный ему дискретный ряд. Построить гистограмму, кумуляту интервального ряда и полигон соответствующего дискретного ряда.
Контрольная работа по статистике
тема «Ряды распределения»
В результате статистического наблюдения были получены следующие данные о прибыли 100 торговых предприятий за год (млн. руб.)
5,2 9,2 6,7 18,0 10,7 12,0 14,
20,7 18,5 17,4 12,4 21,3 18,4
17,7 20,0 13,9 24,5 23,1 18,2
18,2 16,2 7,0 28,0 16,8 8,0 23,2 13,3 11,3 14,2
10,8 24,5 19,6 11,7 16,0 16,5
15,4 26,0 26,6 25,0 25,4 26,8
26,2 26,5 26,9 26,2 25,1 27,1
12,8 24,2 19,1 10,3 3,8 22,8 10,5 13,3 14,6 11,7
10,3 14,5 16,1 18,1 23,0 9,1 14,0 13,4 9,9 9,1
12,3 11,5 10,1 13,1 21,0 19,1 5,1 9,8 6,7 85,2
Указанные
предприятия имеют
1000 1200 1100 1800 1070 1200
2070 1850 1740 1240 2130 1840 2210 1070 4530 1690
1770 2000 1390 2450 2310 1820
1820 1620 700 2800 1680 800 2320 1330 1130 1420
1080 2450 1960 1170 1600 1650
1540 2600 2660 2500 2540 2680
2620 2650 2690 2620 2510 2710
1200 2420 1910 1030 3800 2280 1050 1330 1460 1170
1030 1450 1610 1810 2300 910 1400 1340 990 910
1230 1150 1010 1310 2100 1910 1200 900 800 1000
Провести
группировку с равными
Построим упорядоченный ряд по площади производственных помещений (см. в Excel).
Максимальное значение признака составляет 4570, минимальное – 470, таким образом, размах вариации R = 4570 – 470 = 4100.
Число интервалов определим по формуле n = [1+3.22*lg N] = [1+3.22*2] = 7
Величина интервала R/n = 4100 / 7 = 585.7
Построим данные интервалы и определим число признаков в каждом из них.
Площадь, кв. м |
Число предприятий |
470 - 1055,7 |
17 |
1055,7 - 1641,4 |
34 |
1641,4 - 2227,1 |
23 |
2227,1 - 2812,8 |
23 |
2812,8 - 3398,5 |
0 |
3398,5 - 3984,2 |
2 |
3984,2 - 4570 |
1 |
Гистограмма распределения производственных площадей (по х – площадь, по у – число предприятий)
Кумулята интервального ряда:
Полигон частот:
По гистограмме найти приближенное значение моды, по кумуляте найти приближенное значение медианы.
Мода соответствует интервалу 1055,7 – 1641,4, медиана – тому же интервалу.
Вычислить моду, медиану по формулам.
Мода = 1055,7 + 585,7 * (34-23) / ((34-23)+(34-17)) = 1262,7
Медиана = 1055,7 + 585,7*(0,5 – 0,17) / 0,34 = 1624,17
Сформулировать выводы.
Наибольшую частоту имеет значение производственной площади, равное 1262,7 кв. м, а среднее значение производственной площади у данной совокупности предприятий находится на уровне 1624,17 кв. м
Найти среднее значение, размах, среднее линейное отклонение, дисперсию и среднеквадратическое отклонение, коэффициент вариации. Сделать выводы.
Средняя арифметическая:
Её значений равно 1743,7 кв. м
Среднее линейное отклонение:
Его значение составляет 587,746.
Дисперсия:
Её значение составляет 513571,31.
Среднеквадратическое отклонение:
Его значение равно 716,639.
Расчеты проведены в Excel
Разбить статистическую. совокупность на две группы. В первую группу отнести все предприятия, площади производственных площадей которых меньше 1500 кв. м, во вторую группу – все остальные предприятия. Вычислить среднюю из внутригрупповых дисперсий и межгрупповую дисперсию. Вычисления проверить по правилу сложения дисперсий. Вычислить эмпирическое корреляционное отношение. Сформулировать выводы.
Разобьем совокупность на 2 группы:
Производственная площадь, кв. м |
Число предприятий |
Средняя площадь |
470-1500 |
44 |
1115,681818 |
1500-4530 |
56 |
2237,142857 |
Внутригрупповая дисперсия характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Такая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы X от средней арифметической группы и может быть вычислена как простая дисперсия или как взвешенная дисперсия.
Средняя из внутри групповых дисперсий отражает случайную вариацию, т. е. ту часть вариации, которая происходила под влиянием всех прочих факторов, за исключением фактора группировки. Она рассчитывается по формуле:
Её значение составляет 203680,224.
Расчеты проведены в Excel
Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, которая обусловлена влиянием признака-фактора, положенного в основание группировки. Она равняется среднему квадрату отклонений групповых средних от общей средней.
Межгрупповая дисперсия рассчитывается по формуле:
Её значение составляет 309891,86.
Расчеты проведены в Excel
Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:
Проверим полученные значения по правилу сложения дисперсий: 203680,224 + 309891,86 = 513571,31. Полученное значение совпадает со значением общей дисперсии, полученной ранее.
Эмпирическое корреляционное отношение оценивает тесноту связи между изучаемым и группировочным признаками. Она равна корню отношения межгрупповой дисперсии к общей дисперсии.
ЭКО = √309891,86 / 513571,31 = 0,6034
Наблюдается заметная связь между показателями, что означает, что вариация производственных площадей обусловлена не только внутригрупповыми отличиями.
Тема. Выборочный метод.
1.
При контрольной проверке
n = 10, среднее значение = 4,13
Найдем дисперсию: σ2 = ((4,5-4,13)2 + … + (3,8-4,13)2) / 10 = 0,0881
Определим выборочную среднюю: μx = √(0,0881)2/10 = 0.02786
Для вероятности 0,99 и числа признаков 10 значение коэффициента Стьюдента составит 3,25.
Найдем предельную ошибку выборки: ∆x = 3,25*0,02786 = 0,0905
Таким образом, границы, в которых находится средний процент содержания соли, равны
(4,13 – 0,0905; 4,13 + 0,0905) = (4,04; 4,22)
3.
С лесного массива,
Кол-во деловой древесины в одном дереве м3 |
Число деревьев |
Середина интервала |
0,4–0,6 |
9 |
0,5 |
0,6–0,8 |
65 |
0,7 |
0,8–1,0 |
121 |
0,9 |
1,0–1,2 |
174 |
1,1 |
1,2–1,4 |
99 |
1,3 |
1,4–1,6 |
6 |
1,5 |
Итого |
474 |
- |
Найти границы, в которых с вероятностью 0,95 заключено среднее количество древесины.
Найдем средневзвешенное количество деловой древесины:
Хср. = 1,029536
Найдем дисперсию:
Дисперсия равна 0,044402.
Определим выборочную среднюю: μx = √(0,044402)2/10 = 0.014
Для вероятности 0,95 и числа признаков 474 значение коэффициента Стьюдента составит 1,9647.
Найдем предельную ошибку выборки: ∆x = 1,9647*0,014 = 0,0276
Таким образом, границы, в которых находится среднее количество древесины, равны
(1,03–0,0276; 1,03+0,0276) = (1,0024; 1,0576)
3.
При обследовании семейных
Группа населения по семейному положению |
Объем выборки |
Удельный вес расходов на оплату жилья, % |
Одинокие |
40 |
9,6 |
Семейные |
124 |
6,85 |
Найти границы, в которых с вероятностью 0,95 заключен удельный вес расходов на оплату жилья населением города.
Найдем средневзвешенный удельный вес расходов на оплату жилья:
Хср. = (40*9,6+124*6,85) / (40+124) = 7,52%
Найдем выборочную дисперсию:
s2 = ((7,52-9,6)2*40 + (7,52-6,85)2*124) / 164 = 1,39463
4. Для контроля всхожести партия семян была разбита на 25 равных по величине серий. На основе случайного бесповторного отбора было проверено на всхожесть 5 серий и установлен процент всхожести равный 65. Межсерийная дисперсия составила 9,04.
Найти границы, в которых с вероятностью 0,96 заключен всхожести семян всей партии.
В данном примере числом признаков выступает число серий.
Доля отбора = 5 / 25 = 0,2
Процент всхожести
65% выступает как среднее
Остальные расчеты производим аналогично предыдущей задаче:
5. В коммерческом банке 180 компьютеров, в том числе типа I – 37, типа II – 57, типа III – 70, типа IV – 16. Необходимо составить типическую выборку. Определить, какое количество компьютеров необходимо отобрать, чтобы с вероятностью 0,683 ошибка не превышала пяти. Известно, что дисперсия такой типической выборки равна 805.
Доля групп компьютеров: I – 37/180 = 0.205; II – 57/180 = 0.317; III – 70/180 = 0.389; IV – 0.089
Для бесповторного отбора расчет необходимого отбора компьютеров при заданной дисперсии 805, вероятности 0,683 и предельной ошибке, равной 5, проводится по следующей формуле:
Округлив полученное значение в большую сторону, получим, что необходимо отобрать 28 компьютеров.
Составим типическую выборку пропорционально доле компьютеров в генеральной совокупности (доли округляем согласно правилу округления):
I – 28*0,205 = 5,74 ≈ 6
II – 28*0,317 = 8,876 ≈ 9
III – 28*0,389 = 10,892 ≈ 11
IV – 28*0,089 = 2,492 ≈ 2
Таким образом, необходимо отобрать 6 ед. 1-й группы, 9 ед. 2-й группы, 11 ед. 3-й группы, и 2 ед. 4-й группы.
Тема Изучение связи между явлениями.
1. Имеются данные о связи между средней взвешенной ценой и объемом продаж облигаций на ММВБ 23.02.98 г.:
№ серии |
Средняя взвешенная цена Х ( руб.) |
Объем продаж Y (млн. руб) |
22041 |
84,42 |
79,5 |
22042 |
82,46 |
79,7 |
22043 |
80,9 |
71,4 |
22044 |
63,42 |
42,9 |
22045 |
76,9 |
76,3 |
22046 |
75,5 |
74,9 |
22047 |
74,84 |
10,7 |
22048 |
73,03 |
75,1 |
22049 |
73,41 |
75,5 |
22050 |
71,34 |
84,3 |
Итого |
Выявить всеми известными методами наличие и направление связи между Х и У. Вычислить линейный коэффициент корреляции.