Контрольная работа по "Статистике "

Автор работы: Пользователь скрыл имя, 23 Марта 2013 в 22:03, контрольная работа

Описание работы

Провести группировку с равными интервалами. При необходимости перегруппировать с неравными интервалами. Записать полученный интервальный ряд распределения и соответственный ему дискретный ряд. Построить гистограмму, кумуляту интервального ряда и полигон соответствующего дискретного ряда.

Файлы: 1 файл

Контрольная по статистике 2011-2012 (2).docx

— 435.23 Кб (Скачать файл)

Контрольная работа  по статистике

 тема «Ряды распределения»

 

В результате статистического наблюдения были получены следующие данные о прибыли 100 торговых предприятий за год (млн. руб.)

5,2 9,2 6,7 18,0 10,7 12,0 14,2 12,1 20,8 21,0

20,7 18,5 17,4 12,4 21,3 18,4 22,1 10,7 45,3 16,9 

17,7 20,0 13,9 24,5 23,1 18,2 9,0  27,3 17,7 19,7

18,2 16,2 7,0  28,0 16,8 8,0  23,2 13,3 11,3 14,2

10,8 24,5 19,6 11,7 16,0 16,5 15,5 13,5 15,3 15,5

15,4 26,0 26,6 25,0 25,4 26,8 34,4 26,4 26,6 26,9

26,2 26,5 26,9 26,2 25,1 27,1 10,0 8,0  11,7 4,7

12,8 24,2 19,1 10,3 3,8  22,8 10,5 13,3 14,6 11,7

10,3 14,5 16,1 18,1 23,0 9,1  14,0 13,4 9,9  9,1

12,3 11,5 10,1 13,1 21,0 19,1  5,1 9,8 6,7  85,2

Указанные предприятия имеют соответственно следующие площади производственных помещений (кв. м):

1000 1200 1100 1800 1070 1200 1420 1210 2080    2100

2070 1850    1740 1240 2130 1840    2210 1070 4530 1690 

1770 2000 1390 2450 2310 1820 900  2730 1770 1970

1820    1620 700  2800 1680 800  2320 1330 1130 1420

1080 2450 1960 1170 1600 1650 1550 1350 1530 1550

1540 2600 2660 2500 2540 2680 3440 2640 2660 2690

2620 2650 2690 2620 2510 2710 1000 800  1170 470

1200 2420 1910 1030 3800  2280 1050 1330 1460 1170

1030 1450 1610 1810 2300 910  1400 1340 990  910

1230 1150 1010 1310 2100 1910  1200 900 800  1000

Провести  группировку с равными интервалами. При необходимости перегруппировать с неравными интервалами. Записать полученный интервальный ряд распределения и соответственный ему дискретный ряд. Построить гистограмму, кумуляту интервального ряда  и полигон соответствующего дискретного ряда.

 

Построим  упорядоченный ряд по площади  производственных помещений (см. в Excel).

Максимальное  значение признака составляет 4570, минимальное  – 470, таким образом, размах вариации R = 4570 – 470 = 4100.

 

Число интервалов определим по формуле n = [1+3.22*lg N] = [1+3.22*2] = 7

Величина  интервала R/n = 4100 / 7 = 585.7

 

Построим  данные интервалы и определим  число признаков в каждом из них.

 

Площадь, кв. м

Число предприятий

470 - 1055,7

17

1055,7 - 1641,4

34

1641,4 - 2227,1

23

2227,1 - 2812,8

23

2812,8 - 3398,5

0

3398,5 - 3984,2

2

3984,2 - 4570

1


 

 

Гистограмма распределения производственных площадей (по х – площадь, по у – число  предприятий)

 

 

Кумулята  интервального ряда:

 

 

Полигон частот:

 

 

 

 

 

 

По  гистограмме найти приближенное значение моды, по кумуляте найти приближенное значение медианы.

 

Мода соответствует  интервалу 1055,7 – 1641,4, медиана – тому же интервалу. 

Вычислить моду, медиану по формулам. 

Мода = 1055,7 + 585,7 * (34-23) / ((34-23)+(34-17)) = 1262,7

 

 

Медиана = 1055,7 + 585,7*(0,5 – 0,17) / 0,34 = 1624,17

Сформулировать  выводы.

 

Наибольшую  частоту имеет значение производственной площади, равное 1262,7 кв. м, а среднее  значение производственной площади у данной совокупности предприятий находится на уровне 1624,17 кв. м

Найти среднее значение, размах, среднее  линейное отклонение, дисперсию и  среднеквадратическое отклонение, коэффициент вариации. Сделать выводы.

 

Средняя арифметическая:

Её значений равно 1743,7 кв. м

Среднее линейное отклонение:

Его значение составляет 587,746.

Дисперсия:

Её значение составляет 513571,31.

Среднеквадратическое  отклонение:

Его значение равно 716,639.

Расчеты проведены в Excel

 

Разбить статистическую. совокупность на две группы. В первую группу отнести все предприятия, площади производственных площадей которых  меньше 1500 кв. м, во вторую группу – все  остальные предприятия. Вычислить среднюю из внутригрупповых дисперсий   и  межгрупповую дисперсию. Вычисления проверить по правилу сложения дисперсий. Вычислить эмпирическое корреляционное отношение. Сформулировать выводы.

 

Разобьем совокупность на 2 группы:

Производственная площадь, кв. м

Число предприятий

Средняя площадь

470-1500

44

1115,681818

1500-4530

56

2237,142857


 

Внутригрупповая дисперсия характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Такая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы X от средней арифметической группы и может быть вычислена как простая дисперсия или как взвешенная дисперсия.

Средняя из внутри групповых дисперсий отражает случайную вариацию, т. е. ту часть вариации, которая происходила под влиянием всех прочих факторов, за исключением фактора группировки. Она рассчитывается по формуле:

Её значение составляет 203680,224.

Расчеты проведены в Excel

 

 

Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, которая обусловлена влиянием признака-фактора, положенного в основание группировки. Она равняется среднему квадрату отклонений групповых средних от общей средней.

 

Межгрупповая дисперсия  рассчитывается по формуле:

Её значение составляет 309891,86.

Расчеты проведены в Excel

 

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповых дисперсий:

 

Проверим полученные значения по правилу сложения дисперсий: 203680,224 + 309891,86 = 513571,31. Полученное значение совпадает со значением общей  дисперсии, полученной ранее.

Эмпирическое корреляционное отношение оценивает тесноту связи между изучаемым и группировочным признаками. Она равна корню отношения межгрупповой дисперсии к общей дисперсии.

ЭКО = √309891,86 / 513571,31 = 0,6034

Наблюдается заметная связь между показателями, что  означает, что вариация производственных площадей обусловлена не только внутригрупповыми отличиями.

Тема. Выборочный метод.

1. При контрольной проверке качества  поставляемой в торговлю партии  сыра была образована малая  выборка и получены следующие  данные о процентном содержании  поваренной соли в пробах: 4,5; 4,2; 3,9; 4,3; 3,7; 3,9; 4,6; 4,4; 4,0; 3,8.  С вероятностью 0.99 установить границы, в которых находится средний процент содержания поваренной соли во всей партии колбасы.

n = 10, среднее значение = 4,13

Найдем  дисперсию: σ2 = ((4,5-4,13)2 + … + (3,8-4,13)2) / 10 = 0,0881

Определим выборочную среднюю: μx = √(0,0881)2/10 = 0.02786

Для вероятности 0,99 и числа признаков 10 значение коэффициента Стьюдента составит 3,25.

Найдем  предельную ошибку выборки: ∆x = 3,25*0,02786 = 0,0905

 

Таким образом, границы, в которых находится  средний процент содержания соли, равны 

(4,13 – 0,0905; 4,13 + 0,0905) = (4,04; 4,22)

 

3. С лесного массива, насчитывающего 20000  деревьев, с помощью выборочного  метода были получены следующие  данные о количестве деловой  древесины в одном дереве:

Кол-во деловой древесины

в одном дереве м3

Число деревьев

Середина интервала

0,4–0,6

9

0,5

0,6–0,8

65

0,7

0,8–1,0

121

0,9

1,0–1,2

174

1,1

1,2–1,4

99

1,3

1,4–1,6

6

1,5

Итого

474

-


Найти границы, в которых с вероятностью 0,95 заключено среднее количество древесины.

 

Найдем  средневзвешенное количество деловой  древесины:

Хср. = 1,029536

Найдем  дисперсию:

Дисперсия равна 0,044402.

Определим выборочную среднюю: μx = √(0,044402)2/10 = 0.014

Для вероятности 0,95 и числа признаков 474 значение коэффициента Стьюдента  составит 1,9647.

Найдем  предельную ошибку выборки: ∆x = 1,9647*0,014 = 0,0276

Таким образом, границы, в которых находится  среднее количество древесины, равны 

(1,03–0,0276; 1,03+0,0276) = (1,0024; 1,0576)

 

 

 

3. При обследовании семейных бюджетов  населения города была организована 10%-ная пропорциональная выборка типическая выборка. Результаты обследования представлены в следующей таблице.

Группа населения по

семейному положению

Объем

 выборки

Удельный вес расходов

 на оплату жилья, %

Одинокие

40

9,6

Семейные

124

6,85


Найти границы, в которых с вероятностью 0,95 заключен удельный вес расходов на оплату жилья населением города.

 

Найдем  средневзвешенный удельный вес расходов на оплату жилья:

Хср. = (40*9,6+124*6,85) / (40+124) = 7,52%

Найдем  выборочную дисперсию:

s2 = ((7,52-9,6)2*40 + (7,52-6,85)2*124) / 164 = 1,39463

 

 

4. Для контроля всхожести партия  семян была разбита на 25 равных  по величине серий. На основе случайного бесповторного отбора было проверено на всхожесть 5 серий и установлен процент всхожести равный 65. Межсерийная дисперсия составила 9,04.

Найти границы, в которых с вероятностью 0,96 заключен всхожести семян всей партии.

 

В данном примере  числом признаков выступает число  серий.

Доля отбора = 5 / 25 = 0,2

Процент всхожести 65% выступает как среднее значение, а значение межсерийной дисперсии выступает аналогом выборочной дисперсии для обычного отбора.

 

 

 

 

 

 

 

 

 

Остальные расчеты  производим аналогично предыдущей задаче:

 

 

5. В коммерческом банке 180 компьютеров, в том числе типа I – 37, типа II – 57, типа III – 70, типа IV – 16. Необходимо составить типическую выборку. Определить, какое количество компьютеров необходимо отобрать, чтобы с вероятностью 0,683 ошибка не превышала пяти. Известно, что дисперсия такой типической выборки равна 805.


 

Доля групп компьютеров: I – 37/180 = 0.205; II – 57/180 = 0.317; III – 70/180 = 0.389; IV – 0.089

Для бесповторного отбора расчет необходимого отбора компьютеров при заданной дисперсии 805, вероятности 0,683 и предельной ошибке, равной 5, проводится по следующей формуле:

 

Округлив полученное значение в  большую сторону, получим, что необходимо отобрать 28 компьютеров.

Составим типическую выборку пропорционально  доле компьютеров в генеральной  совокупности (доли округляем согласно правилу округления):

I – 28*0,205 = 5,74 ≈ 6

II – 28*0,317 = 8,876 ≈ 9

III – 28*0,389 = 10,892 ≈ 11

IV – 28*0,089 = 2,492 ≈ 2

 

Таким образом, необходимо отобрать 6 ед. 1-й группы, 9 ед. 2-й группы, 11 ед. 3-й группы, и 2 ед. 4-й группы.

 

 

Тема Изучение связи между явлениями.

1. Имеются   данные о связи между средней  взвешенной ценой и объемом  продаж облигаций на ММВБ 23.02.98 г.:

№ серии

Средняя взвешенная цена

Х  ( руб.)

Объем продаж

Y (млн. руб)

22041

 

84,42

 

79,5

22042

82,46

79,7

22043

80,9

71,4

22044

63,42

42,9

22045

76,9

76,3

22046

75,5

74,9

22047

74,84

10,7

22048

73,03

75,1

22049

73,41

75,5

22050

71,34

84,3

Итого

   

Выявить всеми известными методами наличие  и направление связи между  Х и У. Вычислить линейный коэффициент корреляции.

Информация о работе Контрольная работа по "Статистике "