Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор работы: Пользователь скрыл имя, 23 Апреля 2013 в 18:27, лабораторная работа

Описание работы

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов (ОПФ) и Выпуск продукции – как изучаемые признаки единиц.

Файлы: 1 файл

Лабораторная работа по статистике.doc

— 544.00 Кб (Скачать файл)

Задача 1. Рассчитанные генеральные показатели представлены в табл.10.

Таблица 10

Описательные статистики генеральной совокупности

Обобщающие статистические показатели совокупности по изучаемым  признакам

Признаки

Среднегодовая стоимость основных производственных фондов

Выпуск продукции

Стандартное отклонение

60,46

72,13

Дисперсия

3656,46

5203,30

Асимметричность As

-0,15

0,04

Эксцесс Ek

-0,34

-0,20

Ожидаемый размах вариации признаков RN

362,76

432,78


 

Величина дисперсии генеральной совокупности может быть оценена непосредственно по выборочной дисперсии .

В математической статистике доказано, что при малом числе  наблюдений (особенно при n 40-50) для вычисления генеральной дисперсии по выборочной дисперсии следует использовать формулу

При достаточно больших n значение поправочного коэффициента близко к единице (при n=100 его значение равно 1,101, а при n=500 - 1,002 и т.д.). Поэтому при достаточно больших n можно приближено считать, что обе дисперсии совпадают:

.

Рассчитаем отношение для двух признаков:

Для первого признака =1,03  Для второго признака =1,03

Вывод: Степень расхождения между признаками оценивается величиной 0,т.е. расхождения между признаками нет, или оно слишком мало.

 

 

Для нормального распределения  справедливо равенство RN=6sN.

В условиях близости распределения  единиц генеральной совокупности к нормальному это соотношение используется для прогнозной оценки размаха вариации признака в генеральной совокупности.

Ожидаемый размах вариации признаков RN:

- для первого признака RN =362,76

- для второго признака RN  =432,78

Величина расхождения между показателями: RN и Rn:

- для первого признака |RN -Rn|=112,76

- для второго признака |RN -Rn| =132,78

 

Задача 2. Применение выборочного метода наблюдения связано с измерением степени достоверности статистических характеристик генеральной совокупности, полученных по результатам выборочного наблюдения. Достоверность генеральных параметров зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности.

Как правило, статистические характеристики выборочной и генеральной совокупностей не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки (ошибкой репрезентативности). Ошибка выборки – это разность между значением показателя, который был получен по выборке, и генеральным значением этого показателя. Например, разность

= |
-
|

определяет ошибку репрезентативности для средней величины признака.

Для среднего значения признака средняя ошибка выборки (ее называют также стандартной ошибкой)  выражает среднее квадратическое отклонение s выборочной средней от математического ожидания M[ ] генеральной средней .

Для изучаемых признаков  средние ошибки выборки  даны в табл. 3:

- для признака Среднегодовая стоимость основных производственных фондов

=11,04

- для признака Выпуск продукции

=13,17

Предельная  ошибка выборки определяет границы, в пределах которых  лежит генеральная средняя . Эти границы задают так называемый доверительный интервал генеральной средней – случайную область значений, которая с вероятностью P, близкой к 1,  гарантированно содержит значение генеральной средней. Эту вероятность называют доверительной вероятностью или уровнем надежности.

Для уровней надежности P=0,954; P=0,997; P=0,683 оценки предельных ошибок выборки даны в табл. 3, табл. 4а и табл. 4б.

Для генеральной средней  предельные значения и доверительные  интервалы определяются выражениями:

,

Предельные ошибки выборки  и ожидаемые границы для генеральных  средних представлены в табл. 11.

Таблица 11

Предельные ошибки выборки  и ожидаемые границы для генеральных  средних

Доверительная

вероятность

Р

Коэффициент

доверия

t

Предельные ошибки выборки

Ожидаемые границы для средних 

для первого

признака

для второго

признака

для первого

признака

для второго

признака

0,683

1

11,24

13,40

328,76

351,24

312,6

339,4

0,954

2

23,01

27,45

316,99

363,01

298,55

353,45

0,997

3

35,76

42,66

304,24

375.76

283,34

368,66


 

Задача 3 Значения коэффициентов асимметрии As и эксцесса Ek даны в табл.10.

Показатель  асимметрии As оценивает смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.

Если асимметрия правосторонняя (As>0) то правая часть эмпирической кривой оказывается длиннее левой, т.е. имеет место неравенство >Me>Mo, что означает преимущественное появление в распределении более высоких значений признака. (среднее значение больше серединного Me и модального Mo).

Если асимметрия левосторонняя (As<0), то левая часть эмпирической кривой оказывается длиннее правой и выполняется неравенство <Me<Mo, означающее, что в распределении чаще встречаются более низкие значения признака (среднее значение меньше серединного Me и модального Mo).

Чем больше величина |As|, тем более асимметрично распределение. Оценочная шкала асимметрии:

|As|  0,25  - асимметрия незначительная;

0,25<|As| 0.5 - асимметрия заметная (умеренная);

|As|>0,5  - асимметрия существенная.

Вывод: Для признака Среднегодовая стоимость основных производственных фондов наблюдается незначительная  левосторонняя асимметрия.

Показатель  эксцесса Ek характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой.

Как правило, коэффициент эксцесса вычисляется только для симметричных или близких к ним распределений.

Если Ek>0, то вершина кривой распределения располагается выше  вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средней величине.

Если Ek<0, то вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin.

Для нормального распределения Ek=0. При незначительном отклонении Ek от нуля форма кривой эмпирического распределения незначительно отличается от формы нормального распределения.

Чем больше абсолютная величина |Ek|, тем существеннее распределение отличается от нормального.

Вывод: Для признака Среднегодовая стоимость основных производственных фондов Ek<0, это свидетельствует о том, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin.

Для признака Выпуск продукции Ek<0, это свидетельствует о том, что значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin.

 

 

 

III. Экономическая интерпретация результатов статистического исследования предприятий2

Задача 1.

Вывод: При построении точечного графика-диаграммы, были выявлены предприятия с резко выделяющимися характеристиками, которые я исключила из проводимого статистического исследования, это говорит о нетипичности этих предприятий для изучаемой совокупности

Задача 2.

Вывод: Среднее квадратическое показывает на сколько в среднем откланяется индивидуальное значение от средней величины. Установим число предприятий которые входят в диапазон ( ), включающий предприятия с наиболее характерными значениями показателей. В этот диапазон входит 20 предприятий (№ 2, 3, 4, 6, 7, 9, 10, 13, 14, 17, 18, 19, 20, 22, 24, 25, 26, 27).

 

Задача 3.

Вывод: Рассчитав коэффициент вариации, установим насколько предприятия однородны по изучаемым экономическим характеристикам. Для признака Среднегодовая стоимость основных производственных фондов показатель Vs = 17,48

Для признака Выпуск продукции показатель Vs = 21,74. Так как коэффициент вариации меньше 33%, это говорит о том, что индивидуальные значения признака xi  мало отличаются друг от друга, единицы наблюдения количественно однородны, совокупность однородна.

 

Задача 4.

Вывод: Была проведена группировка предприятий по стоимости основных производственных фондов. В модальный интервал входят 11 предприятий с наибольшей стоимостью  основных фондов(№ 3, 4, 6, 7, 9, 13, 14, 17, 25, 26, 28), и 3 предприятия с наименьшей стоимостью основных фондов (№ 12, 16, 21).Удельный вес предприятий   модального интервала с наибольшими значениями показателя составляет 66,67 %, а с наименьшими значениями показателя составляет 100%.

 

Задача 5.

Вывод: При построении гистограммы было установлено, что распределение близко к нормальному. Рассчитали коэффициент ассиметрии, который показывает, что доминирует совокупность предприятий с более низкой стоимостью основных фондов.

Задача 6

Вывод: При расчете предельной ошибки средней для каждого показателя(для признака Среднегодовая стоимость основных производственных фондов =11,04; для признака Выпуск продукции  =13,17),были определены границы представленные в табл.11, в которых будут находится средние значения показателей, определили ожидаемый размах вариации для каждого признака: для первого признака RN =362,76; для второго признака RN  =432,78. Величину расхождения в значениях показателя можно ожидать для первого признака |RN -Rn|=112,76, а для второго признака |RN -Rn| =132,78

 

 

Лабораторная работа №2

1. Постановка  задачи

Корреляционно-регрессионный  анализ взаимосвязи признаков является составной частью проводимого статистического исследования и частично использует результаты Лабораторной работы № 1.

В Лабораторной работе № 2 изучается взаимосвязь между  факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные Лабораторной работы № 1 после исключения из них аномальных значений.

 

Исходные данные

Номер предприятия

Среднегодовая стоимость  основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

5

215,00

175,00

23

232,50

232,50

27

252,50

200,00

1

260,00

257,50

8

270,00

275,00

32

275,00

290,00

22

295,00

247,50

19

302,50

237,50

2

307,50

282,50

3

317,50

315,00

13

320,00

335,00

26

327,50

307,50

9

332,50

322,50

4

335,00

350,00

28

342,50

312,50

17

345,00

320,00

6

352,50

300,00

14

352,50

365,00

25

352,50

325,00

7

362,50

405,00

31

377,50

325,00

18

382,50

380,00

10

385,00

402,50

20

387,50

325,00

24

395,00

372,50

29

397,50

342,50

15

405,00

442,50

12

422,50

425,00

21

432,50

437,50

16

465,00

475,00

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel