Взаимосвязанные признаки и графики связи

Автор работы: Пользователь скрыл имя, 24 Сентября 2013 в 23:33, курсовая работа

Описание работы

Для полного усвоения корреляционно-регрессионного анализа в эконо¬мических исследованиях в аналитической части работы будет приведено еще одно решение задачи.
Данная работа посвящена изучению возможности обработки статис-тических данных методами корреляционного и регрессионного анализа
с использованием пакета прикладных программ Microsoft Excel.

Файлы: 1 файл

Prakticheskaya_chast_reshennye_zadachi.docx

— 1.02 Мб (Скачать файл)

Целью выполнения данного Задания является выявление наличия корреляционной связи между факторным и результативным признаками, установление направления связи, оценка тесноты и силы связи.

Факторный и результативный признаки либо задаются в условии  задания, либо определяются путем проведения предварительного теоретического анализа. Лишь после того, как выяснена экономическая сущность явления и определены факторный и результативный признаки, приступают к проведению корреляционного анализа данных.

По условию Задания 2 факторным  является признак цена на первичном  рынке жилья (X), результативным – признак среднемесячная прибыль (Y).

Применение метода аналитической  группировки

При использовании  метода аналитической группировки  строится интервальный ряд распределения  единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.

Используя разработочную  таблицу 3, строим аналитическую группировку, характеризующую зависимость между  факторным признаком Х – Ценой на первичном рынке жилья и результативным признаком Y – Среднемесячной прибыль.

Групповые средние  значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8.

Таблица 8

Зависимость суммы прибыли  банков от цены на первичном рынке жилья

Номер группы

Группы цен 
на первичном рынке жилья, тыс. руб./ м2,

х

Число организаций,

fj

Среднемесячная прибыль,

млн руб.

всего

в среднем на одну организацию,

1

2

3

4

5=4:3

1

20,6 – 23,5

6

0,45

0,075

2

23,5 – 26,4

9

1,8

0,2

3

26,4 – 29,3

8

3,57

0,45

4

29,3 – 32,2

4

4,5

1,125

5

32,2 – 35,2

3

3,08

1,03

 

Итого

30

13,4

2,88


 

Вывод. Анализ данных табл. 8 показывает, что с увеличением цены на первичном рынке жилья от группы к группе систематически возрастает и средняя прибыль по каждой группе организация, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.

Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического  корреляционного отношения

Для измерения  тесноты и силы связи между  факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .

Эмпирический  коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле

,          (9)

где  – общая дисперсия признака Y,

        – межгрупповая (факторная) дисперсия признака Y.

Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними - равенство =1.

Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле

,         (10)

где  yi – индивидуальные значения результативного признака;

        – общая средняя значений результативного признака;

         n – число единиц совокупности.

Общая средняя  вычисляется как средняя арифметическая простая по всем единицам совокупности:

               (11)

или как средняя взвешенная по частоте групп интервального ряда:

Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.

Расчет  по формуле (11):

 тыс. руб./ м2

Для расчета общей дисперсии 

применяется вспомогательная

Таблица 12.

Номер

банка

п/п

Прибыль, млн руб.

1

2

3

4

5

1

0,81

0,36

0,13

0,66

2

0,71

0,26

0,068

0,50

3

0,42

-0,03

0,0009

0,18

4

0,70

0,25

0,063

0,49

5

0,19

-0,26

0,068

0,036

6

0,43

-0,02

0,0004

0,18

7

0,40

-0,05

0,0025

0,16

8

0,42

-0,03

0,0009

0,18

9

0,27

-0,18

0,032

0,073

10

0,46

0,01

0,0001

0,21

11

0,43

-0,02

0,0004

0,18

12

0,34

-0,11

0,012

0,12

13

0,32

-0,13

0,012

0,102

14

0,50

0,05

0,0025

0,25

15

0,11

-0,34

0,116

0,012

16

0,55

0,1

0,01

0,303

17

0,44

-0,01

0,0001

0,19

18

0,61

0,16

0,026

0,37

19

0,25

-0,2

0,04

0,063

20

0,28

-0,17

0,029

0,078

21

0,36

-0,09

0,0081

0,13

22

0,70

0,25

0,06

0,49

23

0,33

-0,12

0,0144

0,11

24

0,68

0,23

0,053

0,46

25

0,56

0,11

0,012

0,31

26

0,47

0,02

0,0004

0,22

27

0,24

-0,21

0,044

0,06

28

0,86

0,41

0,17

0,74

29

0,41

-0,04

0,0016

0,17

30

0,15

-0,3

0,09

0,023

Итого

13,4

-0,1

1,0673

7,05


Расчет общей дисперсии по формуле (10):

Общая дисперсия может  быть также рассчитана по формуле

,

где – средняя из квадратов значений результативного признака,

      – квадрат средней величины значений результативного признака.

Для демонстрационного примера 

Тогда

Межгрупповая  дисперсия измеряет систематическую  вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле

,                (13)

где     –групповые средние,

 – общая средняя,

–число единиц в j-ой группе,

k – число групп.

Для  расчета  межгрупповой  дисперсии  строится  вспомогательная таблица 13 При этом используются  групповые средние значения из табл. 8 (графа 5).

Таблица 13

Вспомогательная таблица  для расчета межгрупповой дисперсии

Группы банков по размеру  кредитных вложений,

млн руб.

Число банков,

Среднее значение

в группе

1

2

3

4

5

20,6 – 23,5

6

0,075

-0,375

0,844

23,5 – 26,4

9

0,2

-0,25

0,563

26,4 – 29,3

8

0,45

0

0

29,3 – 32,2

4

1,125

0,675

1,82

32,2 – 35,2

3

1,03

0,58

1,009

Итого

30

   

4,236


Расчет межгрупповой дисперсии по формуле (11):

Расчет эмпирического  коэффициента детерминации по формуле (9):

  

или 43,8%

Вывод. 43,8% вариации среднемесячная прибыль организаций обусловлено вариацией ценой на первичном рынке жилья, а 56,2 % – влиянием прочих неучтенных факторов.

Эмпирическое  корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле

                          (14)

Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):

Таблица 14

Шкала Чэддока

h

0,1 – 0,3

0,3 – 0,5

0,5 – 0,7

0,7 – 0,9

0,9 – 0,99

Характеристика

силы связи

Слабая

Умеренная

Заметная

Тесная

Весьма тесная


Расчет эмпирического  корреляционного отношения  по формуле (14):

 

Вывод. Согласно шкале Чэддока связь между объемом кредитных вложений и суммой прибыли банков является тесной.

Оценим статистическую значимость коэффициента детерминации .

Показатели  и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.

Проверка выборочных показателей на их не случайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации  служит дисперсионный F-критерий Фишера, который рассчитывается по формуле

,

где  n – число единиц выборочной совокупности,

    m – количество групп,

       – межгрупповая дисперсия,

      – дисперсия j-ой группы (j=1,2,…,m),

       – средняя арифметическая групповых дисперсий.

Величина  рассчитывается, исходя из правила сложения дисперсий:

,

где – общая дисперсия.

Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m : k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия  для различных комбинаций  значений  , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).

Если Fрасч>Fтабл , коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков,  сделанные на основе выборки, можно распространить на всю генеральную совокупность.

Если Fрасч<Fтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.

Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:

 

 

k2

k1

24

25

26

27

28

29

30

31

32

33

34

35

3

3,01

2,99

2,98

2,96

2,95

2,93

2,92

2,91

2,90

2,89

2,88

2,87

4

2,78

2,76

2,74

2,73

2,71

2,70

2,69

2,68

2,67

2,66

2,65

2,64

5

2,62

2,60

2,59

2,57

2,56

2,55

2,53

2,52

2,51

2,50

2,49

2,48

Информация о работе Взаимосвязанные признаки и графики связи