Автор работы: Пользователь скрыл имя, 24 Сентября 2013 в 23:33, курсовая работа
Для полного усвоения корреляционно-регрессионного анализа в эконо¬мических исследованиях в аналитической части работы будет приведено еще одно решение задачи.
Данная работа посвящена изучению возможности обработки статис-тических данных методами корреляционного и регрессионного анализа
с использованием пакета прикладных программ Microsoft Excel.
Целью выполнения данного Задания является выявление наличия корреляционной связи между факторным и результативным признаками, установление направления связи, оценка тесноты и силы связи.
Факторный и результативный признаки либо задаются в условии задания, либо определяются путем проведения предварительного теоретического анализа. Лишь после того, как выяснена экономическая сущность явления и определены факторный и результативный признаки, приступают к проведению корреляционного анализа данных.
По условию Задания 2 факторным является признак цена на первичном рынке жилья (X), результативным – признак среднемесячная прибыль (Y).
Применение метода аналитической группировки
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.
Используя разработочную
таблицу 3, строим аналитическую группировку,
характеризующую зависимость
Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8.
Таблица 8
Зависимость суммы прибыли банков от цены на первичном рынке жилья
Номер группы |
Группы цен х |
Число организаций, fj |
Среднемесячная прибыль, млн руб. | |
всего |
в среднем на одну организацию, | |||
1 |
2 |
3 |
4 |
5=4:3 |
1 |
20,6 – 23,5 |
6 |
0,45 |
0,075 |
2 |
23,5 – 26,4 |
9 |
1,8 |
0,2 |
3 |
26,4 – 29,3 |
8 |
3,57 |
0,45 |
4 |
29,3 – 32,2 |
4 |
4,5 |
1,125 |
5 |
32,2 – 35,2 |
3 |
3,08 |
1,03 |
Итого |
30 |
13,4 |
2,88 |
Вывод. Анализ данных табл. 8 показывает, что с увеличением цены на первичном рынке жилья от группы к группе систематически возрастает и средняя прибыль по каждой группе организация, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .
Эмпирический коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
, (9)
где – общая дисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними - равенство =1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле
, (10)
где yi – индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n – число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
(11)
или как средняя взвешенная по частоте групп интервального ряда:
Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле (11):
Для расчета общей дисперсии
Таблица 12.
Номер банка п/п |
Прибыль, млн руб. |
|||
1 |
2 |
3 |
4 |
5 |
1 |
0,81 |
0,36 |
0,13 |
0,66 |
2 |
0,71 |
0,26 |
0,068 |
0,50 |
3 |
0,42 |
-0,03 |
0,0009 |
0,18 |
4 |
0,70 |
0,25 |
0,063 |
0,49 |
5 |
0,19 |
-0,26 |
0,068 |
0,036 |
6 |
0,43 |
-0,02 |
0,0004 |
0,18 |
7 |
0,40 |
-0,05 |
0,0025 |
0,16 |
8 |
0,42 |
-0,03 |
0,0009 |
0,18 |
9 |
0,27 |
-0,18 |
0,032 |
0,073 |
10 |
0,46 |
0,01 |
0,0001 |
0,21 |
11 |
0,43 |
-0,02 |
0,0004 |
0,18 |
12 |
0,34 |
-0,11 |
0,012 |
0,12 |
13 |
0,32 |
-0,13 |
0,012 |
0,102 |
14 |
0,50 |
0,05 |
0,0025 |
0,25 |
15 |
0,11 |
-0,34 |
0,116 |
0,012 |
16 |
0,55 |
0,1 |
0,01 |
0,303 |
17 |
0,44 |
-0,01 |
0,0001 |
0,19 |
18 |
0,61 |
0,16 |
0,026 |
0,37 |
19 |
0,25 |
-0,2 |
0,04 |
0,063 |
20 |
0,28 |
-0,17 |
0,029 |
0,078 |
21 |
0,36 |
-0,09 |
0,0081 |
0,13 |
22 |
0,70 |
0,25 |
0,06 |
0,49 |
23 |
0,33 |
-0,12 |
0,0144 |
0,11 |
24 |
0,68 |
0,23 |
0,053 |
0,46 |
25 |
0,56 |
0,11 |
0,012 |
0,31 |
26 |
0,47 |
0,02 |
0,0004 |
0,22 |
27 |
0,24 |
-0,21 |
0,044 |
0,06 |
28 |
0,86 |
0,41 |
0,17 |
0,74 |
29 |
0,41 |
-0,04 |
0,0016 |
0,17 |
30 |
0,15 |
-0,3 |
0,09 |
0,023 |
Итого |
13,4 |
-0,1 |
1,0673 |
7,05 |
Расчет общей дисперсии по формуле (10):
Общая дисперсия может быть также рассчитана по формуле
где – средняя из квадратов значений результативного признака,
– квадрат средней величины значений результативного признака.
Для демонстрационного примера
Тогда
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k – число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы банков по размеру кредитных вложений, млн руб. |
Число банков, |
Среднее значение |
||
1 |
2 |
3 |
4 |
5 |
20,6 – 23,5 |
6 |
0,075 |
-0,375 |
0,844 |
23,5 – 26,4 |
9 |
0,2 |
-0,25 |
0,563 |
26,4 – 29,3 |
8 |
0,45 |
0 |
0 |
29,3 – 32,2 |
4 |
1,125 |
0,675 |
1,82 |
32,2 – 35,2 |
3 |
1,03 |
0,58 |
1,009 |
Итого |
30 |
4,236 |
Расчет межгрупповой дисперсии по формуле (11):
Расчет эмпирического коэффициента детерминации по формуле (9):
Вывод. 43,8% вариации среднемесячная прибыль организаций обусловлено вариацией ценой на первичном рынке жилья, а 56,2 % – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
(14)
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14
Шкала Чэддока
h |
0,1 – 0,3 |
0,3 – 0,5 |
0,5 – 0,7 |
0,7 – 0,9 |
0,9 – 0,99 |
Характеристика силы связи |
Слабая |
Умеренная |
Заметная |
Тесная |
Весьма тесная |
Расчет эмпирического корреляционного отношения по формуле (14):
Вывод. Согласно шкале Чэддока связь между объемом кредитных вложений и суммой прибыли банков является тесной.
Оценим статистическую значимость коэффициента детерминации .
Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их не случайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
где n – число единиц выборочной совокупности,
m – количество групп,
– межгрупповая дисперсия,
– дисперсия j-ой группы (j=1,2,…,m),
– средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
где – общая дисперсия.
Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m : k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).
Если Fрасч>Fтабл , коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если Fрасч<Fтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:
k2 | ||||||||||||
k1 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
3 |
3,01 |
2,99 |
2,98 |
2,96 |
2,95 |
2,93 |
2,92 |
2,91 |
2,90 |
2,89 |
2,88 |
2,87 |
4 |
2,78 |
2,76 |
2,74 |
2,73 |
2,71 |
2,70 |
2,69 |
2,68 |
2,67 |
2,66 |
2,65 |
2,64 |
5 |
2,62 |
2,60 |
2,59 |
2,57 |
2,56 |
2,55 |
2,53 |
2,52 |
2,51 |
2,50 |
2,49 |
2,48 |
Информация о работе Взаимосвязанные признаки и графики связи