Автор работы: Пользователь скрыл имя, 01 Декабря 2013 в 11:10, контрольная работа
Цель. Рассмотреть основные виды и формы связей социально-экономических явлений; методы выявления корреляционной связи и оценки ее тесноты; методику построения и использования однофакторных регрессионных моделей; способы выявления и измерения неколичественных связей. Задачи. Формирование навыков определения основных видов и форм связей социально-экономических явлений, использования методов выявления корреляционной связи и оценки ее тесноты; построения однофакторных линейных регрессионных моделей; измерения связей неколичественных переменных.
Виды и формы связей социально-экономических явлений. Корреляционная связь
Основные статистические методы выявления корреляционной связи.
Корреляционно-регрессионный метод анализа. Уравнение регрессии как форма аналитического выражения аналитической выражения статистической связи.
Методика построения однофакторных регрессионных моделей.
Применение линейного коэффициента корреляции, индекса корреляции, теоретического корреляционного отношения, коэффициента детерминации в анализе качества однофакторной регрессионной модели.
Измерение связей неколичественных переменных.
Использование регрессионных моделей для целей анализа и прогноза экономических и финансовых показателей.
Полученное значение теоретического корреляционного отношения позволяет сделать вывод о наличии тесной прямой зависимости между признаками.
Квадрат теоретического корреляционного отношения – коэффициент детерминации показывает долю дисперсии результативной переменной, у, которую можно объяснить построенным уравнением регрессии.
Кроме того при линейной форме уравнения применяется другой показатель тесноты связи – линейный коэффициент корреляции:
а его выборочное
значение – по формуле
При малом числе наблюдений выборочный коэффициент корреляции удобно вычислять по следующей формуле:
Величина коэффициента корреляции изменяется в интервале .
При между двумя переменными существует функциональная связь, при - прямая функциональная связь. Если , то значение Х и У в выборке некоррелированы; в случае, если система случайных величин имеет двумерное нормальное распределение, то величины Х и У будут и независимыми.
Если коэффициент корреляции находится в интервале , то между величинами Х и У существует обратная корреляционная связь. Это находит подтверждение и при визуальном анализе исходной информации. В этом случае отклонение величины У от среднего значения взяты с обратным знаком.
Если каждая пара значений величин Х и У чаще всего одновременно оказывается выше (ниже) соответствующих средних значений, то между величинами существует прямая корреляционная связь и коэффициент корреляции находится в интервале .
Если же отклонение величины x от среднего значения одинаково часто вызывают отклонения величины y вниз от среднего значения и при этом отклонения оказываются все время различными, то можно предполагать, что значение коэффициента корреляции стремится к нулю.
Следует отметить, что значение коэффициента корреляции не зависит от единиц измерения и выбора начала отсчета. Это означает, что если переменные x и y уменьшить (увеличить) в k раз либо на одно и то же число С, то коэффициент корреляции не изменится.
Для рассматриваемого примера:
Для оценки значимости коэффициента корреляции r , так же используют используют t-критерий Стьюдента. Вычисляются фактические значения t-критерия:
в нашем примере: (при α = 0,05)
Полученный результат свидетельствует о значимости коэффициента корреляции и существенности связи между признаками. Таким образом, построенная регрессионная модель адекватна и выводы, полученные по результатам малой выборки, с достаточно большой вероятностью можно распространить на всю гипотетическую генеральную совокупность.
№ партии |
Средняя занятость рабочего места x |
Среднее время меж- операционного перерыва, ч, у |
x2 |
xy |
y2 |
1 |
0,220 |
1,460 |
0,048 |
0,321 |
2,132 |
2 |
0,220 |
1,120 |
0,048 |
0,246 |
1,254 |
3 |
0,220 |
1,180 |
0,048 |
0,260 |
1,392 |
4 |
0,324 |
0,820 |
0,105 |
0,266 |
0,672 |
5 |
0,240 |
1,260 |
0,058 |
0,302 |
1,588 |
6 |
0,240 |
0,900 |
0,058 |
0,216 |
0,810 |
7 |
0,240 |
1,020 |
0,058 |
0,245 |
1,040 |
8 |
0,240 |
1,080 |
0,058 |
0,259 |
1,166 |
9 |
0,260 |
0,570 |
0,068 |
0,148 |
0,325 |
10 |
0,260 |
1,370 |
0,068 |
0,356 |
1,877 |
11 |
0,260 |
0,690 |
0,068 |
0,179 |
0,476 |
12 |
0,300 |
0,800 |
0,090 |
0,240 |
0,640 |
13 |
0,300 |
0,610 |
0,090 |
0,183 |
0,372 |
14 |
0,300 |
0,950 |
0,090 |
0,285 |
0,903 |
15 |
0,300 |
0,730 |
0,090 |
0,219 |
0,533 |
16 |
0,320 |
0,500 |
0,102 |
0,160 |
0,250 |
17 |
0,320 |
0,370 |
0,102 |
0,118 |
0,137 |
18 |
0,320 |
0,470 |
0,102 |
0,150 |
0,221 |
19 |
0,320 |
0,320 |
0,102 |
0,102 |
0,102 |
20 |
0,320 |
0,360 |
0,102 |
0,115 |
0,130 |
Итого |
5,524 |
16,580 |
1,555 |
4,372 |
16,020 |
Среднее значение |
0,276 |
0,839 |
- |
- |
- |
Корреляционно-регрессионный метод применим только к количественным признакам. Однако задача измерения связи ставится перед статистикой и по отношению к таким признакам, как пол, образование, занятие, семейное состояние человека, отрасль, форма собственности предприятия, т. е. признакам, не имеющим количественного выражения.
Методы корреляционного и дисперсионного анализа не универсальны: их можно применять, если все изучаемые признаки являются количественными. При использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий), поэтому они получили название параметрических методов. Между тем в статистической практике приходится сталкиваться с задачами измерения связи между качественными признаками, к которым параметрические методы анализа в их обычном виде неприменимы. Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили название непараметрических.
Если изучается взаимосвязь двух качественных признаков, то используют комбинационное распределение единиц совокупности, в форме так называемых таблиц взаимной сопряженности.
Рассмотрим методику анализа таблиц взаимной сопряженности на конкретном примере социальной мобильности как процесса преодоления замкнутости отдельных социальных и профессиональных групп населения. Ниже приведены данные о распределении выпускников средних школ по сферам занятости с выделением аналогичных общественных групп их родителей.
Род занятий родителей |
Число детей, занятых в |
Всего | |||
промышлен- |
сельском |
сфере |
сфере интел- | ||
А B | |||||
Промышленность и строительство |
40 |
5 |
7 |
39 |
91 |
Сельское хозяйство |
34 |
29 |
13 |
12 |
88 |
Сфера обслуживания |
16 |
6 |
15 |
19 |
56 |
Сфера интеллектуального труда |
24 |
5 |
9 |
72 |
110 |
Всего |
114 |
45 |
44 |
142 |
345 |
Распределение частот по строкам и столбцам таблицы взаимной сопряженности позволяет выявить основные закономерности социальной мобильности: 42,9 % детей родителей группы 1 («Промышленность и строительство») заняты в сфере интеллектуального труда (39 из 91); 38,9% детей. родители которых трудятся в сельском хозяйстве, работают в промышленности (34 из 88) и т.д. Можно заметить и явную наследственность в передаче профессий. Так, из пришедших в сельское хозяйство 29 человек, или 64,4 %, являются детьми работников сельского хозяйства; более чем у 50 % в сфере интеллектуального труда родители относятся к той же социальной группе и т.д.
Однако важно получить обобщающий показатель, характеризующий тесноту связи между признаками и позволяющий сравнить проявление связи в разных совокупностях. Для этой цели исчисляют, например, коэффициенты взаимной сопряженности Пирсона (С) и Чупрова (К), коэффициент взаимной сопряженности А. А. Чупрова изменяется от 0 до 1, но уже при значении 0,3 можно говорить о тесной связи между вариацией изучаемых признаков.
- показатель средней квадратической сопряженности, определяемый путем вычитания единицы из суммы отношений квадратов частот каждой клетки корреляционной таблицы к произведению частот соответствующего столбца и строки:
К1 и К2 – число групп по каждому из признаков. Величина коэффициента взаимной сопряженности, отражающая тесноту связи между качественными признаками, колеблется в обычных для этих показателей пределах от 0 до 1.
Вычислим
Род занятий родителей |
Число детей, занятых в |
Всего | ||||
промышлен- |
сельском |
сфере |
сфере интел- | |||
А |
B | |||||
Промышленность и строительство |
40 1600 14,035 |
5 25 0,556 |
7 49 1,114 |
39 1521 10,711 |
91 - 26,416 |
0,290 |
Сельское хозяйство |
34 1156 0,063 |
29 841 18.689 |
13 169 3.841 |
12 144 1.014 |
88 - 23,607 |
0,268 |
Сфера обслуживания |
16 256 2.246 |
6 36 0.800 |
15 225 5.114 |
19 361 2.542 |
56 - 10,702 |
0,191 |
Сфера интеллектуального труда |
24 576 5,053 |
5 25 0,556 |
9 81 1,841 |
72 5184 36,507 |
110 - 43,957 |
0,400 |
Всего |
114 |
45 |
44 |
142 |
345 |
1,149 |
В клетках таблицы: верхние строки – частоты, средние – их квадраты, нижние – квадраты частот деленные на суммы частот по столбцу; в итоговых столбцах – сумма частот, сумма результатов деления (А), а так же нижнего числа на верхнее (В)
Значения полученных коэффициентов показывают наличие заметной связи между распределением выпускников средних школ по сферам занятости с выделением аналогичных общественных групп их родителей.
Важным частным случаем задачи является измерение связи при альтернативной вариации двух признаков, один из которых имеет характер причины, а другой - следствия.
Например, при социологическом обследовании 1000 жителей города были поставлены два вопроса:
1. Считаете ли вы, что ваши доходы позволяют обеспечивать удовлетворение основных потребностей?
2. Удовлетворяет ли вас деятельность мэра города?
Можно предположить, что причиной отрицательного ответа на второй вопрос у части населения является неудовлетворенность их потребностей доходами, т.е. имеется связь между ответами на оба вопроса. Для измерения этой связи составляют двухмерное (дихотомическое) распределение ответов 2х2, приведенное в табл.
Взаимосвязь между ответами на два вопроса социологического обследования
Ответы на 1-й вопрос |
Ответы на 2-й вопрос |
Итого | ||
Да, а |
Нет, b |
|||
Да |
А |
170 |
80 |
250 |
Нет |
В |
230 |
20 |
750 |
Итого |
400 |
600 |
1000 |
Если бы все, ответившие «да» на 1-й вопрос, отвечали бы «да» и на 2-й вопрос, а так же совпадали ответы «нет», то связь была бы предельно тесной, функциональной. Но на самом деле распределение ответов на оба вопроса не совпадает. Большая часть ответивших «да» на 1-й вопрос ответила «да» и на 2-й вопрос, но часть ответила «нет». То же относится к ответившим «да» на 2-й вопрос. Связь есть, но неполная, типа корреляционной, и нужно измерить тесноту этой связи. К. Пирсон предложил показатель, названный коэффициентом ассоциации. В числителе этого относительного показателя разность произведения чисел с одинаковыми ответами на оба вопроса: да-да и нет-нет и произведения чисел с неодинаковыми ответами: «да-нет» и «нет-да». В знаменателе коэффициента ассоциации - корень квадратный из произведения всех четырех частных итогов.
Информация о работе Статистические методы изучения взаимосвязей социально-экономических явлений