Статистические методы изучения взаимосвязей социально-экономических явлений

Автор работы: Пользователь скрыл имя, 01 Декабря 2013 в 11:10, контрольная работа

Описание работы

Цель. Рассмотреть основные виды и формы связей социально-экономических явлений; методы выявления корреляционной связи и оценки ее тесноты; методику построения и использования однофакторных регрессионных моделей; способы выявления и измерения неколичественных связей. Задачи. Формирование навыков определения основных видов и форм связей социально-экономических явлений, использования методов выявления корреляционной связи и оценки ее тесноты; построения однофакторных линейных регрессионных моделей; измерения связей неколичественных переменных.

Содержание работы

Виды и формы связей социально-экономических явлений. Корреляционная связь
Основные статистические методы выявления корреляционной связи.
Корреляционно-регрессионный метод анализа. Уравнение регрессии как форма аналитического выражения аналитической выражения статистической связи.
Методика построения однофакторных регрессионных моделей.
Применение линейного коэффициента корреляции, индекса корреляции, теоретического корреляционного отношения, коэффициента детерминации в анализе качества однофакторной регрессионной модели.
Измерение связей неколичественных переменных.
Использование регрессионных моделей для целей анализа и прогноза экономических и финансовых показателей.

Файлы: 1 файл

изучение взаимосвязей.doc

— 689.50 Кб (Скачать файл)


 

Полученное  значение теоретического корреляционного отношения позволяет сделать вывод о наличии тесной прямой зависимости  между признаками.

Квадрат теоретического корреляционного отношения – коэффициент детерминации показывает долю дисперсии результативной переменной,  у, которую можно объяснить построенным уравнением регрессии.

Кроме того при  линейной форме уравнения применяется другой показатель тесноты связи – линейный коэффициент корреляции:

,

а его выборочное значение – по формуле 

При малом числе наблюдений выборочный коэффициент корреляции удобно вычислять  по следующей формуле:

Величина коэффициента корреляции изменяется в интервале  .

При между двумя переменными существует функциональная связь, при - прямая функциональная связь. Если , то значение Х и У в выборке некоррелированы; в случае, если система случайных величин имеет двумерное нормальное распределение, то величины Х и У будут и независимыми.

Если коэффициент  корреляции находится в интервале , то между величинами Х и У существует обратная корреляционная связь. Это находит подтверждение и при визуальном анализе исходной информации. В этом случае отклонение величины У от среднего значения взяты с обратным знаком.

Если каждая пара значений величин Х и У  чаще всего одновременно оказывается  выше (ниже) соответствующих средних  значений, то между величинами существует прямая корреляционная связь и коэффициент  корреляции находится в интервале  .

Если же отклонение величины x от среднего значения одинаково часто вызывают отклонения величины y вниз от среднего значения и при этом отклонения оказываются все время различными, то можно предполагать, что значение коэффициента корреляции стремится к нулю.

Следует отметить, что значение коэффициента корреляции не зависит от единиц измерения и  выбора начала отсчета. Это означает, что если переменные x и y уменьшить (увеличить) в k раз либо на одно и то же число С, то коэффициент корреляции не изменится.

Для рассматриваемого примера:

Для оценки значимости коэффициента корреляции r , так же используют используют t-критерий Стьюдента. Вычисляются фактические значения t-критерия:

             в нашем примере:    (при α = 0,05)

Полученный  результат свидетельствует о  значимости коэффициента корреляции и  существенности связи между признаками. Таким образом, построенная регрессионная модель адекватна и выводы, полученные по результатам малой выборки, с достаточно большой вероятностью можно распространить на всю гипотетическую генеральную совокупность.

партии

Средняя

занятость

рабочего места

x

Среднее время меж-

операционного

перерыва, ч, у

x2

xy

y2

1

0,220

1,460

0,048

0,321

2,132

2

0,220

1,120

0,048

0,246

1,254

3

0,220

1,180

0,048

0,260

1,392

4

0,324

0,820

0,105

0,266

0,672

5

0,240

1,260

0,058

0,302

1,588

6

0,240

0,900

0,058

0,216

0,810

7

0,240

1,020

0,058

0,245

1,040

8

0,240

1,080

0,058

0,259

1,166

9

0,260

0,570

0,068

0,148

0,325

10

0,260

1,370

0,068

0,356

1,877

11

0,260

0,690

0,068

0,179

0,476

12

0,300

0,800

0,090

0,240

0,640

13

0,300

0,610

0,090

0,183

0,372

14

0,300

0,950

0,090

0,285

0,903

15

0,300

0,730

0,090

0,219

0,533

16

0,320

0,500

0,102

0,160

0,250

17

0,320

0,370

0,102

0,118

0,137

18

0,320

0,470

0,102

0,150

0,221

19

0,320

0,320

0,102

0,102

0,102

20

0,320

0,360

0,102

0,115

0,130

Итого

5,524

16,580

1,555

4,372

16,020

Среднее

значение

0,276

0,839

-

-

-


 

  1. Измерение связей неколичественных переменных.

Корреляционно-регрессионный метод применим только к количественным признакам. Однако задача измерения связи ставится перед статистикой и по отношению к таким признакам, как пол, образование, занятие, семейное состояние человека, отрасль, форма собственности предприятия, т. е. признакам, не имеющим количественного выражения.

Методы корреляционного  и дисперсионного анализа не универсальны: их можно применять, если все изучаемые  признаки являются количественными. При  использовании этих методов нельзя обойтись без вычисления основных параметров распределения (средних величин, дисперсий), поэтому они получили название параметрических методов. Между тем в статистической практике приходится сталкиваться с задачами измерения связи между качественными признаками, к которым параметрические методы анализа в их обычном виде неприменимы. Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили название непараметрических.

Если изучается  взаимосвязь двух качественных признаков, то используют комбинационное распределение  единиц совокупности, в форме так называемых таблиц взаимной сопряженности.

Рассмотрим  методику анализа таблиц взаимной сопряженности на конкретном примере социальной мобильности как процесса преодоления замкнутости отдельных социальных и профессиональных групп населения. Ниже приведены данные о распределении выпускников средних школ по сферам занятости с выделением аналогичных общественных групп их родителей.

Род занятий

родителей

Число детей, занятых  в

Всего

промышлен- 
ности и стро- 
ительстве

сельском  
хозяйстве

сфере  
обслужи- 
вания

сфере интел- 
лектуального  
труда

А

B

Промышленность

и

строительство

40

5

7

39

91

Сельское

хозяйство

34

29

13

12

88

Сфера

обслуживания

16

6

15

19

56

Сфера

интеллектуального

труда

24

5

9

72

110

Всего

114

45

44

142

345


Распределение частот по строкам и столбцам таблицы  взаимной сопряженности позволяет выявить основные закономерности социальной мобильности: 42,9 % детей родителей группы 1 («Промышленность и строительство») заняты в сфере интеллектуального труда (39 из 91); 38,9% детей. родители которых трудятся в сельском хозяйстве, работают в промышленности (34 из 88) и т.д. Можно заметить и явную наследственность в передаче профессий. Так, из пришедших в сельское хозяйство 29 человек, или 64,4 %, являются детьми работников сельского хозяйства; более чем у 50 % в сфере интеллектуального труда родители относятся к той же социальной группе и т.д.

Однако важно получить обобщающий показатель, характеризующий  тесноту связи между признаками и позволяющий сравнить проявление связи в разных совокупностях. Для  этой цели исчисляют, например, коэффициенты взаимной сопряженности Пирсона (С) и Чупрова (К), коэффициент взаимной сопряженности А. А. Чупрова изменяется от 0 до 1, но уже при значении 0,3 можно говорить о тесной связи между вариацией изучаемых признаков.


 

 

- показатель средней квадратической сопряженности, определяемый путем вычитания единицы из суммы отношений квадратов частот каждой клетки корреляционной таблицы к произведению частот соответствующего столбца и строки:

К1 и К2 – число групп по каждому из признаков. Величина коэффициента взаимной сопряженности, отражающая тесноту связи между качественными признаками, колеблется в обычных для этих показателей пределах от 0 до 1.

Вычислим

Род занятий

родителей

Число детей, занятых  в

Всего

промышлен- 
ности и стро- 
ительстве

сельском  
хозяйстве

сфере  
обслужи- 
вания

сфере интел- 
лектуального  
труда

А

B

Промышленность

и

строительство

40

1600

14,035

5

25

0,556

7

49

1,114

39

1521

10,711

91

-

26,416

0,290

Сельское

хозяйство

34

1156

0,063

29

841

18.689

13

169

3.841

12

144

1.014

88

-

23,607

0,268

Сфера

обслуживания

16

256

2.246

6

36

0.800

15

225

5.114

19

361

2.542

56

-

10,702

0,191

Сфера

интеллектуального

труда

24

576

5,053

5

25

0,556

9

81

1,841

72

5184

36,507

110

-

43,957

0,400

Всего

114

45

44

142

345

1,149


В клетках таблицы: верхние строки –  частоты, средние  – их квадраты, нижние – квадраты частот деленные на суммы  частот по столбцу; в  итоговых столбцах –  сумма частот, сумма  результатов деления (А), а так же нижнего числа на верхнее (В)


 


 

Значения  полученных коэффициентов показывают наличие заметной связи между распределением выпускников средних школ по сферам занятости с выделением аналогичных общественных групп их родителей.

Важным частным случаем задачи является измерение связи при альтернативной вариации двух признаков, один из которых имеет характер причины, а другой - следствия.

Например, при социологическом обследовании 1000 жителей города были поставлены два вопроса:

1. Считаете ли вы, что ваши доходы позволяют обеспечивать удовлетворение основных потребностей?

2. Удовлетворяет ли вас деятельность мэра города?

Можно предположить, что причиной отрицательного ответа на второй вопрос у части населения является неудовлетворенность их потребностей доходами, т.е. имеется связь между ответами на оба вопроса. Для измерения этой связи составляют двухмерное (дихотомическое) распределение ответов 2х2, приведенное в табл.

Взаимосвязь между ответами на два вопроса социологического обследования

Ответы на 1-й вопрос

Ответы на 2-й вопрос

Итого

Да, а

Нет, b

 

Да

А

170

80

250

Нет

В

230

20

750

Итого

400

600

1000


Если бы все, ответившие «да» на 1-й вопрос, отвечали бы «да» и на 2-й вопрос, а так же совпадали ответы «нет», то связь была бы предельно тесной, функциональной. Но на самом деле распределение ответов на оба вопроса не совпадает. Большая часть ответивших «да» на 1-й вопрос ответила «да» и на 2-й вопрос, но часть ответила «нет». То же относится к ответившим «да» на 2-й вопрос. Связь есть, но неполная, типа корреляционной, и нужно измерить тесноту этой связи. К. Пирсон предложил показатель, названный коэффициентом ассоциации. В числителе этого относительного показателя разность произведения чисел с одинаковыми ответами на оба вопроса: да-да и нет-нет и произведения чисел с неодинаковыми ответами: «да-нет» и «нет-да». В знаменателе коэффициента ассоциации - корень квадратный из произведения всех четырех частных итогов.

Информация о работе Статистические методы изучения взаимосвязей социально-экономических явлений