Лекции по "Эконометрике"

Автор работы: Пользователь скрыл имя, 31 Октября 2013 в 16:51, курс лекций

Описание работы

Анализ невременных данных.
Характеристики случайной величины.
Модель парной линейной регрессии.
Теорема Гаусса-Маркова.
Ковариационная матрица.
Дисперсионный анализ.
Модель множественной регрессии.
Спецификация модели.
Dummy – переменные, фиктивные переменные.

Файлы: 1 файл

Лекции.doc

— 1,006.50 Кб (Скачать файл)

Например: оценка успеваемости, номер места на соревнованиях или группы людей по возрастам. В исследовании социально-экономических явлений часто возникает необходимость оценить силу связи между категориальными и порядковыми переменными. Коэффициент корреляции Пирсона, который считали ранее, не подходит, он не показывает реального состояния. Необходимо использовать другие коэффициенты связи.

Пример: Пусть у нас имеется лекарство и мы хотим проверить есть ли связь между приемом этого лекарства и состояния больного.


x2

x1

В

Итого по строке

А

n11

n12

n10

Ā

n21

n22

n20

Итого по стобцу

n01

n02

N


Всех больных случайным образом  делят на 2 группы. 1-ю группу лечат  новым препаратом, а 2-ю группу лечат  традиционными методами. Таким образом мы получаем 2 показателя: 1-ый показатель: проходил ли больной курс лечения новым препаратом.

Х1: А – давали лекарство

     Ā – не давали

Х2 – результат лечения.

Х2: В – состояние улучшилось

      В – состояние  ухудшилось

Результаты этого опыта можно представить в таблице.

n11 – число людей, которым давали лекарство и чье состояние улучшилось.

n12 - число людей, которым давали лекарство и чье состояние ухудшилось.

n01=n11+n21

n02=n12+n22

n10=n11+n12

N20=n21+n12

N=n11+n12+n21+n22

Задача состоит в том, чтобы по этим 4-м числам определить, связан ли результат лечения с приемом лекарства и как именно связан.

Рассмотрим разные варианты.

1.Если между Х1 и Х2 нет  никакой связи, лекарство бессмысленно. Тогда доля принимавших лекарство  среди больных, чье состояние улучшилось должна быть равна доле принимавших лекарство среди тех, кому стало хуже и равна доле принимавших лекарство среди всех больных.

Доля принимающих лекарство, чье  состояние улучшилось=n11/n01

Доля принимающих лекарство, чье  состояние ухудшилось=n12/n02

Доля принимавших лекарство  среди всех участвующих в эксперименте=n11/n01+n12/n02=n10/N

N11=(n11+n12)(n22+n21)/N – то связи нет!

На равенстве долей и построена  мера связи. За меру связи можно принять  величину n11=…, но у этой величины значения могут быть и больше 1 и меньше 1 по модулюÞ ее необходимо модифицировать, чтобы сделать похожей на коэффициент корреляции. А именно ввести коэффициент Юла, равный D=(n11n22 - n12n21)/(n11n22+n12n21)

Если D=0, то связи нет.

Если связь сильная отрицательная, то коэффициент Юла D=-1

Если связь сильная положительная, то D=1

Замечание: Коэффициент Юла подходит, если рассматривается таблица 2*2. Т.е. определяется сила связи между 2-мя параметрами, каждый из которых принимает только 2 значения.

Связь считается подтвержденной, если ‌‌׀D׀>0,5.

Пример 1.

 

B

A

n11

n12

Ā

0

n22


D=(n11n22-0)/(n11n22+0)=1, т.е. из нелечения Þухудшение состояния.

Пример 2.

n11

n12

n21

0


D=(0-n12n21)/(0+n12n21)=-1, т.е. из лечения Þухудшение самочувствия или если не лечили, то обязательно стало лучше.

Однако часто в маркетинговых  исследованиях приходится сталкиваться с ситуацией, когда 1 или оба признака принимают несколько значений.

В этом случае рассчитать коэффициент  Юла не получится и следует использовать другие коэффициенты.

Примером таблиц n*m может служить анализ результатов выборок кандидатов в разных регионах страны. Тогда каждому региону сопоставляют столбец, а каждому кандидату – строку.

       
       
       
       

В таблице стоят значения рейтинга кандидата в соответствующем регионе. Требуется установить связь между регионом и рейтингом в нем кандидатов. Рассмотрим различия статистики тесноты связи: 1. Фи – коэффициент. Его используют для таблиц 2*2.

Фи= , где

 

 

- итоговое число в столбце

- итоговое число в строке

- полный размер выборки

- соответствующее число в  таблице

Ф – коэффициент принимающий значение, равное 0, если связь присутствует, и 1, если связь сильная.

Пример. Найти связь между использованием Интернета и полом.

 

 

Исп.интер

М

Ж

Итого

Много(>3ч.в день)

5

10

15

Мало(<3ч.в день)

10

5

15

Итого

15

15

30


 

= =7,5

=7,5

=7,5

 

=7,5

Тогда

Таким образом связь положительная, не очень сильная.

Ф применяется только для таблиц 2*2, а коэффициент сопряженности С используется в таблице любого размера.

С Î [0;1]

Также используется V – коэффициент Крамера, который является модификацией.

Для таблиц с r рядами

  ,

т.е. V – коэффициент подтверждает наличие слабой связи.

 

 

Коэффициент взаимной сопряженности  Чупрова

 

- коэффициент взаимной сопряженности.  Чем ближе Кп к 1, тем теснее  связь.

Пример.

 

Форма собственности

Оценка уровня жизни

Вполне уд.

Скорее уд.

Скорее неуд.

Совсем неуд.

Итого

Государственная

31

35

35

35

136

Муниципальная

17

13

14

9

53

Смешанная рос.

4

2

1

1

8

Частная

8

5

4

3

20

Итого

60

55

54

48

27


 

 

Оценить взаимосвязь  между уровнем жизни респондента и формой собственности предприятий, на которых они работают.

Вывод: коэффициент маленький (меньше 0,3) Þ значимой связи между формой собственности и уровнем жизни.

Существует  модификация этого коэффициента через

Биссериальный коэффициент корреляции

 

Он имеет особое значение, т.к. позволяет  оценить связь между качественным альтернативным и количественным варьирующим  признаком.

 где 

 и  - средние по группе

sу – корень из дисперсии (для количественной переменной)

р – доля 1-ой группы

q – доля 2-ой группы

z – табличное значение в зависимости от распределения значений 1-ой группы.

Пример. Найти зависимость между возрастом и социальным положением потенциальных эмигрантов.

 

До 30

30-40

40-50

50 и более

Всего, чел.

Руковод

5

30

39

26

100

Рабочие

21

 

28

13

100

Итого

26

68

67

39

200


 

Оценить силу связи.

- частота проявления признаков.

Выбираем  среднее в группе = [25*5+35*30+45*39+55*26]*1/100=43,6

Средний возраст  эмигрантов – руководителей =43,6 лет.

(рабочие) = [25*21+35*38+45*28+55*13]*1/100=38,3

= [25*26+35*68+45*67+55*39]*1/200=40,95

sу=

Р (рук)=100/200=0,5

Q (раб)=100/200=0,5

Z=0,3977

 

Ранговые коэффициенты корреляции

 

Как определить силу линейной связи  между порядковыми переменными, между которыми существует отношение упорядоченности, т.е. между ранжированными значениями?

Все дальнейшие рассуждения опираются  на понятие ранг.

Ранг – номер объекта в упорядоченном ряду.

Например: эксперт сравнивает объекты и выстраивает их по порядку. Чем лучше объект, тем выше ранг ему присваивают.

Ранг

A B C D E F G – ранжированный вариационный ряд

D A B C F E G

1  2  3  4 5 6  7


 

ранг

Т – объем выборки.

К сожалению, бывает, что ранги не различимы. Если же какие-то объекты  не различимы для объекта, то используется понятие распределенный ранг. Тогда всем 3-м объектам присваивается один и тот же номер ранга, получаемый как сумма рангов этих объектов, деленная на их количество.

B C F – не различимы

(3+4+5)/3=4

Суммарное значение всех присвоенных рангов зависит от объема выборки и может быть рассчитан следующим образом:

- номер ранга, присвоенного  i-му объекту.

В нашем  случае

Коэффициент корреляции Спирмена

 

Рассмотрим задачу о силе связи 2-х различных оценок. Эти 2 оценки были получены  с помощью оценивания одного и того же множества, но разными критериями. Например: инвестиционные проекты могут быть оценены с помощью или чистого дохода или срока окупаемости.

Х1 – 1-ый признак

Х2 -  2-й признак.

Тогда результаты оценивания могут  быть представлены в таблице.

 

1

2

3

4

Т

Х1

Х1(1)

Х1(2)

Х1(3)

Х1(4)

Х1(Т)

Х2

Х2(1)

Х2(2

Х2(3)

Х2(4)

Х2(Т)


 

Хi(k) – это значение ранга, присвоенного объекту с номером к по i-му признаку.

В нашем случае i=(1;2)

Требуется определить силу связи этих 2-х оценок, причем желательно, чтобы  мера связи лежала в отр. [-1;1] и  была бы равна

0, если связи нет

1, если связь сильная положительная

-1, если связь сильная отрицательная

 

Связь будет идеально положительна, если Х1(к)=Х2(к), т.е. совпадают.

Связь будет сильно отрицательной, если 2-й ряд упорядочен в обратном порядке, т.е. Х2(к)=Т-Х1(к)+1

В качестве меры связи можно использовать ранговый коэффициент корреляции Спирмена, который для 2-х критериев выглядит следующим образом:

 

Если имеются распределительные  ранги, то выражение сильно усложняется.

Пример.

N

Стоимость активов

Кредит.вложения

СК

Ry

Rx1

Rx2

Di

Di2

0

y

X1

X2

         

1

3176

2496

209

7

7

7

0

0

2

3066

1962

201

6

6

6

0

0

3

2941

783

177

5

3

5

-2

4

4

1997

1319

136

4

5

3

2

4

5

1865

1142

175

3

4

4

0

0

6

1194

658

88

2

2

2

0

0

7

518

311

60

1

1

1

0

0


 

Тогда коэффициент корреляции Спирмена

,

Т.е. связь очень сильная положительная.

Много активов у банка, у которых много кредитов.

 

Использование эконометрических методов  в маркетинговых исследованиях

 

Процесс маркетинговых исследований состоит из 6 этапов:

  1. Определение проблемы. На этом этапе выявляется основная проблема и какая информация нужна для решения данной задачи.
  2. Разработка подхода к решению проблемы. На этом этапе формируются рамки исследования, аналитические модели, план исследования, собираются необходимые вторичные данные.
  3. Разработка плана исследования. План маркетингового исследования детализирует ход выполнения процедур, необходимых для получения нужной информации, т.е. определяется, каким образом получаются данные от респондентов, шкалы измерения. На этом этапе активно привлекают социологов и психологов.
  4. Полевые работы или сбор данных.
  5. Подготовка данных и их анализ. Подготовка данных включает в себя редактирование, кодирование, расшифровку и проверку данных. Каждому ответу присваиваются числовые или буквенные коды. Затем все анкетные данные вводятся в компьютер.
  6. Подготовка отчета и его презентация. Ход и результат исследования должны быть изложены в форме отчета, полученные выводы должны быть представлены в письменном виде и изложены простым и понятным языком. После определения набора информации, которая должна быть получена, следует особое внимание уделить формированию выборки, а именно: с учетом доступных времени людей и денег определить: а) размер выборки б) способ ее получения.
  7. Кодирование вопросов. Оно заключается в переводе ответов на вопросы в числа. Например: 1. Действителен ли сегодня ваш паспорт? 1. Да 2. Нет (2/54)

54 – количество человек, выбравших  данный ответ

      Для проверки получаемой  информации и получения первичных  результатов анализа используется теория проверки гипотез.

 

Общая схема проверки гипотез

 

  1. Формулировка проверки гипотез. Формируется нулевая гипотеза Н0 и альтернативная – Н1. Н0 – предположение о том, что между определенными статистическими параметрами не существует связи или различия. Ее подтверждение не требует от компании каких-либо действий. Н1 – противоположная гипотеза, т.е. предположение о том, что связь или различие существует. Ее подтверждение означает, что компания должна предпринять какие-либо меры или поменять свои взгляды на положение дел. Маркетолог проверяет всегда нулевую гипотезу.
  2. Выбор уровня значимости и метода проверки гипотезы. Используют математико-статистический анализ, поэтому то или иное утверждение принимается или отвергается с вероятностью a. Реультатом проверки гипотез является 1 из 2-х вариантов. 1. Н0 – принимается

Информация о работе Лекции по "Эконометрике"