Модели с дискретными зависимыми переменными

Автор работы: Пользователь скрыл имя, 24 Апреля 2013 в 20:24, курсовая работа

Описание работы

Изучение моделей с дискретными зависимыми переменными является важным разделом эконометрики. Модели с дискретными зависимыми переменными имеют не только теоретическое, но и практическое значение. Примерами экономических моделей с дискретными зависимыми переменными являются модели потребительского выбора, модели фирмы, модели экономического

Содержание работы

ВВЕДЕНИЕ………………………………………………………………………3
Глава 1. Понятие моделей с дискретными зависимыми переменными………………………………………………………………….
Глава 2. Модели бинарного выбора ………………………………………...
Глава 3. Модели множественного выбора …………………………………
Глава4. Модели счетных данных ……………………………………………
ЗАКЛЮЧЕНИЕ……………………………………………………………….…
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ….…………………………

Скачать архив (342.18 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

курс ЭконометрикА.docx

— 364.62 Кб (Скачать файл)

P(Y=1)=ò(a¢x). (10.50)

где Ф(.) – функция стандартного нормального распределения, зависящая от значений факторов x и параметров a, j(u)– функция плотности распределения стандартной нормальной переменной u.

В предположении о независимости и гомоскедастичности ошибок e_t функцию j(u) можем записать в следующем виде:

j(a¢x_t)=

Заметим, что s²в выражении (10.51) является неизвестным параметром, который должен быть оценен, как и вектор параметров a.

Рис.10.2 График функции закона распределения, близкого к нормальному.

Из выражения (10.51) вытекает, что между значениями независимой переменной у_t и j(a¢x_t) выполняется следующее соотношение (см. табл. 10.3).

Таблица 10.3

у_t

j(a¢x_t)

Не менее широко в моделях бинарного выбора используется и логистическое распределение:

P(Y=1) =L(a¢x). (10.52)

гдеL(.) представляет собой интегральную функцию логистического распределения.

Модели, построенные на его основе, называются logit-моделями. Несложно заметить, что в данном случае между составными частями регрессионного уравнения выполняется следующее соотношение (см. табл. 10.4).

Таблица 10.4

у_t

P(у_t=...)=

e_t

Вопрос о том, какое из вышеназванных распределений более подходит для практических исследований, остается открытым. На участке a¢xÎ[–1,2; 1,2] оба они ведут себя практически одинаково. Однако вне этого участка, т. е. на хвостах распределения, значения функционалов Ф(a¢x) и L(a¢x) имеют некоторые отличия. В частности, логистическое распределение имеет более “тяжелый хвост”, чем нормальное. Практика показывает, что при отсутствии существенного преобладания одной альтернативы над другой, а также для выборок с небольшим разбросом переменных, выводы, полученные на основе probit- и logit-моделей, как правило, совпадают.

В общем случае из выражения (10.41) для модели бинарного выбора вытекает, что условное математическое ожидание зависимой переменной при заданном наборе факторов может быть определено следующим выражением:

M[y_t|x_t]=0×[1–F(a¢x_t)]+1×F(a¢x_t)=F(a¢x_t). (10.53)

Одно из направлений использования результата (10.53) в анализе рассматриваемых явлений связано с оценками, так называемого маржинального эффекта факторов, входящих в модель. Маржинальный эффект фактора x_it, i=1,2,...,n; t=1,2,..,T показывает изменение функции F(a¢x_t) (характеризующей вероятность того, что у=1) при изменении фактора x_it на единицу.

Маржинальные эффекты факторов x_t для модели бинарного выбора оцениваются на основе следующего выражения:

¶M[y_t|x_t]/¶x_t={¶ F(a¢x_t)/ ¶(a¢x_t)}×a=f(a¢x_t)×a, (10.54)

где f(.) – плотность безусловного распределения, соответствующая интегральному распределению F(.) и дифференцирование осуществляется по вектору x_t. В частности, для нормального распределения маржинальный эффект рассчитывается по формуле

¶M[y_t|x_t]/¶x_t=f(a¢x_t)×a, (10.55)

гдеf(.) – плотность стандартного нормального распределения.

Для логистического распределения производная функции этого закона по факторамx_t функция f(a¢x_t) имеет следующий вид:

¶L[a¢x_t]/¶x_t=e^a^¢^x/(1+ e^a^¢^x)² =L(a¢x_t)×[1–L(a¢x_t)]. (10.56)

Соответственно в logit-модели маржинальные эффекты определяются как

¶M[y_t|x_t]/¶x_t=L(a¢x_t)×[1–L(a¢x_t)]×a, (10.57)

Из выражений (10.54)–(10.57) вытекает, что величина маржинального эффекта для probit- и logit-моделей зависит от значений независимых факторов x. В связи с этим полезно будет определить так называемый “средний маржинальный эффект” в области существования значений независимых факторов.

На практике возможны два подхода к его оценке. Первый основан на усреднении значений независимых факторов, т. е. сначала рассчитываются выборочные средние всех факторов , i=1,2,..., п, а затем для оценки среднего эффекта определяется f(a¢)×a. В соответствии со вторым подходом маржинальные эффекты оцениваются для каждого наблюдения, затем по полученным оценкам этих индивидуальных маржинальных эффектов определяется его среднее значение.

Поскольку функция (10.51) у рассматриваемых моделей непрерывна, то в соответствии с теоремой Слуцкого^* на больших выборках оба подхода будут давать один и тот же набор средних маржинальных эффектов. Но это неверно для малых выборок. Практика показывает, что в этом случае лучшие результаты дает второй подход, основанный на усреднение индивидуальных маржинальных эффектов.

Заметим, что средний маржинальный эффект бинарной независимой переменной (например, с) можно определить как следующую разность: P[y=1|, с=1]–P[y=1|, с=0], где – вектор выборочных средних значений остальных независимых переменных х.

Обратим внимание на то, что результаты моделей бинарного выбора могут иметь разнообразное содержание. В частности, их можно проинтерпретировать в терминах выгоды или ущерба. Рассмотрим такую интерпретацию на примере модели крупной покупки. Исходными данными (наблюдаемыми переменными) в этом случае являются сведения о покупке (1 – покупка сделана, 0 – в противном случае) и факторы, характеризующие субъекта, потребителя (доход, пол, возраст и т. д.). Далее предполагается, что покупка имеет место, если она приносит выгоду потребителю, и покупка отсутствует, если такой выгоды нет, и даже возможен “ущерб” (например, покупка бесполезна).

Ненаблюдаемую (латентную) выгоду, получаемую t-м потребителем от покупки, будем моделировать как переменную y_t^*, определяемую следующим выражением:

y_t^*=a¢x_t+e_t, (10.58)

где a¢x_t в данном случае называется индексной функцией (indexfunktion); e_t– ошибка модели, в отношении которой делается предположение, что она имеет стандартное нормальное распределение с нулевым математическим ожиданием и единичной дисперсией.

Вероятность получения t-м потребителем выгоды от покупки может быть определена следующим образом:P(y_t^*>0)=P(a¢x_t+e_t>0)=P(e_t>–a¢x_t). (10.59)

Если распределение симметрично (каковыми являются нормальное и логистическое), то выражение (10.59), можно представить в следующем виде:

P(y_t^*>0)=P(e<a¢x_t)=F(a¢x_t). (10.60)

В качестве примера модели типа (10.58)–(10.60) рассмотрим модель миграции, разработанную Нейкостином и Циммером (Nakosteen, Zimmer, 1980). В ее основе лежит предположение о том, что индивидуум принимает решение о переезде, если это приносит ему определенную выгоду, которая оценивается на основе сопоставления доходов в настоящем и “новом” месте его проживания, затрат на переезд.

Доход y_p^*, который индивидуум может получить в данной местности настоящего проживания за год, определяется как

y_p^*=a¢x_p+e_p, (10.61)

где a– вектор значений параметров; x_p – вектор независимых переменных, характеризующих индивидуума, например, возраст, образование, опыт работы, и т. д.; e_p – ошибка модели.

Если индивидуум переезжает на новое место, то его доход y_m^* будет определяться согласно следующему выражению:

y_m^*=b¢x_m+e_m, (10.62)

где b– вектор значений параметров; x_m – вектор независимых переменных, состав которых может как совпадать, так и не совпадать с составом компонент вектора x_p (включать, например, возможность получения более престижной должности); e_m – ошибка модели.

Переезд связан с определенными затратами C^*, которые могут быть связаны линейной зависимостью со статусом индивидуума (предприниматель, наемный работник, семейный или несемейный и т. д.):

C^*=g¢z+u, (10.63)

где z – вектор независимых переменных, характеризующих статус индивидуума; u– ошибка модели.

С учетом вышеперечисленного выгода от переезда может быть представлена в следующем виде:

N^*=y_m^*–y_p^*– C^*=b¢x_m –a¢x_p –g¢z+(e_m –e_p– u)=d¢w+e, (10.64)

где w – вектор независимых переменных, характеризующих индивидуума, условия его жизнедеятельности в местах его жительства и т. п., которые влияют на уровень доходов и затраты на переезд; e=e_m –e_p– u – ошибка модели.

В целом, вероятность переезда P(N=1) определяется следующим образом:

P(N^*>0)=P(d¢w+e>0)=P(e>–d¢w). (10.65)

Выражение (10.65) полностью соответствует выражению (10.59).

Альтернативную интерпретацию данных об индивидуальных предпочтениях дает модель случайной полезности (randomutilitymodel). Согласно этой интерпретации латентные (ненаблюдаемые) переменные предыдущей задачи, т. е. y_mиy_p, представляют собой полезности для индивидуума двух выборов (переезжать или не переезжать). В другом примере латентные переменные могут характеризовать полезность аренды дома и полезность владения домом. Статистика индивидуальных выборов, т. е. значения y_t=1 и y_t=0, дают возможность оценить, какая из альтернатив имеет большую полезность при соответствующих наборах факторов, но при этом величина полезности остается неопределенной. Обозначим полезность аренды дома через U^a, а полезность владения домом – через U^b. Наблюдаемый индикатор y_t равняется 1, если U^a>U^b, и равняется 0, если U^a£U^b.

Общая постановка модели случайной полезности выглядит следующим образом:

U^a=a¢_ax+e_a;

U^b=a¢_bx+e_b. (10.63)

где a_a и a_b – различающиеся между собой вектора параметров модели; индексы а и b характеризуют варианты выбора.

Тогда, вероятность выбора варианта а (наблюдаемая переменная y принимает значение 1) определяется по следующей формуле:

P(y=1|x)=P[U^a>U^b]=P[(a¢_ax+e_a –a¢_bx–e_b|x]=

= P[(a_a –a_b)¢x+e_a –e_b>0|x]= P[a¢x+e>0|x]. (10.64)

На практике по известным значениям наблюдаемой переменной y_t оценивается вектор a=a_a –a_b.

Рассмотренные выше модели использовали, так называемые индивидуальные данные. Каждое наблюдение содержало набор значений [y_t, x_t], характеризующих реальный выбор отдельного индивидуума и соответствующий вектор независимых факторов. Вместе с тем, часто при построении моделей бинарного выбора используются групповые данные, которые выражают результаты подсчетов или пропорций. Обозначим через k_t количество индивидуумов, имеющих одинаковые значения, характеризующих их признаков (т. е. одинаковый вектор x_t). Индекс t в этом случае выражает различные вектора признаков x_t и соответствующие количества индивидуумов k_t, обладающих ими. Пусть наблюдаемая зависимая переменная N_tвыражает долю индивидуумов, у которых y_t=1, в общем числе индивидуумов k_t. С учетом этого информация для фиксированного индекса t выглядит как [k_t, N_t, x_t], t=1,..., T. Для сгруппированных таким образом данных представим зависимость доли N_t от факторов-признаков, характеризующих индивидуумов t-й группы, в следующем виде:

N_t=F(a¢x_t)+e_t =p_t +e_t,

M[e_t]=0;

D[e_t]=p_t×(1–p_t)/k_t. (10.68)

где в качестве функции F(a¢x_t) обычно используются функции законов нормального и логистического распределений; p_t – оценка доли N_t; e_t – ошибка модели.

В заключение раздела, посвященного рассмотрению моделей бинарного выбора, объясним происхождение терминов logit и probit. Из выражения (10.68) следует, что дисперсия ошибки eгетероскедастична. Поскольку функция F(a¢x_t) предполагается нелинейной, то для оценки параметров следовало бы применить нелинейный МНК с весами, однако можно предложить менее громоздкий подход к решению данной задачи. Для этого обозначим через F(N_t) значение интегральной функции закона распределения в точке N_t. Тогда можно показать, что обратное значение этой функции F^–1(N_t) допускает следующее представление^*:

F^–1(N_t)»a¢x_t +e_t/f(p_t)илиF^–1(N_t)=z_t»a¢x_t +u_t, (10.66)

Информация о работе Модели с дискретными зависимыми переменными