Автор работы: Пользователь скрыл имя, 23 Апреля 2014 в 08:53, контрольная работа
Цель данного исследования – выяснить, какие факторы и каким образом влияют на размер расходов домашних хозяйств США, затрачиваемых на продукты и безалкогольные напитки, потребляемые в домашних условиях.
Для достижения поставленной цели необходимо выполнить ряд следующих задач:
построить экономическую модель на основе исходных данных и выдвинуть соответствующие гипотезы;
провести предварительный анализ данных и построить эконометрические модели;
произвести оценку качества построенных моделей, на основе которой попытаться дать экономическую интерпретацию полученных результатов.
Цель данного исследования – выяснить, какие факторы и каким образом влияют на размер расходов домашних хозяйств США, затрачиваемых на продукты и безалкогольные напитки, потребляемые в домашних условиях.
Для достижения поставленной цели необходимо выполнить ряд следующих задач:
Поскольку результирующим признаком являются расходы на продукты и напитки, потребляемые домохозяйствами в домашних условиях, то в роли независимых признаков могут выступить следующие факторы:
Данные по выбранным параметрам представляют собой выборку, состоящую из 800 наблюдений, полученных при обследовании потребительских расходов домашних хозяйств в США в 1995 г.
На основе экономического обследования и краткой характеристики выбранных зависимых и независимых параметров, можно выдвинуть следующие гипотезы:
Гипотеза 1. Чем больше детей в той или иной семье, тем больше средств приходится затрачивать этим семьям на питание и безалкогольные напитки, потребляемые в домашних условиях.
Гипотеза 2. С ростом общего объёма потребительских расходов домашних хозяйств затраты на питание и безалкогольные напитки, потребляемые в домашних условиях и составляющие определённую долю от этого объёма, будут также увеличиваться.
Гипотеза 3. Чем больше домохозяйства тратят средств на питание в кафе, ресторанах, кино, парках и т.п., тем меньше их расходы на питание и безалкогольные напитки, потребляемые в домашних условиях.
Гипотеза 4.
При увеличении затрат домохозяйств на пользование общественным транспортом за пределами города, в котором проживает та или иная семья, их расходы на потребляемые в домашних условиях еду и безалкогольные напитки уменьшатся.
Независимые количественные переменные
Данные по количеству детей не однородны (коэффициент вариации 159,7%>33,3%, ящичковая диаграмма (рис. 1б) выявила выбросы – значения 3,4,5,6), имеют островершинное, скошенное вправо распределение (положительный эксцесс, коэффициент асимметрии положительный), которое существенно отличается от нормального с вероятностью 95% (значение критерия Харки-Бера не близко к нулю и (р-value=0,00)<0,05, ) (рис. 1а).
Однако стоит лишь исключить семьи, в которых 5 и 6 детей, потому как их удельный вес в выборки мал, чтобы существенно повлиять на её объём.
С целью сохранения количества наблюдений необходимо исключить семьи с совокупными затратами более 100000 долларов, т.к. эти семьи занимают маленькую долю в выборочной совокупности.
Независимые ранговые переменные
Зависимые количественные переменные
Существуют одна семья, расходы которой по данной категории равны нулю, этот признак говорит о том, что эта семья предпочитает питаться вне дома – в кафе, ресторанах и т.п., более того, эта семья занимают очень малую долю в общем объёме выборки, поэтому её можно исключить. Имеет смысл исключить семьи с расходами по данной категории выше 10000, т.к. их удельный вес также очень мал.
После исключения некоторого количества наблюдений в выборке осталось 775 наблюдений.
На основе построенной корреляционной матрицы (Таблица 1) можно увидеть, что между типом жилья домохозяйств и их затратами на питание в домашних условиях наблюдается слабая обратная линейная взаимосвязь. Между количеством детей и анализируемой категорией расходов, а также затратами на потребляемые вне дома питание и безалкогольные напитки и аналогичной категорией расходов наблюдается умеренная прямая линейная взаимосвязь. А между совокупными расходами и расходами на потребляемые в домашних условиях еду и безалкогольные напитки существует заметная прямая линейная взаимосвязь. Все перечисленные коэффициенты значимы на 1%-ном уровне.
Кроме того, между двумя независимыми признаками – расходами на питание вне дома и совокупными затратами домохозяйств существует заметная прямая линейная взаимосвязь (парный коэффициент корреляции равен 0,648), следовательно, есть подозрения на то, что имеет место нестрогая мультиколлинеарность, тем более что данный коэффициент превышает коэффициенты корреляции между зависимой переменной и каждым из этих признаков в отдельности. Наличие мультиколлинеарности в модели может привести к получению ненадёжных оценок и затруднениям при оценивании влияния каждой из тесно взаимосвязанных признаков на зависимую переменную, поэтому необходимо подтвердить её наличие или отсутствие, чтобы при необходимости исключить данную проблему.
Таблица 1. Корреляционная матрица
FDHO |
CHILD |
EXPEND |
FDAW |
HHTENURE | |
FDHO |
1.000000 |
||||
CHILD |
0.429273*** |
1.000000 |
|||
EXPEND |
0.562070*** |
0.183745*** |
1.000000 |
||
FDAW |
0.334399*** |
0.107501*** |
0.647860*** |
1.000000 |
|
HHTENURE |
-0.242147*** |
-0.043288 |
-0.405021*** |
-0.267768*** |
1.000000 |
*-значим на 10%-ном уровне, **-значим на 5%-ном уровне, ***-значим на 1%-ном уровне
При построении вспомогательной парной регрессии для этих двух признаков можно увидеть, что коэффициент детерминации равен 42%, хотя это значение далеко от 100% и коэффициент VIF=3,7 значительно меньше 10, однако, всё равно можно предположить, что в реальной жизни существует связь между исследуемыми факторами. Чем выше расходы на питание вне дома, тем выше совокупные расходы семей, в действительности это вполне вероятно, ведь цены на еду и напитки в кафе, ресторанах, кино и т.д. значительно выше цен на продукты в обычных розничных магазинах, поэтому такие расходы могут оказать значительное влияние на бюджет семей.
Чтобы устранить сомнения по поводу наличия или отсутствия мультиколлинеарности, можно включить в модель в качестве факторного признака линейную комбинацию двух независимых, которые по подозрению заметно связаны между собой. Пусть переменная ex=expend – fdaw характеризует совокупные затраты домохозяйств, не связанные с потреблением еды и безалкогольных напитков вне дома.
При построении моделей зависимым фактором будут выступать затраты домохозяйств на еду и безалкогольные напитки, потребляемые в домашних условиях, а независимыми: количество детей в семье (в возрасте до 15 лет) и тип жилья, поскольку коэффициенты корреляции между данными признаками и результирующим значимы на 1%-ном уровне, следовательно есть смысл проверить количественный характер связи между ними. В число независимых факторов также войдут совокупные затраты домохозяйств за исключением затрат на питание вне дома. Данная переменная линейно включает в себя два других независимых фактора – совокупные расходы и затраты на питании вне домашних условий и создана для устранения сомнений по поводу наличия мультиколлинеарности в модели.
На основе построенных корреляционных полей зависимости результирующего признака и факторных (Рис. 6), можно предположить, что между ними существует линейная взаимосвязь.
Уравнение построенной множественной регрессии будет выглядеть следующим образом:
FDHO=1733,73+602,30*CHILD+0,
Уравнение для подушевых расходов домохозяйств будет выглядеть следующим образом:
FDHO/SIZE=1033.75–44.82*CHILD+