Автор работы: Пользователь скрыл имя, 20 Марта 2013 в 12:42, контрольная работа
1. Расчет показателей тесноты связи между двумя экономическими показателями из статистических данных.
2. Определение и графическое изображение регрессионной зависимости между рассматриваемыми показателями по методу выбранных точек и МНК линейная модель и любая на выбор (квадратичная, логарифмическая). Оценка адекватности построенной модели.
Содержание
1. Расчет показателей тесноты связи между двумя экономическими показателями из статистических данных.
2. Определение и графическое изображение регрессионной зависимости между рассматриваемыми показателями по методу выбранных точек и МНК линейная модель и любая на выбор (квадратичная, логарифмическая). Оценка адекватности построенной модели.
1. Расчет показателей тесноты связи между двумя экономическими показателями из статистических данных.
Таблица 1. Исходные статистические данные
№п/п |
Квартал, год |
Чистая прибыль, млн. долл. США |
ARPU, доллары США |
Средний ежемесячный трафик на одного абонента |
Общее число абонентов на конец периода, млн. чел. |
1 |
4 кв, 2002 |
85,2 |
21,2 |
175 |
6,64 |
2 |
1 кв, 2003 |
80,2 |
18,5 |
148 |
9,42 |
3 |
2 кв, 2003 |
128,5 |
18,7 |
162 |
11,34 |
4 |
3 кв, 2003 |
155,7 |
18,8 |
159 |
13,89 |
5 |
4 кв, 2003 |
152,7 |
16,3 |
140 |
16,72 |
6 |
1 кв, 2004 |
207,8 |
14,1 |
147 |
19,19 |
7 |
2 кв, 2004 |
267,5 |
14,1 |
160 |
22,78 |
8 |
3 кв, 2004 |
338,3 |
14,0 |
168 |
26,63 |
9 |
4 кв, 2004 |
209,1 |
11,2 |
164 |
34,22 |
10 |
1 кв, 2005 |
232,5 |
9,1 |
138 |
38,69 |
11 |
2 кв, 2005 |
303,9 |
9,3 |
134 |
44,07 |
12 |
3 кв, 2005 |
347,4 |
8,9 |
130 |
50,36 |
13 |
4 кв, 2005 |
242,6 |
7,3 |
123 |
58,19 |
14 |
1 кв, 2006 |
184,4 |
6,2 |
118 |
61,05 |
15 |
2 кв, 2006 |
294,7 |
7,1 |
128 |
64,10 |
16 |
3 кв, 2006 |
486,3 |
7,8 |
135 |
67,59 |
17 |
4 кв, 2006 |
280,3 |
8,3 |
133 |
72,86 |
18 |
1 кв, 2007 |
448,6 |
8,2 |
134 |
74,16 |
19 |
2 кв, 2007 |
507,9 |
9,2 |
151 |
74,67 |
20 |
3 кв, 2007 |
654,7 |
10,0 |
167 |
77,97 |
сумма |
5608,3 |
238,3 |
2914 |
844,54 | |
среднее |
280,42 |
11,92 |
145,7 |
42,23 |
Рисунок 1
Построение описательной экономической модели.
Данная работа будет посвящена
анализу связи между
Исходя из предположения, строим эконометрическую модель, которая относится к классу факторных статических моделей:
y=f(x1, x2)
где x1 – количество абонентов в сети (объясняющая переменная)
x2 – средняя ежемесячная выручка от продажи услуг в расчете на одного абонента (ARPU) (объясняющая переменная)
y – чистая прибыль (зависимая переменная)
Чтобы убедиться в том,
что выбор объясняющих
Таблица 2. Матрица корреляций между исходными статистическими признаками
x1 |
x2 |
y | |
x1 |
1 |
-0,97 |
0,72 |
x2 |
-0,97 |
1 |
-0,71 |
y |
0,72 |
-0,71 |
1 |
Анализируя матрицу корреляций, можем сделать вывод о наличии сильной положительной связи между количеством абонентов и чистой прибылью оператора. В то же время также существует сильная отрицательная связь ARPU и чистой прибылью.
Для дальнейшего исследования модифицируем модель к виду парной регрессии: y=f(x1).
Для выбора функциональной формы модели проанализируем корреляционное поле:
Рисунок 2. Корреляционное поле (x1 – кол-во абонентов в сети, млн. чел.; y – чистая прибыль оператора
Визуальный анализ показывает, что для построения модели вполне подойдет степенная функция:
Для дальнейшего исследования приведем наше уравнение к линейному виду. То есть:
,
где .
Таким образом, все дальнейшие исследования будем проводить с этим уравнением.
Оценка параметров модели.
Проведем оценку параметров модели при помощи различных способов.
Метод средних.
Предположим, что изменение чистой прибыли обусловлено только изменением количества абонентов (т.е. α0 = 0). Тогда оценка a1 и a2 неизвестного параметра α1 и α2 определится по формулам:
Тогда модель принимает вид: y=4,7985×x1,35881+e.
Метод выбранных точек.
Проанализируем корреляционное поле и выберем точки, которые ближе всех лежат в предполагаемой прямой линии, описывающей модель. Это будут точки 4 кв. 2004 г. (209,1; 34,22) и 2 кв. 2007 г. (507,9; 74,67).
Рассчитаем параметры модели:
уравнение регрессии выглядит следующим образом:
Метод наименьших квадратов.
Для применения этого метода составим вспомогательную таблицу:
Таблица 3
№ п/п |
Квартал, год |
Чистая прибыль, млн. долл. США y |
Общее число абонентов на конец периода, млн. чел. x |
x2 |
xy |
1 |
4 кв, 2002 |
4,445001 |
1,893112 |
3,583873 |
8,414885 |
2 |
1 кв, 2003 |
4,384524 |
2,242835 |
5,030309 |
9,833764 |
3 |
2 кв, 2003 |
4,855929 |
2,428336 |
5,896816 |
11,791827 |
4 |
3 кв, 2003 |
5,047931 |
2,631169 |
6,92305 |
13,28196 |
5 |
4 кв, 2003 |
5,028475 |
2,816606 |
7,933269 |
14,163233 |
6 |
1 кв, 2004 |
5,336576 |
2,954389 |
8,728414 |
15,766321 |
7 |
2 кв, 2004 |
5,58912 |
3,125883 |
9,771145 |
17,470935 |
8 |
3 кв, 2004 |
5,823933 |
3,282038 |
10,771773 |
19,114369 |
9 |
4 кв, 2004 |
5,342813 |
3,53281 |
12,48075 |
18,875143 |
10 |
1 кв, 2005 |
5,44889 |
3,655581 |
13,363272 |
19,918859 |
11 |
2 кв, 2005 |
5,716699 |
3,785779 |
14,332123 |
21,642159 |
12 |
3 кв, 2005 |
5,850477 |
3,919197 |
15,360105 |
22,929172 |
13 |
4 кв, 2005 |
5,491414 |
4,063714 |
16,513771 |
22,315536 |
14 |
1 кв, 2006 |
5,217107 |
4,111693 |
16,906019 |
21,451142 |
15 |
2 кв, 2006 |
5,685958 |
4,160444 |
17,309294 |
23,65611 |
16 |
3 кв, 2006 |
6,186826 |
4,21346 |
17,75325 |
26,067944 |
17 |
4 кв, 2006 |
5,63586 |
4,28854 |
18,39158 |
24,16961 |
18 |
1 кв, 2007 |
6,106132 |
4,306225 |
18,543574 |
26,294378 |
19 |
2 кв, 2007 |
6,230285 |
4,313078 |
18,602642 |
26,871705 |
20 |
3 кв, 2007 |
6,484177 |
4,356324 |
18,977559 |
28,247176 |
сумма |
109,908127 |
70,081213 |
257,172588 |
392,276228 | |
среднее |
5,495406 |
3,504061 |
12,858629 |
19,613811 |
Составим систему для расчета значений параметров на основе следующей системы уравнений:
Решив эту систему, получаем значения
a1 = 31,766
a2 = 0,5833
Линия регрессии описывается уравнением:
.
Таблица 4. Уравнения регрессий, полученные при помощи разных методов
№п/п |
Метод расчета |
Уравнение регрессии |
1. |
Метод средних |
|
2. |
Метод выбранных точек |
|
3. |
Метод наименьших квадратов |
|
Покажем на графике различие
между полученными линиями
Рисунок 3. Линии регрессии, полученные при помощи различных методов
теснота корреляция регрессионный зависимость
2. Определение и графическое изображение регрессионной зависимости между рассматриваемыми показателями по методу выбранных точек и МНК линейная модель и любая на выбор (квадратичная, логарифмическая). Оценка адекватности построенной модели
Проверка качества построенной модели.
Выполним оценку качества поэтапно.
Оценим адекватность модели в целом, для каждой из выбранных моделей. Так как выбранная нами модель является нелинейной, то приведем исследуемые модели к линейному виду.
Таблица 5. Уравнения регрессий, приведенных к линейному виду
№п/п |
Метод расчета |
Уравнение регрессии |
1. |
Метод средних |
|
2. |
Метод выбранных точек |
|
3. |
Метод наименьших квадратов |
|
Таблица 6. Предварительные расчеты для вычисления дисперсий случайных отклонений
№ п/п |
x1 |
y |
|
e2 | ||||
МС |
МВТ |
МНК |
МС |
МВТ |
МНК | |||
1 |
1,89 |
4,45 |
4,1404 |
3,4780 |
4,5627 |
0,0928 |
0,9352 |
0,0138 |
2 |
2,24 |
4,38 |
4,6156 |
3,8756 |
4,7666 |
0,0534 |
0,2590 |
0,1460 |
3 |
2,43 |
4,86 |
4,8676 |
4,0866 |
4,8748 |
0,0001 |
0,5919 |
0,0004 |
4 |
2,63 |
5,05 |
5,1432 |
4,3172 |
4,9932 |
0,0091 |
0,5340 |
0,0030 |
5 |
2,82 |
5,03 |
5,3952 |
4,5281 |
5,1013 |
0,1345 |
0,2504 |
0,0053 |
6 |
2,95 |
5,34 |
5,5824 |
4,6847 |
5,1817 |
0,0604 |
0,4249 |
0,0240 |
7 |
3,13 |
5,59 |
5,8154 |
4,8797 |
5,2817 |
0,0512 |
0,5032 |
0,0945 |
8 |
3,28 |
5,82 |
6,0276 |
5,0573 |
5,3728 |
0,0415 |
0,5877 |
0,2035 |
9 |
3,53 |
5,34 |
6,3684 |
5,3425 |
5,5191 |
1,0518 |
0,0000 |
0,0311 |
10 |
3,66 |
5,45 |
6,5352 |
5,4821 |
5,5907 |
1,1801 |
0,0011 |
0,0201 |
11 |
3,79 |
5,72 |
6,7121 |
5,6301 |
5,6666 |
0,9909 |
0,0075 |
0,0025 |
12 |
3,92 |
5,85 |
6,8934 |
5,7818 |
5,7445 |
1,0877 |
0,0047 |
0,0112 |
13 |
4,06 |
5,49 |
7,0898 |
5,9461 |
5,8288 |
2,5548 |
0,2068 |
0,1138 |
14 |
4,11 |
5,22 |
7,1550 |
6,0007 |
5,8568 |
3,7553 |
0,6140 |
0,4091 |
15 |
4,16 |
5,69 |
7,2212 |
6,0561 |
5,8852 |
2,3570 |
0,1370 |
0,0397 |
16 |
4,21 |
6,19 |
7,2932 |
6,1164 |
5,9161 |
1,2242 |
0,0050 |
0,0733 |
17 |
4,29 |
5,64 |
7,3953 |
6,2018 |
5,9599 |
3,0955 |
0,3203 |
0,1050 |
18 |
4,31 |
6,11 |
7,4193 |
6,2219 |
5,9702 |
1,7244 |
0,0134 |
0,0185 |
19 |
4,31 |
6,23 |
7,4286 |
6,2297 |
5,9742 |
1,4360 |
0,0000 |
0,0656 |
20 |
4,36 |
6,48 |
7,4874 |
6,2789 |
5,9994 |
1,0064 |
0,0421 |
0,2350 |
сум. |
70,08 |
109,93 |
126,5863 |
106,1953 |
110,0463 |
21,9071 |
5,4382 |
1,6154 |
ср. |
3,5 |
5,5 |
6,3293 |
5,3098 |
5,5023 |
1,0954 |
0,2719 |
0,0808 |
Примечание:
МС – метод средних
МВТ – метод выбранных точек
МНК – метод наименьших квадратов
На основе таблицы для каждой модели рассчитаем значение дисперсий случайного остатка
,
и значения коэффициента детерминации
.
Результат запишем в таблицу:
Таблица 7. Оценка адекватности моделей парной регрессии
№п/п |
Метод расчета |
Дисперсия случайного остатка (s2e) |
Коэффициент детерминации (R2) |
1. |
Метод средних |
1,2171 |
-2,6455 |
2. |
Метод выбранных точек |
0,3021 |
0,095 |
3. |
Метод наименьших квадратов |
0,0897 |
0,7312 |
Как видно из таблицы, наилучшее качество имеет модель, построенная по методу наименьших квадратов.
Следующие этапы оценки качества проведем только для этой модели.
Для нее расчетное значение F-критерия равно:
,
а соответствующее критическое значение – F0,05;1;18 = 4,41. Поскольку расчетное значение больше критического, то модель признается статистически значимой.
Вычислим дисперсии оценок коэффициентов регрессии. Для этого воспользуемся формулами:
Стандартные ошибки коэффициентов регрессии будут равны:
Оценим статистическую значимость коэффициентов регрессии. Для этого рассчитаем t-статистику для каждого коэффициента:
Сравним с критическими значениями,
взятыми из таблицы (http://chemstat.com.ru/node/
Таблица 8. Критические значения t-статистики
№п/п |
α (уровень значимости) |
|
1. |
0,1 |
1.7341 |
2. |
0,05 |
2.1009 |
3. |
0,01 |
2.8784 |