Автор работы: Пользователь скрыл имя, 14 Мая 2013 в 11:56, курс лекций
Тема 1. Таможенная статистика как научная дисциплина.
План:
Предмет и содержание таможенной статистики.
Сущность таможенной статистики как составной части статистических наук.
Объект таможенной статистики.
Разделы таможенной статистики.
Задачи таможенной статистики.
Правовая и нормативная база таможенной статистики
Наиболее совершенным
методом обработки рядов
При этом каждый фактический уровень yi рассматривается как сумма двух1 составляющих:
где f(t) = - систематическая составляющая, отражающая тренд и выраженная определенным уравнением; - случайная величина, вызывающая колебания уровней вокруг тренда.
Задача аналитического выравнивания сводится к следующему:
В аналитическом выравнивании наиболее часто используются простейшие функции, представленные в табл. 28, где обозначено - теоретические (выравненные) уровни (читается как «игрек, выравненный по t»); t – условное обозначение времени (1, 2, 3 …); a0, a1, a2, ... – параметры аналитической функции; k – число гармоник (при выравнивании по ряду Фурье).
Таблица 28. Виды математических функций2, используемые при выравнивании
Название функции |
График функции |
Формула |
Прямая линия |
(86) | |
Парабола 2-го порядка |
(87) | |
Гипербола |
(88) | |
Показательная |
(89) | |
Степенная |
(90) | |
Ряд Фурье |
(91) |
Выбор той или иной функции для выравнивания ряда динамики осуществляется на основании графического изображения эмпирических данных. Если по тем или иным причинам уровни эмпирического ряда трудно описать одной функцией, следует разбить анализируемый период на отдельные части и затем выровнять каждую часть по соответствующей кривой.
Нередко один и тот же ряд можно выровнять по разным аналитическим функциям и получить довольно близкие результаты. В нашем примере про ВО России можно произвести выравнивание и по прямой линии, и по параболе. Чтобы решить вопрос о том, использование какой кривой дает лучший результат, обычно сопоставляют суммы квадратов отклонений эмпирических уровней от теоретических (остатки), рассчитанным по разным функциям, то есть:
Та функция, при которой эта сумма минимальна, считается наиболее адекватной, приемлемой. Однако сравнивать непосредственно суммы квадратов отклонений можно в том случае, если сравниваемые уравнения имеют одинаковое число параметров. Если же число параметров k разное, то каждую сумму квадратов делят на разность (n – k), выступающую в роли числа степеней свободы, и сравнивают уже квадраты отклонений уровней, рассчитанные на одну степень свободы (т.е. остаточные дисперсии на одну степень свободы).
Параметры искомых уравнений (a0, a1, a2, ...) при аналитическом выравнивании могут быть определены по-разному, но наиболее распространенным методом является метод наименьших квадратов (МНК). При этом методе учитываются все эмпирические уровни и должна обеспечиваться минимальная сумма квадратов отклонений эмпирических значений уровней y от теоретических уровней :
. (93)
В частности, при выравнивании по прямой вида (86) параметры и отыскиваются по МНК следующим образом. В формуле (93) вместо записываем его конкретное выражение . Тогда . Дальнейшее решение сводится к задаче на экстремум, т.е. к определению того, при каком значении и функция двух переменных S может достигнуть минимума. Как известно, для этого надо найти частные производные S по и , приравнять их к нулю и после элементарных преобразований решить систему двух уравнений с двумя неизвестными.
В соответствии с вышеизложенным найдем частные производные:
Сократив каждое уравнение на 2, раскрыв скобки и перенеся члены с y в правую сторону, а остальные – оставив в левой, получим систему нормальных уравнений:
(94)
где n – количество уровней ряда; t – порядковый номер в условном обозначении периода или момента времени; y – уровни эмпирического ряда.
Эта система и, соответственно, расчет параметров и упрощаются, если отсчет времени ведется от середины ряда3. Например, при нечетном числе уровней серединная точка времени (год, месяц) принимается за нуль, тогда предшествующие периоды обозначаются соответственно –1, –2, –3 и т.д., а следующие за средним (центральным) – соответственно 1, 2, 3 и т.д. При четном числе уровней (как в нашем примере про ВО России – 7 уровней) два серединных момента (периода) времени обозначают –1 и +1, а все последующие и предыдущие, соответственно, через два интервала: , , и т.д. (см. 3-й столбец табл. 29).
При таком порядке отсчета времени (от середины ряда) = 0, поэтому, система нормальных уравнений (94) упрощается до следующих двух уравнений, каждое из которых решается самостоятельно:
(95)
Как видим, при такой нумерации периодов параметр a0 представляет собой средний уровень равномерного интервального ряда, то есть формулу (77).
5.Прогнозирование при помощи тренда.
Определим по формуле (95) параметры уравнения прямой для нашего примера про ВО России, для чего исходные данные и все расчеты необходимых сумм представим в табл. 29.
Таблица 29. Вспомогательные расчеты для линейного тренда
Год |
y |
t |
t2 |
yt |
||||
2000 |
149,9 |
-7 |
49 |
-1049,3 |
84,050 |
4336,223 |
44283,941 |
20905,545 |
2001 |
155,6 |
-5 |
25 |
-778 |
144,175 |
130,531 |
22593,848 |
19289,738 |
2002 |
168,3 |
-3 |
9 |
-504,9 |
204,300 |
1296,000 |
8133,785 |
15923,285 |
2003 |
212 |
-1 |
1 |
-212 |
264,425 |
2748,381 |
903,754 |
6804,188 |
2004 |
280,6 |
1 |
1 |
280,6 |
324,550 |
1931,602 |
903,754 |
192,863 |
2005 |
368,9 |
3 |
9 |
1106,7 |
384,675 |
248,851 |
8133,785 |
5537,220 |
2006 |
468,4 |
5 |
25 |
2342 |
444,800 |
556,960 |
22593,848 |
30245,558 |
2007 |
552,2 |
7 |
49 |
3865,4 |
504,925 |
2234,926 |
44283,941 |
66415,733 |
Итого |
2355,9 |
0 |
168 |
5050,5 |
2355,900 |
13483,473 |
151830,656 |
165314,129 |
Из табл. 29 получаем, что: a0 = 2355,9/8 = 294,4875 и a1 = 5050,5/168 = 30,0625. Отсюда искомое уравнение тренда: =294,4875+30,0625t. В 6-м столбце табл. 29 приведены теоретические (трендовые) уровни, рассчитанные по этому уравнению, а в итоге 7-го столбца – остатки по формуле (92). Для иллюстрации построим график эмпирических и трендовых уровней – рис. 18.
Рис. 18. Эмпирические и трендовые уровни ряда динамики ВО России
Для найденного уравнения тренда необходимо провести оценку его надежности (адекватности), что осуществляется обычно с помощью критерия Фишера, сравнивая его расчетное значение Fр с теоретическим (табличным) значением FТ (Приложение 8). При этом расчетный критерий Фишера определяется по формуле (96):
, (96)
где k – число параметров (членов) выбранного уравнения тренда.
Для проверки правильности расчета сумм в формуле (96) можно использовать следующее равенство (97):
. (97)
В нашем примере про ВО равенство (97) соблюдается (необходимые суммы рассчитаны в трех последних столбцах табл. 29): 165314,129 = 13483,473 + 151830,656.
Сравнение расчетного и теоретического значений критерия Фишера ведется при заданном уровне значимости4 с учетом степеней свободы: и . При условии Fр > FТ считается, что выбранная математическая модель ряда динамики адекватно отражает обнаруженный в нем тренд.
Проверим тренд на адекватность в нашем примере про ВО по формуле (96):
FР = 151830,656*6/(13483,473*1) = 67,563 > FТ, значит, модель адекватна и ее можно использовать для прогнозирования (FТ = 5,99 находим по Приложению 8 в 1-ом столбце [ = k – 1 = 2 – 1 = 1] и 5-й строке [ = n – k = 6]).
Как уже было отмечено ранее, в нашем примере про ВО России можно произвести выравнивание не только по прямой линии, но и по параболе, чего делать не будем, так как уже найденный линейный тренд адекватно описывает тенденцию5.
При составлении прогнозов уровней социально-экономических явлений обычно оперируют не точечной, а интервальной оценкой, рассчитывая так называемые доверительные интервалы прогноза. Границы интервалов определяются по формуле (98):
, (98)
где – точечный прогноз, рассчитанный по модели тренда; – коэффициент доверия по распределению Стьюдента при уровне значимости и числе степеней свободы =n–1 (приложение 9)6; – ошибка аппроксимации, определяемая по формуле (99):
. (99)
Спрогнозируем ВО России на 2008 и 2009 годы с вероятностью 0,95 (значимостью 0,05), для чего найдем ошибку аппроксимации по формуле (99): = = 47,405 и найдем коэффициент доверия по распределению Стьюдента по Приложению 9: = 2,3646 при = 8 – 1= 7.
Прогноз на 2008 и 2009 годы с вероятностью 0,95 по формуле (98):
Y2008 = (294,4875+30,0625*9) 2,3646*47,405 или 452,96<Y2008<677,14 (млрд. долл.);
Y2009 = (294,4875+30,0625*11) 2,3646*47,405 или 513,08<Y2009<737,27 (млрд. долл.).
Как видно из полученных прогнозов, доверительный интервал достаточно широк (из-за достаточно большой величины ошибки аппроксимации). Более точный прогноз можно получить при выравнивании по параболе 2-го порядка7.
По данным ФСГС сальдо внешней торговли (СВТ) России за период 2003-2007 гг. характеризуется рядом динамики, представленным в табл. 30.
Таблица 30. Сальдо внешней торговли (СВТ) России за период 2003-2007 гг.
Год |
2003 |
2004 |
2005 |
2006 |
2007 |
Млрд. долл. США |
76,3 |
106,1 |
142,8 |
163,4 |
152,8 |
Проанализируем данный ряд динамики: выявим тенденцию и сделаем прогноз на 2008 и 2009 годы с вероятностью 0,95.
Для большей наглядности представим данные табл. 30 на графике – рис. 19.
Рис. 19. Сальдо внешней торговли (СВТ) России за период 2000-2006 гг.
Данные табл. 30 и рис. 19 наглядно иллюстрируют постепенный рост и последующее уменьшение СВТ России за период 2003-2007 гг. Очевидно, что такую динамику не следует описывать линейной функцией тренда. Попробуем описать эту динамику с помощью тренда по параболе 2-го порядка по формуле (87). Параметры параболы (a0, a1, a2) определим методом МНК, для чего в формуле (93) вместо записываем выражение параболы . Тогда . Дальнейшее решение сводится к задаче на экстремум, т.е. к определению того, при каком значении a0, a1, a2 функция трех переменных S может достигнуть минимума. Как известно, для этого надо найти частные производные S по a0, a1, a2 и приравнять их к нулю и после элементарных преобразований решить систему трех уравнений с тремя неизвестными.
В соответствии с вышеизложенным найдем частные производные:
Сократив каждое уравнение на 2, раскрыв скобки и перенеся члены с y в правую сторону, а остальные – оставив в левой, получим систему нормальных уравнений:
(100)
Упростим систему (100), введя условную нумерацию t от середины ряда. Тогда ∑t = 0 и ∑t3 = 0, а система (100) упростится до следующего вида:
Информация о работе Лекции по "Общей и таможенной статистике"