Автор работы: Пользователь скрыл имя, 14 Мая 2013 в 11:56, курс лекций
Тема 1. Таможенная статистика как научная дисциплина.
План:
Предмет и содержание таможенной статистики.
Сущность таможенной статистики как составной части статистических наук.
Объект таможенной статистики.
Разделы таможенной статистики.
Задачи таможенной статистики.
Правовая и нормативная база таможенной статистики
В отличие от КФ в линейном коэффициенте корреляции учитываются не только знаки отклонений от средних величин, но и значения самих отклонений, выраженные для сопоставимости в единицах среднего квадратического отклонения t:
и .
Линейный коэффициент корреляции r представляет собой среднюю величину из произведений нормированных отклонений для x и у:
, (106) или . (107)
Числитель формулы (107), деленный на n, представляющий собой среднее произведение отклонений значений двух признаков от их средних значений, называется коэффициентом ковариации – это мера совместной вариации факторного x и результативного y признаков:
(108)
Недостатком коэффициента ковариации является то, что он не нормирован, в отличие от линейного коэффициента корреляции. Очевидно, что линейный коэффициент корреляции представляет собой частное от деления ковариации между х и у на произведение их средних квадратических отклонений:
. (109)
Путем несложных математических преобразований7 можно получить и другие модификации формулы линейного коэффициента корреляции, например:
, (110) , (111)
, (112) . (113)
Линейный коэффициент корреляции может принимать значения от –1 до +1, причем знак определяется в ходе решения. Например, если , то r по формуле (110) будет положительным, что характеризует прямую зависимость между х и у, в противном случае (r<0) – обратную связь. Если , то r=0, что означает отсутствие линейной зависимости между х и у, а при r=1 – функциональная зависимость между х и у. Следовательно, всякое промежуточное значение r от 0 до 1 характеризует степень приближения корреляционной связи между х и у к функциональной. Существует эмпирическое правило (шкала Чэддока) для оценки тесноты связи, представленное в таблице 34.
Таблица 34. Шкала Чэддока
| r | |
Теснота связи |
менее 0,1 |
отсутствует линейная связь |
0,1 ÷ 0,3 |
слабая |
0,3 ÷ 0,5 |
умеренная |
0,5 ÷ 0,7 |
заметная |
более 0,7 |
сильная (тесная) |
Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.
В нашей задаче для расчета r построим вспомогательную таблицу 35.
Таблица 35. Вспомогательные расчеты линейного коэффициента корреляции
№ месяца |
x |
y |
tx |
ty |
tx ty |
xy | |||
1 |
27,068 |
172,17 |
90,897 |
4422,782 |
-1,993 |
-2,408 |
4,799 |
634,049 |
4660,298 |
2 |
29,889 |
200,90 |
45,064 |
1426,875 |
-1,403 |
-1,368 |
1,919 |
253,577 |
6004,700 |
3 |
34,444 |
231,83 |
4,657 |
46,840 |
-0,451 |
-0,248 |
0,112 |
14,769 |
7985,153 |
4 |
33,158 |
232,10 |
11,861 |
43,217 |
-0,720 |
-0,238 |
0,171 |
22,641 |
7695,972 |
5 |
37,755 |
233,40 |
1,329 |
27,815 |
0,241 |
-0,191 |
-0,046 |
-6,081 |
8812,017 |
6 |
37,554 |
236,99 |
0,906 |
2,836 |
0,199 |
-0,061 |
-0,012 |
-1,603 |
8899,922 |
7 |
37,299 |
246,53 |
0,486 |
61,717 |
0,146 |
0,284 |
0,041 |
5,476 |
9195,322 |
8 |
40,370 |
253,62 |
14,198 |
223,383 |
0,788 |
0,541 |
0,426 |
56,317 |
10238,639 |
9 |
37,909 |
256,43 |
1,708 |
315,276 |
0,273 |
0,643 |
0,176 |
23,207 |
9721,005 |
10 |
38,348 |
261,89 |
3,049 |
538,983 |
0,365 |
0,841 |
0,307 |
40,535 |
10042,958 |
11 |
39,137 |
259,36 |
6,426 |
427,911 |
0,530 |
0,749 |
0,397 |
52,439 |
10150,572 |
12 |
46,298 |
278,87 |
94,012 |
1615,718 |
2,027 |
1,455 |
2,950 |
389,740 |
12911,123 |
Итого |
439,229 |
2864,09 |
274,594 |
9153,353 |
11,241 |
1485,066 |
106317,681 |
В нашей задаче: = = 4,784; = = 27,618.
Тогда линейный коэффициент корреляции по формуле (106): r = 11,241/12 = 0,937.
Аналогичный результат получаем по формуле (107):
r = 1485,066/(12*4,784*27,618) = 0,937
Или по формуле (110):
r = (106317,681/12 – 36,602*238,674) / (4,784*27,618) = 0,937.
Найденное значение свидетельствует о том, что связь между величиной стоимостного внешнеторгового товарооборота и величиной таможенных платежей в федеральный бюджет очень близка к функциональной (сильная по шкале Чэддока).
Проверка коэффициента корреляции на значимость (существенность). Интерпретируя значение коэффициента корреляции, следует иметь в виду, что он рассчитан для ограниченного числа наблюдений и подвержен случайным колебаниям, как и сами значения x и y, на основе которых он рассчитан. Другими словами, как любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми показателями. Для того, чтобы оценить существенность (значимость) самого r и, соответственно, реальность измеряемой связи между х и у, необходимо рассчитать среднюю квадратическую ошибку коэффициента корреляции σr. Оценка существенности (значимости) r основана на сопоставлении значения r с его средней квадратической ошибкой: .
Существуют некоторые особенности расчета σr в зависимости от числа наблюдений (объема выборки) – n.
. (114)
Обычно, если >3, то r считается значимым (существенным), а связь – реальной. Задавшись определенной вероятностью, можно определить доверительные пределы (границы) r = ( ), где t – коэффициент доверия, рассчитываемый по интегралу Лапласа (см. Приложение 11).
, (115)
а значимость r проверяется на основе t-критерия Стьюдента, для чего определяется расчетное значение критерия по формуле (116) и сопоставляется c tТАБЛ.
. (116)
Табличное значение tТАБЛ находится по таблице распределения t-критерия Стьюдента (см. Приложение 9) при уровне значимости α=1-β и числе степеней свободы ν=n–2. Если tРАСЧ> tТАБЛ , то r считается значимым, а связь между х и у – реальной. В противном случае (tРАСЧ< tТАБЛ) считается, что связь между х и у отсутствует, и значение r, отличное от нуля, получено случайно.
В нашей задаче число наблюдений небольшое, значит, оценивать существенность (значимость) линейного коэффициента корреляции будем по формулам (115) и (116):
= 0,349/3,162 = 0,110; = 0,937/0,110 = 8,482.
Из приложения 9 видно, что при числе степеней свободы ν = 12 – 2 = 10 (в 10-й строке) и вероятности β = 95% (уровень значимости α =1 – β = 0,05) tтабл=2,2281, а при вероятности 99% (α=0,01) tтабл=3,169, значит, tРАСЧ > tТАБЛ, что дает возможность считать линейный коэффициент корреляции r = 0,937 значимым.
4. Применение методов регрессионного анализа
5. Подбор уравнения регрессии8 представляет собой математическое описание изменения взаимно коррелируемых величин по эмпирическим (фактическим) данным. Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как вероятностную гипотетическую функциональную связь величины результативного признака у со значениями факторного признака х.
Уравнение регрессии
можно также назвать теоретичес
Найти в каждом конкретном случае тип функции, с помощью которой можно наиболее адекватно отразить ту или иную зависимость между признаками х и у, — одна из основных задач регрессионного анализа. Выбор теоретической линии регрессии часто обусловлен формой эмпирической линии регрессии; теоретическая линия как бы сглаживает изломы эмпирической линии регрессии. Кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей.
Для аналитической связи между х и у могут использоваться виды уравнений, приведенные в таблице 28 (при условии замены t на x). Обычно зависимость, выражаемую уравнением прямой, называют линейной (или прямолинейной), а все остальные — криволинейными зависимостями.
Выбрав тип функции (таблица 28), по эмпирическим данным определяют параметры уравнения. При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака были бы максимально близки к эмпирическим данным.
Существует несколько методов нахождения параметров уравнения регрессии. Наиболее часто используется метод наименьших квадратов (МНК). Его суть заключается в следующем требовании: искомые теоретические значения результативного признака должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических значений, т.е.
.
Поставив данное условие, легко определить, при каких значениях a0, a1 и т.д. для каждой аналитической кривой эта сумма квадратов отклонений будет минимальной. Данный метод уже использовался нами в теме 6 «Статистическое изучение динамики ВЭД», поэтому, воспользуемся формулой (94) для нахождения параметров теоретической линии регрессии, заменив параметр t на x:
(117)
Выразив из первого уравнения системы (117) a0, получим9:
. (118)
Подставив (118) во второе уравнение системы (117), затем, разделив обе его части на n, получим:
.
Применяя 3 раза формулу средней арифметической, получим: .
Раскрыв скобки и перенеся члены без a1 в правую часть уравнения, выразим a1:
. (119)
Параметр a1 в уравнении линейной регрессии называется коэффициентом регрессии, который показывает на сколько изменяется значение результативного признака y при изменении факторного признака x на единицу.
Исходные данные и расчеты для нашего примера представим в таблице 36.
Таблица 36. Вспомогательные расчеты для нахождения уравнения регрессии
№ п/п |
x |
y |
x2 |
xy |
|||
1 |
27,068 |
172,17 |
732,677 |
4660,298 |
187,124 |
223,612 |
2657,453 |
2 |
29,889 |
200,90 |
893,352 |
6004,700 |
202,377 |
2,181 |
1317,497 |
3 |
34,444 |
231,83 |
1186,389 |
7985,153 |
227,006 |
23,274 |
136,153 |
4 |
33,158 |
232,10 |
1099,453 |
7695,972 |
220,052 |
145,147 |
346,774 |
5 |
37,755 |
233,40 |
1425,440 |
8812,017 |
244,908 |
132,441 |
38,864 |
6 |
37,554 |
236,99 |
1410,303 |
8899,922 |
243,821 |
46,669 |
26,495 |
7 |
37,299 |
246,53 |
1391,215 |
9195,322 |
242,443 |
16,706 |
14,202 |
8 |
40,370 |
253,62 |
1629,737 |
10238,639 |
259,048 |
29,459 |
415,076 |
9 |
37,909 |
256,43 |
1437,092 |
9721,005 |
245,741 |
114,256 |
49,940 |
10 |
38,348 |
261,89 |
1470,569 |
10042,958 |
248,115 |
189,761 |
89,122 |
11 |
39,137 |
259,36 |
1531,705 |
10150,572 |
252,381 |
48,710 |
187,871 |
12 |
46,298 |
278,87 |
2143,505 |
12911,123 |
291,100 |
149,580 |
2748,498 |
Итого |
439,229 |
2864,09 |
16351,437 |
106317,681 |
2864,115 |
1121,795 |
8027,945 |
Информация о работе Лекции по "Общей и таможенной статистике"