Использование агрегатных индексов в статистическом анализе уровня и качества жизни населения региона

Автор работы: Пользователь скрыл имя, 15 Января 2014 в 22:22, контрольная работа

Описание работы

Признак – валовой доход в среднем на одного члена домохозяйства в год.
Число групп – пять.
1.Построение интервального ряда распределения домохозяйств по объему валового дохода

Для построения интервального вариационного ряда, характеризующего распределение домохозяйств по объему валового дохода, необходимо вычислить величину и границы интервалов ряда.

Скачать архив (242.53 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

kontrolnaya_statistika_1__vosstanovlen.doc

— 957.00 Кб (Скачать файл)

Расчет межгрупповой дисперсии по формуле (11):

Расчет эмпирического коэффициента детерминации по формуле (9):

^{или 81,91%}

Вывод. 81,91% вариации суммы расходов домохозяйств обусловлено вариацией объема валового дохода, а 18,09% – влиянием прочих неучтенных факторов.

Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле

(14)

Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):

Таблица 14

Шкала Чэддока

0,1 – 0,3

0,3 – 0,5

0,5 – 0,7

0,7 – 0,9

0,9 – 0,99

Характеристика

силы связи

Слабая

Умеренная

Заметная

Тесная

Весьма тесная

Расчет эмпирического корреляционного отношения по формуле (14):

Вывод. Согласно шкале Чэддока связь между объемом валового дохода и суммой расходов домохозяйств является тесной.

3. Оценка статистической значимости коэффициента детерминации

Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.

Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле

где n – число единиц выборочной совокупности,

m – количество групп,

– межгрупповая дисперсия,

– дисперсия j-ой группы (j=1,2,…,m),

– средняя арифметическая групповых дисперсий.

Величина рассчитывается, исходя из правила сложения дисперсий:

где – общая дисперсия.

Для проверки значимости показателя рассчитанное значение F-критерия F_расч сравнивается с табличным F_табл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m : k₁=m-1, k₂=n-m. Величина F_табл для значений , k_1, k₂ определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k_1, k₂. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).

Если F_расч>F_табл, коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.

Если F_расч<F_табл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.

Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k₁=3,4,5; k₂=24-35 представлен ниже:

	k₂
k₁	24	25	26	27	28	29	30	31	32	33	34	35
3	3,01	2,99	2,98	2,96	2,95	2,93	2,92	2,91	2,90	2,89	2,88	2,87
4	2,78	2,76	2,74	2,73	2,71	2,70	2,69	2,68	2,67	2,66	2,65	2,64
5	2,62	2,60	2,59	2,57	2,56	2,55	2,53	2,52	2,51	2,50	2,49	2,48

Расчет дисперсионного F-критерия Фишера для оценки =81,91%, полученной при =25,53, =20,91376:

F_рас_ч

Табличное значение F-критерия при = 0,05:

n	m	k₁=m-1	k₂=n-m	F_табл(,4_, 25)
30	5	4	25	2,76

Вывод: поскольку F_расч>F_табл, то величина коэффициента детерминации =81,91% признается значимой (неслучайной) с уровнем надежности 95% и, следовательно, найденные характеристики связи между признаками Объем валового дохода и Расходы на продукты питания правомерны не только для выборки, но и для всей генеральной совокупности банков.

Задание 3

По результатам выполнения задания 1 с вероятностью 0,954 определите:

1) ошибку выборки среднего валового дохода на одного члена домохозяйства в год и границы, в которых он будет находиться для домохозяйств генеральной совокупности;

2) ошибку выборки доли домохозяйств с уровнем валового дохода менее 52 тыс. руб. и границы, в которых будет находиться генеральная доля.

1. Определение ошибки выборки для среднего объема валового дохода домохозяйств и границ, в которых будет находиться генеральная средняя

Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки (ошибкой репрезентативности).

Значения признаков единиц, отобранных из генеральной совокупности в выборочную, всегда случайны, поэтому и статистические характеристики выборки случайны, следовательно, и ошибки выборки также случайны. Ввиду этого принято вычислять два вида ошибок - среднюю и предельную .

Средняя ошибка выборки - это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т.е. от своего математического ожидания M[].

Величина средней ошибки выборки рассчитывается дифференцированно (по различным формулам) в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.

Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка выборочной средней определяется по формуле

, (15)

где – общая дисперсия выборочных значений признаков,

N – число единиц в генеральной совокупности,

n – число единиц в выборочной совокупности.

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:

, (16)

где – выборочная средняя,

– генеральная средняя.

Границы задают доверительный интервал генеральной средней, т.е. случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней. Эту вероятность Р называют доверительной вероятностью или уровнем надёжности.

В экономических исследованиях чаще всего используются доверительные вероятности Р= 0.954, Р= 0.997, реже Р= 0,683.

В математической статистике доказано, что предельная ошибка выборки кратна средней ошибке µ с коэффициентом кратности t (называемым также коэффициентом доверия), который зависит от значения доверительной вероятности Р. Для предельной ошибки выборочной средней это теоретическое положение выражается формулой

(17)

Значения t вычислены заранее для различных доверительных вероятностей Р и протабулированы (таблицы функции Лапласа Ф). Для наиболее часто используемых уровней надежности Р значения t задаются следующим образом (табл. 15):

Таблица 15

Доверительная вероятность P	0,683	0,866	0,954	0,988	0,997	0,999
Значение t	1,0	1,5	2,0	2,5	3,0	3,5

По условию примера выборочная совокупность насчитывает 30 домохозяйств, выборка 5% механическая, следовательно, генеральная совокупность включает 600 банков. Выборочная средняя , дисперсия определены в Задании 1 (п. 3). Значения параметров, необходимых для решения задачи, представлены в табл. 16:

Таблица 16

0,954

600

229,2

185,8

Расчет средней ошибки выборки по формуле (15):

Расчет предельной ошибки выборки по формуле (17):

Определение по формуле (16) доверительного интервала для генеральной средней:

229,2-4,82

229,2+4,82,

224,38 млн руб.

234,02 млн руб.

Вывод. На основании проведенного выборочного обследования домохозяйств с вероятностью 0,954 можно утверждать, что для генеральной совокупности домохозяйств средний объем валового дохода находится в пределах от 224,38 млн руб. до 234,02 млн руб.

2. Определение ошибки выборки для доли домохозяйств с объемом валового дохода 234,02 млн руб. и выше, а также границ, в которых будет находиться генеральная доля

Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой

, (18)

где m – число единиц совокупности, обладающих заданным свойством;

n – общее число единиц в совокупности.

Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле

, (19)

где w – доля единиц совокупности, обладающих заданным свойством;

(1-w) – доля единиц совокупности, не обладающих заданным свойством,

N – число единиц в генеральной совокупности,

n– число единиц в выборочной совокупности.

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих заданным свойством:

Информация о работе Использование агрегатных индексов в статистическом анализе уровня и качества жизни населения региона