Автор работы: Пользователь скрыл имя, 15 Января 2014 в 22:22, контрольная работа
Признак – валовой доход в среднем на одного члена домохозяйства в год.
Число групп – пять.
1.Построение интервального ряда распределения домохозяйств по объему валового дохода
Для построения интервального вариационного ряда, характеризующего распределение домохозяйств по объему валового дохода, необходимо вычислить величину и границы интервалов ряда.
Расчет межгрупповой дисперсии по формуле (11):
Расчет эмпирического коэффициента детерминации по формуле (9):
Вывод. 81,91% вариации суммы расходов домохозяйств обусловлено вариацией объема валового дохода, а 18,09% – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14
Шкала Чэддока
h |
0,1 – 0,3 |
0,3 – 0,5 |
0,5 – 0,7 |
0,7 – 0,9 |
0,9 – 0,99 |
Характеристика силы связи |
Слабая |
Умеренная |
Заметная |
Тесная |
Весьма тесная |
Расчет эмпирического корреляционного отношения по формуле (14):
Вывод. Согласно шкале Чэддока связь между объемом валового дохода и суммой расходов домохозяйств является тесной.
3. Оценка статистической
Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
где n – число единиц выборочной совокупности,
m – количество групп,
– межгрупповая дисперсия,
– дисперсия j-ой группы (j=1,2,…,m),
– средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
где – общая дисперсия.
Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m : k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).
Если Fрасч>Fтабл , коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если Fрасч<Fтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:
k2 | ||||||||||||
k1 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
3 |
3,01 |
2,99 |
2,98 |
2,96 |
2,95 |
2,93 |
2,92 |
2,91 |
2,90 |
2,89 |
2,88 |
2,87 |
4 |
2,78 |
2,76 |
2,74 |
2,73 |
2,71 |
2,70 |
2,69 |
2,68 |
2,67 |
2,66 |
2,65 |
2,64 |
5 |
2,62 |
2,60 |
2,59 |
2,57 |
2,56 |
2,55 |
2,53 |
2,52 |
2,51 |
2,50 |
2,49 |
2,48 |
Расчет дисперсионного F-критерия Фишера для оценки =81,91%, полученной при =25,53, =20,91376:
Fрасч
Табличное значение F-критерия при = 0,05:
n |
m |
k1=m-1 |
k2=n-m |
Fтабл ( ,4, 25) |
30 |
5 |
4 |
25 |
2,76 |
Вывод: поскольку Fрасч>Fтабл, то величина коэффициента детерминации =81,91% признается значимой (неслучайной) с уровнем надежности 95% и, следовательно, найденные характеристики связи между признаками Объем валового дохода и Расходы на продукты питания правомерны не только для выборки, но и для всей генеральной совокупности банков.
Задание 3
По результатам выполнения задания 1 с вероятностью 0,954 определите:
1) ошибку выборки среднего валового дохода на одного члена домохозяйства в год и границы, в которых он будет находиться для домохозяйств генеральной совокупности;
2) ошибку выборки доли домохозяйств с уровнем валового дохода менее 52 тыс. руб. и границы, в которых будет находиться генеральная доля.
1. Определение ошибки выборки для среднего объема валового дохода домохозяйств и границ, в которых будет находиться генеральная средняя
Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений показателей выборочной совокупности. Достоверность этих оценок зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности. Как правило, генеральные и выборочные характеристики не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки (ошибкой репрезентативности).
Значения признаков единиц, отобранных из генеральной совокупности в выборочную, всегда случайны, поэтому и статистические характеристики выборки случайны, следовательно, и ошибки выборки также случайны. Ввиду этого принято вычислять два вида ошибок - среднюю и предельную .
Средняя ошибка выборки - это среднее квадратическое отклонение всех возможных значений выборочной средней от генеральной средней, т.е. от своего математического ожидания M[ ].
Величина средней ошибки выборки рассчитывается дифференцированно (по различным формулам) в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.
Для собственно-случайной и
где – общая дисперсия выборочных значений признаков,
N – число единиц в генеральной совокупности,
n – число единиц в выборочной совокупности.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:
где – выборочная средняя,
– генеральная средняя.
Границы задают доверительный интервал генеральной средней, т.е. случайную область значений, которая с вероятностью Р гарантированно содержит значение генеральной средней. Эту вероятность Р называют доверительной вероятностью или уровнем надёжности.
В экономических исследованиях чаще всего используются доверительные вероятности Р= 0.954, Р= 0.997, реже Р= 0,683.
В математической статистике доказано, что предельная ошибка выборки кратна средней ошибке µ с коэффициентом кратности t (называемым также коэффициентом доверия), который зависит от значения доверительной вероятности Р. Для предельной ошибки выборочной средней это теоретическое положение выражается формулой
Значения t вычислены заранее для различных доверительных вероятностей Р и протабулированы (таблицы функции Лапласа Ф). Для наиболее часто используемых уровней надежности Р значения t задаются следующим образом (табл. 15):
Таблица 15
Доверительная вероятность P |
0,683 |
0,866 |
0,954 |
0,988 |
0,997 |
0,999 |
Значение t |
1,0 |
1,5 |
2,0 |
2,5 |
3,0 |
3,5 |
По условию примера выборочная совокупность насчитывает 30 домохозяйств, выборка 5% механическая, следовательно, генеральная совокупность включает 600 банков. Выборочная средняя , дисперсия определены в Задании 1 (п. 3). Значения параметров, необходимых для решения задачи, представлены в табл. 16:
Таблица 16
Р |
t |
n |
N |
||
0,954 |
2 |
30 |
600 |
229,2 |
185,8 |
Расчет средней ошибки выборки по формуле (15):
Расчет предельной ошибки выборки по формуле (17):
Определение по формуле (16) доверительного
интервала для генеральной
229,2-4,82
224,38 млн руб.
Вывод. На основании проведенного выборочного обследования домохозяйств с вероятностью 0,954 можно утверждать, что для генеральной совокупности домохозяйств средний объем валового дохода находится в пределах от 224,38 млн руб. до 234,02 млн руб.
2. Определение
ошибки выборки для доли
Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой
,
где m – число единиц совокупности, обладающих заданным свойством;
n – общее число единиц в совокупности.
Для собственно-случайной и
,
где w – доля единиц совокупности, обладающих заданным свойством;
(1-w) – доля единиц совокупности, не обладающих заданным свойством,
N – число единиц в генеральной совокупности,
n– число единиц в выборочной совокупности.
Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих заданным свойством: