Автор работы: Пользователь скрыл имя, 22 Декабря 2011 в 15:40, курсовая работа
В курсовой работе исследуется показатель «Численность пенсионеров по субъектам РФ, всего тыс. чел. в 2008г.». В ходе работы выполнены простая сводка и две группировки, так же выполнены вариационный анализ, корреляционно анализ, моделирование рядов распределения, проведена отбор 59 и 19 регионов по принципам выборочного наблюдения.
Подставив значения,
получаем:
Занесем все
полученные показатели в Таблицу 5.
Таблица 5 – Сводная таблица по показателям вариации.
Группа | Показатель | Обозначение | Единицы измерения | Значение |
Показатели структуры | Мода | чел. | 166505,0 | |
Медиана | чел. | 258446,0 | ||
Показатели силы |
Размах | чел. | 1559988,0 | |
Среднее линейное отклонение | |
чел. |
194408,0 | |
Среднее квадратическое отклонение | |
чел. |
271598,0 | |
Дисперсия | 73765615705,0 | |||
Показатели интенсивности |
Относительный размах | |
% |
480,0 |
Относительное линейное отклонение | |
% |
60,0 | |
Коэффициент вариации | |
% |
80,0 | |
Показатели характера |
Коэффициент ассиметрии | |
― |
1,8 |
Эксцесс | ― | 4,0 |
Мода, равная 166505 человек, означает, что в совокупности у большинства регионов численность пенсионеров сосредоточена вблизи 166505 человек.
Вычисленное значение медианы практически совпадают с примерными значениями, полученными при анализе гистограммы распределения и графика огивы и кумуляты. Медиана, равная 258446 человек, означает, что в совокупности половина регионов имеет численность пенсионеров меньше 258446 человек, а вторая половина – больше данного значения.
В
рассматриваемой совокупности получается
следующее соотношение: Mо<Mе< Xср.
Размах
вариации, равный 1559988 человек, показывает,
насколько отличаются друг от друга
крайние значения. Значение среднего
линейного отклонения, равное 194408 человек,
показывает, что в среднем в совокупности
численность пенсионеров каждого региона
отклоняется от средней численности пенсионеров,
равной 324112 человек, на 194408 человек,
что составляет 60,0% от среднего признака
по совокупности. Среднее квадратическое
отклонение составляет 271598 человек, это
означает, что в среднем в совокупности
численность пенсионеров каждого региона
отклоняется от средней численности пенсионеров,
равной 324112 человек, на 271598 человек,
что составляет 80,0% от среднего признака
по совокупности.
Соотношение СКО и СЛО равно 1,4 больше 1,25, что позволяет сделать вывод об не подтверждении гипотезы о нормальном распределении показателя.
Относительный размах вариации равен 400%, это говорит о том, что относительный разброс значений достаточно высок.
Коэффициент асимметрии составляет 1,8. Так как коэффициент ассиметрии положителен и , то имеет место не значительная правосторонняя ассиметрия. Таким образом основная численность пенсионеров находится в области больших значений.
Показатель
эксцесса составляет 4,0. Так как , значит
общая численность пенсионеров распределена
не равномерно по всему диапазону.
Одна
из важнейших задач анализа
Проверим
гипотезу о нормальном законе распределения.
Для этого воспользуемся
Приступим к проверки гипотезы:
Для проверки гипотезы о нормальном распределении показателя найдем теоретические частоты.
Нормальное отклонение и теоретические частоты находим по формулам:
Среднее значение и СКО возьмем из вариационного анализа из вариационного анализа. Среднее значение рано 324112 человек, а СКО равно 271598 человек.
Таблица 6 – Расчет теоретических частот ряда распределения
интервал | xi' | f | t | f(t) | fmj расч | fmj окр |
4600-204600 | 104600 | 34 | -0,81 | 0,28740 | 17,354161 | 17 |
204600-404600 | 304600 | 26 | -0,07 | 0,39800 | 24,032554 | 24 |
404600-604600 | 504600 | 12 | 0,66 | 0,32090 | 19,377002 | 20 |
604600-804600 | 704600 | 5 | 1,40 | 0,14970 | 9,039380 | 9 |
804600-1004600 | 904600 | 2 | 2,14 | 0,04130 | 2,493830 | 3 |
1004600-1204600 | 1104600 | 2 | 2,87 | 0,00650 | 0,392491 | 0 |
1204600-1404600 | 1304600 | 0 | 3,61 | 0,00060 | 0,036230 | 0 |
1404600-1604600 | 1504600 | 1 | 4,35 | 0,00016 | 0,009661 | 0 |
Итого: | x | 82 | x | x | x | 73 |
Так как у нас есть интервалы с частотой меньше 5, нам необходимо объединить некоторые интервалы. После несложных преобразований получаем новые частоты и рассчитаем фактическое значение критерия Пирсона χ2 по формуле:
Таблица 9 – Теоретический ряд распределения после объединения.
интервал | Частота, fэмп | Частота, fmj окр | χ2 |
4600-204600 | 34 | 17 | 17,0 |
204600-404600 | 26 | 24 | 0,2 |
404600-604600 | 12 | 20 | 3,2 |
604600-1604600 | 10 | 12 | 0,3 |
Итого: | 82 | 73 | 20,7 |
Для сравнения фактического значения критерия Пирсона с табличным значением рассчитаем число степеней свободы по следующей формуле:
Таким образом, df=4-3=1, при уровне значимости 0,05 и при df = 1, табличное значение χ2 равно 3,841. Расчётное значение χ2= 20,7, что значительно выше табличного. Следовательно, гипотезу о близости эмпирического распределения к нормальному отвергается с вероятностью 95%.
Для наглядности анализа данных, представим распределения теоретических и фактических частот графически.
Рисунок
5 – Распределение частот.
Из
графика наглядно видно, что данное
эмпирическое распределение не соответствует
нормальному закону распределения.
4.
КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
Изучение объективно существующих связей между социально-экономическими явлениями и процессами является важной задачей статистики.
Предположим,
что число умерших зависит от численности
пенсионеров (ПРИЛОЖЕНИЕ Б) . Построим
график корреляционного поля.
Рисунок
6 – Зависимость числа
умерших от числа пенсионеров.
Оценку тесноты связи проведем с помощью таких показателей, как эмпирическое корреляционное отношение(ЭКО) и коэффициент Спирмена.
Для расчета ЭКО необходимо построить корреляционную решетку. Группировку по факторному признаку производим используя расчеты из вариационного анализа. Всего получилось 8 интервалов с длиной 307000 человек. Теперь разделим совокупность на группы по результативному признаку. Размах его вариации равен 123651 человек. Количество интервалов так же равно 8. Получаем интервал для каждой группе 15500 человек. Т.о. получаем следующую корреляционную решетку:
Таблица 10 – Корреляционная решетка показателя «численность пенсионеров в 2008 году(X)» и «число умерших в 2008 году»(Y).
Численность пенсионеров, человек | Число умерших, человек | Итого: | |||||||
500-16000 | 16000-31500 | 31500-47000 | 47000-62500 | 62500-78000 | 78000-93500 | 93500-109000 | 109000-124500 | ||
4600 - 311600 | 34 | 17 | ― | ― | ― | ― | ― | ― | 51 |
311600 - 618600 | ― | 10 | 11 | ― | ― | ― | ― | ― | 21 |
618600 - 925600 | ― | ― | ― | 5 | ― | ― | ― | ― | 5 |
925600 - 1232600 | ― | ― | ― | ― | 4 | ― | ― | ― | 4 |
1232600-1539600 | ― | ― | ― | ― | ― | ― | ― | ― | ― |
1539600-1846600 | ― | ― | ― | ― | ― | ― | ― | 1 | 1 |
1846600-2153600 | ― | ― | ― | ― | ― | ― | ― | ― | ― |
2153600-2460600 | ― | ― | ― | ― | ― | ― | ― | 1 | 1 |
Итого: | 34 | 27 | 11 | 5 | 4 | ― | ― | 2 | 83 |