Анализ статистического наблюдения

Автор работы: Пользователь скрыл имя, 22 Декабря 2011 в 15:40, курсовая работа

Описание работы

В курсовой работе исследуется показатель «Численность пенсионеров по субъектам РФ, всего тыс. чел. в 2008г.». В ходе работы выполнены простая сводка и две группировки, так же выполнены вариационный анализ, корреляционно анализ, моделирование рядов распределения, проведена отбор 59 и 19 регионов по принципам выборочного наблюдения.

Файлы: 1 файл

моя курсовая.docx

— 181.13 Кб (Скачать файл)

Подставив значения, получаем: 
 
 

Занесем все  полученные показатели в Таблицу 5. 
 
 
 
 

    Таблица 5 – Сводная таблица по показателям вариации.

Группа Показатель Обозначение Единицы измерения Значение
Показатели  структуры  Мода   чел. 166505,0
Медиана   чел. 258446,0
 
 
Показатели  силы
Размах   чел. 1559988,0
Среднее линейное отклонение  
 
 
чел.
 
194408,0
Среднее квадратическое отклонение  
 
 
 чел.
 
271598,0
Дисперсия     73765615705,0
 
 
Показатели  интенсивности
Относительный размах  
 
 
%
 
480,0
Относительное линейное отклонение  
 
 
%
 
60,0
Коэффициент вариации  
 
 
%
 
80,0
 
Показатели  характера
Коэффициент ассиметрии  
 
 
 
1,8
Эксцесс   4,0
 

     Мода, равная 166505 человек, означает, что в совокупности у большинства регионов  численность пенсионеров сосредоточена вблизи 166505 человек.

     Вычисленное значение медианы практически совпадают с примерными значениями, полученными при анализе гистограммы распределения и графика огивы и кумуляты. Медиана, равная 258446 человек, означает, что в совокупности половина регионов имеет численность пенсионеров меньше 258446 человек, а вторая половина – больше данного значения.

     В рассматриваемой совокупности получается следующее соотношение: Mо<Mе< Xср. 

     Размах  вариации, равный 1559988 человек, показывает, насколько отличаются друг от друга  крайние значения. Значение среднего линейного отклонения, равное 194408 человек, показывает, что в среднем в совокупности численность пенсионеров каждого региона отклоняется от средней численности пенсионеров, равной 324112 человек,  на 194408 человек, что составляет 60,0% от среднего признака  по совокупности. Среднее квадратическое отклонение составляет 271598 человек, это означает, что в среднем в совокупности численность пенсионеров каждого региона отклоняется от средней численности пенсионеров, равной 324112 человек,  на  271598 человек, что составляет 80,0% от среднего признака  по совокупности.  

     Соотношение СКО и СЛО равно 1,4 больше 1,25, что позволяет сделать вывод об не подтверждении гипотезы о нормальном распределении показателя.

     Относительный размах вариации равен 400%, это говорит о том, что относительный разброс значений достаточно высок.

     Коэффициент асимметрии составляет 1,8. Так как коэффициент ассиметрии положителен и , то имеет место не значительная правосторонняя ассиметрия. Таким образом основная численность пенсионеров находится в области больших значений.

     Показатель  эксцесса составляет 4,0.  Так как , значит общая численность пенсионеров распределена не равномерно по всему диапазону.  
 
 
 
 
 
 
 
 

  1. МОДЕЛИРОВАНИЕ РЯДОВ РАСПРЕДЕЛЕНИЯ

   Одна  из важнейших задач анализа вариационных рядов заключается в выявлении  закономерности распределения. Гипотезы о распределениях заключаются в  том, что выдвигается предположение  о подчинении распределения совокупности какому-то определенному закону.

   Проверим  гипотезу о нормальном законе распределения. Для этого воспользуемся критерием  согласия Пирсона (хи-квадрат). Идея Пирсона  заключается в расчете и последующей  оценке размера отклонений фактических  значений частоты появления признака по интервалам от их теоретических  значений, т.е. значений, которые бы имели место в случае нормального  распределения. Чем больше размер этих отклонений, тем меньше оснований  считать распределение близким  к нормальному.

   Приступим к проверки гипотезы:

     Для проверки гипотезы о нормальном распределении показателя найдем теоретические частоты.

     Нормальное  отклонение и теоретические частоты  находим по формулам:

                                         (16)

                                   (17)

   Среднее значение и СКО возьмем из вариационного  анализа из вариационного анализа. Среднее значение рано 324112 человек, а СКО равно 271598 человек.

     Таблица 6 – Расчет теоретических частот  ряда распределения

интервал xi' f t f(t) fmj расч fmj окр
4600-204600 104600 34 -0,81 0,28740 17,354161 17
204600-404600 304600 26 -0,07 0,39800 24,032554 24
404600-604600 504600 12 0,66 0,32090 19,377002 20
604600-804600 704600 5 1,40 0,14970 9,039380 9
804600-1004600 904600 2 2,14 0,04130 2,493830 3
1004600-1204600 1104600 2 2,87 0,00650 0,392491 0
1204600-1404600 1304600 0 3,61 0,00060 0,036230 0
1404600-1604600 1504600 1 4,35 0,00016 0,009661 0
Итого: x 82 x x x 73

      Так как у нас есть интервалы с частотой меньше 5, нам необходимо объединить некоторые интервалы. После несложных преобразований получаем новые частоты и рассчитаем фактическое значение критерия Пирсона χ2 по формуле:

                                                    (18) 

Таблица 9 – Теоретический ряд распределения после объединения.

интервал Частота, fэмп Частота, fmj окр χ2
4600-204600 34 17 17,0
204600-404600 26 24 0,2
404600-604600 12 20 3,2
604600-1604600 10 12 0,3
Итого: 82 73 20,7
 

     Для сравнения фактического значения критерия Пирсона с табличным значением рассчитаем число степеней свободы по следующей формуле:

                                                       (19)

     Таким образом, df=4-3=1, при уровне значимости 0,05 и при df = 1, табличное значение χ2 равно 3,841.  Расчётное значение χ2= 20,7, что значительно выше табличного. Следовательно, гипотезу о близости эмпирического распределения к нормальному отвергается с вероятностью 95%.

     Для наглядности анализа данных,  представим  распределения теоретических  и фактических частот графически.

   

    Рисунок 5 – Распределение частот. 

     Из  графика наглядно видно, что данное эмпирическое распределение не соответствует нормальному закону распределения. 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

   4. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ 

     Изучение  объективно существующих связей между  социально-экономическими явлениями  и процессами является важной задачей  статистики.

     Предположим, что число умерших зависит от численности пенсионеров (ПРИЛОЖЕНИЕ Б) . Построим график корреляционного поля. 

     Рисунок 6 – Зависимость числа умерших от числа пенсионеров. 

   Оценку  тесноты связи проведем с помощью  таких показателей, как эмпирическое корреляционное отношение(ЭКО) и коэффициент Спирмена.

   Для расчета ЭКО необходимо построить  корреляционную решетку. Группировку по факторному признаку производим используя расчеты из вариационного анализа. Всего получилось 8 интервалов с длиной 307000 человек. Теперь разделим совокупность на группы по результативному признаку. Размах его вариации равен 123651 человек. Количество интервалов так же равно 8. Получаем интервал для каждой группе 15500 человек. Т.о. получаем следующую корреляционную решетку:

   Таблица 10 – Корреляционная решетка показателя «численность пенсионеров в 2008 году(X)» и «число умерших в 2008 году»(Y).

Численность пенсионеров, человек Число умерших, человек Итого:
500-16000 16000-31500 31500-47000 47000-62500 62500-78000 78000-93500 93500-109000 109000-124500
4600 - 311600 34 17 51
311600 - 618600 10 11 21
618600 - 925600 5 5
925600 - 1232600 4 4
1232600-1539600
1539600-1846600 1 1
1846600-2153600
2153600-2460600 1 1
Итого: 34 27 11 5 4 2 83

Информация о работе Анализ статистического наблюдения