Анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году

Автор работы: Пользователь скрыл имя, 04 Мая 2013 в 18:57, курсовая работа

Описание работы

Цель работы – провести полный анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году. Задачи работы:
провести вариационный анализ статистической совокупности;
провести бесповторную выборку, а также описать процесс ее проведения;
провести корреляционно-регрессионный анализ;
проверить гипотезу о нормальном характере распределения
провести анализ рядов динамики.

Файлы: 1 файл

kursovaya_text.docx

— 355.93 Кб (Скачать файл)

     ВВЕДЕНИЕ

 

Актуальность  темы: возрастающий интерес к статистике вызван современным этапом развития экономики в стране, формирования рыночных отношений. Это требует глубоких экономических знаний в области сбора, обработки и анализа экономической информации.

Статистика в узком  смысле представляет собой количественную совокупность, связанную с обработкой данных индивидуальных наблюдений, свойственных предметам, явлениям, составляющим отдельные  параметры единицы совокупности.

Статистическая грамотность является неотъемлемой составной частью профессиональной подготовки каждого экономиста, финансиста, социолога, политолога, а также любого специалиста, имеющего дело с анализом массовых явлений (социально-общественных, экономических, технических, научных и других). Работа этих групп специалистов неизбежно связана со сбором, разработкой и анализом данных статистического (массового) характера. Нередко им самим приходится проводить статистический анализ различных типов и направленностей либо знакомиться с результатами статанализа, выполненного другими. В настоящее время от работника, занятого в любой области науки, техники, производства, бизнеса и прочее, связанной с изучением массовых явлений, требуется, чтобы он был, по крайней мере, статистически грамотным человеком. В конечном счете, невозможно успешно специализироваться по многим дисциплинам без усвоения какого-либо статистического курса. Поэтому большое значение имеет знакомство с общими категориями, принципами и методологией статистического анализа, которое мы и осуществили с практической точки зрения в данном курсовом проекте.

Цель работы – провести полный анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году. Задачи работы:

    • провести вариационный анализ статистической совокупности;
    • провести бесповторную выборку, а также описать процесс ее проведения;
    • провести корреляционно-регрессионный анализ;
    • проверить гипотезу о нормальном характере распределения
    • провести анализ рядов динамики.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Сводка и группировка статистического наблюдения

В данной задаче необходимо на основании  имеющихся данных определить среднее  значение показателя совокупности «Численность экономически активного населения по субъектам РФ в 2010 году, чел.», построить две простые группировки, в том числе одну - с выделением групп регионов со значением показателя ниже и выше среднего по РФ.

Для изучения и анализа  данных необходимо выполнить сводку, которая позволит наглядно представить, сравнить и структурировать данные.

Итак, в таблице 1 (см. приложение 1) представлены сводка данных по показателю «Численность экономически активного населения по субъектам РФ в 2010 году, чел.»

Для дальнейшей группировки  необходимо рассчитать среднее значение по всей группе. Для этого воспользуемся  следующей формулой:

     (1)


 

где - это число численность экономически активного населения по субъектам РФ в 2010 году, тыс. чел.;

n- количество субъектов по РФ.

Подставив в формулу, получим среднее  значение показателя:

. (2)

Это значит, что в среднем  численность экономически активного  населения по субъектам РФ в 2010 году составляет 924 тыс. чел.

Далее необходимо составить две  простые группировки. Для первой из них распределим единицы по группам в соответствии со значением  показателя выше и ниже среднего по РФ. Полученные результаты представим в таблице 1.2:

Таблица 1.2 - Группировка значений субъектов РФ по изучаемому показателю со значением выше и ниже среднего по РФ

Доля 

Кол-во субъектов, шт.

В % к итогу

Среднее значение по группе

Меньше среднего значения

57

69

481

Больше среднего значения

26

31

1 896

Итого:

83

100

 

 

Результаты данной таблицы представим графически, построив круговую диаграмму:

Рисунок 1.1 - Доля регионов РФ со значением выше/ниже среднего по изучаемому показателю по РФ, %

 

 

По данным диаграммы можно  сделать вывод о том, что регионы  со значением выше среднего преобладают (68,67%).

 

 

Для второй простой группировки  распределим единицы по группам  в соответствии со значением показателя выше и ниже значения в Челябинской  области и получим:

Таблица 1.3 - Группировка субъектов РФ по изучаемому показателю со значением выше и ниже среднего по Челябинской области

Доля

Кол-во субъектов, шт.

В % к итогу

Среднее значение по группе

Меньше значения по Челябинской  области

73

89

674

Больше значения по Челябинской области

9

11

2 846

Итого:

82

100

 

 

Изобразим графически результаты, представленные в таблице:

Рисунок 1.2 - Доля регионов РФ со значением выше/ниже среднего по изучаемому показателю по Челябинской области, %

Анализируя полученные данные, можно сделать вывод о том, что в подавляющем большинстве регионов по РФ (89,02%) численность экономически активного населения меньше значения по Челябинской области.

Задание 2

В данном задании необходимо провести вариационный анализ статистической совокупности по показателю «Численность экономически активного населения в 2010 году, тыс. чел.»,  для чего нужно:

    • построить вариационный ряд и изобразить его графически;
    • построить кумуляту и огиву ;
      • рассчитать показатели структуры, силы и интенсивности       вариации;
    • сделать выводы относительно исследуемой совокупности.

Сначала построим вариационный ряд. Так  как количество значений признака достаточно велико, то строим интервальный вариационный ряд. Для этого определим количество (k) и длину (l) интервалов по формуле Стержесса:


,   

где n – количество единиц в ряду.

В нашем случае n=81 в силу того, что мы исключили из дальнейшего анализа Москву и Московскую область, т.к. они являются аномальными  единицами (это связано с тем, что данные регионы более экономически развиты). Поэтому целесообразнее их исключить.

Подставив в формулу, получим:

,   

количество интервалов в  вариационном ряду 7.

Для удобства восприятия данных длину интервала возьмем равную  350.

Исходя из полученных данных, составим вариационный ряд - Таблица 2.1:

Таблица 2.1 – Распределение  численности экономически активного населения по субъектам РФ.

Численность населения

Кол-во регионов

23-373

18

373-723

31

723-1 073

8

1 073-1 423

11

1 423-1 773

4

1 773-2 123

5

2 123-2 473

2

2 473-2 823

2

Итого:

81


 

Изобразим полученный вариационный ряд графически. Так как в нашем случае ряд является интервальным, то графическим его отображением является гистограмма.

 

 

 

 

 

 

 

 

 

 

 

Рисунок 2.1 - Гистограмма распределения численности экономически активного населения по субъектам РФ

Для работы с данными также  необходимо построить огиву и  кумуляту. Для построения этих двух линий необходимо рассчитать накопленные частоты отдельно для каждой («Таблица 2.2»):

Таблица 2.2 - Расчет накопленных частот для огивы и кумуляты

Численность экономически активного населения

Накопленная частота (для кумуляты)

Накопленная частота (для огивы)

23

-

81

373

18

63

723

49

32

1 073

57

24

1 423

68

13

1 773

72

9

2 123

77

4

2 473

79

2

2 823

81

-


 

 

Построим огиву и кумуляту:

Рисунок 2.2 - Кумулята и огива распределения экономически активного населения по субъектам РФ

После построения вариационного  ряда необходимо перейти ко второму этапу вариационного анализа – расчету показателей вариации.

Рассмотрим структуру  вариации, для этого рассчитаем моду и медиану.

Для интервального ряда мода определяется по формуле

     


Подставив соответствующие  значения, получим:

Это означает, что большинство субъектов РФ имеют численность экономически активного населения, близкую к 499 тыс. чел.

 

Определим медиану по следующей  формуле:

     


Подставив соответствующие  числовые значения, получим:

Медиана означает, что в половине субъектов РФ численность экономически активного населения равна 627 тыс. чел. или меньше, а в половине – 627 тыс. чел. или больше.

Далее рассчитаем показатели силы и интенсивности вариации.

Размах вариации

Данный показатель рассчитывается по формуле:

     


Подставив числовые значения, получим:

Среднее линейное отклонение рассчитаем по формуле:

     


Из формулы видно, что  для расчета данного показателя нам необходимо рассчитать среднее  значение признака (без учета г. Москва и Московской области), воспользовавшись формулой 1. Получим:

Все промежуточные расчеты, необходимые для определения  среднего линейного отклонения, представим в таблице «Таблица 2.3» (см. приложение 2).

Подставив в формулу соответствующие  показатели, получим:

d= 498,95

Следующий показатель силы вариации – дисперсия – это  средняя величина квадратов отклонений.

Для интервального ряда этот показатель рассчитывается по следующей  формуле:

     


Промежуточные расчеты, используемые при расчете дисперсии, представим в Таблице 2.4 (см. приложение 3)

Подставив в формулу рассчитанные данные, получим:

=384 533,1437

Следующий показатель найдем с помощью извлечения квадратного  корня из дисперсии – среднее  квадратическое отклонение.

Среднее квадратическое отклонение – это обобщающая характеристика размера вариации признака в совокупности.

Для интервального ряда этот показатель рассчитывается по следующей  формуле

     


Подставив числа, получим:

620,107 3647

Для более полного анализа  изучаемой совокупности необходимо рассчитать показатели интенсивности  вариации.

 

Первым из них является относительный размах вариации. Он рассчитывается по формуле:

     


3,195 или 319,5%

Следующим показателем является относительное линейное отклонение, которое рассчитывается по формуле

     


Для наших данных относительное  линейное отклонение будет следующим:

0,605 или 60,5%

Последним показателем интенсивности  вариации является коэффициент вариации:

     


0,751 или 75,1%

Данные показатели служат для сравнительной оценки вариации в разных совокупностях и характеризуют  однородность изучаемой совокупности.

При анализе данных важно  представить как именно распределены единицы совокупности по всему диапазону  значений признака, для этого рассчитаем показатели характера вариации.

 

Первым из них является коэффициент асимметрии, который  рассчитывается по формуле:

  ,   


где – центральный момент третьего порядка:

     


Все промежуточные расчеты, необходимые для определения  центрального момента третьего порядка  и асимметрии, представим в таблице “Таблица 2.5” (см. приложение 4).

Информация о работе Анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году