Автор работы: Пользователь скрыл имя, 04 Мая 2013 в 18:57, курсовая работа
Цель работы – провести полный анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году. Задачи работы:
провести вариационный анализ статистической совокупности;
провести бесповторную выборку, а также описать процесс ее проведения;
провести корреляционно-регрессионный анализ;
проверить гипотезу о нормальном характере распределения
провести анализ рядов динамики.
ВВЕДЕНИЕ
Актуальность темы: возрастающий интерес к статистике вызван современным этапом развития экономики в стране, формирования рыночных отношений. Это требует глубоких экономических знаний в области сбора, обработки и анализа экономической информации.
Статистика в узком
смысле представляет собой количественную
совокупность, связанную с обработкой
данных индивидуальных наблюдений, свойственных
предметам, явлениям, составляющим отдельные
параметры единицы
Статистическая грамотность
Цель работы – провести полный анализ статистической совокупности по численности экономически активного населения по субъктам РФ в 2010 году. Задачи работы:
В данной задаче необходимо на основании имеющихся данных определить среднее значение показателя совокупности «Численность экономически активного населения по субъектам РФ в 2010 году, чел.», построить две простые группировки, в том числе одну - с выделением групп регионов со значением показателя ниже и выше среднего по РФ.
Для изучения и анализа данных необходимо выполнить сводку, которая позволит наглядно представить, сравнить и структурировать данные.
Итак, в таблице 1 (см. приложение 1) представлены сводка данных по показателю «Численность экономически активного населения по субъектам РФ в 2010 году, чел.»
Для дальнейшей группировки необходимо рассчитать среднее значение по всей группе. Для этого воспользуемся следующей формулой:
(1)
где - это число численность экономически активного населения по субъектам РФ в 2010 году, тыс. чел.;
n- количество субъектов по РФ.
Подставив в формулу, получим среднее значение показателя:
. (2)
Это значит, что в среднем численность экономически активного населения по субъектам РФ в 2010 году составляет 924 тыс. чел.
Далее необходимо составить две простые группировки. Для первой из них распределим единицы по группам в соответствии со значением показателя выше и ниже среднего по РФ. Полученные результаты представим в таблице 1.2:
Таблица 1.2 - Группировка значений субъектов РФ по изучаемому показателю со значением выше и ниже среднего по РФ
Доля |
Кол-во субъектов, шт. |
В % к итогу |
Среднее значение по группе |
Меньше среднего значения |
57 |
69 |
481 |
Больше среднего значения |
26 |
31 |
1 896 |
Итого: |
83 |
100 |
Результаты данной таблицы представим графически, построив круговую диаграмму:
Рисунок 1.1 - Доля регионов РФ со значением выше/ниже среднего по изучаемому показателю по РФ, %
По данным диаграммы можно сделать вывод о том, что регионы со значением выше среднего преобладают (68,67%).
Для второй простой группировки распределим единицы по группам в соответствии со значением показателя выше и ниже значения в Челябинской области и получим:
Таблица 1.3 - Группировка субъектов РФ по изучаемому показателю со значением выше и ниже среднего по Челябинской области
Доля |
Кол-во субъектов, шт. |
В % к итогу |
Среднее значение по группе |
Меньше значения по Челябинской области |
73 |
89 |
674 |
Больше значения по Челябинской области |
9 |
11 |
2 846 |
Итого: |
82 |
100 |
Изобразим графически результаты, представленные в таблице:
Рисунок 1.2 - Доля регионов РФ со значением выше/ниже среднего по изучаемому показателю по Челябинской области, %
Анализируя полученные данные, можно сделать вывод о том, что в подавляющем большинстве регионов по РФ (89,02%) численность экономически активного населения меньше значения по Челябинской области.
Задание 2
В данном задании необходимо провести вариационный анализ статистической совокупности по показателю «Численность экономически активного населения в 2010 году, тыс. чел.», для чего нужно:
Сначала построим вариационный ряд. Так как количество значений признака достаточно велико, то строим интервальный вариационный ряд. Для этого определим количество (k) и длину (l) интервалов по формуле Стержесса:
,
где n – количество единиц в ряду.
В нашем случае n=81 в силу того, что мы исключили из дальнейшего анализа Москву и Московскую область, т.к. они являются аномальными единицами (это связано с тем, что данные регионы более экономически развиты). Поэтому целесообразнее их исключить.
Подставив в формулу, получим:
,
количество интервалов в вариационном ряду 7.
Для удобства восприятия данных
длину интервала возьмем
Исходя из полученных данных, составим вариационный ряд - Таблица 2.1:
Таблица 2.1 – Распределение численности экономически активного населения по субъектам РФ.
Численность населения |
Кол-во регионов |
23-373 |
18 |
373-723 |
31 |
723-1 073 |
8 |
1 073-1 423 |
11 |
1 423-1 773 |
4 |
1 773-2 123 |
5 |
2 123-2 473 |
2 |
2 473-2 823 |
2 |
Итого: |
81 |
Изобразим полученный вариационный ряд графически. Так как в нашем случае ряд является интервальным, то графическим его отображением является гистограмма.
Рисунок 2.1 - Гистограмма распределения численности экономически активного населения по субъектам РФ
Для работы с данными также необходимо построить огиву и кумуляту. Для построения этих двух линий необходимо рассчитать накопленные частоты отдельно для каждой («Таблица 2.2»):
Таблица 2.2 - Расчет накопленных частот для огивы и кумуляты
Численность экономически активного населения |
Накопленная частота (для кумуляты) |
Накопленная частота (для огивы) |
23 |
- |
81 |
373 |
18 |
63 |
723 |
49 |
32 |
1 073 |
57 |
24 |
1 423 |
68 |
13 |
1 773 |
72 |
9 |
2 123 |
77 |
4 |
2 473 |
79 |
2 |
2 823 |
81 |
- |
Построим огиву и кумуляту:
Рисунок 2.2 - Кумулята и огива распределения экономически активного населения по субъектам РФ
После построения вариационного ряда необходимо перейти ко второму этапу вариационного анализа – расчету показателей вариации.
Рассмотрим структуру вариации, для этого рассчитаем моду и медиану.
Для интервального ряда мода определяется по формуле
Подставив соответствующие значения, получим:
Это означает, что большинство субъектов РФ имеют численность экономически активного населения, близкую к 499 тыс. чел.
Определим медиану по следующей формуле:
Подставив соответствующие числовые значения, получим:
Медиана означает, что в половине субъектов РФ численность экономически активного населения равна 627 тыс. чел. или меньше, а в половине – 627 тыс. чел. или больше.
Далее рассчитаем показатели силы и интенсивности вариации.
Размах вариации
Данный показатель рассчитывается по формуле:
Подставив числовые значения, получим:
Среднее линейное отклонение рассчитаем по формуле:
Из формулы видно, что для расчета данного показателя нам необходимо рассчитать среднее значение признака (без учета г. Москва и Московской области), воспользовавшись формулой 1. Получим:
Все промежуточные расчеты, необходимые для определения среднего линейного отклонения, представим в таблице «Таблица 2.3» (см. приложение 2).
Подставив в формулу соответствующие показатели, получим:
d= 498,95
Следующий показатель силы вариации – дисперсия – это средняя величина квадратов отклонений.
Для интервального ряда этот показатель рассчитывается по следующей формуле:
Промежуточные расчеты, используемые при расчете дисперсии, представим в Таблице 2.4 (см. приложение 3)
Подставив в формулу рассчитанные данные, получим:
Следующий показатель найдем с помощью извлечения квадратного корня из дисперсии – среднее квадратическое отклонение.
Среднее квадратическое отклонение – это обобщающая характеристика размера вариации признака в совокупности.
Для интервального ряда этот показатель рассчитывается по следующей формуле
Подставив числа, получим:
Для более полного анализа изучаемой совокупности необходимо рассчитать показатели интенсивности вариации.
Первым из них является относительный размах вариации. Он рассчитывается по формуле:
Следующим показателем является относительное линейное отклонение, которое рассчитывается по формуле
Для наших данных относительное линейное отклонение будет следующим:
Последним показателем интенсивности вариации является коэффициент вариации:
Данные показатели служат для сравнительной оценки вариации в разных совокупностях и характеризуют однородность изучаемой совокупности.
При анализе данных важно представить как именно распределены единицы совокупности по всему диапазону значений признака, для этого рассчитаем показатели характера вариации.
Первым из них является коэффициент асимметрии, который рассчитывается по формуле:
,
где – центральный момент третьего порядка:
Все промежуточные расчеты, необходимые для определения центрального момента третьего порядка и асимметрии, представим в таблице “Таблица 2.5” (см. приложение 4).