Статистический анализ рядов распределения

Автор работы: Пользователь скрыл имя, 24 Ноября 2013 в 03:48, курсовая работа

Описание работы

Основной целью написания курсовой работы является изучение методики статистического анализа рядов распределения. Для достижения поставленной цели были поставлены и выполнены следующие основные задачи:
1. Освещены понятие и виды статистических рядов распределения, и основные формы их представления.
2. Рассчитаны и проанализированы показатели, характеризующие центральную тенденцию, вариацию, структуру и форму ряда распределения.
3. Изучены формы и закономерности распределения.

Содержание работы

Введение 1
Глава 1. Понятие статистических рядов распределения и их виды 1
Глава 2. Методология расчета различных видов средних 5
2.1 Особенности расчета и использования степенных средних 5
2.2 Понятие и сфера использования структурных средних 11
2.3 Использование показателей вариации в анализе рядов распределения 17
2.4 Виды дисперсий и правило их сложения 22
2.5 Понятие о закономерностях распределения
Изучение формы распределения 26
2.6 Динамика распределения населения по величине среднедушевых денежных доходов по Российской Федерации за 2006 г. и 2011 г. 31
Заключение 34
Список использованной литературы 36

Файлы: 1 файл

Курсовая.docx

— 161.59 Кб (Скачать файл)

Используя приведенные  ранее условные обозначения, можно  представить формулу данной средней  в следующем виде:

Средняя арифметическая взвешенная. При расчете средних  величин отдельные значения осредняемого признака могут повторяться, встречаться  по нескольку раз. В подобных случаях  расчет средней производится по сгруппированным данным или вариационным рядам, которые могут быть дискретными или интервальными.

Определим среднюю  по данным таблицы 3:

Таблица 3 - Распределение численности работников по видам экономической деятельности по Российской Федерации за апрель 2011 г.

Группы  работников по видам экономической  деятельности.

   

Численность работников, человек

Средняя заработная плата, тыс. рублей

Сельское  хозяйство, охота  и лесное хозяйство

1213066

12,1

Рыболовство, рыбоводство

36375

44,4

Добыча  полезных ископаемых

794138

41,5

Обрабатывающие  производства

5047356

23,0

Всего

7090935

-


Определим по данному  дискретному вариационному ряду среднюю заработную плату:

 

 

Расчет средней  заработной платы произведен по формуле  средней арифметической взвешенной:

При расчете  средней по интервальному вариационному  ряду для выполнения необходимых  вычислений от интервалов переходят  к их серединам. Рассмотрим следующий  пример (табл. 4):

Используя среднюю  арифметическую взвешенную, определим  средний денежный доход одного человека:

 

 

Таблица 4 - Распределение населения по величине среднедушевых денежных доходов по Российской Федерации за 2011г.

Группы населения  по величине денежных доходов, руб. в  месяц

Население, тыс. чел. (f)

Середины интервалов (x)

Общая величина денежных доходов, руб. (x∙f)

до 3500

4000

2750

11000000

3500–5000

6429

4250

27323250

5000–7000

11572

6000

69432000

7000–10000

19144

8500

162724000

10000–15000

28287

12500

353587500

15000–25000

35431

20000

708620000

25000–35000

17287

30000

518610000

свыше 35000

20715

40000

828600000

Все население

142865

-

2679896750


 

Средняя арифметическая обладает некоторыми математическими  свойствами, которые более полно раскрывают ее сущность и в ряде случаев используемые при ее расчетах.

  1. Произведение средней на сумму частот равно сумме произведений отдельных вариантов на соответствующие им частоты:

.

Действительно, если мы обратимся к приведенному выше примеру расчета среднедушевого дохода населения (табл. 4), то получим  следующее равенство:

 

  1. Сумма отклонений индивидуальных значений признака от средней арифметической равна нулю:

.

Для нашего примера:

 

  1. Сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем  сумма квадратов их отклонений от любой другой произвольной величины C.

На  использовании этого свойства базируется расчет центральных моментов, представляющих собой характеристики вариационного ряда при .

.

  1. Если все осредняемые варианты уменьшить или увеличить на постоянное число А, то средняя арифметическая соответственно уменьшится или увеличится  на ту же величину:

.

Так, если все  денежные доходы населения увеличить  на 100 руб., то средний денежный доход  населения также увеличится на 100 руб.:

 

  1. Если все варианты значений признака уменьшить или увеличить  в А раз, то средняя также соответственно увеличится или уменьшится в А раз:

.

Предположим, что  все денежные доходы населения возросли в 1,5 раза. Тогда и средний денежный доход населения также увеличится на 50%:

 

  1. Если все веса уменьшить  или увеличить в А раз, то средняя  арифметическая от этого не изменится:

.

Так, в нашем  примере удобнее было бы рассчитывать среднюю, предварительно поделив все веса на 100:

 

  1. средняя гармоническая взвешенная. Данный вид средней используется, когда известен числитель исходного соотношения средней, но не известен его знаменатель.

Формулой данной средней является:

 

где

Средняя гармоническая  невзвешенная, используемая значительно  реже, имеет следующий вид:

 

Средняя гармоническая невзвешенная может использоваться вместо взвешенной в тех случаях, когда значения для единиц совокупности равны.

  1. средняя геометрическая имеет вид:

 

 

Наиболее широкое  применение этот вид средней получил  в анализе динамики для определения  среднего темпа роста.

  1. средняя квадратическая. В основе вычислений ряда сводных расчетных показателей лежит средняя квадратическая:

 

 

Наиболее широко этот вид средней используется при  расчете показателей вариации.

Известно, что  степенные средние разных видов, исчисленные по одной и той  же совокупности, имеют различные  количественные значения. И чем больше показатель степени k, тем больше и  величина соответствующей средней:

 

Это свойство степенных  средних возрастать с повышением показателя степени определяющей функции  называется мажорантностью средних.

2.2 Понятие и сфера использования структурных средних

Наряду с рассмотренными средними величинами в качестве статистических характеристик вариационных рядов  распределения рассчитываются так  называемые структурные средние – мода и медиана, а также квартили, децили и перцентили. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. Мода и медиана часто используются как средние характеристики в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Мода (Мо) – это наиболее часто встречающееся значение признака у единиц данной совокупности, т.e. это варианта, имеющая наибольшую частоту. Она соответствует определенному значению признака. Мода не зависит от крайних значений вариант и может применяется для характеристики центра в рядах распределения с неопределенными границами.

Медианой (Ме) называют такое значение признака, которое  находится на середине ранжированного (упорядоченного) ряда и делит его  на две равные по числу единиц части. Таким образом, в ранжированном ряду распределения одна половина ряда имеет значения признака, превышающие медиану, другая - меньше медианы. Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем любой другой величины:

 

В дискретном вариационном ряду мода определяется визуально и  равна варианте с наибольшей частотой или частостью. А для определения медианного значения признака по следующей формуле находят номер медианной единицы ряда (NМе):

 

где n – объем совокупности.

 

Рассмотрим расчет моды и медианы в дискретном вариационном ряду по данным таблицы 3.

Мо = 23,0 тыс. руб.

Из таблицы  видно, что наибольшую численность (частоту)  работников имеют обрабатывающие производства.

Для определения  медианы, найдем номер медианной единицы ряда:

 

Ме = 44,4 тыс.руб.

В интервальных рядах распределения для нахождения моды сначала по наибольшей частоте определяют модальный интервал, т.е. интервал, содержащий моду, а затем приблизительно рассчитывают ее по формуле:

 

где: хо   – нижняя граница модального интервала (интервал, имеющий      наибольшую частоту);

       i      – величина модального интервала;

         – частота, соответствующая модальному интервалу;

       – частота интервала, предшествующего модальному;

       – частота интервала, следующего за модальным.

А для определения  медианы в интервальном ряду сначала  находят медианный интервал, (т.е. содержащий медиану), для чего используют накопленные частоты или частости. Медианным является интервал, накопленная  частота которого равна или превышает  половину всего объема совокупности. Затем значение медианы рассчитывается по формуле:

 

где  нижняя граница медианного интервала (это первый интервал, накопленная частота которого превышает половину общей суммы частот);

         i       – величина медианного интервала;

        накопленная частота интервала, предшествующего    медианному;

         – частота медианного интервала.

Проиллюстрируем применение формул моды и медианы, используя данные таблицы 5:

Интервал с  границами 15000 - 25000 руб. в данном распределении будет модальным, так как он имеет наибольшую частоту. Используя формулу, определим моду:

 

Для установления медианного  интервала необходимо определить накопленную частоту каждого последующего интервала до тех пор, пока она не превысит половины суммы накопленных частот:

 

Мы установили, что медианным является интервал с границами 15000 - 25000 руб. Определим теперь медиану:

 

Таблица 5 - Распределение населения по величине среднедушевых денежных доходов по Российской Федерации за 2011г.

Группы населения  по величине денежных доходов, руб. в  месяц

Население, тыс. чел.

Накопленная частота, тыс. чел.

до 3500

4000

4000

3500–5000

6429

10429

5000–7000

11572

22001

7000–10000

19144

41145

10000–15000

28287

69432

15000–25000

35431

104863

25000–35000

17287

122150

свыше 35000

20715

142865

Все население

142865

-


 

Таким образом, в качестве обобщенной характеристики значений определенного признака у единиц ранжированной совокупности могут быть использованы средняя арифметическая, мода и медиана. Каждая из них имеет свои особенности.

Соотношение моды, медианы и средней арифметической указывает на характер распределения  признака в совокупности, позволяет  оценить его асимметрию.

В симметричных распределениях все три характеристики совпадают. Чем больше расхождение  между модой и средней арифметической, тем больше асимметричен ряд. Для умеренно асимметричных рядов разность между модой и средней примерно в три раза превышает разность между медианой и средней, т.е.

 

Аналогично с  нахождением медианы в вариационных рядах распределения можно отыскать значение признака у любой по порядку  единицы ранжированного ряда. Так, например, можно найти значение признака у  единиц, делящих ряд на четыре, десять или сто равных частей. Эти величины называются «квартили», «децили» и  «перцентили».

Квартили представляют собой значения признака, делящие  ранжированную совокупность на четыре равновеликие части. Различают квартиль нижний (Q1), отделяющий ¼ часть совокупности с наименьшими значениями признака, и квартиль верхний (Q3), отсекающий ¼ часть с наибольшими значениями признака. Это означает, что 25% единиц совокупности будут меньше по величине Q1; 25% единиц будут заключены между Q1 и Q2; 25% - между Q2 и Q3 и остальные 25% превосходят Q3. Средним квартилем Q2 является медиана.

Для расчета  квартилей по интервальному вариационному  ряду используются формулы:

 

 

где нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25%);

 нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75%);

i       – величина интервала;

накопленная частота интервала, предшествующего интервалу, содержащему  нижний квартиль;

 то же для верхнего квартиля;

    – частота интервала, содержащего нижний квартиль;

 то же для верхнего квартиля.

Рассмотрим расчет нижнего и верхнего квартилей по данным табл. 5. Нижний квартиль находится в интервале от 7000 до 10000, накопленная частота которого равна 41145 тыс. чел. Верхний квартиль лежит в интервале от 25000 до 35000 с накопленной частотой 122150. С учетом этого получим:

 

 

Таким образом, 25% населения имеют денежный доход  меньше, чем 9149,3 руб.; еще 25% имеют доход  от 9149,3 руб. до 71432,5 руб.; ¼ населения Российской Федерации имеет доход от 71432,5 руб. до 26322,3 руб.; и наконец, оставшиеся 25% имеют денежный доход, превышающий 26322,3 руб.

Информация о работе Статистический анализ рядов распределения