Статистический анализ рядов распределения. Проверка гипотезы о законе распределения

Автор работы: Пользователь скрыл имя, 30 Января 2015 в 11:50, курсовая работа

Описание работы

Ряд распределения – это распределение единиц совокупности по значению того или иного признака в конкретных условиях места и времени.
Ряды распределения могут быть:
• атрибутивным, если они строятся на основе атрибутивного признака.
• вариационным, если они строятся на основе количественного признака;

Содержание работы

ВВЕДЕНИЕ 4
1. Табличное и графическое представление вариационного ряда 6
2. Характеристика центральной тенденции распределения 12
3. Оценка вариации изучаемого признак 14
4. Характеристика структуры распределения 17
6. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения. 20
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 25

Файлы: 1 файл

статистика курсач.doc

— 443.00 Кб (Скачать файл)

Государственное образовательное учреждение

высшего профессионального образования

«Санкт-Петербургский государственный политехнический университет»

 

 

Факультет экономики и менеджмента

 

Кафедра «Предпринимательство и коммерция»

 

 

 

КУРСОВОЙ ПРОЕКТ

 

по дисциплине «Статистика»

на тему «Статистический анализ рядов распределения.  
Проверка гипотезы о законе распределения»

 

 

 

Выполнил студент группы з4077/26 

 

___________________

 (подпись)

_ Николаев А.В, _

(Фамилия.И.О.)

Принял _ к.э.н., доцент__

(должность, ученая  степень)

__________________

 (подпись)

_ Пономарева О.А._

(Фамилия.И.О.)

__________________

(Дата)

 

 

Санкт-Петербург

2011

 

Николаев А.В. Статистический анализ рядов распределения. Проверка гипотезы о законе распределения: Курсовой проект по дисциплине «Статистика». – СПб.: СПбГПУ, 2011, стр. ___, табл. ___, рис. ___.

 

РЯД РАСПРЕДЕЛЕНИЯ, МЕДИАНА, МОДА, РАЗМАХ ВАРИАЦИИ, ДИСПЕРСИЯ, КВАРТИЛЬ, КОЭФФИЦИЕНТ АСИММЕТРИИ, КОЭФФИЦИЕНТ ЭКСЦЕССА, СРЕДНЕЕ КВАДРАТИЧНОЕ ОТКЛОНЕНИЕ.

 

 

СОДЕРЖАНИЕ

 

 

 

Введение

Ряд распределения – это распределение единиц совокупности по значению того или иного признака в конкретных условиях места и времени.

Ряды распределения могут быть:

  • атрибутивным, если они строятся на основе атрибутивного признака.
  • вариационным, если они строятся на основе количественного признака;

Изучение вариационных рядов распределения позволяет:

  • определить типический уровень признака в изучаемой совокупности;
  • определить наличие выбросов и решить вопрос о необходимости их самостоятельного изучения;
  • оценить степень разброса значений признака вокруг типического уровня;
  • изучить структуру совокупности;
  • охарактеризовать форму распределения;
  • подобрать теоретическое распределение, на основе которого можно моделировать поведение распределения изучаемой совокупности.

Комплексный анализ рядов распределения включает в себя:

  1. Построение ряда распределения и его графическое представление.
  2. Расчет показателей центра и структуры распределения.
  3. Расчет и анализ показателей вариации.
  4. Характеристика формы распределения.
  5. Выравнивание эмпирического распределения и оценка соответствия теоретическому распределению.

Исходными данными для анализа служит информация о банковских вкладах (депозиты) физических лиц на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году. Объем исходной совокупности – 80 единиц.

 

1. Табличное и графическое  представление вариационного ряда

 

Анализ распределений направлен на выявление закономерности изменения частот в зависимости от значений варьирующего признака и анализ различных характеристик изучаемого распределения. Прежде, чем приступить к вычислению специальных статистических показателей, необходимо из исходной совокупности исключить единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы – это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака у основной части единиц совокупности.

Для локализации и устранения выбросов необходимо, прежде всего, ранжировать исходные данные.

Таблица 1

Исходные данные, ранжированные по возрастанию значений признака

№ региона

Сумма на банковских счетах

№ региона

Сумма на банковских счетах

№ региона

Сумма на банковских счетах

№ региона

Сумма на банковских счетах

№ региона

Сумма на банковских счетах

№ региона

Сумма на банковских счетах

1

5110

16

5297

31

188

46

3824

61

1519

76

1522

2

2998

17

5186

32

1306

47

3001

62

245

77

1369

3

4720

18

97468*

33

219

48

11578

63

1030

78

2656

4

9356

19

1921

34

481

49

4325

64

6536

79

356

5

3157

20

5186

35

1427

50

14180

65

9583

80

795

6

3277

21

4439

36

-

51

5481

66

7840

 

7

2027

22

4187

37

18348*

52

4147

67

8823

8

3085

23

2702

38

9141

53

15415

68

6295

9

3724

24

39

2413

54

7910

69

5081

10

28328*

25

5305

40

7772

55

4345

70

2804

11

2382

26

1608

41

10808

56

1840

71

2212

12

3795

27

1659

42

9102

57

12838

72

4826

13

2969

28

26098*

43

1308

58

15726

73

5525

14

3372

29

1069

44

1562

59

9141

74

5058

15

3593

30

956

45

11855

60

329

75

2054


 

 

Затем, в ППП Statistica строится график Box plot на основании ранжированной совокупности. Единицы совокупности, обозначенные на графике звёздочками (*), являются выбросами, которые необходимо исключить из изучаемой совокупности.

Вариационным называется ряд распределения, построенный по количественному признаку. Он может быть представлен в виде таблицы и графически. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.

Таблицы вариационных рядов строятся по принципам группировки. Определим число групп по формуле Стерджеса:

 

         (1.1)

где k – число групп; N – объем совокупности.

Конечный вариант таблицы должен отвечать следующим требованиям: в таблице не должно быть малонаполненных и нулевых групп; нужно стремиться к получению мономодального распределения (т.е. по обе стороны от максимальной частоты должно наблюдаться закономерное убывание частот). Если не удается избавиться от многовершинности в распределении, это означает, что изучаемая статистическая совокупность неоднородна и требует более детального изучения.

Таблицы вариационного ряда, построенные с использованием разного числа интервалов.

 

Рис. 1.1. Банковские вклады (депозиты) физических лиц на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году.

(k = 15.)

 

 

 

 

Рис. 1.2. Банковские вклады (депозиты) физических лиц на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году (k = 6)

 

 

При k = 15 получено много малонаполненных групп, что является нежелательным для анализа ряда распределения. Выбирая окончательный вариант табличного представления вариационного ряда в работе, следует остановиться на группировке с использованием 6 групп. Тогда величина группировочного интервала составит 2589,67.

Необходимо подвести предварительные итоги: в 26 регионах России, что составляет 35,1% от общего числа регионов, банковские вклады физических лиц на рублевых счетах в Сберегательном банке Российской Федерации в 2003гогу составили от 2777,67 руб. до 5367,34 руб. В 54 регионах России (72,9% от всех регионов) банковские вклады в среднем на одного жителя в 2003 году составили менее 5367,34 рубля.

На основе таблиц построим графики, наглядно представляющие закономерность распределения анализируемой статистической совокупности.

 

Рис. 1.3. Полигон распределения регионов России по сумме банковских вкладов на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году.

Рис. 1.4. Гистограмма распределение регионов России по сумме банковских вкладов физических лиц на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году

Рис. 1.5. Кумулята распределение регионов России по сумме банковских вкладов на рублевых счетах в Сберегательном банке Российской Федерации в 2003 году.

.

 

2. Характеристика центральной  тенденции распределения

 

Среднее значение признаков совокупности, мода и медиана характеризуют центральную тенденцию распределения, указывают тот уровень признака, который является типичным, характерным для данной совокупности. Использование того или иного показателя распределения зависит от типа исходных данных и цели исследования. Поскольку средняя величина рассчитывается на единицу совокупности, но с использованием всех индивидуальных значений признака, она является обобщённой характеристикой всей совокупности.

Средняя арифметическая простая:

 

,  (2.1)

где – значение признака у i-ой единицы совокупности; n – объём совокупности.

Мода:

 

,

(2.2)

где - нижняя граница модального интервала; - величина группировочного интервала; – частота модального интервала; / – частота интервала, предшествующего / следующего за модальным.

Медиана:

,  (2.3)

где – нижняя граница медианного интервала; – величина группировочного интервала; – сумма частот ( ); – накопленная частота интервала, предшествующего медианному; – частота медианного интервала.

 

Таблица 2

Показатели центра распределения

Показатель центра распределения

Значение

Среднее значение

4606,365

Мода

Multiple

Медиана

3658,500


 

В среднем в регионах России в 2003 году на банковских вкладах физических лиц находилось 4606,365 рублей.

 

3. Оценка вариации изучаемого  признака

 

Вариация – различия у индивидуального значения признака изучаемой совокупности. Расчёт показателей центра сопровождается расчётом показателей вариации. Показатели вариации бывают:

  • абсолютные (размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение);
  • относительные (коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации).

Размах вариации:

,    (3.1)

где и – максимальное и минимальное значение признака совокупности.

Дисперсия:

,   (3.2)

где – значение признака у i-ой единицы совокупности; – средняя арифметическая; – частота у i-ой единицы совокупности; – сумма частот ( ).

Среднее квадратическое (стандартное) отклонение:

.    (3.3)

 

Коэффициент вариации:

.   (3.4)

Таблица 3

Показатели вариации

Показатели вариации

Значение

Размах вариации

15538,00

Дисперсия

14163878

Среднее квадратическое отклонение

3763,493

Коэффициент вариации

87,7%


 

Размах вариации, разность между максимальным и минимальным значениями совокупности, составляет 15538,00 единиц. Дисперсия содержательно не интерпретируется, однако является важнейшим показателем вариации, на основе которого рассчитывается ряд статистических показателей, в том числе и коэффициент вариации, в данном случае равный 87,7%. Коэффициент вариации оценивает степень количественной однородности изучаемой совокупности. В данном случае совокупность можно признать неоднородной, т.к. коэффициент вариации больше 33%.

В 2003 году в регионах России сумма банковских вкладов, приходящаяся в среднем на одного жителя отличалось от среднего по стране на 3763,49 рубдей

 

4. Характеристика структуры распределения

 

К показателям структуры, кроме медианы, также относят квартили, которые делят совокупность на четыре части, децили (10 частей) и прочие перцентили. Использование тех или иных характеристик зависит от цели исследования и от объёма изучаемой совокупности (с увеличением объёма растёт число групп). В данной работе необходимо подсчитать только медиану и квартили.

Нижний квартиль:

. (4.1)

 

Верхний квартиль:

. (4.2)

 

Таблица 4

Показатели структуры распределения

Показатели структуры распределения

Значение

Нижний квартиль

1659,000

Медиана

3658,500

Верхний квартиль

5525,000

Информация о работе Статистический анализ рядов распределения. Проверка гипотезы о законе распределения