Лекция по "Статистике"

Автор работы: Пользователь скрыл имя, 13 Июня 2013 в 23:34, лекция

Описание работы

Исходным понятием статистики является понятие статистической совокупности, под которой понимают массовое явление, изучаемое в данный момент статистикой (например: население страны). Каждая статистическая совокупность состоит из отдельных элементов, которые называют единицами статистической совокупности (для населения – человек, семья, население какого-нибудь региона, национальность и т. д.). Каждая единица совокупности обладает определенными свойствами. Признаком в статистике называют свойство или качество единицы совокупности, которое может быть определено или измерено (для человека – пол, рост, возраст, вес и т. д.). Признаки подразделяются на количественные и качественные (атрибутивные).

Файлы: 1 файл

Lektsii.doc

— 854.50 Кб (Скачать файл)

В этом примере наибольшей частоте 8 соответствует значение признака – 1 ребенок, это и есть значение Мо и, следовательно, наиболее часто  встречаются в данном примере  семьи, имеющие одного ребенка.

В интервальном вариационном ряду с равными интервалами по наибольшей частоте (частости) находят интервал, содержащий Мо (модальный интервал) и далее Мо вычисляют по формуле:  , где: - нижняя граница интервала, содержащая Мо; iMo – величина модального интервала; fMo – частота модального интервала; - частота интервала, предшествующего модальному; - частота интервала, следующего за модальным. Пример:

Возраст депутата (полных лет) (X)

Численность депутатов (кол-во человек) (ƒ)

20-29

1

30-39

16

40-49

28

50-59

30

60-69

7

Итог:

82




В этом примере наибольшая частота  равна 30, следовательно, Мо содержится в интервале от 50 до 59 лет. Таким образом вычислили, что наиболее часто встречаются депутаты в возрасте 50,7 лет.

В интервальном вариационном ряду Мо можно также вычислить графически по гистограмме:

В интервальном вариационном ряду с  неравными интервалами для определения  Мо необходимо:

  1. рассчитать частости W
  2. вычислить плотность распределения путем деления частости на величину соответствующего интервала: Z=W/i.
  3. по наибольшей плотности распределения найти модальный интервал
  4. Мо вычислить по формуле:

В интервальном вариационном ряду с  неравными интервалами Мо можно вычислить графически по гистограмме. Для этого по оси ординат вместо частот откладываются соответствующие плотности распределения.

 

Лекция № 5

Медиана – это значение признака при котором исходная совокупность делится на 2 равные части, при этом  первая половина совокупности имеет значение признака меньше, чем медиана, а вторая имеет значения признака больше, чем медиана.

Квартиль  делит исходную совокупность на 4 равные части. На практике вычисляют первый (нижний) квартиль, который делит исходную совокупность в соотношении ¼ : ¾ и третий (верхний) квартиль, который делит исходную совокупность в соотношении ¾ : ¼ .

Дециль делит исходную совокупность на 10 равных частей. Например: второй D делит исходную совокупность в соотношении 2/10 : 8/10; девятый D делит исходную совокупность в соотношении 9/10 : 1/10.

В дискретном вариационном ряду для  определения Ме, квартилей и децилей  необходимо:

1) Вычислить  накопленные частоты.

2) Определить порядковый номер  единицы, которая делит исходную  совокупность в нужном нам соотношении. Например: для Ме: ; для первого Q: ; для девятого D: .

3) По накопленным частотам найти  значение признака, которое имеет  нужная нам единица совокупности. Пример (про семьи):

 

Число детей

Количество семей

S

 Х

ƒ

 

0

3

3

1

8

11

2

4

15

3

3

18

4

2

20

Итого

20

 



По накопленным частотам определяем, что 10-ой единице совокупности (10-ой семье) соответствует значение признака равное 1, значит Ме равна 1 ребенку. Половина семей имеют 1 ребенка и вообще не имеют детей, а вторая половина имеют 1 ребенка и больше.

; Таким образом мы вычислили, что ¾ семей (75%) имеют 2-ух детей и меньше, а 25% семей имеют более 2-ух детей; 90% семей имеют 3-ех детей и меньше, а 10% более 3-ех детей.

В интервальном вариационном ряду для  определения медианы, квартилей  и децилей необходимо:

1) Вычислить накопленные частоты.

2) Найти порядковый номер единицы, которая делит исходную совокупность в нужном нам соотношении.

3) По накопленным частотам найти  интервал, содержащий нужную нам  единицу совокупности.

4) Медиану, квартили и децили  вычисляют по формулам: , где - нижняя граница медианного интервала (интервала, содержащего единицу, которая делит всю совокупность на 2 равные части); - величина медианного интервала; - накопленная частота интервала, предшествующего медианному; - частота медианного интервала. Пример:

Возраст депутата (полных лет) (X)

Численность депутатов (кол-во человек) (ƒ)

S

20-29

1

1

30-39

16

17

40-49

28

45

50-59

30

75

60-69

7

82

Итог:

82

 



 

 По накопленным частотам определяем, что 41-ая единица совокупности содержится в интервале 40-49 лет. Этот интервал является медианным.

Половина депутатов фракции  «Единство» моложе 47,7 лет, 2-ая половина старше 47,7 лет.

В интервальном вариационном ряду медиану можно вычислить графически по кумуляте:

Квартиль вычисляют по формуле: ;

Дециль вычисляют по формуле:  
.

В интервальном вариационном ряду квартиль и дециль можно вычислить графически по кумуляте:

 

 
Показатели вариации.

Изменение величины признака от одной  единицы совокупности к другой в  статистике называют вариацией признака. Кроме средних величин для  анализа исходной совокупности вычисляют абсолютные и относительные показатели вариации. К абсолютным показателям относятся:

1) Размах вариации (R) определяется, как разность между максимальным и минимальным значением признака в исходной совокупности R=Xmax-Xmin.

2) Среднее квартильное отклонение. Определяется как половина разности 3-его и 1-ого квартиля: .

3) Среднее линейное отклонение (d). Определяется, как средняя арифметическая величина из абсолютных отклонений индивидуальных значений признака от их средней величины. Применяют 2 формулы для не сгруппированных данных и сгруппированных.

Для не сгруппированных: ; для сгруппированных: .

4) Дисперсия ( ). Определяется, как средняя арифметическая величина из квадратов отклонений индивидуальных значений признака от из средней величины.

Для не сгруппированных: ; для сгруппированных: .

5) Среднее квадратическое отклонение  представляет собой квадратный  корень из дисперсии.

Для не сгруппированных: ; для сгруппированных: .

Среднее квадратическое отклонение показывает на сколько в среднем отличаются индивидуальные значения признака (варианты) в исходной совокупности от средней величины. Показатель среднего квадратического отклонения применяется при оценке возможного риска в финансово-экономических расчетах.

Лекция №6.

К относительным показателям вариации относятся:

1. Коэффициент квартильной вариации, который вычисляется по формуле:

2. Коэффициент осцилляции: .

3. Коэффициент вариации:

исходная совокупность считается  однородной по изучаемому признаку, если коэффициент вариации меньше 33%. В  этом случае средняя величина объективно представляет свою исходную совокупность. Пример вычисления показателей вариации:

Возраст депутата (полных лет) (X)

Численность депутатов (кол-во человек) (ƒ)

Середины интервалов (X)

20-29

1

24,5

23,2

23,2

538,24

30-39

16

34,5

13,2

211,2

2787,84

40-49

28

44,5

3,2

89,6

286,72

50-59

30

54,5

6,8

204

1387,2

60-69

7

64,5

16,8

117,6

1975,68

Итог:

82

   

645,6

6975,68




 

; R=69-20=49 (лет); =7,9(лет); =6975,68/82=85,07; ;

В среднем возраст каждого депутата отличается от среднего возраста для  депутатов данной фракции на 9,2 лет. Данная совокупность депутатов считается однородной по возрасту, т. к. коэффициент вариации меньше 33%.

Математические свойства дисперсии.

  1. Дисперсия, рассчитанная по отношению к средней величине, является минимальной.
  2. Дисперсия постоянной величины равна 0.
  3. Если все значения признака (варианты) увеличить (уменьшить) на какое-то постоянное число А, то дисперсия новой совокупности не изменится.
  4. Если все значения признака (варианты) увеличить (умножить) в К раз, где К – постоянное число, то дисперсия новой совокупности увеличится (уменьшится) в К2 раз.
  5. Если вычислена дисперсия по отношению к числу В, отличному от средней величины, то дисперсию исходной совокупности можно рассчитать по формуле: .
  6. Дисперсию исходной совокупности можно рассчитать как разность между средней квадратов признака и квадратом средней величины.

 

Расчет дисперсии способом моментов.

 

Возраст депутата (полных лет) (X)

Численность депутатов (кол-во человек) (ƒ)

Середины интервалов (X)

X-24,5

20-29

1

24,5

0

0

0

0

30-39

16

34,5

10

1

1

16

40-49

28

44,5

20

2

4

112

50-59

30

54,5

30

3

9

270

60-69

7

64,5

40

4

16

112

Итог:

82

       

510




 

В этом случае дисперсия рассчитывается по формуле  , где i – величина равного интервала или любое постоянное число, отличное от 0; m1- момент первого порядка, m2 – момент второго порядка, который рассчитывается по формуле: .

А=24,5; i=10; ; =102(6,22-2,3172)=85,15

 

 

Расчет дисперсии методом  средних.

Этот способ расчета основан  на использовании последнего свойства дисперсии.

 

 

Возраст депутата (полных лет) (X)

Численность депутатов (кол-во человек) (ƒ)

Середины интервалов (X)

X2

X2

20-29

1

24,5

600,25

600,25

30-39

16

34,5

1190,25

19044

40-49

28

44,5

1980,25

55447

50-59

30

54,5

2970,25

89107,5

60-69

7

64,5

4160,25

29121,75

Итог:

82

   

193320,5




 

 

 

 

 

 

;

Правила сложения дисперсии.

Если исходная совокупность разделена на группы по какому-то существенному признаку, то вычисляют следующие виды дисперсий:

  1. Общую дисперсию исходной совокупности по формуле: , где - общая средняя величина исходной совокупности; f – частоты исходной совокупности. Общая дисперсия характеризует отклонение индивидуальных значений признака от общей средней величины исходной совокупности.
  2. Внутригрупповые дисперсии по формуле: , где j - номер группы; - средняя величина в каждой j-ой группе; - частоты j-ой группы. Внутригрупповые дисперсии характеризуют отклонение индивидуального значения признака в каждой группе от групповой средней величины. Из всех внутригрупповых дисперсий вычисляют среднюю по формуле: , где - численность единиц в каждой j-ой группе.
  3. Межгрупповую дисперсию по формуле: . Межгрупповая дисперсия характеризует отклонение групповых средних величин от общей средней величины исходной совокупности. Правило сложения дисперсий заключается в том. что общая дисперсия исходной совокупности должна быть равна сумме межгрупповой и средней из внутригрупповых дисперсий: . Результат отношения межгрупповой к общей дисперсии исходной совокупности называется эмпирическим коэффициентом детерминации. Он показывает долю вариации изучаемого признака, обусловленную вариацией группировочного признака.

Информация о работе Лекция по "Статистике"