Автор работы: Пользователь скрыл имя, 13 Июня 2013 в 23:34, лекция
Исходным понятием статистики является понятие статистической совокупности, под которой понимают массовое явление, изучаемое в данный момент статистикой (например: население страны). Каждая статистическая совокупность состоит из отдельных элементов, которые называют единицами статистической совокупности (для населения – человек, семья, население какого-нибудь региона, национальность и т. д.). Каждая единица совокупности обладает определенными свойствами. Признаком в статистике называют свойство или качество единицы совокупности, которое может быть определено или измерено (для человека – пол, рост, возраст, вес и т. д.). Признаки подразделяются на количественные и качественные (атрибутивные).
В этом примере наибольшей частоте 8 соответствует значение признака – 1 ребенок, это и есть значение Мо и, следовательно, наиболее часто встречаются в данном примере семьи, имеющие одного ребенка.
В интервальном вариационном ряду с равными интервалами по наибольшей частоте (частости) находят интервал, содержащий Мо (модальный интервал) и далее Мо вычисляют по формуле: , где: - нижняя граница интервала, содержащая Мо; iMo – величина модального интервала; fMo – частота модального интервала; - частота интервала, предшествующего модальному; - частота интервала, следующего за модальным. Пример:
Возраст депутата (полных лет) (X) |
Численность депутатов (кол-во человек) (ƒ) |
20-29 |
1 |
30-39 |
16 |
40-49 |
28 |
50-59 |
30 |
60-69 |
7 |
Итог: |
82 |
В этом примере наибольшая частота равна 30, следовательно, Мо содержится в интервале от 50 до 59 лет. Таким образом вычислили, что наиболее часто встречаются депутаты в возрасте 50,7 лет.
В интервальном вариационном ряду Мо
можно также вычислить
В интервальном вариационном ряду с
неравными интервалами для
В интервальном вариационном ряду с неравными интервалами Мо можно вычислить графически по гистограмме. Для этого по оси ординат вместо частот откладываются соответствующие плотности распределения.
Лекция № 5
Медиана – это значение признака при котором исходная совокупность делится на 2 равные части, при этом первая половина совокупности имеет значение признака меньше, чем медиана, а вторая имеет значения признака больше, чем медиана.
Квартиль делит исходную совокупность на 4 равные части. На практике вычисляют первый (нижний) квартиль, который делит исходную совокупность в соотношении ¼ : ¾ и третий (верхний) квартиль, который делит исходную совокупность в соотношении ¾ : ¼ .
Дециль делит исходную совокупность на 10 равных частей. Например: второй D делит исходную совокупность в соотношении 2/10 : 8/10; девятый D делит исходную совокупность в соотношении 9/10 : 1/10.
В дискретном вариационном ряду для определения Ме, квартилей и децилей необходимо:
1) Вычислить накопленные
2) Определить порядковый номер
единицы, которая делит
3) По накопленным частотам найти
значение признака, которое имеет
нужная нам единица совокупност
Число детей |
Количество семей |
S |
Х |
ƒ |
|
0 |
3 |
3 |
1 |
8 |
11 |
2 |
4 |
15 |
3 |
3 |
18 |
4 |
2 |
20 |
Итого |
20 |
По накопленным частотам определяем, что 10-ой единице совокупности (10-ой семье) соответствует значение признака равное 1, значит Ме равна 1 ребенку. Половина семей имеют 1 ребенка и вообще не имеют детей, а вторая половина имеют 1 ребенка и больше.
; Таким образом мы вычислили, что ¾ семей (75%) имеют 2-ух детей и меньше, а 25% семей имеют более 2-ух детей; 90% семей имеют 3-ех детей и меньше, а 10% более 3-ех детей.
В интервальном вариационном ряду для определения медианы, квартилей и децилей необходимо:
1) Вычислить накопленные частоты.
2) Найти порядковый номер
3) По накопленным частотам найти интервал, содержащий нужную нам единицу совокупности.
4) Медиану, квартили и децили вычисляют по формулам: , где - нижняя граница медианного интервала (интервала, содержащего единицу, которая делит всю совокупность на 2 равные части); - величина медианного интервала; - накопленная частота интервала, предшествующего медианному; - частота медианного интервала. Пример:
Возраст депутата (полных лет) (X) |
Численность депутатов (кол-во человек) (ƒ) |
S |
20-29 |
1 |
1 |
30-39 |
16 |
17 |
40-49 |
28 |
45 |
50-59 |
30 |
75 |
60-69 |
7 |
82 |
Итог: |
82 |
По накопленным частотам определяем, что 41-ая единица совокупности содержится в интервале 40-49 лет. Этот интервал является медианным.
Половина депутатов фракции «Единство» моложе 47,7 лет, 2-ая половина старше 47,7 лет.
В интервальном вариационном ряду медиану можно вычислить графически по кумуляте:
Квартиль вычисляют по формуле: ;
Дециль вычисляют по формуле:
.
В интервальном вариационном ряду квартиль и дециль можно вычислить графически по кумуляте:
Показатели вариации.
Изменение величины признака от одной единицы совокупности к другой в статистике называют вариацией признака. Кроме средних величин для анализа исходной совокупности вычисляют абсолютные и относительные показатели вариации. К абсолютным показателям относятся:
1) Размах вариации (R) определяется, как разность между максимальным и минимальным значением признака в исходной совокупности R=Xmax-Xmin.
2) Среднее квартильное отклонение. Определяется как половина разности 3-его и 1-ого квартиля: .
3) Среднее линейное отклонение (d). Определяется, как средняя арифметическая величина из абсолютных отклонений индивидуальных значений признака от их средней величины. Применяют 2 формулы для не сгруппированных данных и сгруппированных.
Для не сгруппированных: ; для сгруппированных: .
4) Дисперсия ( ). Определяется, как средняя арифметическая величина из квадратов отклонений индивидуальных значений признака от из средней величины.
Для не сгруппированных: ; для сгруппированных: .
5) Среднее квадратическое
Для не сгруппированных: ; для сгруппированных: .
Среднее квадратическое отклонение показывает на сколько в среднем отличаются индивидуальные значения признака (варианты) в исходной совокупности от средней величины. Показатель среднего квадратического отклонения применяется при оценке возможного риска в финансово-экономических расчетах.
Лекция №6.
К относительным показателям
1. Коэффициент квартильной
2. Коэффициент осцилляции: .
3. Коэффициент вариации:
исходная совокупность считается однородной по изучаемому признаку, если коэффициент вариации меньше 33%. В этом случае средняя величина объективно представляет свою исходную совокупность. Пример вычисления показателей вариации:
Возраст депутата (полных лет) (X) |
Численность депутатов (кол-во человек) (ƒ) |
Середины интервалов (X) |
|||
20-29 |
1 |
24,5 |
23,2 |
23,2 |
538,24 |
30-39 |
16 |
34,5 |
13,2 |
211,2 |
2787,84 |
40-49 |
28 |
44,5 |
3,2 |
89,6 |
286,72 |
50-59 |
30 |
54,5 |
6,8 |
204 |
1387,2 |
60-69 |
7 |
64,5 |
16,8 |
117,6 |
1975,68 |
Итог: |
82 |
645,6 |
6975,68 |
; R=69-20=49 (лет); =7,9(лет); =6975,68/82=85,07; ;
В среднем возраст каждого
Математические свойства дисперсии.
Расчет дисперсии способом моментов.
Возраст депутата (полных лет) (X) |
Численность депутатов (кол-во человек) (ƒ) |
Середины интервалов (X) |
X-24,5 |
|||
20-29 |
1 |
24,5 |
0 |
0 |
0 |
0 |
30-39 |
16 |
34,5 |
10 |
1 |
1 |
16 |
40-49 |
28 |
44,5 |
20 |
2 |
4 |
112 |
50-59 |
30 |
54,5 |
30 |
3 |
9 |
270 |
60-69 |
7 |
64,5 |
40 |
4 |
16 |
112 |
Итог: |
82 |
510 |
В этом случае дисперсия рассчитывается по формуле , где i – величина равного интервала или любое постоянное число, отличное от 0; m1- момент первого порядка, m2 – момент второго порядка, который рассчитывается по формуле: .
А=24,5; i=10; ; =102(6,22-2,3172)=85,15
Расчет дисперсии методом средних.
Этот способ расчета основан на использовании последнего свойства дисперсии.
Возраст депутата (полных лет) (X) |
Численность депутатов (кол-во человек) (ƒ) |
Середины интервалов (X) |
X2 |
X2*ƒ |
20-29 |
1 |
24,5 |
600,25 |
600,25 |
30-39 |
16 |
34,5 |
1190,25 |
19044 |
40-49 |
28 |
44,5 |
1980,25 |
55447 |
50-59 |
30 |
54,5 |
2970,25 |
89107,5 |
60-69 |
7 |
64,5 |
4160,25 |
29121,75 |
Итог: |
82 |
193320,5 |
;
Правила сложения дисперсии.
Если исходная совокупность разделена на группы по какому-то существенному признаку, то вычисляют следующие виды дисперсий: