Автор работы: Пользователь скрыл имя, 21 Мая 2012 в 15:18, курсовая работа
Ряд распределения – это распределение единиц совокупности по значению того или иного признака.
Анализ ряда распределения включает:
Табличное и графическое представление ряда распределения;
Расчёт и анализ выборочных статистик;
Характеристику формы распределения;
Выбор теоретического распределения, которому соответствует изучаемое эмпирическое.
Введение
1. Основная часть
1.1. Анализ эмпирического распределения
1.1.1. Исходные данные
1.1.2. Графическое и табличное представление вариационного ряда распределения
1.1.3. Вычисление выборочных статистик для количества интервалов k=9
1.1.4. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения
1.2. Проведение выборочного наблюдения
1.2.1. Получение выборок
1.2.2. Графическое представление результатов выборочного наблюдения
Заключение
Список использованных источников
С помощью программы получаем все перечисленные показатели (рис. 1.5).
Рисунок 1.5. Показатели вариационного ряда
Средние показатели
Средняя величина - это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.
Средняя арифметическая ( в табл.Mean) относится к степенным средним.
В таблице рассчитана простая средняя величина 292,0964 по формуле:
Структурные средние применяются для изучения внутреннего строения рядов распределения значений признака. К структурным средним относятся Мода, Медиана, Квартили.
У нас N=167, нечетное число. Таким образом:
Me = x84= 287,40
Где floor – округление до ближайшего целого;
Ceiling – округление до ближайшего большего.
Таким образом, в нашем случае i=42, j=42.
Q1=(253,7+253,7)/2=253,7
i=126; j=125
Q3=(328,6+328,6)/2=328,6
Показатели вариации
Абсолютные:
R – размах вариации. Разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности:
σ2– средний квадрат отклонений значений переменной от среднего арифметического значения (дисперсия - в таблице Variance).
σ– среднее квадратическое отклонение (в табл. Std.Dev).
Относительные:
V – относительный показатель вариацииявляется наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.
Рассчитывается
по формуле:
В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными.
В нашем случае коэффициент вариации=18%, таким образом, совокупность является однородной.
As – коэффициент асимметрии оценивает симметричность эмпирического распределения относительно вертикальной оси симметрии, проходящей через среднюю арифметическую (в табл. Skewness). Значение коэффициента 0,224374 означает, что распределение имеет незначительную правостороннюю асимметрию.
Kurtosis – коэффициент эксцесса. Оценивает отклонения формы эмпирического распределения от идеального модального распределения. Значение коэффициента 0,017441.
Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретических распределении.
С
помощью программы проводится расчет
для нескольких типов сглаживания
(нормальное, лог-нормальное и прямоугольное
сглаживание представлены на рисунках
1.6, 1.7 и 1.8 соответственно).
Рисунок 1.6. Проверка гипотезы о нормальном распределении переменной Var1.
Рисунок 1.7. Проверка
гипотезы о лог-нормальном распределении
переменной Var1
Рисунок 1.8. Проверка
гипотезы о прямоугольном распределении
переменной Var1
а)
б)
в)
Рисунок
1.9. Гистограммы и расчетные кривые а) нормального
распределения; б) лог-нормального распределения;
в) прямоугольного распределения для переменной
Var1.
В шапке таблиц и графиков находятся следующие показатели:
Chi-SquareTest – расчетное значение критерия Пирсона;
d.f.(adjusted) – уточненное значения числа степеней свободы:
Гдеk - число интервалов эмпирического распределения (вариационного ряда);
l– число параметров теоретического распределения, определяемых по опытным данным (например, в случае нормального распределения число оцениваемых по выборке параметров l=2, математическое ожидание и дисперсия).
p
– расчетный уровень значимости.
Таблица 1.3
Результаты решения задачи сглаживания
Тип распределения | Число степеней свободы (r) | Расчетное значение
критерия |
Табличное значение
критерия |
(расчетное значение уровня значимости) |
Нормальное | 4 | 4,87120 | 9,488 | 0,30077 |
Логнормальное | 4 | 7,00026 | 9,488 | 0,13587 |
прямоугольное | 6 | 85,79042 | 12,59 | 0,00000 |
Принятие решения
о справедливости гипотезы о законе
распределения можно
Окончательные выводы по проверке гипотез о законе распределения:
χ02=4,87120<χ20.05;4=9,488 и
P(χ20.05;4 >χ02)=0,30077<α=0.05,
то гипотеза о нормальном распределении переменной Var1 противоречит статистическим данным.
χ02=7,00026<χ20.05;4=9,488 и
P(χ20.05;4 >χ02)=0,13587<α=0.05,
то гипотеза о лог-нормальном распределении переменной Var1 противоречит статистическим данным.
χ02=85,79042<χ20.05;6=12,59 и
P(χ20.05;6 >χ02)=0.0000<α=0.05,
то гипотеза о прямоугольном распределении переменной Var1 противоречит статистическим данным.
Предполагаем, что имеющиеся исходные данные представляют собой полностью определенную генеральную совокупность.
Задача: оценить генеральную среднюю и генеральную дисперсию по выборке.
Реализуется одна выборка большого объема и пять малых выборок.
Определение объема большой выборки проводится
по следующей формуле:
Где N=167 (объем генеральной совокупности);
t=1,96 – параметр нормального распределения (находится по таблицам интегральной функции нормального распределения в соответствии с заданным уровнем доверительной вероятности);
σ= 52,62363 –среднее квадратическое отклонение в генеральной совокупности;
Δ = 5% от генеральной средней – предельная ошибка выборки. Устанавливает точность результатов выборочного наблюдения;
Генеральная средняя = 292,0964
Таким образом n=120.
Объемы
малых выборок n1=n2=n3=n4=n5=
С помощью процедуры формирования случайных выборок сформированы 6 выборок (Выборки 1, 2, 3, 4, 5 – малые; Выборка 6 – большая) – рис. 1.10.
Рисунок 1.10. Сформированные
случайные выборки
На рисунке первый столбец – это генеральная совокупность.
Далее производится статистическая обработка результатов выборочного наблюдения.
При проведении статистической обработки задаются следующие параметры:
Генеральная средняя = 292,0964 (из первой части работы);
Уровень значимости критерия α=0,05;
Заданная
доверительная вероятность P=0.
Результаты статистической обработки представлены на рисунке 1.11.
Рисунок 1.11. Результаты статистической обработки результатов выборочного наблюдения
В первом столбце таблицы результатов представлены значения переменных (выборок):
Mean – значения выборочных средних;
Std.Dv. – среднее квадратическое отклонение;
N – объем выборок;
Std.Err. – средняя ошибка выборки;
Confidence -95% - нижняя граница доверительного интервала при вероятности 95%;
Confidence +95% - верхняя граница доверительного интервала при вероятности 95%;
ReferenceConstant– значение генеральной средней из первой части работы;
t-value– расчетное значение t-критерия для проверки гипотезы о значении генеральной средней;
df – число степеней свободы (определяется как n-1);
p– расчетный уровень значимости t-критерия.
Рисунок 1.12. Графическое сравнение результатов сплошного и выборочного наблюдения
График наглядно показывает, что доверительные интервалы, построенные по всем выборкам, накрывают генеральную среднюю.
В работе выполнен анализ эмпирического наблюдения и проведение выборочного наблюдения.
Получены показатели вариационного ряда.
Коэффициент вариации не превысил 35%, следовательно, изучаемую совокупность признаем однородной. Величина коэффициента асимметрии указывает на небольшую правостороннюю асимметрию относительно вертикальной оси.
Информация о работе Анализ эмпирического распределения. Выборочное наблюдение