Анализ эмпирического распределения. Выборочное наблюдение

Автор работы: Пользователь скрыл имя, 21 Мая 2012 в 15:18, курсовая работа

Описание работы

Ряд распределения – это распределение единиц совокупности по значению того или иного признака.
Анализ ряда распределения включает:
 Табличное и графическое представление ряда распределения;
 Расчёт и анализ выборочных статистик;
 Характеристику формы распределения;
 Выбор теоретического распределения, которому соответствует изучаемое эмпирическое.

Содержание работы

Введение
1. Основная часть
1.1. Анализ эмпирического распределения
1.1.1. Исходные данные
1.1.2. Графическое и табличное представление вариационного ряда распределения
1.1.3. Вычисление выборочных статистик для количества интервалов k=9
1.1.4. Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения
1.2. Проведение выборочного наблюдения
1.2.1. Получение выборок
1.2.2. Графическое представление результатов выборочного наблюдения
Заключение
Список использованных источников

Файлы: 1 файл

курсовик СТАТИСТИКА.doc

— 1.24 Мб (Скачать файл)

     С помощью программы получаем все  перечисленные показатели (рис. 1.5).

Рисунок 1.5. Показатели вариационного ряда

Средние показатели

     Средняя величина - это обобщающий показатель статистической совокупности, который  погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.

Средняя арифметическая ( в табл.Mean) относится к степенным средним.

В таблице  рассчитана простая средняя величина 292,0964 по формуле:

     Структурные средние  применяются для изучения внутреннего строения рядов распределения значений признака. К структурным средним относятся Мода, Медиана, Квартили.

  1. Мода (в табл.Mode) – наиболее часто повторяющееся значение признака. Определяется непосредственно по исходных данным (запись в таблице Multipleозначает, что распределение имеет не одну Моду).
  2. Медиана (в табл. Median) - величина признака, которая делит упорядоченную последовательность его значений на две равные по численности части.

У нас  N=167, нечетное число. Таким образом:

Me = x84= 287,40

  1. Нижний (первый) квартиль (в табл.Lower)
 

    Где floor – округление до ближайшего целого;

    Ceiling – округление до ближайшего большего.

Таким образом, в нашем случае i=42, j=42.

Q1=(253,7+253,7)/2=253,7

  1. Верхний (третий) квартиль (в табл.Upper)

     

    i=126; j=125

    Q3=(328,6+328,6)/2=328,6

Показатели  вариации

Абсолютные:

    R – размах вариации. Разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности:

    σ2– средний квадрат отклонений значений переменной от среднего арифметического значения (дисперсия - в таблице Variance).

    σ– среднее квадратическое отклонение (в табл. Std.Dev).

Относительные:

V – относительный показатель вариацииявляется наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.

Рассчитывается  по формуле: 

    В статистике совокупности, имеющие коэффициент  вариации больше 30–35 %, принято считать неоднородными.

    В нашем случае коэффициент вариации=18%, таким образом, совокупность является однородной.

As – коэффициент асимметрии оценивает симметричность эмпирического распределения относительно вертикальной оси симметрии, проходящей через среднюю арифметическую (в табл. Skewness). Значение коэффициента 0,224374 означает, что распределение имеет незначительную правостороннюю асимметрию.

Kurtosis – коэффициент эксцесса. Оценивает отклонения формы эмпирического распределения от идеального модального распределения. Значение коэффициента 0,017441.

      1. Сглаживание эмпирического распределения. Проверка гипотезы о  законе распределения

    Процедура выравнивания, сглаживания анализируемого распределения заключается в  замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретических распределении.

    С помощью программы проводится расчет для нескольких типов сглаживания (нормальное, лог-нормальное и прямоугольное  сглаживание представлены на рисунках 1.6, 1.7 и 1.8 соответственно). 

Рисунок 1.6. Проверка гипотезы о нормальном распределении переменной Var1.

Рисунок 1.7. Проверка гипотезы о лог-нормальном распределении переменной Var1 

Рисунок 1.8. Проверка гипотезы о прямоугольном распределении переменной  Var1 

а)

б)

 

в)

Рисунок 1.9. Гистограммы и расчетные кривые а) нормального распределения; б) лог-нормального распределения; в) прямоугольного распределения для переменной Var1. 
 

В шапке таблиц и графиков находятся следующие  показатели:

Chi-SquareTest – расчетное значение критерия Пирсона;

d.f.(adjusted) – уточненное значения числа степеней свободы:

Гдеk -   число интервалов эмпирического распределения (вариационного ряда);

l– число параметров теоретического распределения, определяемых по опытным данным (например, в случае нормального распределения число оцениваемых по выборке параметров l=2, математическое ожидание и дисперсия).

p – расчетный уровень значимости. 

Таблица 1.3

Результаты  решения задачи сглаживания

Тип распределения Число степеней свободы (r) Расчетное значение критерия
Табличное значение критерия

(расчетное  значение уровня значимости)

Нормальное 4 4,87120 9,488 0,30077
Логнормальное 4 7,00026 9,488 0,13587
прямоугольное 6 85,79042 12,59 0,00000

 

          Принятие решения  о справедливости гипотезы о законе распределения можно осуществить, ориентируясь на эмпирическое значение критерияχ02 ,  либо на расчетное значение вероятности (расчетный уровень значимости) (P(χ2α;r>χ02) . Первое сравнивается с табличным значением χ2α;r, второе – с принятым уровнем значимости (примем  α=0,05).

    Окончательные выводы по проверке гипотез о законе распределения:

  1. Так как

    χ02=4,8712020.05;4=9,488 и

    P(χ20.05;4 02)=0,30077<α=0.05,

    то  гипотеза о нормальном распределении переменной Var1 противоречит статистическим данным.

  1. Так как

        χ02=7,0002620.05;4=9,488 и

        P(χ20.05;4 02)=0,13587<α=0.05,

    то  гипотеза о лог-нормальном распределении  переменной Var1 противоречит статистическим данным.

  1. Так как

    χ02=85,7904220.05;6=12,59 и

    P(χ20.05;6 02)=0.0000<α=0.05,

то гипотеза о прямоугольном распределении  переменной Var1 противоречит статистическим данным.

    1. Проведение  выборочного наблюдения

    Предполагаем, что имеющиеся исходные данные представляют собой полностью определенную генеральную совокупность.

    Задача: оценить генеральную среднюю  и генеральную дисперсию по выборке.

      1. Получение выборок

    Реализуется одна выборка большого объема и пять малых выборок.

     Определение объема большой выборки проводится по следующей формуле: 

    Где N=167 (объем генеральной совокупности);

    t=1,96 – параметр нормального распределения (находится по таблицам интегральной функции нормального распределения в соответствии с заданным уровнем доверительной вероятности);

    σ= 52,62363 –среднее квадратическое отклонение в генеральной совокупности;

    Δ = 5% от генеральной средней – предельная ошибка выборки. Устанавливает точность результатов выборочного наблюдения;

    Генеральная средняя = 292,0964

    Таким образом n=120.

    Объемы  малых выборок n1=n2=n3=n4=n5=8.

    С помощью процедуры формирования случайных выборок сформированы 6 выборок (Выборки 1, 2, 3, 4, 5 – малые; Выборка 6 – большая) – рис. 1.10.

Рисунок 1.10. Сформированные случайные выборки 

    На  рисунке первый столбец – это  генеральная совокупность.

    Далее производится статистическая обработка результатов выборочного наблюдения.

    При проведении статистической обработки  задаются следующие параметры:

    Генеральная средняя = 292,0964 (из первой части работы);

    Уровень значимости критерия α=0,05;

    Заданная  доверительная вероятность P=0.95.

    Результаты  статистической обработки представлены на рисунке 1.11.

Рисунок 1.11. Результаты статистической обработки результатов выборочного наблюдения

    В первом столбце таблицы результатов  представлены значения переменных (выборок):

    Mean – значения выборочных средних;

    Std.Dv. – среднее квадратическое отклонение;

    N – объем выборок;

    Std.Err. – средняя ошибка выборки;

    Confidence -95% - нижняя граница доверительного интервала при вероятности 95%;

    Confidence +95% - верхняя граница доверительного интервала при вероятности 95%;

    ReferenceConstant– значение генеральной средней из первой части работы;

    t-value– расчетное значение t-критерия для проверки гипотезы о значении генеральной средней;

    df – число степеней свободы (определяется как n-1);

    p– расчетный уровень значимости t-критерия.

      1. Графическое представление результатов  выборочного наблюдения

Рисунок 1.12. Графическое сравнение результатов сплошного и выборочного наблюдения

    График  наглядно показывает, что доверительные  интервалы, построенные по всем выборкам, накрывают генеральную среднюю.

Заключение

    В работе выполнен анализ эмпирического  наблюдения и проведение выборочного наблюдения.

    Получены  показатели вариационного ряда.

    Коэффициент вариации не превысил 35%, следовательно, изучаемую совокупность признаем однородной. Величина коэффициента асимметрии указывает на небольшую правостороннюю асимметрию относительно вертикальной оси.

Список  использованных источников

Информация о работе Анализ эмпирического распределения. Выборочное наблюдение