Автор работы: Пользователь скрыл имя, 12 Декабря 2011 в 09:39, курсовая работа
Цель работы: рассмотреть основы описательной статистики и провести анализ инфляции РК, используя изученный материал.
Для осуществления поставленной цели необходимо выполнить следующие задачи:
Определить понятие инфляции.
Рассмотреть методы описательной статистики.
Использовать описательную статистику в анализе инфляции РК.
ВВЕДЕНИЕ 4
1 ИНФЛЯЦИОННЫЕ ПРОЦЕССЫ. ПОКАЗАТЕЛИ ИЗУЧЕНИЯ ИНФЛЯЦИИ 6
1.1 Понятие инфляция 6
1.2 Основные причины возникновения инфляции 8
1.3 Виды и классификация современной инфляции 10
1.4 Методы измерения инфляции 11
2 МЕТОДЫ ОПИСАТЕЛЬНОЙ СТАТИСТИКИ 13
2.1 Описательная статистика как часть математической статистики 13
2.2 Показатели положения 14
2.3 Показатели разброса 16
2.4 Показатели асимметрии 18
2.5 Показатели закона распределения 19
3 АНАЛИЗ ИНФЛЯЦИИ 20
3.1 Анализ инфляции РК за 1996 – 2010 гг. 20
3.2 Анализ инфляции РК за 2006 – 2010 гг. по месяцам 25
ЗАКЛЮЧЕНИЕ 30
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 31
Методами описательной статистики называются методы описания выборок с помощью различных показателей и графиков. Достоинство методов описательной статистики в том, что ее простые и довольно информативные статистические показатели избавляют от необходимости просмотра большого количества значений выборки [2].
Показатели, описывающие выборку можно разбить на несколько групп:
Показатели положения – описывают положение данных (или середины совокупности) на числовой оси:
Вариационным рядом называется ранжированный в порядке возрастания (или убывания) ряд вариантов с соответствующими им весами (частотами и частостями) [1].
Частоты – числа, показывающие, сколько раз встречаются варианты из данного интервала. Обозначаются .
Частости – отношение частот к общему числу наблюдений, то есть .
При изучении вариационных рядов наряду с понятием частоты используется понятие накопленной частоты (обозначается ). Накопленная частота показывает, сколько наблюдалось вариантов со значением признака, меньшим . Отношение накопленной частоты к общему числу наблюдений назовем накопленной частостью .
Минимум
и максимум выборки - это соответственно
наименьшее (
) и наибольшее (
) значение изучаемой переменной. Разность
между максимумом и минимумом называется
размахом выборки (
). Все данные выборки расположены в
промежутке между минимумом и максимумом.
Эти показатели как бы очерчивают границы
выборки.
Квартиль – величина, отсекающая (25%) членов ряда. Различают нижний и верхний квартили.
Нижний и верхний квартили (термин был впервые использован Галтоном, 1882; также их называют квантилями 25 и 75) равны 25-й и 75-й процентилям распределения (соответственно).
25-я
процентиль переменной - это такое
значение, ниже которого попадают
25% значений переменной. Аналогично, 75-я
процентиль - это такое значение, ниже
которого попадают 75% значений переменной.
Среднее арифметическое выборки это, наверное, один из наиболее употребительных статистических показателей. Среднее арифметическое характеризует положение центра выборки на числовой прямой и является мерой математического ожидания переменной.
Среднее арифметическое ряда – сумма произведений всех вариантов на соответствующие частоты, деленная на сумму частот:
,
где - варианты дискретного ряда или середины интервалов интервального вариационного ряда; - соответствующие им частоты; - число неповторяющихся вариантов или число интервалов: формула Стерджеса
;
.
Очевидно, что , где - частости вариантов или интервалов.
Величина интервала (интервальная разность, ширина интервала):
,
где - разность между наибольшим и наименьшим значениями признака.
Медианой
вариационного ряда называется значение
признака, приходящееся на середину ранжированного
ряда наблюдений. Если объем выборки –
четное число, то медианой является среднее
арифметическое двух центральных членов,
а если нечетное, то медиана равна серединному
варианту. Другими словами медиана разбивает
выборку на две равные части. Достоинство
медианы как меры центральной тенденции
заключается в том, что на нее не влияет
изменение крайних членов вариационного
ряда, если любой из них, меньший медианы,
остается меньше ее, а любой, больший медианы,
продолжает быть большее ее. Медиана предпочтительнее
средней арифметической для ряда, у которого
крайние варианты по сравнению с остальными
оказались чрезмерно большими и малыми.
Модой вариационного ряда называется вариант, которому соответствует наибольшая частота. Сложность состоит в том, что редкая выборка имеет единственную моду. Если в выборке несколько мод, то говорят, что она мультимодальна или многомодальна (имеет два или более «пика»). Особенность моды как меры центральной тенденции заключается в том, что она не изменяется при изменении крайних членов ряда, т.е. обладает определенной устойчивостью к вариации признака.
Показатели разброса – описывают степень разброса данных относительно своего центра (насколько кучно основная масса данных группируется около середины совокупности)
Дисперсией вариационного ряда называется средняя арифметическая квадратов отклонений вариантов от их средней арифметической.
Пусть - выборка из распределения вероятности. Тогда выборочная дисперсия – это случайная величина
, (2.4)
где символ
обозначает
выборочное среднее.
Среднее квадратическое отклонение определяется как обобщающая характеристика размеров вариации признака в совокупности. Оно равно квадратному корню из среднего квадрата отклонений отдельных значений признака от средней арифметической, то есть корень из дисперсии и может быть найдена так:
, (2.5)
. (2.6)
Среднее
квадратичное отклонение определяет,
на сколько в среднем отклоняются
конкретные варианты от их среднего значения,
и к тому же является абсолютной мерой
колеблемости признака и выражается в
тех же единицах, что и варианты, и поэтому
хорошо интерпретируется.
Размах
(интерквартильный размах) – разность
между третьим и первым квартилями, то
есть
. Интерквартильный размах является
характеристикой разброса распределения
величины и является робастным аналогом
дисперсии. Вместе, медиана и интерквартильный
размах могут быть использованы вместо
математического ожидания и дисперсии
в случае распределений с большими выбросами,
либо при невозможности вычисления последних.
Средняя арифметическая и дисперсия вариационного ряда являются частными случаями более общего понятия – моментов вариационного ряда.
Начальный момент -го порядка вариационного ряда определяется по формуле:
. (2.7)
Очевидно, что , то есть средняя арифметическая является начальным моментом первого порядка вариационного ряда.
Центральный момент -го порядка вариационного ряда определяется по формуле:
. (2.8)
С
помощью моментов распределения
можно описать не только среднюю тенденцию,
рассеяние, но и другие особенности вариации
признака.
Эксцессом (или коэффициентом эксцесса) вариационного ряда называется число:
. (2.9)
Эксцесс является показателем «крутости» вариационного ряда по сравнению с нормальным распределением. Эксцесс нормально распределенной случайной величины равен нулю.
Если ( ), то полигон вариационного ряда имеет более крутую (пологую) вершину по сравнению с нормальной кривой.
Показатели асимметрии – описывают симметричность распределения данных около своего центра
Коэффициентом асимметрии вариационного ряда называется число:
. (2.10)
Если
, то распределение
имеет симметричную форму, то есть варианты,
равноудаленные от
, имеют одинаковую частоту. При
(
) говорят
о положительной (правосторонней) или
отрицательной (левосторонней) асимметрии.
Гистограмма
служит только для изображения интервальных
вариационных рядов и представляет собой
ступенчатую фигуру из прямоугольников
с основаниями, равными интервалам значений
признака
,
, и высотами равными частотам (частостям)
интервалов. Если же соединить середины
верхних оснований прямоугольников отрезками
прямой, то можно получить полигон того
же распределения.
Кумулятивная кривая (кумулята) – кривая накопленных частот (частостей). Для дискретного ряда кумулята представляет ломаную, соединяющую точки , . Для интервального вариационного ряда ломаная начинается с точки, абсцисса которой равна началу первого интервала, а ордината – накопленной частоте (частости), равной 0. Другие точки этой ломаной соответствуют концам интервалов.
Показатели,
описывающие закон
Выборочной (эмпирической) функцией распределения называется относительная частота (частость) того, что признак (случайная величина ) примет значение, меньшее заданного , то есть
.
(2.11)
Из перечисленных выше характеристик на практике по традиции чаще всего используют выборочные среднее, медиану и дисперсию (или стандартное отклонение). Однако для получения более точных и достоверных выводов необходимо использовать и другие показатели.
Особое
внимание следует обратить на наличие
в выборке выбросов – грубых,
сильно отличающихся от основной массы,
наблюдений. Большинство традиционных
статистических методов весьма чувствительны
к отклонениям от условий применимости
метода. Поэтому выбросы могут не только
исказить значение выборочных показателей,
но и привести к ошибочным выводам. Подозрение
о присутствии таких наблюдений должно
возникнуть, если выборочная медиана сильно
отличается от выборочного среднего, хотя
в целом совокупность симметрична, или,
если положение медианы сильно несимметрично
относительно минимального и максимального
элементов выборки. Проще всего обнаружить
выбросы с помощью перехода от выборки
к вариационному ряду или гистограмме
с большим числом интервалов группировки.