Автор работы: Пользователь скрыл имя, 15 Мая 2013 в 08:34, курсовая работа
Корреляционный анализ — метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными. Корреляционный анализ тесно связан с регрессионным анализом (также часто встречается термин «корреляционно-регрессионный анализ», который является более общим статистическим понятием), с его помощью определяют необходимость включения тех или иных факторов в уравнение множественной регрессии, а также оценивают полученное уравнение регрессии на соответствие выявленным связям.
ВВЕДЕНИЕ 3
1. Постановка задачи 5
2. Применение методов корреляционного анализа 7
2.1. Оценки числовых характеристик X и Y. 7
2.2. Регрессионные модели 9
2.2.1.Линейная функция 9
2.2.2.Парабола 11
2.3.Определение доверительного интервала 12
2.4.Определение толерантного интервала 14
ЗАКЛЮЧЕНИЕ 15
СПИСОК ЛИТЕРАТУРЫ 16
Федеральное государственное
бюджетное образовательное
высшего профессионального образования
РОССИЙСКАЯ АКАДЕМИЯ НАРОДНОГО ХОЗЯЙСТВА И ГОСУДАРСТВЕННОЙ СЛУЖБЫ
ПРИ ПРЕЗИДЕНТЕ РОССИЙСКОЙ ФЕДЕРАЦИИ
НИЖЕГОРОДСКИЙ ИНСТИТУТ УПРАВЛЕНИЯ
Факультет очного обучения
Кафедра математики и системного анализа
КУРСОВАЯ РАБОТА
ПО ДИСЦИПЛИНЕ «Теория вероятностей и математическая статистика»
Тема: Корреляционный анализ в торговой деятельности
Специальность:
Прикладная информатика
Выполнила: студентка группы Иб-321
Научный руководитель:
кандидат технических наук, доцент
г.Нижний Новгород
2013 г.
ВВЕДЕНИЕ 3
1. Постановка задачи 5
2. Применение методов корреляционного анализа 7
2.1. Оценки числовых характеристик
2.2. Регрессионные модели 9
2.2.1.Линейная функция 9
2.2.2.Парабола 11
2.3.Определение
2.4.Определение толерантного интервала 14
ЗАКЛЮЧЕНИЕ 15
СПИСОК ЛИТЕРАТУРЫ 16
Математическая статистика - раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками.
Метод исследования, опирающийся
на рассмотрение статистических данных
о тех или иных совокупностях
объектов, называется статистическим.
Статистический метод применяется
в самых различных областях знания.
Однако черты статистического метода
в применении к объектам различной
природы столь своеобразны, что
было бы бессмысленно объединять, например,
социально-экономическую
Корреляция (корреляционная зависимость) — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. Математической мерой корреляции двух случайных величин служит корреляционное отношение , либо коэффициент корреляции (или ).
Корреляционный анализ — метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными. Корреляционный анализ тесно связан с регрессионным анализом (также часто встречается термин «корреляционно-регрессионный анализ», который является более общим статистическим понятием), с его помощью определяют необходимость включения тех или иных факторов в уравнение множественной регрессии, а также оценивают полученное уравнение регрессии на соответствие выявленным связям.
Корреляционный анализ имеет дело только двумерными или многомерными случайными выборками из определенной генеральной совокупности, в то время как регрессионный анализ имеет дело с реализацией случайных величин при одних и тех же значениях, но при этом в регрессионную модель можно включать различное количество параметров.
Производитель игрушек, выводя качественно новый продукт на рынок, для определения наилучшей цены для него, проводит эксперимент. Приняв за «ноль» три вторых себестоимости продукта, он через некоторые интервалы времени меняет цену (сначала ниже, а затем выше «нуля»).
Ниже в таблице приведены данные по месяцам об изменении цены товара по сравнению с принятой за «ноль» (в процентах) и об изменении количества продаж (в сотнях от предполагаемого). Из приведенных данных видно, что чем ниже цена товара, тем больше количество продаж, а чем выше цена товара, тем меньше количество продаж.
Месяц |
Май 2012 |
Июнь 2012 |
Июль 2012 |
Август 2012 |
Сентябрь 2012 |
Октябрь 2012 |
Ноябрь 2012 |
Декабрь 2012 |
Отклонение цены от «нулевой» отметки |
-8 |
-5 |
-2 |
0 |
1 |
2 |
4 |
7 |
Изменение кол-ва продаж товара |
20 |
10 |
3 |
-1 |
-3 |
-5 |
-8 |
-12 |
Таблица 1: Исходные данные
Примем отклонения цены товара от «нулевой» за значения случайной величины X, а изменения количества продаж этого товара за значения случайной величины Y. Тогда представленная выше таблица примет вид выборки из некоторой генеральной совокупности.
Требуется:
1.Оценить математические ожидания, дисперсии, средние квадратические отклонения и коэффициент корреляции случайных величин X и Y. На координатную плоскость нанести точки из таблицы (Таблица 2).
2.Используя методы
3.Дать интервальную оценку случайной величины Y с вероятностью попадания в интервал p=0,92, если взятое из той же генеральной совокупности значение , при предположении, что эмпирическое уравнение регрессии построено точно. Определить толерантный интервал.
Имеется выборка из некоторой генеральной совокупности, представленная в таблице.
xi |
-8 |
-5 |
-2 |
0 |
1 |
2 |
4 |
7 |
yi |
20 |
10 |
3 |
-1 |
-3 |
-5 |
-8 |
-12 |
Таблица 2: Выборка из некоторой генеральной совокупности
Нанесем точки из таблицы на координатную плоскость.
Рассмотрим гипотезу H0: =0. Найдем оценки числовых характеристик X и Y.
1)Вычислим оценки
2)Вычислим несмещенные оценки дисперсий по формуле:
3)Вычислим несмещенные оценки средних квадратических отклонений по формуле:
4)Вычислим несмещенную оценку ковариации по формуле:
=((-8+0,125)(20-0,5)+(-5+0,
+(0+0,125)(-1-0,5)+(1+0,125)(-
+(7+0,125)(-12-0,5))/7=-49,21
Если ковариация положительна, то с ростом значений одной случайной величины, значения второй также возрастают, а если знак отрицательный — то убывать. В данном случае наблюдается обратная зависимость.
5)Вычислим оценку
=-49,21/(4,82*10,35)=-0,9857
Гипотеза H0: =0 не подтвердилась. А значит между X и Y существует линейная статистическая связь.
2.2. Регрессионные модели
Построим регрессионную модель:
, где N( 0 , ), ycр( х)=М[ Y/x].
В качестве эмпирического уравнения возьмем линейную функцию:
Для построения используем прямой метод. Сначала построим уравнение X на Y по формуле:
Затем строим уравнение Y на X:
Для вычисления используем несмещенные оценки средних квадратических отклонений и коэффициентов корреляции.
Построим графики полученных уравнений:
Теперь оценим среднее квадратическое отклонение условного распределения для линейного уравнения Y на X:
1)В случае линейной регрессии и при нормальном законе используем простой метод
где l =2 – число параметров в эмпирическом уравнении регрессии ( в данном случае линейном).
Подставим известные значения:
2)Метод наименьших квадратов равносилен критерию минимума дисперсии , если она постоянна, а значит, мы можем найти оценку среднего квадратического отклонения по формуле:
Подставим известные значения:
Результаты, полученные с помощью первого и второго методов, равны, значит, оценка среднего квадратического отклонения вычислена верно.
Предположим, что эмпирическая функция представлена параболой.
Тогда:
Находим частные производные и приравниваем к нулю.
или
Так как a, b и c нам неизвестны, они находятся из представленной выше системы уравнений. Подставив исходные данные, мы получим:
И параболическое эмпирическое
уравнение регрессии будет
Построим график этой функции:
Вычислим оценку корреляционного отношения. Для этого надо найти:
При предположении о нелинейной регрессии, величина оказалась больше чем и гипотеза H0: =0 была отвергнута, значит, в качестве можно взять параболу.
Найдем доверительный интервал для условного математического ожидания с доверительной вероятностью 1- =0,96 при предположении о нормальном условном распределении случайной величины Y. Для этого используем выражение:
, где
- квантиль распределения Стьюдента с (n-2)-мя степенями свободы, соответствующий доверительной вероятности 1- α.
По таблице «Критические точки распределения Стьюдента» находим , при принятом уровне значимости α=0,04 и числе степеней свободы равном 6.
=2,45;
Подставляем известные нам значения и составляем таблицу.
Пусть x=-8, тогда
Доверительный интервал будет выглядеть:
Для других x вычисляем аналогично.
В итоге получится:
Верхняя граница |
20,33 |
13,16 |
6,23 |
1,87 |
-0,2 |
-2,21 |
-6,09 |
-11,69 |
Нижняя граница |
14,07 |
8,52 |
2,73 |
-1,39 |
-3,56 |
-5,79 |
-10,39 |
-17,51 |
x |
-8 |
-5 |
-2 |
0 |
1 |
2 |
4 |
7 |
Информация о работе Корреляционный анализ в торговой деятельности