Корреляционный анализ в торговой деятельности

Автор работы: Пользователь скрыл имя, 15 Мая 2013 в 08:34, курсовая работа

Описание работы

Корреляционный анализ — метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными. Корреляционный анализ тесно связан с регрессионным анализом (также часто встречается термин «корреляционно-регрессионный анализ», который является более общим статистическим понятием), с его помощью определяют необходимость включения тех или иных факторов в уравнение множественной регрессии, а также оценивают полученное уравнение регрессии на соответствие выявленным связям.

Содержание работы

ВВЕДЕНИЕ 3
1. Постановка задачи 5
2. Применение методов корреляционного анализа 7
2.1. Оценки числовых характеристик X и Y. 7
2.2. Регрессионные модели 9
2.2.1.Линейная функция 9
2.2.2.Парабола 11
2.3.Определение доверительного интервала 12
2.4.Определение толерантного интервала 14
ЗАКЛЮЧЕНИЕ 15
СПИСОК ЛИТЕРАТУРЫ 16

Файлы: 1 файл

Исправленный Курсовая.docx

— 153.67 Кб (Скачать файл)

Федеральное государственное  бюджетное образовательное учреждение

высшего профессионального  образования

РОССИЙСКАЯ АКАДЕМИЯ НАРОДНОГО  ХОЗЯЙСТВА И ГОСУДАРСТВЕННОЙ  СЛУЖБЫ

ПРИ ПРЕЗИДЕНТЕ РОССИЙСКОЙ ФЕДЕРАЦИИ

 

НИЖЕГОРОДСКИЙ ИНСТИТУТ УПРАВЛЕНИЯ

Факультет очного обучения

 

Кафедра математики и системного анализа

 

 

 

 

КУРСОВАЯ РАБОТА

 

ПО ДИСЦИПЛИНЕ «Теория вероятностей и математическая статистика»

Тема: Корреляционный анализ в торговой деятельности

 

 

 

 

 

 

Специальность:

Прикладная информатика

 

Выполнила: студентка группы Иб-321

 

Научный руководитель:

кандидат технических  наук, доцент

 

 

 

 

 

 

 

 

г.Нижний Новгород

2013 г.

СОДЕРЖАНИЕ

 

ВВЕДЕНИЕ 3

1. Постановка задачи 5

2. Применение методов  корреляционного анализа 7

2.1. Оценки числовых характеристик X и Y. 7

2.2. Регрессионные модели 9

2.2.1.Линейная функция 9

2.2.2.Парабола 11

2.3.Определение доверительного  интервала 12

2.4.Определение толерантного  интервала 14

ЗАКЛЮЧЕНИЕ 15

СПИСОК ЛИТЕРАТУРЫ 16

 

ВВЕДЕНИЕ

Математическая статистика - раздел математики, посвященный математическим методам систематизации, обработки  и использования статистических данных для научных и практических выводов. При этом статистическими  данными называются сведения о числе  объектов в какой-либо более или  менее обширной совокупности, обладающих теми или иными признаками.

Метод исследования, опирающийся  на рассмотрение статистических данных о тех или иных совокупностях  объектов, называется статистическим. Статистический метод применяется  в самых различных областях знания. Однако черты статистического метода в применении к объектам различной  природы столь своеобразны, что  было бы бессмысленно объединять, например, социально-экономическую статистику и физическую статистику. Общие черты  статистического метода в различных  областях знания сводятся к подсчёту числа объектов, входящих в те или  иные группы, рассмотрению распределения  количеств, признаков, применению выборочного  метода? использованию теории вероятностей при оценке достаточности числа наблюдений для тех или иных выводов и т. п. Эта формальная математическая сторона статистических методов исследования, безразличная к специфической природе изучаемых объектов, и составляет предмет математической статистики.

Корреляция (корреляционная зависимость) — статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. Математической мерой корреляции двух случайных величин служит корреляционное отношение , либо коэффициент корреляции (или ).

Корреляционный анализ —  метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными. Корреляционный анализ тесно связан с регрессионным анализом (также часто встречается термин «корреляционно-регрессионный анализ», который является более общим статистическим понятием), с его помощью определяют необходимость включения тех или иных факторов в уравнение множественной регрессии, а также оценивают полученное уравнение регрессии на соответствие выявленным связям.

Корреляционный анализ имеет  дело только двумерными или многомерными случайными выборками из определенной генеральной совокупности, в то время  как регрессионный анализ имеет  дело с реализацией случайных  величин при одних и тех  же значениях, но при этом в регрессионную  модель можно включать различное  количество параметров.

 

1. Постановка задачи

Производитель игрушек, выводя качественно новый продукт на рынок, для определения наилучшей  цены для него, проводит эксперимент. Приняв за «ноль» три вторых себестоимости  продукта, он через некоторые интервалы  времени меняет цену (сначала ниже, а затем выше «нуля»).

Ниже в таблице приведены  данные по месяцам об изменении цены товара по сравнению с принятой за «ноль» (в процентах) и об изменении  количества продаж (в сотнях от предполагаемого). Из приведенных данных видно, что  чем ниже цена товара, тем больше количество продаж, а чем выше цена товара, тем меньше количество продаж.

Месяц

Май

2012

Июнь

2012

Июль

2012

Август

2012

Сентябрь

2012

Октябрь

2012

Ноябрь

2012

Декабрь

2012

Отклонение цены от «нулевой» отметки

-8

-5

-2

0

1

2

4

7

Изменение кол-ва продаж товара

20

10

3

-1

-3

-5

-8

-12


Таблица 1: Исходные данные

Примем отклонения цены товара от «нулевой» за значения случайной  величины X, а изменения количества продаж этого товара за значения случайной величины Y. Тогда представленная выше таблица примет вид выборки из некоторой генеральной совокупности.

Требуется:

1.Оценить математические ожидания, дисперсии, средние квадратические отклонения и коэффициент корреляции случайных величин X и Y. На координатную плоскость нанести точки из таблицы (Таблица 2).

2.Используя методы корреляционного  анализа построить (аналитически  и графически) регрессионные модели  , причем в качестве эмпирического уравнения регрессии взять линейную функцию и параболу. Для линейного случая прямым методом построить два уравнения регрессии (X на Y  и Y на X), причем среднее квадратическое отклонение случайной величины оценить двумя способами. Найти доверительный интервал для условного математического ожидания M[Y/x] с доверительной вероятностью при предположении о нормальном условном распределении случайной величины Y. Для параболической регрессии оценить корреляционное отношение.

3.Дать интервальную оценку  случайной величины Y с вероятностью попадания в интервал p=0,92, если взятое из той же генеральной совокупности значение , при предположении, что эмпирическое уравнение регрессии построено точно. Определить толерантный интервал.

2. Применение  методов корреляционного анализа

2.1. Оценки числовых  характеристик X и Y.

Имеется выборка из некоторой  генеральной совокупности, представленная в таблице.

xi

-8

-5

-2

0

1

2

4

7

yi

20

10

3

-1

-3

-5

-8

-12


Таблица 2: Выборка из некоторой генеральной совокупности

Нанесем точки из таблицы  на координатную плоскость.

 

Рассмотрим гипотезу H0: =0. Найдем оценки числовых характеристик X и Y.

1)Вычислим оценки математических  ожиданий для этих случайных  величин по формуле:

2)Вычислим несмещенные  оценки дисперсий по формуле:

3)Вычислим несмещенные  оценки средних квадратических  отклонений по формуле:

4)Вычислим несмещенную  оценку ковариации по формуле:

=((-8+0,125)(20-0,5)+(-5+0,125)(10-0,5)+(-2+0,125)(3-0,5)+

+(0+0,125)(-1-0,5)+(1+0,125)(-3-0,5)+(2+0,125)(-5-0,5)+(4+0,125)(-8-0,5)+

+(7+0,125)(-12-0,5))/7=-49,21

Если ковариация положительна, то с ростом значений одной случайной  величины, значения второй также возрастают, а если знак отрицательный — то убывать. В данном случае наблюдается  обратная зависимость.

5)Вычислим оценку коэффициента  корреляции по формуле:

=-49,21/(4,82*10,35)=-0,9857

 

Гипотеза H0: =0 не подтвердилась. А значит между X и Y существует линейная статистическая связь.

2.2. Регрессионные  модели

Построим регрессионную  модель:

 , где N( 0 , ), ycр( х)=М[ Y/x].

2.2.1.Линейная функция

В качестве эмпирического  уравнения возьмем линейную функцию:

Для построения используем прямой метод. Сначала построим уравнение X на Y по формуле:

Затем строим уравнение Y на X:

Для вычисления используем несмещенные оценки средних квадратических отклонений и коэффициентов корреляции.

Построим графики полученных уравнений:

 

Теперь оценим среднее  квадратическое отклонение условного распределения для линейного уравнения Y на X:

1)В случае линейной регрессии и при нормальном законе используем простой метод

где l =2 – число параметров в эмпирическом уравнении регрессии ( в данном случае линейном).

Подставим известные значения:

2)Метод наименьших квадратов равносилен критерию минимума дисперсии , если она постоянна, а значит, мы можем найти оценку среднего квадратического отклонения по формуле:

Подставим известные значения:

Результаты, полученные с помощью первого и второго методов, равны, значит, оценка среднего квадратического отклонения вычислена верно.

2.2.2.Парабола

Предположим, что эмпирическая функция представлена параболой.

Тогда:

 

Находим частные производные  и приравниваем к нулю.

    или     

Так как a, b и c нам неизвестны, они находятся из представленной выше системы уравнений. Подставив исходные данные, мы получим:

И параболическое эмпирическое уравнение регрессии будет выглядеть:

Построим график этой функции:

Вычислим оценку корреляционного  отношения. Для этого надо найти:

При предположении о нелинейной регрессии, величина оказалась больше чем и гипотеза H0: =0 была отвергнута, значит, в качестве можно взять параболу.

2.3.Определение доверительного  интервала

Найдем доверительный  интервал для условного математического  ожидания с доверительной вероятностью 1- =0,96 при предположении о нормальном условном распределении случайной величины Y. Для этого используем выражение:

, где     

- квантиль распределения  Стьюдента с (n-2)-мя степенями свободы, соответствующий доверительной вероятности 1- α.

По таблице «Критические точки распределения Стьюдента» находим  , при принятом уровне значимости α=0,04 и числе степеней свободы равном 6.

=2,45;

Подставляем известные нам  значения и составляем таблицу.

Пусть x=-8, тогда

Доверительный интервал будет  выглядеть:

Для других x вычисляем аналогично.

В итоге получится:

Верхняя граница

20,33

13,16

6,23

1,87

-0,2

-2,21

-6,09

-11,69

Нижняя граница

14,07

8,52

2,73

-1,39

-3,56

-5,79

-10,39

-17,51

x

-8

-5

-2

0

1

2

4

7

Информация о работе Корреляционный анализ в торговой деятельности