Автор работы: Пользователь скрыл имя, 04 Мая 2013 в 13:44, курсовая работа
Задачи корреляционного анализа:
Измерение тесноты известной связи между варьирующими признаками,
определение неизвестных причинных связей и оценки факторов, оказывающих наибольшее влияние на результативный признак.
Задачами регрессионного анализа являются:
выбор типа модели
установление степени влияния независимых переменных на зависимую и определение расчётных значений зависимой переменной.
Решение всех названных задач приводит к необходимости комплексного использования этих методов.
ВВЕДЕНИЕ 3
ОПИСАНИЕ СИТУАЦИИ И ПОСТАНОВКА ЗАДАЧИ 5
ИСПОЛЬЗОВАНИЕ МЕТОДОВ РЕГРЕССИОННОГО И КОРРЕЛЯЦИОННОГО АНАЛИЗА ДЛЯ ПОСТРОЕНИЯ ПРОГНОЗА 6
Определение доверительного интервала 12
Определение толерантного интервала 15
ЗАКЛЮЧЕНИЕ 16
СПИСОК ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 17
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
РОССИЙСКАЯ АКАДЕМИЯ
НАРОДНОГО ХОЗЯЙСТВА И
ПРИ ПРЕЗИДЕНТЕ РОССИЙСКОЙ ФЕДЕРАЦИИ
НИЖЕГОРОДСКИЙ ИНСТИТУТ УПРАВЛЕНИЯ
Факультет очного обучения
Кафедра математики и системного анализа
КУРСОВАЯ РАБОТА
ПО ДИСЦИПЛИНЕ «Теория вероятностей и математическая статистика»
Корреляционный и
Тема: Корреляционный анализ в банковской деятельности
(Для решения одной задачи не может быть применён и корреляционный, и регрессионный анализ. Если месяцы выбраны случайным образом в стабильной экономической ситуации и измерены хi ,yi , то это корреляционный анализ)
Специальность:
Прикладная информатика в экономике
Выполнила:
студентка гр. Иб-321
Карпеева Татьяна Викторовна
Научный руководитель:
кандидат технических наук, доцент
Маслов Владимир Николаевич
г.Нижний Новгород
2012 г.
Оглавление
ВВЕДЕНИЕ
Математическая статистика – это один из разделов математики, который тесно связан с теорией вероятности и представляет собой метод сбора, анализа и свертывания информации о некоторых событиях и процессах природной или человеческой деятельности.
Основная задача математической статистики – это оценивание характеристик генеральной совокупности по выборкам, иногда с привлечением экспертной информации, которая основана на использовании данных об аналогичных событиях, объектах.
В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного и регрессионного анализа.
Корреляционный анализ — метод обработки статистических данных, заключающийся в изучении коэффициентов (корреляции). Не только. К скачиваемой из интернета информации надо относиться критически.
Не все факторы, влияющие на экономические процессы, являются случайными величинами, поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом.
Задачи корреляционного анализа:
Задачами
регрессионного анализа являютс
Решение всех названных задач приводит к необходимости комплексного использования этих методов.
Корреляционно-регрессионный анализ применяется в тех случаях, когда между анализируемыми показателями нет строгой зависимости и полного соответствия, т. е. нет функциональной зависимости. Применение этого метода требует использования программ решения задач на ЭВМ, так как корреляционно-регрессионный анализ требует большого количества трудоемких расчетов и большой подготовительной работы.
1. Описание ситуации
Центральный банк устанавливает
ставку рефинансирования, которая определяет
размер процентов в годовом
Год |
Янв. 1992 |
Апр. 1992 |
Май 1992 |
Июнь 1993 |
Июль 1993 |
Сентябрь 1993 |
Январь 1994 |
Апрель 1994 |
Изменение ставки рефинансирования |
-4 |
-2 |
0 |
2 |
3 |
4 |
7 |
10 |
Изменение кол-ва выданных кредитов |
21 |
8 |
-2 |
-11 |
-16 |
-21 |
-33 |
-40 |
Из приведенных данных видно, что при повышении ставки рефинансирования, количество выданных кредитов уменьшается. Требуется составить интервал для индивидуального прогноза изменения количества выданных кредитов, если по сравнению с предыдущим годом, ставка увеличилась на 6 процентов.
Необходимо более подробно описать ситуацию. Прежде всего, надо чётко написать, что такое х и y. Если это изменение, то какое: абсолютное, относительное, по какой формуле оно определяется, по сравнению с чем. И не должно быть противоречий: в Заключении у Вас написано: ставка рефинансирования. Надо ещё отразить, когда была изменена ставка рефинансирования: в начале месяца или в конце.
Имеются исходные данные – выборка из генеральной совокупности, представленная в таблице:
Таблица 1 Исходные данные
xi |
-4 |
-2 |
0 |
2 |
3 |
4 |
7 |
10 |
yi |
21 |
8 |
-2 |
-11 |
-16 |
-21 |
-33 |
-40 |
.
Нанесем точки из таблицы на координатную плоскость
Рис. 1. Исходные данные
Пусть есть гипотеза H0: =0. Необходимо ее проверить. Если гипотеза будет принята, то линейной статистической связи между х и у нет.
Найдем оценки числовых характеристик х и у.
Оценки математических ожиданий, которые характеризую центр рассеяния данных, вычислим по формулам:
,
Оценки дисперсий (смещенные):
Оценки дисперсий (несмещенные):
Найдем смещенные оценки средних квадратических отклонений:
Несмещенные оценки средних квадратических отклонений:
Определим несмещенную оценку ковариации, которая выражает степень статистической зависимости между двумя множествами данных, по формуле:
=650/7=-92,9 (Здесь вычисления требуется осуществлять хотя бы с точностью до сотых долей. Коэффициент корреляции и параметры уравнения регрессии будут уже другими).
Отрицательный коэффициент ковариации характеризует обратную взаимосвязь величин.
Вычисление оценки коэффициента корреляции (характеризует силу и направление связи между двумя переменными):
=-92,9/ (4,59* 20,39)= -0,9902
Коэффициент корреляции, близкий по
модулю к минус единице, говорит
о наличии сильной связи между
Т. к. 0, значит гипотеза H0 отвергается, следовательно между х и у существует линейная статистическая связь.
Будем использовать регрессионную модель в виде: , где –….
Предположим, что эмпирическое уравнение регрессии является линейным:
Прямой метод построения линейной модели эмпирического уравнения Y на X. Используем формулу:
= -11,75
=2,5
=-0,9902; = 4,3; =19,08
. Подставляем значения, находим эмпирические уравнения регрессии Y на X:
Прямой метод построения линейной модели эмпирического уравнения X на Y .
Подставляя значения, получаем следующие результаты:
На основании полученных данных построим графики функций.
Рис. 2. Эмпирические линейные уравнения регрессии Y на X и Х на Y
Также, предположим, что эмпирическое уравнение регрессии является параболой:
Коэффициенты a, b, с найдем из системы уравнений:
;
;
.
Подставляя известные данные, получаем:
Используя метод Крамера, получаем:
=0,1343;
=-5,1857;
=-2,1089
Тогда параболическое эмпирическое уравнение регрессии имеет вид:
Построим график функции на координатной плоскости.
Рис. 3. Параболическое эмпирическое уравнение регрессии
Точность прогноза определяется, во-первых, естественным разбросом, т.е. дисперсией условного распределения, а во-вторых, ограниченность выборки, т. е. доверительным интервалом для величины , который зависит от х.
Поэтому, сначала найдем оценку среднего квадратического отклонения условного распределения для линейного уравнения Y на X двумя способами:
-число параметров в эмпирическом уравнении регрессии
=4,6 =3,076 Пересчитайте
= =
Также найдем оценки дисперсии и среднего квадратического отклонения условного распределения для параболического уравнения регрессии, по формулам:
В результате получаем:
=
=((21-20,7827)+(8-8,7997)+(-2+
Оценим корреляционное отношение для параболического уравнения регрессии:
(?)
=
Гипотеза H0 была отвергнута и , значит можно выбрать нелинейную (параболическую) регрессионную модель.
Доверительный интервал для условного математического ожидания Y находится по выражению:
где = Правильная ли формула?
,- квантиль распределения Стьюдента.
Найдем доверительный интервал для условного математического ожидания с доверительной вероятностью 1- =0,94. при предположении о нормальном распределении случайной величины Y используя линейную и параболическую модель регрессии.
По таблице «Критические точки распределения Стьюдента» находим квантиль , при принятом уровне значимости =0,06
Тогда, доверительный интервал для линейного уравнения регрессии примет вид:
Доверительный интервал для y9 при x9=6: Неверно
, т.е.
-30,3534<yср(6)< -23,8672
Построим доверительный интервал на координатной плоскости.
Рис.4. Доверительный интервал для случая линейной модели
Доверительный интервал для случая параболической модели регрессии по выражению:
Доверительный интервал для y9 при x9=6:
Информация о работе Корреляционный анализ в банковской деятельности