Измерение и прогнозирование в статистических исследованиях

Автор работы: Пользователь скрыл имя, 20 Июня 2013 в 08:36, курсовая работа

Описание работы

Статистика рассматривается как наука о методах изучения массовых явлений. Некоторые процессы, наблюдаемые в массовом количестве, обнаруживают определенные закономерности, которые, однако, невозможно заметить в отдельном случае или же при небольшом числе наблюдений. Явления, которые в случае событий массового характера отличаются определенной закономерностью, однако не обнаруживаются на основе единичного наблюдения, называются массовыми явлениями. Сама такая закономерность называется статистической закономерностью.

Содержание работы

ВВЕДЕНИЕ 6
1 Измерение в статистических исследованиях 11
1.1 Типы взаимосвязей. Корреляционный анализ 11
1.2 Расчет коэффициента парной корреляции и его статистическая проверка 14
1.3 О ложной корреляции (влияние «третьего фактора») 15
1.4 Измерение степени тесноты связи между качественными признаками (ранговая корреляция) 16
2 Прогнозирование в статистических исследованях 18
2.1 Регрессионный анализ данных 19
2.2 Множественная регрессия 24
2.3 Проблемы множественной регрессии 26
3 Практическая часть 29
3.1 Уравнение множественной регрессии 29
3.2 Предпосылки МНК 29
3.3 Оценка уравнения регрессии 30
3.4 Матрица парных коэффициентов корреляции 34
3.4.1 Модель регрессии в стандартном масштабе 37
3.5 Анализ параметров уравнения регрессии 39
3.5.1 Показатели тесноты связи факторов с результатом 42
3.5.2 Частные коэффициенты эластичности 42
3.5.3 Стандартизированные частные коэффициенты регрессии 42
3.5.4 Частные коэффициенты корреляции 43
3.5.5 Индекс множественной корреляции (множественный коэффициент корреляции) 44
3.5.6 Коэффициент детерминации 45
3.6 Оценка значения результативного признака при заданных знчениях факторов 45
3.7 Проверка гипотез относительно коэффициентов уравнения регрессии (проверка значимости параметров) 46
3.8 Проверка общего качества уравнения множественной регресии 47
3.9 Решение задачи с использованием программы (язык С++) 48
ЗАКЛЮЧЕНИЕ 55
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 56

Файлы: 1 файл

Диплом-1.docx

— 533.06 Кб (Скачать файл)

 

Таблица 13 - Матрица парных коэффициентов корреляции

-

y

x1

x2

y

1

0.61

-0.59

x1

0.61

1

0.25

x2

-0.59

0.25

1


 

Анализ первой строки этой матрицы позволяет произвести отбор  факторных признаков, которые могут быть включены в модель множественной корреляционной зависимости. Факторные признаки, у которых ryxi < 0.5 исключают из модели.

Коллинеарность – зависимость между факторами. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:

 

r(xjy) > r(xkxj);              (35)

 

r(xky) > r(xkxj).                      (36)

 

Если одно из неравенств не соблюдается, то исключается тот  параметр xk или xj, связь которого с результативным показателем Y оказывается наименее тесной.

При оценке мультиколлинеарности факторов следует учитывать, что  чем ближе к 0 определитель матрицы  межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии.

Для отбора наиболее значимых факторов xi учитываются следующие условия:

  • связь между результативным признаком и факторным должна быть выше межфакторной связи;
  • связь между факторами должна быть не более 0.7;
  • при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними.

Более объективную характеристику тесноты связи дают частные коэффициенты корреляции, измеряющие влияние на результат фактора xi при неизменном уровне других факторов.

3.4.1 Модель регрессии в стандартном масштабе

 

Модель регрессии в  стандартном масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты (стандартизованные значения) по формулам:

,              (37)

 

где хji - значение переменной хji в i-ом наблюдении.

 

         (38)

 

Таким образом, начало отсчета  каждой стандартизованной переменной совмещается с ее средним значением, а в качестве единицы изменения  принимается ее среднее квадратическое отклонение S.

Если связь между переменными  в естественном масштабе линейная, то изменение начала отсчета и единицы измерения этого свойства не нарушат, так что и стандартизованные переменные будут связаны линейным соотношением:

 

ty = ∑βjtxj               (39)

 

Для оценки β-коэффциентов применим МНК. При этом система нормальных уравнений будет иметь вид:

 

      rx1y1+rx1x2•β2 + ... + rx1xm•βm

rx2y=rx2x1•β1 + β2 + ... + rx2xm•βm

...

rxmy=rxmx1•β1 + rxmx2•β2 + ... + βm                  (40)

 

Для наших данных:

 

0.614277680995 = β1 + 0.245205802365β2

 

-0.587190954891 = 0.245205802365β1 + β2

 

Откуда находим:

β1 = 0.8067679474756;

β2 = -0.7850151367735;

Стандартизированная форма  уравнения регрессии имеет вид:

 

y0 = 0.807x1 -0.785x2                (41)

 

Найденные из данной системы  β–коэффициенты позволяют определить значения коэффициентов в регрессии в естественном масштабе по формулам:

 

         (42)

 

         (43)

3.5 Анализ параметров уравнения регрессии

 

Перейдем к статистическому  анализу полученного уравнения  регрессии: проверке значимости уравнения  и его коэффициентов, исследованию абсолютных и относительных ошибок аппроксимации.

Для несмещенной оценки дисперсии  проделаем следующие вычисления.

Несмещенная ошибка:

 

ε = Y - Y(x) = Y - X*s                      (44)

 

Таблица 14 – Таблица расчетов

Y

Y(x)

ε

(Y-Yср)2

1

1.21

-0.21

6.83

1

0.51

0.49

6.83

1

0.64

0.36

6.83

1

1.36

-0.36

6.83

1

0.43

0.57

6.83

1

0.82

<span class="Text_0020body__Ch



Информация о работе Измерение и прогнозирование в статистических исследованиях