Модель множественной линейной регрессии, оценка ее параметров и качества

Автор работы: Пользователь скрыл имя, 10 Марта 2014 в 04:10, реферат

Описание работы

Современные социально-экономические процессы и явления зависят от большого количества факторов, их определяющих. В связи с этим квалифицированному специалисту необходимо не только иметь четкие представления об основных направлениях развития экономики, но и уметь учитывать сложное взаимосвязанное многообразие факторов, оказывающих существенное влияние на изучаемый процесс. Такие исследования невозможно проводить без знания основ теории вероятностей, математической статистики, многомерных статистических методов и эконометрики. Значение эконометрического анализа состоит в том, что он является связующим звеном между экономической теорией и практикой. Эконометрика дает методы экономических измерений, методы оценки параметров моделей микро- и макроэкономики.

Файлы: 1 файл

курсач стрельченко.docx

— 347.82 Кб (Скачать файл)

РЕФЕРАТ

 

Курсовая работа:  35 с., 7 рис., 25 источников, 6 табл., 6 прил.

 

ИНТЕРВАЛЬНЫЙ ПРОГНОЗ, МЕТОД НАИМЕНЬШИХ КВАДРАТОВ, МОДЕЛЬ МНОЖЕСТВЕННОЙ ЛИНЕЙНОЙ РЕГРЕССИИ, МУЛЬТИКОЛЛИНЕАРНОСТЬ, СРЕДНЯЯ ОШИБКА АППРОКСИМАЦИИ, СТАТИСТИКА ДАРБИНА-УОТСОНА, СТАТИСТИКА СТЬЮДЕНТА, СТАТИСТИКА ФИШЕРА, ТЕОРЕМА ГАУССА-МАРКОВА, ТОЧЕЧНЫЙ ПРОГНОЗ.

 

Объект исследования – объем валовой выручки ОАО «Нафтан».

Предмет исследования – эконометрическое моделирование при анализе структуры и прогнозировании валовой выручки.

Цель работы: построить модель множественной линейной регрессии для анализа структуры и прогнозирования валовой выручки, проверить ее качество и выполнение предпосылок Гаусса-Маркова, изучить структуру валовой выручки, построить точечный и интервальный прогноз на следующий период.

Актуальность выбранной темы обусловлена тем, что выручка является одним из основных результативных показателей предприятия и анализ  ее структуры и прогнозирование – важнейшие позиции планирования.

Методы исследования:  метод описания, систематизации, классификации, аналитический метод, метод сравнительного анализа, статистический, графический, метод сбора фактов, группировок, метод наименьших квадратов.

Автор работы подтверждает, что приведенный в курсовой работе расчётно-аналитический материал правильно и объективно отражает состояние исследуемого процесса, а все заимствованные из литературных и других источников теоретические, методические положения и концепции сопровождаются ссылками на их авторов.

 

 

 

______________________

 

 

 

 

 

THE ABSTRACT

 

Course work: 35 p., 7 fig., 25 sources, 6 tables, 6 adj.

 

AVEREGE ERROR OF APPROXIMATION, DURBIN-WATSON’S STATISTICS, FISHER’S STATISTICS, GAUSS-MARKOV THEOREMA, LEAST SQUARES METOD, MULTICOLLINEARITY,  MULTIPLE LINEAR PEGRESSION MODEL, POINT PREDICTION, PREDICTION INTERVAL, STUDENT’S STATISTICS.

 

Object of study - the amount of gross revenue of public corporation "Naftan".

Subject of the study - econometric modeling for analysis of structure and prediction the value of gross revenue.

Goals: To build a model of multiple linear regression for analizing the structure and predicting the value of gross revenue, check the quality and releasing the Gauss-Markov assumptions, examine the structure of the gross revenue, build point and interval prediction for the next period.

Relevance of the topic chosen due to the fact that revenue is the main outcome indicators of the enterprise and its structure analysis and forecasting - the most important position planning.

Methods: describing, organizing, classifying, analytical method, the method of comparative analysis, statistical, graphical, method of gathering facts groups, the method of least squares.

The author acknowledges that the work that resulted in the term paper settlement and analytical material correctly and objectively reflects the state of the process, and all borrowed from the literature and other sources of theoretical, methodological terms and concepts accompanied by references to their authors.

 

 

 

______________________

СОДЕРЖАНИЕ

 

ВВЕДЕНИЕ

 

Современные социально-экономические процессы и явления зависят от большого количества факторов, их определяющих. В связи с этим квалифицированному специалисту необходимо не только иметь четкие представления об основных направлениях развития экономики, но и уметь учитывать сложное взаимосвязанное многообразие факторов, оказывающих существенное влияние на изучаемый процесс. Такие исследования невозможно проводить без знания основ теории вероятностей, математической статистики, многомерных статистических методов и эконометрики. Значение эконометрического анализа состоит в том, что он является связующим звеном между экономической теорией и практикой. Эконометрика дает методы экономических измерений, методы оценки параметров моделей микро- и макроэкономики. В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса.

Для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи и не только выявить, но и дать им количественную оценку. Основным инструментом решения этой задачи является регрессионный анализ, который позволяет установить статистическую взаимосвязь между двумя или более рядами экономических данных.

Впоследствии полученные результаты могут использоваться в прогнозировании, для чего экономист-теоретик сопоставляет значения одной экономической переменной (зависимой переменной) со значениями одной или нескольких других экономических переменных (независимых переменных). Регрессионный анализ дает возможность установить характер зависимости, определяя коэффициенты соответствующих параметров. Одной из проблем эконометрики является достижение того, чтобы данные адекватно отражали исследуемую переменную величину. В данной работе выясняется с помощью модели множественной регрессии, какие факторы оказывают влияние на уровень валовой выручки ОАО «Нафтан».

1 Модель множественной линейной регрессии, оценка ее параметров и качества

 

Модель множественной регрессии является методом выявления аналитической формы связи между зависимым (или результативным) признаком и несколькими независимыми (или факторными) переменными. Ее построение целесообразно в том случае, если коэффициент множественной корреляции показал наличие связи между переменными.

Общий вид линейного уравнения множественной регрессии:

 

,

(1)


 

где y — значение зависимой переменной,

xi — значения i-ой независимых переменных i = ;

β0, …, βk — параметры уравнения регрессии, подлежащие оценке;

ε — случайные ошибки множественного уравнения регрессии.

На основе n наблюдений получают выборочное уравнение регрессии:

 

 

(2)


 

где – оценки параметров .

Модель нормальной линейной множественной регрессии

строится исходя из следующих предпосылок:

1) величины xi являются неслучайными и независимыми переменными;

2) математическое ожидание  случайной ошибки уравнения регрессии  равно нулю во всех наблюдениях: М(ε) = 0;

3) дисперсия случайной  ошибки уравнения регрессии является  постоянной для всех наблюдений: D(ε) = М2(ε) = const;

4) случайные ошибки уравнения  регрессии не коррелированы между собой, т. е. ковариация случайных ошибок любых двух разных наблюдений равна нулю: Cov(ει ,εj ) = E(ει εj ) = 0. Это предположение верно в том случае, если изучаемые данные не являются временными рядами;

5) основываясь на 3 и 4 предположениях, добавляется условие о том, что  случайная ошибка уравнения регрессии  является случайной величиной, подчиняющейся  нормальному закону распределения  с нулевым математическим ожиданием. [1, c. 50]

Задачи регрессионного анализа:

Основная задача регрессионного анализа заключается в нахождении по выборке объемом n оценки неизвестных коэффициентов регрессии b0, b1,..., bk. Задачи регрессионного анализа состоят в том, чтобы по имеющимся статистическим данным для переменных хi и у:

  • получить наилучшие оценки неизвестных параметров b0, b1,..., bk;
  • проверить статистические гипотезы о параметрах модели;
  • проверить, достаточно ли хорошо модель согласуется со статистическими данными (адекватность модели данным наблюдений).

Построение моделей множественной регрессии состоит из следующих этапов:

1) выбор формы связи (уравнения  регрессии);

2) определение параметров  выбранного уравнения;

3) анализ качества уравнения  и поверка адекватности уравнения  эмпирическим данным, совершенствование  уравнения.

Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Он включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии. Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:

1) Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.

2) Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.

Включение в модель факторов с высокой интеркорреляцией, может привести к нежелательным последствиям  – система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми. [2, c. 40]

Коэффициенты интеркорреляции (т.е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если . Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга. [3]

Включение в модель мультиколлинеарных факторов нежелательно по следующим причинам:

• затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл;

• оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.

 

det R = .

(3)


 

Если факторы не коррелируют между собой, то матрица парных коэффициентов корреляции между ними единичная, поскольку все недиагональные элементы были бы равны нулю.

Если же между факторами существует полная линейная зависимость и все коэффициенты корреляции равны единице, то определитель такой матрицы равен нулю.

Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и надежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.[4]

При отборе факторов также рекомендуется пользоваться следующим правилом: число включаемых факторов обычно в 6–7 раз меньше объема совокупности, по которой строится регрессия. Если это соотношение нарушено, то число степеней свободы остаточной дисперсии очень мало. Это приводит к тому, что параметры уравнения регрессии оказываются статистически незначимыми, а -критерий меньше табличного значения.

Оценка параметров множественной линейной регрессии производится с помощью метода наименьших квадратов.

МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака от расчетных минимальна:

 

.

(4)


 

Как известно из курса математического анализа, для того чтобы найти экстремум функции нескольких переменных, надо вычислить частные производные первого порядка по каждому из параметров и приравнять их к нулю.

Имеем функцию k + 1 аргумента:

 

.

(5)


 

Находим частные производные первого порядка:

 

 

(6)


 

После элементарных преобразований приходим к системе линейных нормальных уравнений для нахождения параметров линейного уравнения множественной регрессии [5, c. 148]:

 

 

(7)


 

При этом параметр характеризует на сколько в среднем изменится у при изменении xi на единицу.

Пусть по выборочным данным получены оценки коэффициентов регрессии  bi. В качестве критерия проверки гипотезы об их значимости принимаются случайные величины:

 

= ,

(8)


 

где – стандартные ошибки коэффициентов регрессии.

Эти величины имеют распределение Стьюдента с n и n-k-1 степенями свободы. Здесь n – число переменных в выборке, использованных для получения уравнения регрессии, k – число параметров регрессии.

Информация о работе Модель множественной линейной регрессии, оценка ее параметров и качества