Автор работы: Пользователь скрыл имя, 21 Марта 2013 в 20:35, курсовая работа
Исследование объективно существующих связей между социально-экономическими явлениями и процессами является важнейшей задачей теории статистики. В процессе статистического исследования зависимостей вскрываются причинно-следственные отношения между явлениями, что позволяет выявлять факторы (признаки), оказывающие основное влияние на вариацию изучаемых процессов и явлений. Причинно-следственные отношения – это такая связь явлений и процессов, когда изменение одного из них – причины ведет к изменению другого – следствия.
Введение………………………………………………………….….….стр.3
1.Общие сведения о корреляционном и регрессионном анализе……стр.4
1.1.Понятие парной регрессии……………………………………..стр.
1.2.Понятие множественной регрессии...……………………........…стр.
1.3. Виды коэффициентов корреляции………………………….…стр.
2.Анализ статистических показателей……………………………...стр.
3. Список литературы…………………………………………….…..стр.
Статистический анализ связей макроэкономических показателей с интенсивностью туристских потоков.
ОГЛАВЛЕНИЕ
Введение…………………………………………………………
1.Общие сведения о корреляционном и регрессионном анализе……стр.4
1.1.Понятие парной регрессии……………………………………..стр.
1.2.Понятие множественной регрессии...……………………........…
1.3. Виды коэффициентов корреляции………………………….…стр.
2.Анализ статистических показателей……………………………...стр.
3.
Список литературы…………………………………………….….
Введение
Исследование объективно существующих
связей между социально-экономическими
явлениями и процессами является
важнейшей задачей теории статистики.
В процессе статистического исследования
зависимостей вскрываются причинно-
Целью данной курсовой работы является статистический анализ связей макроэкономических показателей с интенсивностью туристских потоков.
В качестве исходных данных используются: уровень инфляции, %, объем промышленного производства, млрд.руб., располагаемый доход, млн. руб., потребительские расходы, млн. руб., количество туристов, выехавших за рубеж, тыс. чел.
Для проведения
- рассмотреть различные виды коэффициентов корреляции;
- рассчитать линейные
- оценить наличие, направление
и тесноту связи между
- выбрать 2-3 наиболее информативных макроэкономических показателя (по величине модуля коэффициента корреляции);
- построить уравнение регрессии
между отобранными
- проанализировать полученные
таблицы дисперсионного
1. Общие сведения о корреляционном и регрессионном анализе.
В статистике принято различать следующие виды зависимостей:
Корреляционный анализ имеет своей задачей количественное определение тесноты и направления связи между двумя признаками (при парной связи) и между результативным и множеством факторных признаков (при многофакторной связи).
Теснота связи количественно выражается величиной коэффициентов корреляции, которые, давая количественную характеристику тесноты связи между признаками, позволяют определять «полезность» факторных признаков при построении уравнения множественной регрессии. Знаки при коэффициентах корреляции характеризуют направление связи между признаками.
Регрессия тесно связана
с корреляцией и позволяет
исследовать аналитическое
Регрессионный анализ заключается в определении аналитического выражения связи, в котором изменение одной величины (называемой зависимой или результативным признаком), обусловлено влиянием одной или нескольких независимых величин (факторных признаков).
Одной из проблем построения уравнений регрессии является их размерность, то есть определение числа факторных признаков, включаемых в модель. Их число должно быть оптимальным. Сокращение размерности за счет исключения второстепенных, несущественных факторов позволяет получить модель, быстрее и качественнее реализуемую. В то же время, построение модели малой размерности может привести к тому, что она будет недостаточно полно описывать исследуемое явление или процесс.
При построении моделей регрессии
должны соблюдаться следующие
7. Постоянство
территориальной и временной структуры
изучаемой совокупности.
Соблюдение данных требований позволяет
построить модель, наилучшим образом
описывающую реальные социально-экономические явления и процессы.
1.1. Парная регрессия на основе метода наименьших квадратов.
Парная регрессия позволяет получить аналитическое выражение связи между двумя признаками: результативным и факторным.
Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной
связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.
Оценка параметров уравнений регрессии (а0, а1, и а2 - в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели (а0, а1), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
где п - объем исследуемой совокупности (число единиц наблюдения).
В уравнениях регрессии параметр ао показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков. Коэффициент регрессии а1 показывает, на сколько в среднем изменяется значение результативного признака при увеличении факторного признака на единицу собственного измерения.1
1.2.Множественная (многофакторная) регрессия.
Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии:
Построение моделей
множественной регрессии
Выбор типа уравнения затрудняется
тем, что для любой формы
Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков.
С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. Однако модель размерностью 100 и более факторных признаков сложно реализуема и требует больших затрат машинного времени. Сокращение размерности модели за счет исключения второстепенных, экономически и статистически несущественных факторов способствует простоте и качеству ее реализации.
_
1.Р.А. Шмойлова практикум по теории статистики. – М. Финансы и статистика, 2003. – С. 191
В то же время построение модели регрессии малой размерности может привести к тому, что такая модель будет недостаточно адекватна исследуемым явлениям и процессам.
Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена на основе интуитивно-логических или многомерных математико-статистических методов анализа.
Наиболее приемлемым способом отбора факторных признаков является шаговая регрессия (шаговый регрессионный анализ). Сущность метода шаговой регрессии заключается в реализации алгоритмов последовательного «включения», «исключения» или «включения-исключения» факторов в уравнение регрессии и последующей проверке их статистической значимости. Алгоритм «включения» заключается в том, что факторы поочередно вводятся в уравнение так называемым «прямым методом». При проверке значимости введенного фактора определяется, насколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции (R2). Одновременно используется и алгоритм последовательного «исключения», сущность которого заключается в том, что исключаются факторы, ставшие незначимыми по статистическим критериям.
Фактор является незначимым, если его включение в уравнение регрессии только изменяет значения коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициента регрессии не изменяется (или меняется несущественно), то данный признак существенен и его включение в уравнение регрессии необходимо. В противном случае, фактор нецелесообразно включать в модель регрессии.
При построении модели регрессии возможна проблема мультиколлинеарности, иол которой понимается тесная зависимость между факторными признаками, включенными в модель (rхij > 0,8).
Наличие мультиколлинеарности между признаками вызывает:
В качестве причин возникновения мультиколлинеарности между признаками можно выделить следующие:
Устранение
Вопрос о том, какой из факторов следует отбросить, решается на основании качественного, логического анализа изучаемого явления, а также на основе анализа тесноты связи между результативным (у) с каждым из сильно коллинеарно связанных факторных признаков. Из дальнейшего анализа целесообразно исключить тот факторный признак, связь которого с результативным наименьшая.
Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности. Исследователь должен стремиться к увеличению числа наблюдений, так как большой объем наблюдений является одной из предпосылок построения адекватных статистических моделей.
Аналитическая форма связи результативного признака от нескольких факторных выражается и называется многофакторным (множественным) уравнением регрессии или моделью связи.