Многомерный анализ зависимости заболеваемости населения РФ от ряда факторов

Автор работы: Пользователь скрыл имя, 02 Мая 2014 в 10:21, курсовая работа

Описание работы

Задачей данной работы является исследование зависимости заболеваемости населения РФ от ряда переменных, которые характеризуют социально-экономическое состояние страны за период с 1995 по 2010 год включительно.
В данной работе используется модель множественной линейной регрессии:
Y – заболеваемость населения, тысяч человек.
Х1 – число больничных учреждений, тысяч.
X2 – численность врачей на 10 000 человек населения.
Х3 – выбросы загрязняющих веществ в атмосферный воздух от автотранспорта, млн. тонн.
Х4 – дефицит денежного дохода малоимущего населения, млн. руб.
X5 – расходы на выплату пособий и социальную помощь, млн. руб.

Содержание работы

1. Постановка задачи 3
2. Модель множественной линейной регрессии 5
2. 1. Задачи множественного корреляционно-регрессионного анализа 5
2. 2. Анализ уравнения множественной линейной регрессии 6
2. 3. Коллинеарность и мультиколлинеарность 7
3. Решение задачи 8
4. Выводы 15
5. Список использованной литературы 17

Файлы: 1 файл

многомерный анализ.doc

— 395.00 Кб (Скачать файл)

 

ryx = 0.94902710 – коэффициент корреляции

Значение коэффициента корреляции свидетельствует о сильной и тесной взаимосвязи между величиной заболеваний населения и социально-экономическими факторами.

R2 = 0.90065245 – коэффициент детерминации

Значение коэффициента детерминации указывает на то, что 90% доли общей дисперсии объясняется полученным уравнением ММЛР, а оставшийся 10% приходятся за счет воздействия случайных (неучтенных) факторов, следовательно, данное уравнение высокого качества.

Скорректированный коэффициент детерминации = 0.85097867

F (5, 10) = 18.131 – F-критерий Фишера

ŷ = 100081.2698 – 613.2973*Х1 + 127.6666*X2 – 196.2801*X3 + 0.0389*X4 – 0.0016*X5

Данная модель полностью незначима, так как уровень значимости константы и всех переменных превышает 0.05, следовательно, для дальнейшего анализа её использовать нецелесообразно. Также на незначимость модели указывает то, что с точки зрения постановки задачи знак «–» при Х3 ошибочный. Так как рост выбросов загрязняющих веществ в атмосферный воздух от автотранспорта отрицательно сказывается на здоровье населения, а значит, приводит к повышению числа заболеваний. Загрязнение воздуха представляет серьезную угрозу здоровью населения, способствует снижению качества жизни, а не наоборот. При переменной X2 с точки зрения постановки задачи знак «+» поставлен неправильно. Ясно то, что уменьшение численности врачей на 10 000 человек населения ведет к увеличению нагрузки и, в конечном итоге, к снижению качества медицинской помощи. Следовательно, снижение качества медицинской помощи неминуемо приведет к возрастанию уровня заболеваемости.

Таблица №4

Однофакторная модель с самым информативным показателем X4

 

Параметры уравнения

Стандартная ошибка

t–критерий Стьюдента

Уровень значимости

Константа

96117.7495

961.3969

99.97717

0.000000

Переменная Х4

0.0436

0.0040

10.77113

0.000000


 

ryx = 0.94462799 – коэффициент корреляции

R2 = 0.89232203 – коэффициент детерминации

Скорректированный коэффициент детерминации = 0.88463075

F (1, 14) = 116.02 – F-критерий Фишера

ŷ = 96117.7495 + 0.0436*Х4

Данная модель является полностью значимой (уровень значимости не превышает 0.05), а полученные коэффициенты корреляции и детерминации достаточно высокие. Полученное уравнение регрессии значимо и его следует использовать для дальнейшего экономического анализа и прогнозирования.

 Однако, для получения более точных прогнозов и результатов исследования необходимо рассмотреть все двухфакторные модели, поочередно подсоединяя в модель с самым информативным показателем другие факторные признаки.

Таблица №5

Двухфакторная модель yx1x4

 

Параметры уравнения

Стандартная ошибка

t–критерий Стьюдента

Уровень значимости

Константа

101532.643

5860.827

17.32394

0.000000

Х1

-421.573

450.055

-0.93671

0.365982

Х4

0.037

0.008

4.49833

0.000599


 

ryx = 0.94822478 – коэффициент корреляции

Значение коэффициента корреляции свидетельствует о тесной взаимосвязи между величиной заболеваний и величиной дефицита денежного дохода малоимущего населения (млн. руб.), а также числом больничных учреждений.

R2 = 0.89913023 – коэффициент детерминации

Скорректированный коэффициент детерминации = 0.88361180

F (2, 13) = 57.940 – F-критерий Фишера

ŷ = 101532.643 – 421.573*Х1 + 0.037*Х4

Данная модель является частично незначимой, так как переменная Х1 является незначимой (уровень значимости 0.365982>0.05), а константа и переменная Х4 – значимые (соответствуют уровню значимости <0.05). Поэтому для дальнейшего исследования ситуации, связанной с заболеваемостью, использование этой модели считается нецелесообразным.

 

Таблица №6

Двухфакторная модель yx2x4

 

Параметры уравнения

Стандартная ошибка

t–критерий Стьюдента

Уровень значимости

Константа

73595.478

29234.649

2.517406

0.025730

Х2

499.534

648.050

0.770826

0.454592

Х4

0.037

0.009

4.115532

0.001217


 

ryx = 0.94711584 – коэффициент корреляции

R2 = 0.89702841 – коэффициент детерминации

Скорректированный коэффициент детерминации = 0.88118662

F (2, 13) = 56.624 – F-критерий Фишера

ŷ = 73595.478 + 499.534*Х2 + 0.037*Х4

Значение коэффициента корреляции ryx = 0.94711584 свидетельствует о тесной взаимосвязи между величиной заболеваний и величиной дефицита денежного дохода малоимущего населения (млн. руб.), а также численностью врачей на 10 000 человек населения.

Данная модель является частично значимой – значима по X4, незначима по X2 (уровень значимости 0.454592>0.05). При переменной X2 с точки зрения постановки задачи знак «+» поставлен неправильно. Очевидно то, что уменьшение численности врачей на 10 000 человек населения ведет к возрастанию уровня заболеваемости. Поэтому использование данной модели для дальнейшего анализа нецелесообразно.

Таблица №7

Двухфакторная модель yx3x4

 

Параметры уравнения

Стандартная ошибка

t–критерий Стьюдента

Уровень значимости

Константа

97249.404

5692.108

17.08495

0.000000

Х3

-96.378

477.291

-0.20193

0.843099

Х4

0.044

0.006

7.48082

0.000005


ryx = 0.94480617 – коэффициент корреляции

R2 = 0.89265871 – коэффициент детерминации

Скорректированный коэффициент детерминации = 0.87614466

F (2, 13) = 54.055 – F-критерий Фишера

ŷ = 97249.404 – 96.378*Х3 + 0.044*Х4

Значение коэффициента корреляции ryx = 0.94480617 свидетельствует о тесной взаимосвязи между величиной заболеваний и величиной дефицита денежного дохода малоимущего населения (млн. руб.), а также величиной выбросов загрязняющих веществ в атмосферный воздух от автотранспорта (млн. тонн). Наличие отрицательного знака при переменной Х3 необоснованно, так как при снижении величины выбросов загрязняющих веществ в атмосферный воздух от автотранспорта сокращается заболеваемость населения, а не наоборот.

Данная модель является частично значимой – значима по X4, незначима по X3 (уровень значимости превышает 0.05). Поэтому использование данной модели для дальнейшего анализа нецелесообразно.

Таблица №8

Двухфакторная модель yx4x5

 

Параметры уравнения

Стандартная ошибка

t–критерий Стьюдента

Уровень значимости

Константа

96321.42186

1097.03948

87.80124

0.000000

Х4

0.04145

0.00651

6.36281

0.000025

Х5

0.00070

0.00163

0.43207

0.672770


 

ryx = 0.94543453 – коэффициент корреляции

R2 = 0.89384644 – коэффициент детерминации

Скорректированный коэффициент детерминации = 0.87751513

F (2, 13) = 54.732 – F-критерий Фишера

ŷ = 96321.42186 + 0.04145*Х4 + 0.00070*Х5

Значение коэффициента корреляции ryx = 0.94543453 свидетельствует о тесной взаимосвязи между величиной заболеваний и величиной дефицита денежного дохода малоимущего населения (млн. руб.), а также расходами на выплату пособий и социальную помощь (млн. руб.).

Данная модель является частично значимой – значима по X4, незначима по X5 (уровень значимости 0.672770>0.05). Следовательно, для дальнейшего исследования ситуации, связанной с заболеваемостью, ее использование считается нецелесообразным.

Все полученные двухфакторные модели незначимы и неадекватны, поэтому не могут использоваться для дальнейшего анализа. Следует использовать однофакторную модель ŷ(Х4).

Метод пошаговой регрессии

Forward stepwise – метод последовательно включения переменных.

Таблица №9

Результаты модели, полученной с помощью метода пошаговой регрессии

 

Параметры уравнения

Стандартная ошибка

t–критерий Стьюдента

Уровень значимости

Константа

96117.7495

961.3969

99.97717

0.000000

Переменная Х4

0.0436

0.0040

10.77113

0.000000


 

ryx = 0.94462799 – коэффициент корреляции

R2 = 0.89232203 – коэффициент детерминации

Скорректированный коэффициент детерминации = 0.88463075

F (1, 14) = 116.02 – F-критерий Фишера

ŷ = 96117.7495 + 0.0436*Х4

Метод пошаговой регрессии  на последовательное исключение (Backward stepwise) дал такой же вариант регрессионной модели, что и метод последовательно включения переменных.

Модель пошаговой регрессии тождественна той, что получена в ходе исследования, что доказывает ее значимость и адекватность. Она может использоваться для дальнейшего экономического анализа.

 

4. Выводы

Целью данной курсовой работы было выявление зависимости заболеваемости населения РФ от ряда переменных, которые характеризуют социально-экономическое состояние страны за период с 1995 по 2010 год.

В результате исследования был получен вариант регрессионной модели такой же, как и при эмпирическом способе последовательного включения и исключения переменных.

Полученное уравнение регрессии: ŷ = 96117.7495 + 0.0436*Х4

Данная модель множественной линейной регрессии является адекватной и полностью значимой, т.к. уровни значимости константы и переменной Х4 не превышают 0.05. Высокий коэффициент  детерминации, равный 0.89232203, свидетельствует о том, что 90% доли общей дисперсии объясняется полученным уравнением ММЛР (дефицит денежного дохода малоимущего населения влияет на 90%), а оставшийся 10% приходятся за счет воздействия случайных (неучтенных) факторов, следовательно, данное уравнение высокого качества. Таким образом, она целесообразна для дальнейшего экономического использования.

Но в связи с тем, что почти все коэффициенты в корреляционной матрице больше 0.7, нельзя говорить о надежности результатов множественной регрессии. Так как здесь присутствует сильная мультиколлинеарность факторов.

Вследствие этого можно сделать вывод, что заболеваемость населения нашей страны зависит практически от всех рассматриваемых факторов. Но при этом выделяется один существенный фактор – дефицит денежного дохода малоимущего населения. Нехватка денег приводит к  опасным болезням, способным значительно ухудшить качество жизни любого человека. Заболеваемость населения – это один из основных индикаторов качества жизни населения.

Повышение качества жизни граждан объявлено ключевым вопросом государственной политики России. Приоритетный национальный проект «Здоровье» включает основные направления:

  • Укрепление здоровья населения России, снижение уровня заболеваемости, инвалидности, смертности;
  • Повышение доступности и качества медицинской помощи;
  • Удовлетворение потребности населения в высокотехнологичных видах медицинской помощи.

Информация о работе Многомерный анализ зависимости заболеваемости населения РФ от ряда факторов