Автор работы: Пользователь скрыл имя, 02 Мая 2014 в 10:21, курсовая работа
Задачей данной работы является исследование зависимости заболеваемости населения РФ от ряда переменных, которые характеризуют социально-экономическое состояние страны за период с 1995 по 2010 год включительно.
В данной работе используется модель множественной линейной регрессии:
Y – заболеваемость населения, тысяч человек.
Х1 – число больничных учреждений, тысяч.
X2 – численность врачей на 10 000 человек населения.
Х3 – выбросы загрязняющих веществ в атмосферный воздух от автотранспорта, млн. тонн.
Х4 – дефицит денежного дохода малоимущего населения, млн. руб.
X5 – расходы на выплату пособий и социальную помощь, млн. руб.
1. Постановка задачи 3
2. Модель множественной линейной регрессии 5
2. 1. Задачи множественного корреляционно-регрессионного анализа 5
2. 2. Анализ уравнения множественной линейной регрессии 6
2. 3. Коллинеарность и мультиколлинеарность 7
3. Решение задачи 8
4. Выводы 15
5. Список использованной литературы 17
ryx = 0.94902710 – коэффициент корреляции
Значение коэффициента корреляции свидетельствует о сильной и тесной взаимосвязи между величиной заболеваний населения и социально-экономическими факторами.
R2 = 0.90065245 – коэффициент детерминации
Значение коэффициента детерминации указывает на то, что 90% доли общей дисперсии объясняется полученным уравнением ММЛР, а оставшийся 10% приходятся за счет воздействия случайных (неучтенных) факторов, следовательно, данное уравнение высокого качества.
Скорректированный коэффициент детерминации = 0.85097867
F (5, 10) = 18.131 – F-критерий Фишера
ŷ = 100081.2698 – 613.2973*Х1 + 127.6666*X2 – 196.2801*X3 + 0.0389*X4 – 0.0016*X5
Данная модель полностью незначима, так как уровень значимости константы и всех переменных превышает 0.05, следовательно, для дальнейшего анализа её использовать нецелесообразно. Также на незначимость модели указывает то, что с точки зрения постановки задачи знак «–» при Х3 ошибочный. Так как рост выбросов загрязняющих веществ в атмосферный воздух от автотранспорта отрицательно сказывается на здоровье населения, а значит, приводит к повышению числа заболеваний. Загрязнение воздуха представляет серьезную угрозу здоровью населения, способствует снижению качества жизни, а не наоборот. При переменной X2 с точки зрения постановки задачи знак «+» поставлен неправильно. Ясно то, что уменьшение численности врачей на 10 000 человек населения ведет к увеличению нагрузки и, в конечном итоге, к снижению качества медицинской помощи. Следовательно, снижение качества медицинской помощи неминуемо приведет к возрастанию уровня заболеваемости.
Таблица №4
Однофакторная модель с самым информативным показателем X4
Параметры уравнения |
Стандартная ошибка |
t–критерий Стьюдента |
Уровень значимости | |
Константа |
96117.7495 |
961.3969 |
99.97717 |
0.000000 |
Переменная Х4 |
0.0436 |
0.0040 |
10.77113 |
0.000000 |
ryx = 0.94462799 – коэффициент корреляции
R2 = 0.89232203 – коэффициент детерминации
Скорректированный коэффициент детерминации = 0.88463075
F (1, 14) = 116.02 – F-критерий Фишера
ŷ = 96117.7495 + 0.0436*Х4
Данная модель является полностью значимой (уровень значимости не превышает 0.05), а полученные коэффициенты корреляции и детерминации достаточно высокие. Полученное уравнение регрессии значимо и его следует использовать для дальнейшего экономического анализа и прогнозирования.
Однако, для получения более точных прогнозов и результатов исследования необходимо рассмотреть все двухфакторные модели, поочередно подсоединяя в модель с самым информативным показателем другие факторные признаки.
Таблица №5
Двухфакторная модель yx1x4
Параметры уравнения |
Стандартная ошибка |
t–критерий Стьюдента |
Уровень значимости | |
Константа |
101532.643 |
5860.827 |
17.32394 |
0.000000 |
Х1 |
-421.573 |
450.055 |
-0.93671 |
0.365982 |
Х4 |
0.037 |
0.008 |
4.49833 |
0.000599 |
ryx = 0.94822478 – коэффициент корреляции
Значение коэффициента корреляции свидетельствует о тесной взаимосвязи между величиной заболеваний и величиной дефицита денежного дохода малоимущего населения (млн. руб.), а также числом больничных учреждений.
R2 = 0.89913023 – коэффициент детерминации
Скорректированный коэффициент детерминации = 0.88361180
F (2, 13) = 57.940 – F-критерий Фишера
ŷ = 101532.643 – 421.573*Х1 + 0.037*Х4
Данная модель является частично незначимой, так как переменная Х1 является незначимой (уровень значимости 0.365982>0.05), а константа и переменная Х4 – значимые (соответствуют уровню значимости <0.05). Поэтому для дальнейшего исследования ситуации, связанной с заболеваемостью, использование этой модели считается нецелесообразным.
Таблица №6
Двухфакторная модель yx2x4
Параметры уравнения |
Стандартная ошибка |
t–критерий Стьюдента |
Уровень значимости | ||||
Константа |
73595.478 |
29234.649 |
2.517406 |
0.025730 | |||
Х2 |
499.534 |
648.050 |
0.770826 |
0.454592 | |||
Х4 |
0.037 |
0.009 |
4.115532 |
0.001217 |
ryx = 0.94711584 – коэффициент корреляции
R2 = 0.89702841 – коэффициент детерминации
Скорректированный коэффициент детерминации = 0.88118662
F (2, 13) = 56.624 – F-критерий Фишера
ŷ = 73595.478 + 499.534*Х2 + 0.037*Х4
Значение коэффициента корреляции ryx = 0.94711584 свидетельствует о тесной взаимосвязи между величиной заболеваний и величиной дефицита денежного дохода малоимущего населения (млн. руб.), а также численностью врачей на 10 000 человек населения.
Данная модель является частично значимой – значима по X4, незначима по X2 (уровень значимости 0.454592>0.05). При переменной X2 с точки зрения постановки задачи знак «+» поставлен неправильно. Очевидно то, что уменьшение численности врачей на 10 000 человек населения ведет к возрастанию уровня заболеваемости. Поэтому использование данной модели для дальнейшего анализа нецелесообразно.
Таблица №7
Двухфакторная модель yx3x4
Параметры уравнения |
Стандартная ошибка |
t–критерий Стьюдента |
Уровень значимости | |
Константа |
97249.404 |
5692.108 |
17.08495 |
0.000000 |
Х3 |
-96.378 |
477.291 |
-0.20193 |
0.843099 |
Х4 |
0.044 |
0.006 |
7.48082 |
0.000005 |
ryx = 0.94480617 – коэффициент корреляции
R2 = 0.89265871 – коэффициент детерминации
Скорректированный коэффициент детерминации = 0.87614466
F (2, 13) = 54.055 – F-критерий Фишера
ŷ = 97249.404 – 96.378*Х3 + 0.044*Х4
Значение коэффициента корреляции ryx = 0.94480617 свидетельствует о тесной взаимосвязи между величиной заболеваний и величиной дефицита денежного дохода малоимущего населения (млн. руб.), а также величиной выбросов загрязняющих веществ в атмосферный воздух от автотранспорта (млн. тонн). Наличие отрицательного знака при переменной Х3 необоснованно, так как при снижении величины выбросов загрязняющих веществ в атмосферный воздух от автотранспорта сокращается заболеваемость населения, а не наоборот.
Данная модель является частично значимой – значима по X4, незначима по X3 (уровень значимости превышает 0.05). Поэтому использование данной модели для дальнейшего анализа нецелесообразно.
Таблица №8
Двухфакторная модель yx4x5
Параметры уравнения |
Стандартная ошибка |
t–критерий Стьюдента |
Уровень значимости | |
Константа |
96321.42186 |
1097.03948 |
87.80124 |
0.000000 |
Х4 |
0.04145 |
0.00651 |
6.36281 |
0.000025 |
Х5 |
0.00070 |
0.00163 |
0.43207 |
0.672770 |
ryx = 0.94543453 – коэффициент корреляции
R2 = 0.89384644 – коэффициент детерминации
Скорректированный коэффициент детерминации = 0.87751513
F (2, 13) = 54.732 – F-критерий Фишера
ŷ = 96321.42186 + 0.04145*Х4 + 0.00070*Х5
Значение коэффициента корреляции ryx = 0.94543453 свидетельствует о тесной взаимосвязи между величиной заболеваний и величиной дефицита денежного дохода малоимущего населения (млн. руб.), а также расходами на выплату пособий и социальную помощь (млн. руб.).
Данная модель является частично значимой – значима по X4, незначима по X5 (уровень значимости 0.672770>0.05). Следовательно, для дальнейшего исследования ситуации, связанной с заболеваемостью, ее использование считается нецелесообразным.
Все полученные двухфакторные модели незначимы и неадекватны, поэтому не могут использоваться для дальнейшего анализа. Следует использовать однофакторную модель ŷ(Х4).
Метод пошаговой регрессии
Forward stepwise – метод последовательно включения переменных.
Таблица №9
Результаты модели, полученной с помощью метода пошаговой регрессии
Параметры уравнения |
Стандартная ошибка |
t–критерий Стьюдента |
Уровень значимости | |
Константа |
96117.7495 |
961.3969 |
99.97717 |
0.000000 |
Переменная Х4 |
0.0436 |
0.0040 |
10.77113 |
0.000000 |
ryx = 0.94462799 – коэффициент корреляции
R2 = 0.89232203 – коэффициент детерминации
Скорректированный коэффициент детерминации = 0.88463075
F (1, 14) = 116.02 – F-критерий Фишера
ŷ = 96117.7495 + 0.0436*Х4
Метод пошаговой регрессии на последовательное исключение (Backward stepwise) дал такой же вариант регрессионной модели, что и метод последовательно включения переменных.
Модель пошаговой регрессии тождественна той, что получена в ходе исследования, что доказывает ее значимость и адекватность. Она может использоваться для дальнейшего экономического анализа.
Целью данной курсовой работы было выявление зависимости заболеваемости населения РФ от ряда переменных, которые характеризуют социально-экономическое состояние страны за период с 1995 по 2010 год.
В результате исследования был получен вариант регрессионной модели такой же, как и при эмпирическом способе последовательного включения и исключения переменных.
Полученное уравнение регрессии: ŷ = 96117.7495 + 0.0436*Х4
Данная модель множественной линейной регрессии является адекватной и полностью значимой, т.к. уровни значимости константы и переменной Х4 не превышают 0.05. Высокий коэффициент детерминации, равный 0.89232203, свидетельствует о том, что 90% доли общей дисперсии объясняется полученным уравнением ММЛР (дефицит денежного дохода малоимущего населения влияет на 90%), а оставшийся 10% приходятся за счет воздействия случайных (неучтенных) факторов, следовательно, данное уравнение высокого качества. Таким образом, она целесообразна для дальнейшего экономического использования.
Но в связи с тем, что почти все коэффициенты в корреляционной матрице больше 0.7, нельзя говорить о надежности результатов множественной регрессии. Так как здесь присутствует сильная мультиколлинеарность факторов.
Вследствие этого можно сделать вывод, что заболеваемость населения нашей страны зависит практически от всех рассматриваемых факторов. Но при этом выделяется один существенный фактор – дефицит денежного дохода малоимущего населения. Нехватка денег приводит к опасным болезням, способным значительно ухудшить качество жизни любого человека. Заболеваемость населения – это один из основных индикаторов качества жизни населения.
Повышение качества жизни граждан объявлено ключевым вопросом государственной политики России. Приоритетный национальный проект «Здоровье» включает основные направления:
Информация о работе Многомерный анализ зависимости заболеваемости населения РФ от ряда факторов