Сравнительный анализ муниципальных образований Оренбургской области по набору показателей, характеризующих социальную напряженность

Автор работы: Пользователь скрыл имя, 16 Декабря 2013 в 00:55, курсовая работа

Описание работы

Цель. Провести сравнительный анализ муниципальных образований Оренбургской области по набору показателей, характеризующих социальную напряженность.
Объектом исследования являются муниципальные образования Оренбургской области.
Предметом исследования является состояние социальной напряженности, характеризующееся показателями:
x1 – коэффициент смертности (на 1000 человек);
x2 – коэффициент младенческой смертности (на 1000 человек);
x3 –смертность от инфаркта (на 1000 человек);
x4 –смертность от самоубийств (на 1000 человек);
x5 – смертность от убийств (на 1000 человек).

Содержание работы

Введение………………………………………………………………………..
1 Многомерная классификация муниципальных образований Оренбургской области методом кластерного анализа…………......
Теоретические основы кластерного анализа...…………….......................
1.2 Практическая реализация метода кластерного анализа……….
1.2.1 Классификация муниципальных образований Оренбургской области с помощью иерархических кластер - процедур……………………………...
1.2.2 Классификация муниципальных образований Оренбургской области с помощью итерационных кластер - процедур (методом -средних)……...
1.2.3 Сравнение классификаций………………………………………………
1.2.4 Содержательная интерпретация результатов классификации………..
2 Снижение размерности признакового пространства методом главных компонент………………………………………………………………………
2.1 Теоретические аспекты методом главных компонент ………………….
2.2 Практическая реализация метода главных компонент………………….
3 Многомерная классификация муниципальных образований по выделенным главным компонентам ………………………….......................
3.1 Классификация муниципальных образований по выделенным главным компонентам с помощью иерархических кластер - процедур …...
3.2 Классификация муниципальных образований по выделенным главным компонентам с помощью итерационных кластер - процедур (методом -средних)…………………………………………………………..
3.3Сравнение классификаций ………………………………………………...
3.4 Содержательная интерпретация результатов лучшей классификации...
Заключение……………………………………………………………………..
Список использованных источников……

Файлы: 1 файл

курсовая МСМ.doc

— 1.44 Мб (Скачать файл)

 

Объединения классов  методом Уорда

 

Вертикальная дендрограмма объединения классов методом Уорда представлена на рисунке 18.

  

 

Рисунок 18 – Дендрограмма объединения классов методом Уорда

 

           На         все объекты разделяются на 3 класса, состав которых приведен в таблице 8.

 

 

 

 

Таблица 8 – Объединение классов методом Уорда

 

Номер кластера

Кол-во объектов

Состав кластер

10

Города: Кувандык, Бугуруслан, Оренбург,

Районы: Светлинский, Новоорский, Матвеевский, Илекский, Кувандыкский, Переволоцкий, Александровский

17

Города: Сорочинск, Ясный, Соль-Илецк.

Районы: Тюльганский, Северный,  Беляевский,  Асекеевский, Ташлинский, Акбулакский, Тоцкий, Ясненский, Оренбургский, Красногвардейский, Соль-Илецкий, Сакмарский, Первомайский, Адамовский..

20

Города: Орск, Новотроицк, Бузулук, Абдулино, Гай, Медногорск.

Районы: Октябрьский, Грачевский, Бузулукский, Курманаевский, Бугурусланский, Саракташский, Шарлыкский, Кваркенский, Сорочинский, Пономаревский, Домбаровский, Гайский, Новосергиевский, Абдулинский.


 

Таблица 9 – Средние значения признаков в кластерах, полученных

методом Уорда

 

Номер кластера

Среднее значение смертности от отравления алкоголем

Среднее значение

смертности от самоубийств

Среднее значение

смертности от убийств

-0,10

0,47

015

0,02

-0,02

-0,03

-0,03

-0,13

-0,001


 

 

 

          Рисунок19 – График средних значений признаков в каждом кластере

 

Анализируя график средних значений в классах, можно сделать следующие выводы:

Первый класс  социальной напряженности Оренбургской области  характеризуется наибольшим средним значением младенческой смертности и наименьшим средним значением коэффициента смертности.

Объекты второго класса характеризуются наибольшим средним значением коэффициента смертности, но достаточно низким средним значением смертности от инфаркта.

Третий класс  социальной напряженности Оренбургской области  характеризуется высоким средним  значением смертности от инфаркта и низким средним значением младенческой смертности.

Протокол объединения кластеров методом «полных связей», график изменения между объединенными классами и матрица расстояний представлены в приложении B, рисунок 1,2 и 3.

 

 

 

 

 

 

 

 

3.2 Классификация муниципальных образований по выделенным главным компонентам с помощью итерационных кластер – процедур (метод -средних)

 

Метод К - средних позволяет получить более устойчивое разбиение, но требует задания некоторых начальных условий.

Далее рассчитываются значения о количестве объектов в кластерах, состав кластеров, а также евклидово расстояние от объектов до центра соответствующего класса показателей в каждом классе.

Классификация муниципальных  образований на три класса методом k-

средних представлена в таблице 10. Само разбиение представлено в Приложение B, рисунок 7.

 

Номер кластера

Кол-во объектов

Состав кластер

21

Города: Ясный, Сорочинск, Соль-Илецк, Оренбург

Районы: Адамовский, Акбулакский, Александровский, Асекеевский, Беляевский, Домбаровский, Красногвардейский, Кувандыкский, Оренбургский, Первомайский, Сакмарский, Северный, Соль-Илецкий, Ташлинский, Тоцкий, Тюльганский, Ясненский.

24

Города: Абдулино, Бугуруслан, Бузулук, Гай, Кувандык, Медногорск, Новотроицк, Орск.

Районы: Абдулинский, Бугурусланский, Бузулукский, Гайский, Грачевский, Илекский, Кваркенский, Курманаевский, Матвеевский, Новоорский, Новосергеевский, Пономаревский, Саракташский, Светлинский, Сорочинский, Шарлыкский.

1

Районы: Октябрьский.


 

Таблица 10 – Объединение классов методом к-средних

 

 

 

Рисунок 20 – Средние значения признаков в классах

 

 

Рисунок 21 – Расстояния между классами

 

Ниже главной диагонали указаны расстояния между классами, рассчитанные по метрике обычного евклидового расстояния, а выше главной диагонали – расстояния между классами, рассчитанные по метрике квадратичного евклидового расстояния. Как видно из рисунка 6 наименьшее расстояние наблюдается между первым и третьим классами.

График средних значений признаков в классах представлен  на рисунке 22.

 

 

Рисунок 22 – График средних значений признаков в каждом кластере

 

Данный график, благодаря  своей наглядности, оказывается  полезным при интерпретации результатов классификации, которая приведена в главе 3, пункт 3.4.

Расчеты описательных статистик для каждого кластера: среднего арифметического, оценку среднего квадратичного отклонения, несмещенную оценку дисперсии по каждому признаку. Результаты расчетов представлены на рисунке 23.

 

Рисунок 23 – Результаты расчета описательных статистик для каждого кластера

Результаты расчетов описательных статистик для каждого  кластера представлены в приложении В, рисунок 5.

 

3.3 Сравнение классификаций

 

С помощью метода «полных  связей», метода Уорда и метода k-средних были получены классификации С1,С2 соответственно. Для выбора лучшей классификации можно воспользоваться функционалами качества.

Рассчитаем функционал качества классификации, полученной методом Уорда.

 

 

 

Рисунок 24– Матрицы расстояний

 

Результаты расчетов суммы квадратов расстояний  указаны в приложении В, рисунок 6.

Тогда значение функционала  качества для классификации, полученной методом Уорда, рассчитывается следующим  образом:

Аналогичным образом  рассчитаем значение функционала качества для классификации, полученной методом  «полных связей»

Значение функционала  качества для классификации, полученной методом К-средних рассчитаем на основе таблиц представленных на рисунках 5,6.

         

По выбранному функционалу  качества наилучшей является классификация 

, полученная методом К-средних

 

3.4 Содержательная  интерпретация результатов классификации

 

Первый класс социальной напряженности Оренбургской области, преимущественно города – Ясный, Сорочинск, Соль-Илецк, Оренбург и районы - Адамовский Асекеевский, Акбулакский, Александровский, Беляевский, Домбаровский, Красногвардейский, Кувандыкский, Оренбургский, Первомайский, Сакмарский, Северный, Соль-Илецкий, Ташлинский, Тоцкий, Тюльганский, Ясненский. характеризуются наибольшими значениями среди всех остальных классов таких показателей как «Смертность от инфаркта», «Коэффициент младенческой смертности».

         Объекты второго класса, такие как, города:Абдулино, Бугуруслан, Бузулук, Гай, Кувандык, Медногорск, Новотроицк, Орск, районы: Абдулинский, Бугурусланский, Бузулукский, Гайский, Грачевский, Илекский, Кваркенский, Курманаевский, Матвеевский, Новоорский, Новосергеевский, Пономаревский, Саракташский, Светлинский, Сорочинский, Шарлыкский. характеризуются наибольшим средним значением среди отсальных классов такого показателя как «Коэффициент смертности» и самым низким значением показателя «Смертность от инфаркта».

        Третий класс объектов куда входит Октябрьский район характеризуется наибольшим средним значением такого показателя, как «Младенческая смертность». Что касается среднего значения «Коэффициента смертности» и «Смертности от инфаркта», то для района третьего класса оно значительно ниже, чем для объектов первого и второго класса.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заключение

Первый класс социальной напряженности Оренбургской области, преимущественно города : Медногорск, Новотроицк, Орск, а также районы: Абдулинский, Бугурусланский, Бузулукский, Гайский, Домбаровский, Кваркенский, Новосергиевский, Пономаревский, Саракташский, Сорочинский характеризуются наибольшими значениями среди всех остальных классов таких показателей как «младенческая смертность (Х2)», «Смертность от убийств (Х5)».

         Объекты второго класса, такие как, районы - города: Бугуруслан, Бузулук, Гай, Оренбург, Соль-Илецк, Сорочинск, Ясный; районы: Адамовский, Акбулакский, Александровский, Беляевский, Грачевский, Красногвардейский, Курманаевский, Октябрьский, Оренбургский, Первомайский, Переволоцкий, Сакмарский, Соль-Илецкий, Ташлинский, Тоцкий, Тюльганский, Шарлыкский характеризуются наибольшим средним значением среди отсальных классов такого показателя как «младенческая смертность (Х2)»и самым низким значением показателя «коэффициент смертности ( X1)».

        Третий класс объектов города: Абдулино,Кувандык, районы: Асекеевский, Илекский, Кувандыкский, Матвеевский, Новоорский, Светлинский, Северный, Ясненский характеризуется наибольшим средним значением такого показателя, как «младенческая смертность ( Х 2). Что касается среднего значения «смертности от самоубийств ( Х4 )», то для городов и районов третьего класса оно значительно ниже, чем для объектов первого и второго класса.

        По выбранному функционалу качества, наилучшей является классификация полученная методам k-средних.

С помощью метода главных  компонент мы снизили размерность  признакового пространства до трех главных компонент:

Первая главная компонента тесно связана (коэффициент корреляции >0,7) с двумя исходными признаками: Х4, Х5. Поэтому первую главную компоненту можно интерпретировать как «Уровень смертности». Вторая главная компонента тесно связана (коэффициент корреляции  >0,7) с двумя исходными признаками: Х1 и Х2. Вторую главную компоненту можно интерпретировать как «Смертность самоубийств». Третья главная компонента тесно связана (коэффициент корреляции >0,7) с двумя исходными признаками: Х3.  Ее можно интерпретировать как «Смертность от убийств»

 

По выделенным главным  компонентам, методом иерархических  кластер - процедур, выделили три  класса:

Первый класс социальной напряженности Оренбургской области, преимущественно города – Ясный, Сорочинск, Соль-Илецк, Оренбург и районы - Адамовский Асекеевский, Акбулакский, Александровский, Беляевский, Домбаровский, Красногвардейский, Кувандыкский, Оренбургский, Первомайский, Сакмарский, Северный, Соль-Илецкий, Ташлинский, Тоцкий, Тюльганский, Ясненский. характеризуются наибольшими значениями среди всех остальных классов таких показателей как «Смертность от инфаркта», «Коэффициент младенческой смертности».

         Объекты второго класса, такие как, города:Абдулино, Бугуруслан, Бузулук, Гай, Кувандык, Медногорск, Новотроицк, Орск, районы: Абдулинский, Бугурусланский, Бузулукский, Гайский, Грачевский, Илекский, Кваркенский, Курманаевский, Матвеевский, Новоорский, Новосергеевский, Пономаревский, Саракташский, Светлинский, Сорочинский, Шарлыкский. характеризуются наибольшим средним значением среди отсальных классов такого показателя как «Коэффициент смертности» и самым низким значением показателя «Смертность от инфаркта».

        Третий класс объектов куда входит Октябрьский район характеризуется наибольшим средним значением такого показателя, как «Младенческая смертность». Что касается среднего значения «Коэффициента смертности» и «Смертности от инфаркта», то для района третьего класса оно значительно ниже, чем для объектов первого и второго класса.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Список использованных источников

 

1. Архипова М.Ю., Скорик М.А., Растокин Е.В. Дискриминантный анализ в социально-эконом. исследованиях на основе ППП"SPSS".–Уч.пос.–М.:МЭСИ, 2004

Информация о работе Сравнительный анализ муниципальных образований Оренбургской области по набору показателей, характеризующих социальную напряженность