Сравнительный анализ муниципальных образований Оренбургской области по набору показателей, характеризующих социальную напряженность

Автор работы: Пользователь скрыл имя, 16 Декабря 2013 в 00:55, курсовая работа

Описание работы

Цель. Провести сравнительный анализ муниципальных образований Оренбургской области по набору показателей, характеризующих социальную напряженность.
Объектом исследования являются муниципальные образования Оренбургской области.
Предметом исследования является состояние социальной напряженности, характеризующееся показателями:
x1 – коэффициент смертности (на 1000 человек);
x2 – коэффициент младенческой смертности (на 1000 человек);
x3 –смертность от инфаркта (на 1000 человек);
x4 –смертность от самоубийств (на 1000 человек);
x5 – смертность от убийств (на 1000 человек).

Содержание работы

Введение………………………………………………………………………..
1 Многомерная классификация муниципальных образований Оренбургской области методом кластерного анализа…………......
Теоретические основы кластерного анализа...…………….......................
1.2 Практическая реализация метода кластерного анализа……….
1.2.1 Классификация муниципальных образований Оренбургской области с помощью иерархических кластер - процедур……………………………...
1.2.2 Классификация муниципальных образований Оренбургской области с помощью итерационных кластер - процедур (методом -средних)……...
1.2.3 Сравнение классификаций………………………………………………
1.2.4 Содержательная интерпретация результатов классификации………..
2 Снижение размерности признакового пространства методом главных компонент………………………………………………………………………
2.1 Теоретические аспекты методом главных компонент ………………….
2.2 Практическая реализация метода главных компонент………………….
3 Многомерная классификация муниципальных образований по выделенным главным компонентам ………………………….......................
3.1 Классификация муниципальных образований по выделенным главным компонентам с помощью иерархических кластер - процедур …...
3.2 Классификация муниципальных образований по выделенным главным компонентам с помощью итерационных кластер - процедур (методом -средних)…………………………………………………………..
3.3Сравнение классификаций ………………………………………………...
3.4 Содержательная интерпретация результатов лучшей классификации...
Заключение……………………………………………………………………..
Список использованных источников……

Файлы: 1 файл

курсовая МСМ.doc

— 1.44 Мб (Скачать файл)

Министерство  образования и науки Российской Федерации

 

Федеральное государственное бюджетное  образовательное учреждение

высшего профессионального образования

«Оренбургский государственный университет»

 

Кафедра математических методов и моделей в экономике

 

 

Курсовая работа

по дисциплине «Многомерные статистические методы»

 

Сравнительный анализ муниципальных образований  Оренбургской области по набору показателей,

характеризующих социальную напряженность 

 

 

ОГУ 080601.65.5012.08 ОО

 

 

                                                                       Руководитель работы

                                                                       _________________Бантикова О.И.

                                                               "____"_________________2012г.                    

                             Исполнитель

                                       Студентка гр.10 Ст

                                                                       _________________Аяганова А.А.

                                                                        "_____"_________________2012г.

 

Оренбург 2012

 

Содержание

 

Введение………………………………………………………………………..

1 Многомерная  классификация муниципальных образований Оренбургской области методом кластерного анализа…………......

    1. Теоретические основы кластерного анализа...…………….......................

1.2 Практическая реализация метода кластерного анализа……….

1.2.1 Классификация муниципальных  образований Оренбургской области  с помощью иерархических кластер - процедур……………………………...

1.2.2 Классификация муниципальных  образований Оренбургской области  с помощью итерационных кластер - процедур (методом -средних)……...

1.2.3 Сравнение классификаций………………………………………………

1.2.4 Содержательная интерпретация  результатов классификации………..

2       Снижение размерности признакового пространства методом главных компонент………………………………………………………………………

2.1 Теоретические аспекты методом главных компонент ………………….

2.2 Практическая реализация метода главных компонент………………….

3 Многомерная классификация муниципальных образований по выделенным  главным компонентам ………………………….......................

3.1       Классификация муниципальных образований по выделенным главным компонентам с помощью иерархических кластер - процедур …...

3.2 Классификация муниципальных образований по выделенным главным компонентам с помощью итерационных кластер - процедур (методом -средних)…………………………………………………………..

3.3Сравнение классификаций ………………………………………………...

3.4 Содержательная интерпретация результатов лучшей классификации...

Заключение……………………………………………………………………..

Список использованных источников…………………………………………

Приложение А – Исходные данные для анализа……………………………

Приложение В…………………………………………………………………

4

 

4

4

7

 

7

 

12

14

15

 

16

16

18

 

25

 

25

 

 

29

32

33 

 35

37                             

38

40


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

 

Актуальность темы исследования. Прежде всего, социальная напряженность является необходимым, хотя и не постоянным элементом существования любого сообщества. Человек переживает это явление как стресс, адаптируется к нему, «осваивает» это состояние, оно становится необходимой частью его общественной культуры. Напряженность в тех или иных формах и аспектах сопутствует людям всю жизнь. Социальная напряженность представляет собой эмоциональное состояние в группе или обществе в целом, вызванное давлением со стороны природной или социальной среды, продолжающееся, как правило, в течение более или менее длительного времени. Напряженность может быть вызвана отнюдь не только стремлением достичь какой-либо цели, но и разного рода ошибками или некомпетентностью лидеров. Кроме того, обычное состояние людей может резко измениться из-за воздействия не подконтрольных человеку сил природы: изменения климата, истощения ресурсов, землетрясения и т.д.

 

Цель. Провести сравнительный анализ муниципальных образований Оренбургской области по набору показателей, характеризующих социальную напряженность.

Объектом исследования являются муниципальные образования Оренбургской области.

            Предметом исследования является состояние социальной напряженности, характеризующееся показателями:

x1 – коэффициент смертности (на 1000 человек);

x2 – коэффициент младенческой смертности (на 1000 человек);

x3 –смертность от инфаркта (на 1000 человек);

x4 –смертность от самоубийств (на 1000 человек);

x5 – смертность от убийств (на 1000 человек).

В соответствии с целью  были поставлены и решены следующие  задачи:

          1) провести многомерную классификацию статистического анализа по набору показателей;

2) с помощью метода главных компонент снизить размерность признакового пространства на уровне информативности не менее 70%;

3) провести повторную классификацию муниципальных образований Оренбургской области по выделенным компонентам.

Использовались методы кластерного анализа, методы главных компонент, табличный и графический методы.

Работа выполнялась с использованием ППП Statistica, Excel.

 

 

 

 

 

1 Многомерная классификация муниципальных образований Оренбургской области методом кластерного анализа

 

1.1 Теоретические основы кластерного анализа

 

Выделяют два метода кластерного анализа: иерархические  и итерационные. В свою очередь  иерархические делятся на агломеративные и дивизимные.

Основной принцип работы иерархических агломеративных процедур состоит в последовательном объединении групп элементов, сначала самых близких, а затем все более отдаленных друг от друга.

Основной принцип иерархических  дивизимных процедур состоит в последовательном разделении, сначала самых далеких, а затем все более приближенных к друг другу.

 

Общая постановка кластерного анализа

Необходимо разбить  анализируемую совокупность объектов , которая может быть представлена в виде матрицы , либо в виде матрицы на сравнительно небольшое число однородных групп или классов

Под однородностью объектов в рамках кластерного анализа  понимают правило для вычисления характеристики характеризующих расстояние объектов , либо степень близости или меру сходства i-го и j-го объекта

Если задана функция  , то близкие, с точки зрения этой метрики объекты будут считаться однородными.

При определении правил расчета расстояния или меры сходства должны выполняться следующие требования:

  1. Требование симметричности

  1. Требование максимального сходства объекта с самим собой

  1. Требование монотонного убывания меры близости по расстоянию

Если  , то

 

Основные метрики кластерного  анализа

  1. Расстояние между объектами

Обобщенный вид метрики  Махаланобиса

- вектор значений признака характеризующих

- некоторая симметрическая неотрицательно  определенная матрица весовых  коэффициентов

- ковариационная матрица генеральной  совокупности из которой извлекаются  наблюдения

  1. Обычное Евклидово расстояние

Данная метрика применяется  в трех случаях:

- Если наблюдения извлекаются  из нормального распределенной  генеральной совокупности с диагональной  ковариационной матрицей 

- Компоненты вектора Х однородны по физическому смыслу и одинаково важны для классификации.

- Признаковое пространство  совпадает с геометрическим пространством

     3) Взвешенное  Евклидово расстояние

  1. Хеммингово расстояние

Используется для дихотомических признаков.

  1. Расстояние Минновского

  1. Расстояние Чебышева

  1. Квадратическое Евклидово расстояние простое

Расстояние между классами объектов

Пусть - это группа объектов образующих i-й класс или кластер

- вектор средних арифметических  характеризующих i-й класс

расстояние между классом 

  1. Расстояние измеряемое по принципу «ближнего соседа»

 

                       

  1. Расстояние измеряемое по принципу дальнего соседа

                        

  1. Расстояние измеренное по центрам тяжести групп

  1. Расстояние измеренное по принципу средней связи

  1. Расстояние измеренное по принципу медианной связи
  2. Обобщенное расстояние между классами предложенное Колмагоровым которое в качестве частных случаев включает в себя все рассмотренные выше расстояния основано на понятии степенного среднего и определяется по формуле.

 

Функционалы качества разбиения

           При различных методах кластерного анализа для одной и той же совокупности объектов могут быть получены различные варианты разбиения.

Существование влияния  на результат кластеризации оказывают:

1) Набор признаков, по которым осуществляется классификация

2) Тип выбранного алгоритма

3)Выбор метрики.

Поэтому возникает необходимость выбора лучшего разбиения. С этой целью вводится функционал качества разбиения. Под наилучшим разбиением понимается разбиение, на котором достигается экстремум выбранного функционала качества.

Характеристики функционала  качества:

  1. Сумма квадратов расстояний до центра классов
  2. Сумма внутриклассовых расстояний .

 В данном случае  наилучшим следует считать то  разбиение, при котором достигается min F2(S), что означает получение кластеров большей плотности.

  1. Суммарная внутриклассовая дисперсия

 

1.2 Практическая реализация метода кластерного анализа

 

1.2.1 Классификация муниципальных образований Оренбургской области с помощью иерархических кластер - процедур.

 

На основе исходных данных из статистического ежегодника территориального органа Федеральной службы государственной статистки по Оренбургской области за 2008 год (Приложение А, рисунок 1), необходимо провести классификацию муниципальных образований, иерархическими агломеративными методами кластерного анализа, содержащая результаты кластерного анализа и вертикальную дендрограмму (рисунок 1). Так как все показатели единиц измерения признаков одинаковые, то переходим к решению задачи классификации.

 

 

 

 

Рисунок 1 – Дендрограмма объединения классов методом «полных связей».

 

          Методом «полных связей» при пороговом значении расстояния все города и районы Оренбургской области разбиваются на три класса S1 ={S , S , S }. К первому классу относятся - 8 , ко второму – 29, к третьему – 10.

 

          Таблица 1 – Объединение классов методом полной связи 

 

Номер класса

Кол-во объектов классе

Состав кластер

S

37

Районы: Бузулукский, Бугурусланский, Ясненский, Новоорский, Матвеевский, Асекеевский, Тоцкий, Переволоцкий, Северный, Курманаевский, Светлинский, Кувандыкский, Илекский, Саракташский, Соль-Илецкий, Сакмарский, Тюльганский, Красногвардейский, Октябрьский, Беляевский, Грачевский, Александровский, Оренбургский, Ташлинский, Акбулакский, Первомайский, Адамовский.

Города: Орск, Новотроицк, Бузулук, Бугуруслан, Соль-Илецк, Оренбург, Ясный, Кувандык, Сорочинск, Гай.

S

8

Районы: Шарлыкский, Сорочинский, Пономаревский, Кваркенский, Домбаровский, Гайский.

Города: Абдулино, Медногорск.

S

2

Районы: Новосергиевский, Абдулинский.

Информация о работе Сравнительный анализ муниципальных образований Оренбургской области по набору показателей, характеризующих социальную напряженность