Автор работы: Пользователь скрыл имя, 16 Декабря 2013 в 00:55, курсовая работа
Цель. Провести сравнительный анализ муниципальных образований Оренбургской области по набору показателей, характеризующих социальную напряженность.
Объектом исследования являются муниципальные образования Оренбургской области.
Предметом исследования является состояние социальной напряженности, характеризующееся показателями:
x1 – коэффициент смертности (на 1000 человек);
x2 – коэффициент младенческой смертности (на 1000 человек);
x3 –смертность от инфаркта (на 1000 человек);
x4 –смертность от самоубийств (на 1000 человек);
x5 – смертность от убийств (на 1000 человек).
Введение………………………………………………………………………..
1 Многомерная классификация муниципальных образований Оренбургской области методом кластерного анализа…………......
Теоретические основы кластерного анализа...…………….......................
1.2 Практическая реализация метода кластерного анализа……….
1.2.1 Классификация муниципальных образований Оренбургской области с помощью иерархических кластер - процедур……………………………...
1.2.2 Классификация муниципальных образований Оренбургской области с помощью итерационных кластер - процедур (методом -средних)……...
1.2.3 Сравнение классификаций………………………………………………
1.2.4 Содержательная интерпретация результатов классификации………..
2 Снижение размерности признакового пространства методом главных компонент………………………………………………………………………
2.1 Теоретические аспекты методом главных компонент ………………….
2.2 Практическая реализация метода главных компонент………………….
3 Многомерная классификация муниципальных образований по выделенным главным компонентам ………………………….......................
3.1 Классификация муниципальных образований по выделенным главным компонентам с помощью иерархических кластер - процедур …...
3.2 Классификация муниципальных образований по выделенным главным компонентам с помощью итерационных кластер - процедур (методом -средних)…………………………………………………………..
3.3Сравнение классификаций ………………………………………………...
3.4 Содержательная интерпретация результатов лучшей классификации...
Заключение……………………………………………………………………..
Список использованных источников……
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«Оренбургский государственный университет»
Кафедра математических методов и моделей в экономике
Курсовая работа
по дисциплине «Многомерные статистические методы»
Сравнительный анализ муниципальных образований Оренбургской области по набору показателей,
характеризующих социальную напряженность
ОГУ 080601.65.5012.08 ОО
Исполнитель
Оренбург 2012
Содержание
Введение………………………………………………………… 1 Многомерная классификация муниципальных образований Оренбургской области методом кластерного анализа…………......
1.2 Практическая реализация метода кластерного анализа………. 1.2.1 Классификация муниципальных
образований Оренбургской 1.2.2 Классификация муниципальных
образований Оренбургской 1.2.3 Сравнение классификаций………………… 1.2.4 Содержательная интерпретация результатов классификации……….. 2 Снижение
размерности признакового пространства
методом главных компонент……………………………………………………… 2.1 Теоретические аспекты методом главных компонент …………………. 2.2 Практическая реализация метода главных компонент…………………. 3 Многомерная классификация муниципальных
образований по выделенным главным
компонентам ………………………….................... 3.1 Классификация муниципальных образований по выделенным главным компонентам с помощью иерархических кластер - процедур …... 3.2 Классификация муниципальных образований по
выделенным главным компонентам с помощью
итерационных кластер - процедур (методом
-средних)……………………………………………………… 3.3Сравнение классификаций ………………………………………………... 3.4 Содержательная интерпретация р Заключение…………………………………………………… Список использованных источников………………………………………… Приложение А – Исходные данные для анализа…………………………… Приложение В……………………………………………… |
4
4 4 7
7
12 14 15
16 16 18
25
25
29 32 33 35 37 38 40 |
Введение
Актуальность темы исследования. Прежде всего, социальная напряженность является необходимым, хотя и не постоянным элементом существования любого сообщества. Человек переживает это явление как стресс, адаптируется к нему, «осваивает» это состояние, оно становится необходимой частью его общественной культуры. Напряженность в тех или иных формах и аспектах сопутствует людям всю жизнь. Социальная напряженность представляет собой эмоциональное состояние в группе или обществе в целом, вызванное давлением со стороны природной или социальной среды, продолжающееся, как правило, в течение более или менее длительного времени. Напряженность может быть вызвана отнюдь не только стремлением достичь какой-либо цели, но и разного рода ошибками или некомпетентностью лидеров. Кроме того, обычное состояние людей может резко измениться из-за воздействия не подконтрольных человеку сил природы: изменения климата, истощения ресурсов, землетрясения и т.д.
Цель. Провести сравнительный анализ муниципальных образований Оренбургской области по набору показателей, характеризующих социальную напряженность.
Объектом исследования являются муниципальные образования Оренбургской области.
Предметом исследования является состояние социальной напряженности, характеризующееся показателями:
x1 – коэффициент смертности (на 1000 человек);
x2 – коэффициент младенческой смертности (на 1000 человек);
x3 –смертность от инфаркта (на 1000 человек);
x4 –смертность от самоубийств (на 1000 человек);
x5 – смертность от убийств (на 1000 человек).
В соответствии с целью были поставлены и решены следующие задачи:
1) провести многомерную классификацию статистического анализа по набору показателей;
2) с помощью метода главных компонент снизить размерность признакового пространства на уровне информативности не менее 70%;
3) провести повторную классификацию муниципальных образований Оренбургской области по выделенным компонентам.
Использовались методы кластерного анализа, методы главных компонент, табличный и графический методы.
Работа выполнялась с использованием ППП Statistica, Excel.
1 Многомерная классификация муниципальных образований Оренбургской области методом кластерного анализа
1.1 Теоретические основы кластерного анализа
Выделяют два метода кластерного анализа: иерархические и итерационные. В свою очередь иерархические делятся на агломеративные и дивизимные.
Основной принцип работы иерархических агломеративных процедур состоит в последовательном объединении групп элементов, сначала самых близких, а затем все более отдаленных друг от друга.
Основной принцип
Общая постановка кластерного анализа
Необходимо разбить анализируемую совокупность объектов , которая может быть представлена в виде матрицы , либо в виде матрицы на сравнительно небольшое число однородных групп или классов
Под однородностью объектов в рамках кластерного анализа понимают правило для вычисления характеристики характеризующих расстояние объектов , либо степень близости или меру сходства i-го и j-го объекта
Если задана функция , то близкие, с точки зрения этой метрики объекты будут считаться однородными.
При определении правил расчета расстояния или меры сходства должны выполняться следующие требования:
Если , то
Основные метрики кластерного анализа
Обобщенный вид метрики Махаланобиса
- вектор значений признака характеризующих
- некоторая симметрическая
- ковариационная матрица
Данная метрика применяется в трех случаях:
- Если наблюдения извлекаются
из нормального распределенной
генеральной совокупности с
- Компоненты вектора Х однородны по физическому смыслу и одинаково важны для классификации.
- Признаковое пространство
совпадает с геометрическим
3) Взвешенное Евклидово расстояние
Используется для
Расстояние между классами объектов
Пусть - это группа объектов образующих i-й класс или кластер
- вектор средних арифметических характеризующих i-й класс
расстояние между классом
Функционалы качества разбиения
При различных методах кластерного анализа для одной и той же совокупности объектов могут быть получены различные варианты разбиения.
Существование влияния
на результат кластеризации
1) Набор признаков, по которым осуществляется классификация
2) Тип выбранного алгоритма
3)Выбор метрики.
Поэтому возникает необходимость выбора лучшего разбиения. С этой целью вводится функционал качества разбиения. Под наилучшим разбиением понимается разбиение, на котором достигается экстремум выбранного функционала качества.
Характеристики функционала качества:
В данном случае
наилучшим следует считать то
разбиение, при котором
1.2 Практическая реализация метода кластерного анализа
1.2.1 Классификация муниципальных образований Оренбургской области с помощью иерархических кластер - процедур.
На основе исходных данных из статистического ежегодника территориального органа Федеральной службы государственной статистки по Оренбургской области за 2008 год (Приложение А, рисунок 1), необходимо провести классификацию муниципальных образований, иерархическими агломеративными методами кластерного анализа, содержащая результаты кластерного анализа и вертикальную дендрограмму (рисунок 1). Так как все показатели единиц измерения признаков одинаковые, то переходим к решению задачи классификации.
Рисунок 1 – Дендрограмма объединения классов методом «полных связей».
Методом «полных связей» при пороговом значении расстояния все города и районы Оренбургской области разбиваются на три класса S1 ={S , S , S }. К первому классу относятся - 8 , ко второму – 29, к третьему – 10.
Таблица 1 – Объединение классов методом полной связи
Номер класса |
Кол-во объектов классе |
Состав кластер |
S |
37 |
Районы: Бузулукский, Бугурусланский, Ясненский, Новоорский, Матвеевский, Асекеевский, Тоцкий, Переволоцкий, Северный, Курманаевский, Светлинский, Кувандыкский, Илекский, Саракташский, Соль-Илецкий, Сакмарский, Тюльганский, Красногвардейский, Октябрьский, Беляевский, Грачевский, Александровский, Оренбургский, Ташлинский, Акбулакский, Первомайский, Адамовский. Города: Орск, Новотроицк, Бузулук, Бугуруслан, Соль-Илецк, Оренбург, Ясный, Кувандык, Сорочинск, Гай. |
S |
8 |
Районы: Шарлыкский, Сорочинский, Пономаревский, Кваркенский, Домбаровский, Гайский. Города: Абдулино, Медногорск. |
S |
2 |
Районы: Новосергиевский, Абдулинский. |