Анализ динамических рядов и построение уравнения многофакторной корреляционной связи
Курсовая работа, 14 Июня 2013, автор: пользователь скрыл имя
Описание работы
Целью данной курсовой работы является практическое закрепление знаний студента по базовым теоретическим дисциплинам учебной программы. Работа включает решение комплексной статистической задачи - построения уравнения множественной регрессии на конкретном информационном материале. Выполнение работы сопряжено с использованием студентом своих знаний, теоретических обобщений и навыков практического их применения по высшей и прикладной математике, общей теории статистики, элементам математической статистики, а также теоретическим основам отраслевой экономики. Комплекс расчетных процедур выполняется по индивидуальным и стандартным программам на ПК.
Файлы: 1 файл
kursach_statistika.doc
— 530.50 Кб (Скачать файл)Таким образом, генеральная совокупность является представительной, значит, условие совпадения операционно-расчетного поля с полем регрессии считается выполненным, следовательно, можно утверждать, что данное операционно-расчетное поле является полем регрессии.
Компьютерная программа также предоставляет нам оценку чистоты поля регрессии через расчет относительной ошибки по полю. Регламент данной ошибки для количественных признаков составляет 5%. В нашем случае относительная ошибка равна 3,33% (приложение 1), значит, поле является относительно чистым.
В таком случае мы вправе утверждать, что данное поле регрессии во многом совпадает с полем корреляции, следовательно, мы можем проводить выборку тех признаков, которые будут включены в уравнение множественной регрессии, являющееся конечной целью данной работы.
Дальнейший системный анализ включает в себя:
- Ранжирование признаков-факторов по представительности (по объему признака)
- Расчет оценочного показателя вариации и ранжирование признаков-факторов по нему
- Проведение анализа парной корреляции
- Построение уравнения множественной регрессии.
Произведем ранжирование признаков-факторов по представительности. При балансовой связи признаки-факторы, динамика которых сонаправлена с динамикой признака-функции, ранжируются по их представительности, исходя из удельного веса их средней функции. Рассчитаем соответствующие величины, результаты расчета представим в таблице 17.
Таблица 17
Удельный вес признаков-факторов в составе признака- функции
Значение признака-функции |
Признак-фактор |
Значение признака, м |
Удельный вес признака Xi в Y, %. |
3 662 934 |
X1 |
1 721 592 |
47,00 |
X2 |
354 462 |
9,67 | |
X3 |
1 127 873 |
30,79 | |
X4 |
263 053 |
7,18 |
Далее в таблице 18 произведем ранжирование факторов-признаков по степени их представительности, т.е. расположим в порядке возрастания их удельного веса в значении признака-функции.
Таблица 18
Ранжирование признаков-факторов по представительности
Признак-фактор |
Удельный вес признака Xi в Y, %. |
X1 |
47,00 |
X3 |
30,79 |
X2 |
9,67 |
X4 |
7,18 |
Исходя из полученных результатов можно сказать, что наиболее качественными признаками являются признаки X1 и X3 - объёмы бурения на цветные металлы и неметаллы.
2. Расчёт показателей вариации динамических рядов
2.1. Вариация признаков и статистические способы её измерения
Вариацией значений какого-либо признака в совокупности называется различие его значений у разных единиц данной совокупности в один и тот же период или момент времени. Измерение вариации позволяет выделить стадии (уровни) изменения качества в пределах совокупности и, как следствие, вскрыть резервы для углубления качества в состоянии совокупности.
Для измерения вариации важно установить базу (уровень) регистрации отклонения значений признака у единиц совокупности и содержание признака, вариация которого измеряется.
В экономической статистике для оценки процесса вариации экономических показателей можно принять две базы: модуль средней или устойчивую среднюю признака.
Содержание признака для оценки вариации (процесса) имеет большое значение, так как оно регламентирует показатели вариации для данного признака.
В экономической статистике для измерения вариации используются следующие показатели:
- Размах вариации – разность между наибольшим и наименьшим значениями признака в изучаемой совокупности.
Размах вариации дает лишь самое общее представление о размерах вариации, так как показывает на сколько отличаются друг от друга крайние значения признака, но не указывает на сколько велики отклонения вариантов друг от друга внутри этого промежутка.
- Среднее линейное отклонение - средняя арифметическая из абсолютных
отклонений индивидуальных значений признака от его расчетной базы.
- для первичного ряда;
- для вариационного ряда, где
xi – значение признака i-уровня;
- среднее значение признака в исследуемой совокупности;
n – число единиц совокупности;
fi – число единиц i-й группы (частота или частость).
Данный показатель позволяет оценивать вариацию признака в ограниченных пределах.
- Дисперсия:
- для первичного ряда;
- для вариационного ряда.
Дисперсия - более надежный показатель, чем среднее линейное отклонение. Она оценивает вариацию признаков, исчисление которых предполагает возведение в квадрат основного параметра, и, кроме того, она позволяет сравнивать во времени колеблимость (вариабельность) признаков одной и той же совокупности.
- Среднее квадратическое отклонение:
- для первичного ряда;
- для вариационного ряда.
Все показатели вариации – это качественные признаки. При этом среднее линейное отклонение и среднее квадратическое отклонение имеют размерность признака. Их в статистике принято считать абсолютными мерами вариации.
Дисперсия имеет измеритель признака в квадрате. Это обстоятельство выделяет дисперсию как показатель, характеризующий интенсивность вариации, поэтому средний квадрат отклонения применяется всегда в сопоставлении. Отсюда дисперсию принято считать относительной мерой вариации.
5. В экономической статистике
более надежным является
- от среднего линейного
отклонения;
- от среднего квадратического
отклонения.
Признаки-факторы ранжируются
2.2. Расчет и анализ показателей вариации
Для построения уравнения множественной регрессии необходимо оценить признаки-факторы на вариабельность (устойчивость). Для этого необходимо произвести расчет показателей вариации для каждого из признаков.
Полученные результаты для каждого из признаков рассчитываются с помощью компьютерной программы «Elvis»:
Таблица 19
Показатели вариации для 1-го признака :
Минимальное значение
Максимальное значение
Размах вариации
Среднее по признаку
Среднее линейное отклонение
Дисперсия
Ср-квадратическое отклонение
Козффициент вариации
Лин.коэффициент вариации
Коэффициент осцилляции
Таблица 20
Показатели вариации для 2-го признака :
Минимальное значение .810150E+04
Максимальное значение
Размах вариации
Среднее по признаку
Среднее линейное отклонение .225078E+03
Дисперсия
Ср-квадратическое отклонение
Козффициент вариации
Лин.коэффициент вариации
Коэффициент осцилляции .998727E+01
Показатели вариации для 3-го признака :
Минимальное значение .145800E+04
Максимальное значение
Размах вариации .523900E+03
Среднее по признаку
Среднее линейное отклонение
Дисперсия
Ср-квадратическое отклонение
Козффициент вариации
Лин.коэффициент вариации
Коэффициент осцилляции
Таблица 22
Показатели вариации для 4-го признака :
Минимальное значение .502040E+04
Максимальное значение
Размах вариации
Среднее по признаку
Среднее линейное отклонение
Дисперсия
Ср-квадратическое отклонение
Козффициент вариации
Лин.коэффициент вариации
Коэффициент осцилляции
Таблица 23
Показатели вариации для 5-го признака :
Минимальное значение .110190E+04
Максимальное значение
Размах вариации
Среднее по признаку
Среднее линейное отклонение
Дисперсия
Ср-квадратическое отклонение
Козффициент вариации
Лин.коэффициент вариации
Коэффициент осцилляции
Так как в нашем случае все признаки количественные, их для оценки вариабельности применяют линейный коэффициент вариации. Регламент данного показателя составляет 8-10%. Для составления уравнения множественной регрессии следует выбрать два наиболее результативных признака-фактора, т.е. наименьших.
Ранжирование признаков по вариабельности от самого устойчивого к самому вариабельному выглядит так:
- Х1
- Х3
- Х2
- Х4
На основе данных таблиц можно сделать вывод, что наиболее устойчивыми являются Х1 и Х3.
3. Количественное
измерение тесноты связи признака-функции
и признаков-факторов методом
парной корреляции
3.1. Теоретические сведения о корреляции
Само слово корреляция ввёл в употребление в статистику английский биолог и статистик Френсис Гальтон в конце 19 века. Тогда оно писалось как «correlation» (соответствие), но не просто «связь» (relation), а «как бы связь», т.е. связь но не в привычной в то время функциональной форме.
Корреляционной связью называют важнейший частный случай статистической связи, состоящий в том, что разным значениями одной переменной соответствуют различные средние значения другой. С изменением значения признака х закономерным образом изменяется среднее значение признака у; в то время как в каждом отдельном случае значение признака у (с различными вероятностями) может принимать множество различных значений.