Автор работы: Пользователь скрыл имя, 10 Июня 2012 в 12:14, лабораторная работа
Полученные значения главных компонент не имеют экономического смысла, но геометрически их можно трактовать как координаты 20 точек в пространстве R5 в системе координат, полученной поворотом на некоторый угол относительно другой системы, в которой по нормированным значениям и были построены эти точки.
Так как главные компоненты не коррелированы друг с другом, то их значения можно использовать в регрессионном анализе. Допустим, мы хотим исследовать зависимость некоторого признака Y (например, прибыли предприятия) от объёмов производства тортов. Поскольку объёмы производства каждого вида взаимосвязаны, то регрессионный анализ, проведённый по исходным данным, может привести к неадекватным результатам. Поэтому, лучше построить модель признака Y по главным компонентам (не обязательно по всем, в нашем случае можно взять только компоненты 1, 3, 4 и 5). Полученное соотношение Y=F(f) можно преобразовать в соотношение Y=F1(z), а затем в Y=F2(x). Полученная таким способом модель будет более точно описывать зависимость признаков, поскольку при её построении будут использованы некоррелированные друг с другом данные.
Из
матрицы собственных чисел
T | ||||||
z1 | 8,864462 | -14,8933 | -2,8867 | |||
f2 | z2 | -9,34984 | 11,13806 | 6,64196 | ||
f3 | = | z3 | = | 11,72561 | 9,19656 | 7,53607 |
f5 | z4 | 9,247652 | 15,27651 | -8,09808 | ||
z5 | 3,857446 | -3,26989 | 19,28723 |
Полученные значения главных компонент не имеют экономического смысла, но геометрически их можно трактовать как координаты 20 точек в пространстве R5 в системе координат, полученной поворотом на некоторый угол относительно другой системы, в которой по нормированным значениям и были построены эти точки.
Так как главные компоненты не коррелированы друг с другом, то их значения можно использовать в регрессионном анализе. Допустим, мы хотим исследовать зависимость некоторого признака Y (например, прибыли предприятия) от объёмов производства тортов. Поскольку объёмы производства каждого вида взаимосвязаны, то регрессионный анализ, проведённый по исходным данным, может привести к неадекватным результатам. Поэтому, лучше построить модель признака Y по главным компонентам (не обязательно по всем, в нашем случае можно взять только компоненты 1, 3, 4 и 5). Полученное соотношение Y=F(f) можно преобразовать в соотношение Y=F1(z), а затем в Y=F2(x). Полученная таким способом модель будет более точно описывать зависимость признаков, поскольку при её построении будут использованы некоррелированные друг с другом данные.
В
нашем случае в качестве параметра
Y возьмём объём спроса на торты в данном
регионе за последние 20 лет.
Таблица №2. Выпуск деталей за последние 20 лет в данном регионе
Объём выпуска (тыс. шт) |
3045,083 |
3068,075 |
3103,839 |
3070,629 |
3055,302 |
3065,52 |
3062,965 |
3080,848 |
3062,965 |
3065,52 |
3060,411 |
3052,747 |
3075,738 |
3116,612 |
3034,865 |
3024,646 |
3047,638 |
3052,747 |
3137,049 |
3039,974 |
Полученная модель примет вид
Y=3066,159- | 0,332098f2+ | 11,24024 f3+ | 19,951f5 |
Через переменные z модель запишется как
Y=3066,159- | 8,915554z1+ | 10,2184z2+ | 9,7841z3+ | 27,6918z4+ | 13,56497z5 |
А через исходные признаки x
Y=30,66159- | 38,0654x1+ | 63,865x2+ | 226,593x3+ | 142,2912x4+ | 47,00464x5 |
Вывод: таким образом, был освоен метод линейных компонент. Как видно из полученной модели наибольший вклад в спрос вносит вид №3, т. е. детали вида №3 за исследуемый период пользовались наибольшим спросом.
Информация о работе Применение компонентного анализа при изучении социально-экономических явлений