Основы работы с программным комплексом SPSS

Автор работы: Пользователь скрыл имя, 11 Декабря 2012 в 18:17, курсовая работа

Описание работы

Современные информационные технологии представляют собой компьютерную обработку информации по заранее отработанным алгоритмам, хранение больших объёмов информации на разных носителях и передачу информации на любые расстояния в предельно минимальное время.
Разработка информационных технологий – это очень затратная отрасль, требующая высокой подготовки специалистов и наукоемкой техники, зато их реализация нередко сравнима с революционными преобразованиями.

Содержание работы

Введение…………………………………………………………………....
3
Факторный анализ…………………………………………………..
4
Порядок выполнения факторного анализа………………………..
5
Значения факторов………………………………………………….
14
Задача вращения…………………………………………………….
18
Заключение…………………………………………………………………
22
Список используемой литературы…………

Файлы: 1 файл

Курсовая ИТ.doc

— 256.00 Кб (Скачать файл)

Министерство образования  и науки Республики Татарстан

Альметьевский Государственный Нефтяной Институт

 

 

 

 

 

 

 

КУРСОВАЯ РАБОТА

 

по дисциплине

«Информационные технологии в экономике»

на тему:

«Основы работы с программным комплексом SPSS»

 

 

 

 

 

 

 

                                                                       Выполнил: студент группы

                                                                        Ф.И.О.

 

                                                                         Руководитель:

                                                                        

 

 

 

Альметьевск 2011г.

Содержание.

Введение…………………………………………………………………....

3

  1. Факторный анализ…………………………………………………..

4

  1. Порядок выполнения факторного анализа………………………..

5

  1. Значения факторов………………………………………………….

14

  1. Задача вращения…………………………………………………….

18

Заключение…………………………………………………………………

22

Список используемой литературы………………………………………..

23


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение.

    Современные  информационные технологии представляют  собой компьютерную обработку информации по заранее отработанным алгоритмам,  хранение больших объёмов информации на разных носителях и передачу информации на любые расстояния в предельно минимальное время.

    Разработка  информационных технологий –  это очень затратная отрасль, требующая высокой подготовки специалистов и наукоемкой техники, зато их реализация нередко сравнима с революционными преобразованиями.

Информационная экономика  изменила многие аспекты экономической  реальности, в том числе, и функцию  денег, которые из всеобщего эквивалента трудозатрат постепенно превратились в средство расчета. Виртуальные банки и системы оплаты – плод развития информационных технологий.

    Таким образом,  в самом общем виде информационные  технологии в экономике можно  определить как совокупность действий над экономической информацией при помощи компьютерной техники для получения оптимального конечного результата.

    В экономике информационные технологии применяются для обработки, сортировки и агрегирования данных, для организации взаимодействия участников процесса и вычислительной техники, для удовлетворения информационных потребностей, для оперативной связи и так далее.

    Понятно, что  решение об инвестициях в развитие  информационных технологий, как  и другие управленческие решения, должны приниматься с учетом экономической целесообразности. Но так уж получается, что эту самую выгоду удобнее всего просчитывать при помощи все тех же информационных технологий. Есть модели подсчета совокупного экономического эффекта, позволяющий учитывать, помимо всего прочего, дополнительные преимущества от внедрения информационных технологий, расширяемость и гибкость систем, а также возможные риски.

 

I. Факторный анализ

 

     Факторный  анализ - это процедура, с помощью  которой большое число переменных, относящихся к имеющимся наблюдениям, сводят к меньшему количеству независимых влияющих величин, называемых факторами. При этом в один фактор объединяются переменные, сильно коррелирующие между собой. Переменные из разных факторов слабо коррелируют между собой.

     Таким образом,  целью факторного анализа является  нахождение таких комплексных  факторов, которые как можно более  полно объясняют наблюдаемые  связи между переменными, имеющимися  в наличии.

     В психологии  факторный анализ широко используется при создании многофакторных тестов, а также при систематизации и обобщении комплексных наблюдений.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

II. Порядок выполнения факторного анализа

 

На первом шаге процедуры  факторного анализа происходит стандартизация заданных значений переменных (z-преобразование); затем при помощи стандартизированных значений рассчитывают корреляционные коэффициенты Пирсона между рассматриваемыми переменными.  Исходным элементом для дальнейших расчётов является корреляционная матрица. Для построенной корреляционной матрицы определяются, так называемые, собственные значения и соответствующие им собственные векторы, для определения которых используются оценочные значения диагональных элементов матрицы (так называемые относительные дисперсии простых факторов).                   Собственные значения сортируются в порядке убывания, для чего обычно отбирается столько факторов, сколько имеется собственных значений, превосходящих по величине единицу. Собственные векторы, соответствующие этим собственным значениям, образуют факторы; элементы собственных векторов получили название факторной нагрузки. Их можно понимать как коэффициенты корреляции между соответствующими переменными и факторами. Для решения такой задачи определения факторов были разработаны многочисленные методы, наиболее часто употребляемым из которых является метод определения главных факторов (компонентов). Описанные выше шаги расчёта ещё не дают однозначного решения задачи определения факторов. Основываясь на геометрическом представлении рассматриваемой задачи, поиск однозначного решения называют задачей вращения факторов. И здесь имеется большое количество методов, наиболее часто употребляемым из которых является ортогональное вращение по так называемому методу варимакса. Факторные нагрузки повёрнутой матрицы могут рассматриваться как результат выполнения процедуры факторного анализа. Кроме того, на основании значений этих нагрузок необходимо попытаться дать толкование отдельным факторам. Если факторы найдены и истолкованы, то на последнем шаге факторного анализа, отдельным наблюдениям можно присвоить значения этих факторов, так называемые факторные значения. Таким образом, для каждого наблюдения значения большого количества переменных можно перевести в значения небольшого количества факторов.

Собирая данные, исследователь руководствуется определенными гипотезами. Полученная в ходе исследования информация относится к избранным предмету и теме исследования, но нередко она представляет собой сырой материал, в котором можно изучить структуру показателей, характеризующих объекты, а также выявить однородные группы объектов. Информацию лучше представить в геометрическом пространстве, лаконично отразить ее особенности в классификации объектов и переменных. Такая работа создает предпосылки к выявлению типологий объектов и формулированию «социального пространства», в котором обозначены расстояния между объектами наблюдения, позволяет наглядно представить свойства объектов.

Факторный анализ является одним из наиболее мощных статистических средств анализа данных. В его основе лежит процедура объединения групп коррелирующих друг с другом переменных («корреляционных узлов») в несколько факторов.

Цель факторного анализа  – сконцентрировать исходную информацию, выражая большое число рассматриваемых признаков через меньшее число более емких внутренних характеристики, которые, однако, не поддаются непосредственному измерению (являются латентными).

Факторный метод будет  изложен на примере опроса, проведенного с целью выяснения политических ориентаций жителей города. В ходе опроса респондентам предложили выбрать высказывания, соответствующие их мнению, и отдать свой голос в поддержку тех, кто:

    1. согласен с нынешним политическим курсом (var 21.1)
    2. выступает с критикой нынешнего политического курса (var 21.2)
    3. выступает за вхождение России в западную цивилизацию (var 22.1)
    4. против сближения России с Западом (var 22.2)
    5. выступает за наведение жесткого порядка (var 23.1)
    6. считает главным демократию, политические и личные свободы граждан (var 23.2)
    7. выступает за усиление влияния Церкви на государство (var 24.1)
    8. считает, что государство и Церковь не должны вмешиваться в жизнь граждан (var 24.2)
    9. считает, что государство не должно вмешиваться в свободную рыночную экономику (var 25.1)
    10. выступает за государственный контроль бизнеса (var 25.2)
    11. выступает за объединение граждан в интересах государства (var 26.1)
    12. считает, что граждане должны добиваться успеха сами (var 26.2)

 


 

 

 

 

 

 

Оценки ставились по двухбалльной шкале: 1) поддерживаю, 2) не поддерживаю.

Для факторного анализа:  

  • Выбираю в меню Analyze (Анализ) Data Reduction (Сокращение объема данных) Factor... (Факторный анализ)

Откроется диалоговое окно Factor Analysis (Факторный анализ) 

Переменные var21-….var26 помещаю в поле тестируемых переменных и ознакомьтесь с возможностями, предлагаемыми различными кнопками этого диалогового меню.

 После щелчка по кнопке Descriptive Statistics (Дескриптивные  статистики) оставьте вывод первичных результатов, которые включают в себя первичные относительные дисперсии простых факторов, собственные значения и процентные доли объяснённой дисперсии. Довольно часто бывает необходим также вывод одномерных статистик и корреляционных коэффициентов. В группе Correlation Matrix (Корреляционная матрица) целесообразно отметить флажком KMO and Barltett test of sphericity (Критерии КМО и сферичности Бартлетта), вычисляется два  критерия – на многомерную нормальность (Бартлетта) и адекватность выборки (КМО определяет применимость факторного анализа к выбранным переменным).

     С помощью кнопки Extraction... (Отбор) можно выбрать метод отбора. Если оставить здесь анализ главных компонентов, установленный по умолчанию, то количество отобранных в этом случае факторов приравнивается к числу собственных значений, превосходящих единицу. Также есть возможность собственноручно указать это количество.

Щёлкните на выключателе Extraction... (Извлечение), оставьте установку Principal components (Анализ главных компонентов). В нашем примере количество факторов сознательно ограничим тремя. Если бы мы не сделали такого ограничения, то в соответствии с начальными установками было бы создано двенадцать факторов, количество, которое очень тяжело поддаётся обзору.

Можно построить график собственных значений или диаграмму  каменистой осыпи, установив флажок на Scree plot.  Точками показаны соответствующие собственные значения, в пространстве двух координат. Этот тип диаграммы обычно используется при определении достаточного числа факторов перед вращением. При этом руководствуются следующим правилом: оставлять нужно лишь те факторы, которым соответствуют первые точки на графике до того, как кривая станет более пологой.


Выключатель Rotation... (Вращение) позволяет выбрать метод вращения. Вращение требуется потому, что изначально структура факторов, будучи математически корректной, как правило, трудна для интерпретации. Целью враще ния является получение простой структуры, которой соответствует большое значение нагрузки каждой переменной только по одному фактору и малое по всем остальным факторам.

Факторные нагрузки можно  представить как коэффициенты корреляции каждой переменной с каждым из выявленных факторов. Чем теснее связь переменной с рассматриваемым фактором, тем выше значение факторной нагрузки. Положительный знак факторной нагрузки указывает на прямую, а отрицательный знак – на обратную связь переменной с фактором.

 Активируйте метод  варимакса (Varimax) и оставьте активированным вывод повёрнутой матрицы факторов. Далее вы можете организовать вывод факторных нагрузок в графическом виде, в котором первые три фактора будут представлены в трёхмерном пространстве; в случае наличия только двух факторов в слое приводится только одно изображение. При этом установите флажок на Loading plot(s).

Если Вы хотите найти  значения факторов и сохранить их в виде дополнительных переменных задействуйте выключатель Scores... (Значения) и отметьте Save as variables (Сохранить как переменные). По умолчанию установлен регрессионный метод.

Выключатель Options... (Опции) предназначен для обработки пропущенных значений. Здесь обеспечивается возможность  заменить пропущенные значения средними значениями соответствующих переменных.

При факторном анализе  постоянно появляются сообщения  об ошибках, например 2,56Е-02 и т.п. Действительно, такой формат вывода в глазах непосвященного пользователя очень портит картину всей таблицы. Это, так называемый, Е-формат, знакомый всем программистам по языку Фортран (Fortran), где буква Е соответствует 10 в некоторой степени; для числа 2,5Е-02 можно было бы записать и 0,0256.

Можно запретить вывод  малых факторных нагрузок и для  этого установим граничное значение выводимых нагрузок равным 0,4. Достоинство этого шага состоит в том, что устраняется непривлекательное отображение малых значений в Е-формате. Для этого активируйте опцию Suppress absolute values less then: (He выводить абсолютные значения меньшие, чем:) и введите предельное значение 0,4.  

  • Для проведения расчётов щёлкните на ОК.  
  • В окне обзора появятся результаты. Сначала приводятся первичные статистики: Критерий сферичности Бартлетта показывает статистически достоверный результат (p < 0,05), данные вполне приемлемы для факторного анализа.

 



В таблице Communalities перечислены переменные и общности. Столбцы второй таблицы Total Variance Explained содержат характеристики выделенных факторов: их порядковые номера, суммы квадратов нагрузок, процент общей дисперсии, обусловленной фактором, и соответствующий кумулятивный (накопленный) процент (до и после вращения). Чем больше процент дисперсии, обусловленный фактором, тем больший вес имеет данный фактор. А чем больше кумулятивный процент, накопленный к последнему фактору, тем более состоятельным является факторное решение. Если он составляет менее 50%, следует либо сократить количество переменных, либо увеличить количество факторов. 

Информация о работе Основы работы с программным комплексом SPSS