Автор работы: Пользователь скрыл имя, 21 Апреля 2013 в 08:32, курсовая работа
Целью данной курсовой работы является описание функциональных возможностей системы SPSS и способов решения средствами этой системы задачи прогнозирования.
Задачи:
1. рассмотреть историю возникновения SPSS;
2. выяснить, какие модули составляют основу SPSS;
3. раскрыть функциональные возможности данного программного комплекса
Conjoint (совместный анализ)
Совместный анализ применяется
при исследовании рынка для изучения
потребительских свойств
Data Entry (ввод данных)
Программа Data Entry предназначена для быстрого составления вопросников, а также ввода и чистки данных. Заданные на этапе создания вопросника вопросы и категории ответов потом используются в качестве меток переменных и значений.
Exact Tests (Точные тесты)
Данный модуль служит для вычисления точного значения вероятности ошибки (величины р) в условиях ограниченности данных при проверке по критерию х2 (Chi-Quadrat-Test) и при непараметрических тестах. В случае необходимости для этого также может быть применён метод Монте-Карло (Monte-Carlo).
GOLDMineR
Программа содержит специальную
регрессионную модель для регрессионного
анализа упорядоченных
SamplePower
При помощи SamplePower может
быть определён оптимальный размер
выборки для большинства
SPSS Missing Value Analysis
Данный модуль служит для анализа и восстановления закономерностей, которым подчиняются пропущенные значения. Он предоставляет различные варианты замены недостающих значений.
Trends
Модуль Trends содержит различные методы для анализа временных рядов, такие как: модели ARIMA, экспоненциальное сглаживание, сезонная декомпозиция и спектральный анализ.
Модули Amos, AnswerTree, Categories, Conjoint, LISREL и Trends описаны в книге этих же авторов: "SPSS. Методы исследования рынка и мнений".
ФУНКЦИОНАЛЬНЫЕ ВОЗМОЖНОСТИ СИСТЕМЫ SPSS
Пакет SPSS для Windows является в настоящее время одним из лидеров среди универсальных статистических пакетов. SPSS предлагает полный набор инструментов, обеспечивающих эффективную работу на всех этапах аналитического процесса – от планирования до управления данными, анализа данных и представления результатов.
Программное обеспечение SPSS позволяет:
1. Эффективно осуществлять сбор и ввод данных;
2. Организовывать простой доступ к данным;
3. Эффективно управлять данными;
4. Использовать различные статистические процедуры для анализа данных и строить более точные модели;
5. Наглядно представлять результаты тем;
6. Публиковать результаты в Интернете.
Для прогнозирования числовых переменных в системе SPSS можно использовать такие процедуры как:
Линейная регрессия – исследование взаимосвязей между предикторами и прогнозируемой переменной. Например, прогнозирование продаж на основе данных о ценах и доходе покупателей. Линейная регрессия доступна в SPSS Base.
Регрессия на основе взвешенного метода наименьших квадратов – используется, когда дисперсия независимой переменной в генеральной совокупности непостоянна. Регрессия на основе взвешенного метода наименьших квадратов доступна в SPSS Regression Models.
Двухэтапный метод наименьших квадратов – применяется, когда предиктор и прогнозируемая переменная оказывают взаимное влияние друг на друга. Двухэтапный метод наименьших квадратов доступен в SPSS Regression Models.
Анализ выживаемости – оценка распределения временных интервалов между двумя событиями, например, временных интервалов от момента привлечения клиента до момента ухода клиента к конкурентам, даже если второе событие не регистрируется (например, клиенты остаются лояльными). Анализ выживаемости доступен в SPSS Advanced Models.
Мощным инструментом анализа временных рядов и прогнозирования является модуль SPSS Trends. SPSS Trends позволяет анализировать информацию о прошлом и предсказывать будущее.
SPSS Trends позволяет воспользоваться
следующими процедурами
− Анализ Бокса-Дженкинса для несезонных и одномерных моделей;
− Процедуры для обработки сезонных составляющих;
− Оценка до четырех параметров в 12 различных моделях экспоненциального сглаживания;
− Различные регрессионные методы: регрессия тренда, регрессионные модели с авторегрессионными ошибками первого порядка;
− Разложение временных рядов на гармонические составляющие.
На каждом этапе построения модели в SPSS Trends можно воспользоваться альтернативными методами. Для оценки степени адекватности модели в SPSS Trends выводятся статистики и нормальные вероятностные графики. Адекватность моделей можно оценивать при помощи автоматически вычисляемых стандартных ошибок и других статистик.
SPSS для Windows обладает
целым рядом графических
Категориальные диаграммы
(включая несколько типов
Диаграммы для контроля качества (включая диаграммы Парето, Х-среднего и Сигма).
Гистограммы и диаграммы рассеяния (включая перекрывающиеся, матричные и трехмерные).
Диагностические и исследовательские графики (включая графики по наблюдениям и графики временных рядов).
Вероятностные графики (включая графики
наблюденных и ожидаемых
Графики автокорреляционной и частной автокорреляционной функции (включая преобразование натурального логарифма и сезонное и несезонное дифференцирование).
Графики кросс-корреляционной функции (включая преобразование при помощи натурального логарифмирования, сезонное и несезонное дифференцирование).
Система презентационной графики SPSS для Windows позволяет без лишних усилий создавать диаграммы, наилучшим образом описывающие результаты анализа, а также редактировать созданные диаграммы для их более тонкой настройки. Системой презентационной графики также легко пользоваться в случае работы в производственном режиме. SPSS создавать диаграммы и применять параметры созданной диаграммы к новым диаграммам.
Для представления данных в табличном виде в системе SPSS имеется дополнительный модуль SPSS Tables. Интерактивный интерфейс построения таблиц обновляется в режиме реального времени, так что Вы можете видеть, как будет выглядеть таблица, и изменять ее в процессе построения. Такие возможности, как объединение несколько категорий в одну, вставка итогов и подитогов сверху, снизу, справа или слева в таблице, добавление подкатегорий, изменение типов переменных и исключение категорий позволяют быстро и эффективно управлять внешним видом таблиц. Кроме того, вместе с таблицами можно рассчитывать статистические критерии, что позволяет устанавливать и подчеркивать достоверность полученных результатов. Например, можно показать значимость связи между временем, уделяемым домашним животным, и временем восстановления после сердечного приступа, построив таблицу по переменной времени восстановления после сердечного приступа и переменным повседневной деятельности.
Скорость работы и производственные возможности SPSS Tables позволяют создавать большие отчеты, и обеспечивают быстрое и эффективное представление информации, заложенной в огромных массивах данных, в удобной и понятной форме. SPSS Tables обладает целым рядом возможностей, обеспечивающих удобную и быструю доставку получаемых табличных отчетов. Интерактивные мобильные таблицы, создаваемые в SPSS Tables, можно экспортировать в Word и Excel. Дополнительного форматирования таблиц не требуется, однако, при необходимости в таблицы можно вставлять содержательную и описательную информацию. Результаты также можно распечатывать и публиковать в Интернете.
До сих пор существуют пользователи, которые по тем или иным причинам отказываются от использования мыши. Как правило, программное обеспечение разрабатывается таким образом, что все действия (или их основная часть) были выполнимы при помощи клавиатуры. Пакет SPSS не является исключением, и мы, не вдаваясь в подробности, рассмотрим, каким образом управлять его работой без мыши.
Вместо щелчка мыши на выделенном элементе достаточно просто нажать клавишу Enter. Для того чтобы выделить элемент с помощью клавиатуры, можно использовать клавиши табуляции, пробела, а также клавиши со стрелками.
Выбор пункта меню осуществляется двумя способами: перемещением выделения от пункта к пункту либо с помощью клавиш со стрелками, либо с помощью комбинаций клавиш.
Чтобы выделить блок ячеек, следует выделить угловую ячейку намеченного блока, а затем, удерживая клавишу Shift, с помощью клавиш со стрелками расширить выделение. Существуют и другие варианты использования клавиатуры в программе SPSS, однако они гораздо менее важны.
В большинстве социологических исследований анализируется анкетная информация. Условно эти данные можно представить в виде матрицы, строкам которой соответствуют объекты (анкеты), а столбцам − признаки (отдельные вопросы и подвопросы анкеты). Синонимом слова «признак» является слово «переменная», в дальнейшем мы будем употреблять эти термины равноправно.
В современных статистических пакетах такую информацию принято представлять в виде таблицы. Обычно обрабатывается один файл данных, визуально это напоминает таблицу Excel (один лист).
При кодировании информации удобно пользоваться определенными правилами заполнения матрицы в соответствии со структурой обрабатываемой анкеты (Приложение 1).
Матрица данных, собранных на основании такой анкеты, изображена в приложении 2. Пол здесь закодирован в соответствии с содержимым анкеты кодами 1 − мужчины, 2 − женщины; возраст непосредственно введен в данные; проблемы закодированы в трех переменных − указаны коды обведенных при опросе подсказок; для каждой жалобы отведена своя переменная.
Типы переменных можно
рассмотреть с технической
Строчные переменные используются достаточно редко, например, для введения ответов на открытые вопросы или фамилий респондентов, если имеется такая возможность и в них есть необходимость.
Обычно при внесении в компьютер информации для статистической обработки ответы на вопросы анкеты кодируются числами. Хотя с формальной точки зрения практически любая обрабатывающая программа может использовать эти цифры независимо от того, кодируется ли профессия, возраст или сведения о цвете глаз. Различные методы анализа данных ориентированы на данные определенного типа. Для получения интерпретируемых результатов перед применением программы исследователь должен определить тип обрабатываемых соответствующим методом переменных.
Формируя данные, исследователь ставит в соответствие значениям переменной, имеющей содержательный смысл («пол − мужской», «профессия − учитель»), числовые значения. Такое соответствие называется шкалой измерения переменной. В зависимости от свойств переменной выделяют шкалы: номинальную, ординальную (ранговую), интервальную и шкалу отношений.
1) номинальная шкала является самым «низким» уровнем измерения. В этом случае используется только равенство или неравенство значений. Примером таких переменных являются «пол», «профессия».
2) ординальная или ранговая. Часто значения признака выражают степень проявления какого-либо свойства и могут быть упорядочены. Например, работа «интересна», «безразлична» или «не интересна». Такая шкала называется ранговой или ординальной.
1) интервальная шкала предполагает, что можно определить не только порядок значений, но и расстояние между значениями. Эта шкала, однако, такова, что не имеет смысла рассматривать, во сколько раз одно значение больше другого. Пример: шкала измерения температуры по Цельсию.
2) шкала отношений в дополнение к свойствам интервальной шкалы позволяет измерять пропорции значений. Например, мы можем смело заявить, что зарплата в 1000$ вдвое выше зарплаты в 500$.
Техника анализа переменных, измеренных в количественных шкалах (интервальной и шкале отношений), обычно одинакова. В соответствии с типом шкалы измерения переменные относят к номинальным, ординальным (ранговым) и количественным типам переменных.
К особому типу относят переменные, имеющие два ответа − «да» и «нет» (например, «Имеете ли Вы телевизор?»). Эти переменные называют дихотомическими. Их удобно кодировать цифрами 1 («да») и 0 («нет»). Эти переменные представляют простейший вид номинальных переменных, они выражают количество (0 или 1) и поэтому часто используются в количественном анализе.
Такая классификация переменных несколько упрощает действительность. Например, переменная «время суток» при исследовании бюджета времени имеет «кольцевую» структуру, поскольку 0 часов эквивалентно 24 часам.