Основы статистической обработки информации

Автор работы: Пользователь скрыл имя, 17 Июня 2013 в 12:13, контрольная работа

Описание работы

Вариация – это различие в значениях, какого-либо признака у разных единиц данной совокупности в один и тот же момент времени. Величины признаков изменяются под действием различных факторов. И, следовательно, чем разнообразнее условия, влияющие на размер данного признака, тем больше его вариация. Исследование вариации в статистике имеет большое значение, так как помогает изучить сущность явления. Измерение вариации, выяснение ее причины, выявление влияния отдельных факторов дает важную информацию (продолжительность жизни, доходы и расходы населения и т.д.) для принятия научно-обоснованных управленческих решений.

Файлы: 1 файл

Основы статистической обработки информации.docx

— 1.62 Мб (Скачать файл)

 

Для измерения сезонных колебаний  статистикой предложены различные  методы. Наиболее простые и часто  употребляемые из них:

  • метод абсолютных разностей;
  • метод относительных разностей;
  • построение индексов сезонности.

 

Первые два способа  предполагают нахождение разностей  фактических уровней и уровней, найденных при выявлении основной тенденции развития (тренда).

Применяя способ абсолютных разностей, оперируют непосредственно  размерами этих разностей, а при  использовании метода относительных  разностей, определяют отношение абсолютных размеров указанных разностей к  выровненному уровню. При выявлении  основной тенденции используют либо метод скользящей средней, либо аналитическое  выравнивание. В некоторых случаях  в стационарных рядах можно пользоваться разностью фактических уровней  и средним месячным уровнем за год. Использование данных за несколько  лет связано с тем обстоятельством, что в отклонениях по отдельным  годам сезонные колебания смешиваются  со случайными. Чтобы элиминировать  случайные колебания, берут средние  отклонения за несколько лет.

Для выделения сезонной волны  надо определить средний уровень  за каждый месяц по 3-5-летним данным  и общую среднюю за весь рассматриваемый  период.

Общая средняя  получается делением суммы уровней за все  три-пять лет на 36 или 60 (общее число  месяцев). Затем определяется абсолютное отклонение средних месячных показателей  от общей средней.

Метод абсолютных разностей  заключается в расчете месячных средних и общей средней с  последующим их сравнением:

yt — средний месячный  уровень показателя за три  и более лет,

yc — среднемесячное значение  показателя  за все годы.

 

Если сезонность оценивается  по данным за 3 года (36 месяцев), если за 5 лет (60 месяцев):

 

где: yi — значение уровня динамического ряда. Величина и знак значений абсолютных отклонений определяют наличие сезонности.

В качестве показателя, характеризующего сезонную неравномерность, используется показатель относительного отклонения.

Метод относительных разностей  является развитием метода абсолютных разностей. Для нахождения относительных  разностей абсолютные отклонения делят  на общую среднюю и выражают в  процентах.  По величине и знакам значений относительных отклонений можно судить о величине и силе влияния сезонного фактора.

Вместо относительных  разностей за каждый месяц может  быть вычислен индекс сезонности, который  рассчитывается как отношение среднего уровня соответствующего месяца к общей  средней. Индекс сезонности рассчитывается:

yt — средний уровень  показателя соответствующего месяца  за три и более лет,

yc — среднемесячное (по  году) значение  показателя  за  все годы (общая средняя).

Рассчитанные значения индекса  сезонности сравниваются со значением 100 %. Если индекс сезонности превышает 100 % — это свидетельствует о  влиянии сезонного фактора в  сторону увеличения уровней динамического  ряда и наоборот. Расчет индекса  сезонности по данной формуле не учитывает  наличие тренда.  Выделение сезонной волны можно выполнить на основе построения аналитической модели проявления сезонных колебаний. Построение аналитической  модели выявляет основной закон колеблемости данного временного ряда в связи  с переходом от месяца к месяцу и дает лишь среднюю характеристику внутригодичных колебаний.

Определим наличие сезонных колебаний для динамического  ряда условного показателя:


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вывод: ярко выраженные сезонные колебания приходятся на июнь-июль, недоучет которых при составлении  прогноза, может существенно исказить его.

3. Задача. Для обследования  группы цыплят была создана  выборка способом случайного  повторного отбора. Требуется определить  доверительные пределы случайных  колебаний средней живой массы  цыплят и доли петухов в  стаде при уровне вероятности  суждения 0,95 (нормированное отклонение  составляет 1,96).


 

 

 

 

 

 

 

 

 

 

 

 

 

1

Вероятность

0,95

   

2

нормированное отклонение

1,96

   

3

поголовье цыплят

25

   

4

поголовье петушков

14

   

5

средняя живая масса цыплят

116

   

6

средняя доля петушков

0,56

   

7

средняя квадратическая отклонение живой массы

8,85

   

8

средняя квадратическаое  отклонение доли петушков

0,5

   

9

средняя ошибка выборки живой  массы

1,8

   

10

средняя ошибка выборки доли петушков

0,1

   

11

предельная ошибка выборки  живой массы

3,47

   

12

предельная ошибка выборки  доли петушков

0,19

   
           
           
           
   

живая масса цыплят колеблется от

 

1,67

 
           
   

живая доля петушков колеблется в пределах

 

0,09

 
           

 

 

 

 

 

4. Особенности программы  STATISTICA. Ее использование для социально-экономического анализа данных.

 

ВВЕДЕНИЕ 

(Все продукты)

В работе программы STATISTICA 10 применяются уникальные достижения 64-битной компьютерной технологии (в  случае ее использования), а также  параллельные процессы.

Большинство функций программы STATISTICA, используемых при обработке  данных и выполнении анализа (Классификации  и регрессионные деревья, Выявления  связей, Общие линейные модели и  т.д.), оптимизированы с помощью многопоточной  технологии. Таким образом, стало  возможным их параллельное использование  на многоядерных процессорах и достижение высочайшего быстродействия для  многоразмерных задач в экономике, бизнесе, медицине.

 

 

ИНТЕГРАЦИЯ и СОВМЕСТИМОСТЬ 

SharePoint

(Все продукты)

Загрузка и выгрузка из STATISTICA 10 теперь использует новые программы  обмена и интеграции данных – Microsoft SharePoint.

Документы STATISTICA теперь можно  чрезвычайно удобно передавать и  получать из SharePoint с помощью пользовательского  интерфейса программы. Насколько нам  известно, на данный момент STATISTICA 10 –  единственное приложение по обработке  и разведочному анализу данных, которое  использует эту эффективно интегрированную  программу.

Office 2010

(Все продукты)

STATISTICA напрямую импортирует  файлы Office 2007 и 2010, сохраняя форматирование. Эта новая технология позволила  повысить скорость импорта данных  из Excel 2007 и 2010 в Таблицы программы  STATISTICA, а также сделала его  более устойчивым к ошибкам  выгрузки. Загрузка/выгрузка из Excel 2007/2010 теперь поддерживает текстовый  формат ячеек. 

OLAP - Уникальные возможности

(Все продукты)

STATISTICA Query может получать  данные не только из внешних  систем, таких как поставщик данных Microsoft OLE DB, но и из хранилищ  бизнес-информации SAP Business Warehouse.

MDX запросы могут быть  составлены с помощью удобного  графического интерфейса- конструктора  либо путем написания MDX кода  вручную. 

STATISTICA PI Connector

(Дополнение)

Чрезвычайно упрощена установка  и работа STATISTICA PI. Данный продукт  был включен в дистрибутив STATISTICA и не требует отдельной установки.

ВИЗУАЛИЗАЦИЯ ДАННЫХ

(Все продукты)

Вводный обзор 

Великолепные графические  возможности STATISTICA теперь чрезвычайно  усовершенствованы. Программа автоматически  определяет и использует преимущества высокоэффективного аппаратного ускорения, которое может быть реализовано  не только видеокартами стационарных компьютеров «топ»-уровня, но и графическими ускорителями ноутбуков «среднего» уровня.

В результате графики строятся не только быстрей, но и поддерживают более продвинутые настройки  изображения. Графические возможности  программы STATISTICA были усовершенствованы благодаря новым процедурам расслоения, закрашивания и сглаживания линий, кривых и поверхностей.

Кроме того, все графические  документы STATISTICA (как отдельные, так  и собранные в рабочую книгу) могут изменяться и настраиваться  интерактивно (с помощью инструментов, расположенных в нижней части  окна графика).

Новые возможности STATISTICA 10 позволяют  не только улучшить внешний вид графика, но и проводить более глубокий визуальный анализ и выявлять скрытые  тренды путем постепенного уменьшения насыщенности изображения, а также  вращения трехмерных графиков.

Интерактивное масштабирование 

Теперь вы можете интерактивно изменять масштаб всех осей графика. Наведите курсор мыши на ось, потяните вправо или влево, масштаб изменится. Интерактивное масштабирование  позволяет визуально выявить  скрытые тренды с помощью растяжения или сжатия интересующей части графика.

Интерактивная прокрутка 

С помощью мыши вы можете интерактивно прокручивать оси графика  влево или вправо (наведите курсор мыши на центр оси). Интерактивная  прокрутка поможет обнаружить тренды, скрытые в массиве данных.

Прозрачность 

STATISTICA 10 поддерживает опцию  «прозрачность» (настраивается с  помощью ползунков, расположенных  в нижней части окна), что позволяет  управлять областью графика и  удалять лишние точки маркеров (только в Windows Vista SP 2 или Windows 7). Управление прозрачностью позволит  Вам выявить тренды, скрытые в  плотном массиве данных (особенно  при построении диаграмм рассеяния  по выборке большого объема).

 

Целью является достижение оптимального уровня плотности точек, при котором можно выявить  закономерности, скрытые большим  количеством случайных данных (белым  шумом), которые создают эффект “чернильного пятна”.

Также, настройка прозрачности области графика позволяет различать  наложенные точки.

Reference Lines (Соединительные  линии) 

В программе STATISTICA 10 стало  гораздо проще добавлять соединительные линии на график с помощью опции Reference Lines, доступной в диалоге  Все параметры графика.

Интерактивная правка текста

Текст теперь можно изменять напрямую в окне графика, не открывая редактор. Сам же редактор текста остался  доступным и по-прежнему содержит дополнительные опции для форматирования.

ПОЛЬЗОВАТЕЛЬСКИЙ ИНТЕРФЕЙС, ЭРГОНОМИКА

Вводный обзор 

Пользовательский интерфейс STATISTICA 10  был существенно переработан  с учетом последних достижений эргономики в следующих областях: 1) уменьшение зрительного напряжения и 2) улучшение  эффективности работы человека с  компьютером.

STATISTICA 10 предлагает рациональный  пользовательский интерфейс, который  был получен с помощью последних  достижений техники отображения  и обновленной иконографии. 

Лента

(Все продукты)

Лента полностью обновилась и теперь содержит новые символы [также поддерживается классическое меню для совместного использования  с лентой]. Макросы STATISTICA Visual Basic можно  теперь добавить в меню ленты.

Улучшения рабочего пространства

(STATISTICA Data Miner/STATISTICA Text Miner)

Рабочее пространство STATISTICA Data Miner теперь содержит большие (и визуально  оптимизированные) иконки. Также были настроены другие удобные пользовательские характеристики этого рабочего пространства.

STATISTICA Добавить-Установить  на ленте 

(Все продукты)

Лентой STATISTICA теперь можно  управлять программно. Настроить  ленту теперь можно с помощью  вызова ППИ (Прикладного программного интерфейса). Это полезно с практической точки зрения при создании STATISTICA Добавить-Установить.

АНАЛИЗ

Design Simulation

(Все продукты, кроме STATISTICA Base)

STATISTICA 10 упрощает процедуру  подгонки и моделирования. Используйте  новую вкладку Design Simulation в модуле  Подгонка и моделирование. 

Модель пропорциональных рисков Кокса 

(Все продукты, кроме STATISTICA Base)

Обширная и широко масштабируемая реализация Модели пропорциональных рисков Кокса (мощная модель для данных, содержащих времена жизни) добавлена в версию STATISTICA 10. Данный модуль имеет приложения в следующих областях:

 

Анализ времен жизни пациентов  в медицине

 

Анализ оборота клиентов (утрата доверия клиентов)

 

Моделирование и оценка времени  эксплуатации механических деталей (надежность)

Модуль Модель пропорциональных рисков Кокса позволяет эффективно работать с цензурированными данными, категориальными предикторами и  планами, содержащими взаимодействия и/или вложенные эффекты. В качестве техники построения моделей этот модуль использует метод наилучших  подмножеств и пошаговую регрессию. Построение функций выживаемости для  новых данных можно задать с помощью STATISTICA Rapid Deployment.

Информация о работе Основы статистической обработки информации