Автор работы: Пользователь скрыл имя, 31 Октября 2013 в 16:51, курс лекций
Анализ невременных данных.
Характеристики случайной величины.
Модель парной линейной регрессии.
Теорема Гаусса-Маркова.
Ковариационная матрица.
Дисперсионный анализ.
Модель множественной регрессии.
Спецификация модели.
Dummy – переменные, фиктивные переменные.
2. Н0 – отвергается Þ с вероятностью a принимается Н .
Например. Руководство
универмага хотело бы начать
торговлю своими товарами
p - доля пользователей Интернет, которая совершает покупки меньше 0,4
Н0: p<0,40
Н : p³ 0,40
В таких условиях a - уровень значимости. a=0,95 (0,98)
Если принимается Н0, то услугу внедрять
не стоит. Если же Н0 не принимается, т.е.
нет достаточных оснований
Мы рассматривали двумерную кросстабуляцию, т.е. оценивали взаимосвязь 2-х переменных. Тем не менее часто введение 3-й переменной позволяет маркетологу лучше понять природу исходных связей между 2-мя переменными. Введение 3-й переменной может привести к следующему результату:
Влияние
Две исходные переменные:
- Есть связь между 2-мя
- Отсутствие связи между 2-мя исходными переменными Þ введение 3-ей Þ 1.Есть связь между 2-мя исходными переменными
2.Исходящая структура без
Например. Связь между желанием совершить тур поездку от возраста. Таблица сопряженности 2-х переменных
возраст | ||
желание |
До 45 |
После 45 |
Да |
50% |
50% |
нет |
50% |
50% |
Добавим 3-ю переменную – пол. Можно
увидеть подавленную связь
муж |
жен | |||
Желание |
До 45 |
после |
До 45 |
после |
Да |
60% |
40% |
35% |
65% |
нет |
40% |
60% |
65% |
35% |
Структура международных маркетинговых исследований
Провести международное
Вывод. При использовании эконометрических моделей необходимо обязательно учитывать все эти факторы для получения точных прогнозов, достоверных результатов и применимых моделей.
Изучение большинства экономиче
Это ряд наблюдаемых значений изучаемого
показателя, расположенных в
Обозначается: - временной ряд, t=
N – последняя дата
Временные данные отличаются от обычных следующим:
Чаще всего работают с исходным рядом, но иногда его преобразуют, получая производственный ряд.
Если значения уровня ряда точно определены какой-либо математической функцией, то такой ряд называется детерминированный или неслучайный.
Если же уровни временного ряда могут быть описаны с помощью функции распределения вероятностей, то такой ряд называется случайным.
Временный ряд бывает: - детерминированный (объем, оценка)
Примером детерминированной случайной величины является списочная численность работников.
Процессы, которые рассматриваются во времени в соответствии с законами теории вероятности, называются стохастическими.
Особый вид временного ряда – это так называемый белый шум. Это абсолютный теоретический процесс, который реально не существует. Тем не менее, он является очень важной математической моделью, которая широко применяется при решении множества практических задач. Случайная последовательность значений у1,у2,уN будет белым шумом, если это одинаково распределенные С.В., математическое ожидание которых равно нулю (колеблется около нуля), а дисперсия D(yt)=s2=const.
Белый шум
Для описания и детального изучения временных рядов используются различные математические модели. Их идентификация предполагает выявление основных компонент, которые содержат изучаемые временные ряды. Данные, представленные виде временного ряда могут содержать 2 компоненты – систематическую и случайную. Систематической компонентой называются факторы, действующие постоянно. Выделяют 3 основных систематических компоненты:
1.тренд
2.сезонность
3.цикличность
Тренд – линейная или нелинейная компонента, плавно изменяющаяся во времени. Тренд описывает чистое влияние долговременных факторов.
Сезонная компонента – это периодические колебания уровней временного ряда в течение не очень долгого периода. Отражает повторяемость экономических процессов.
Циклическая компонента характеризует длительность повторяющихся фаз явлений.
Длительность фаз может быть разной, амплитуда колеблется, но последовательность всегда сохраняется.
Разница между соседними периодами или ямами называется периодом цикла.
Например: циклы Кузнецова. Вывел 15-летние строительные циклы инвестиций строительства домов в США.
Случайные составляющие – это случайный шум или ошибка, воздействующая на временной ряд не регулярно. Основными причинами случайных ошибок могут быть факторы резкого и внезапного воздействия, т.е.катастрофы, а также воздействие текущих факторов, которое может быть связано, например, с ошибками наблюдения.
Таким образом, временной ряд может быть представлен как функция
Таким образом модель временного ряда может быть представлена в нескольких вариантах:
1.аддитивная -
2.мультипликативная -
3.смешанная -
При моделировании на практике часть
систематических компонент
Замечание: Модель временного ряда считается хорошо подобранной, если после удаления из ряда наблюдаемых значений систематических компонент и моделей зависимости от времени, остатки являются белым шумом (мелкими случайными выбросами, т.е. непрогнозируемый процесс).
Тренд – основная тенденция или составляющая ряда (она отражает его долговременную тенденцию). Поэтому ее выявление описания очень важно. Для ее определения используют следующие методы:
Прежде чем определять тренд, необходимо сначала доказать, что он есть.
В наше время известно около 10 методов, позволяющих выявить тренд. Рассмотрим 1 из них.
1)Исходный ряд Уt - ранжируется (по возрасту)
2)По ранжированному ряду определяется медиана, т.е.наблюдение, которое делит выборку пополам (50% - выше выборки и 50% ниже)
3)По исходному ряду строится новый ряд, состоящий из 0 и 1.
По Уt ®
Последовательность 0 или 1 называется серией.
Далее определяется количество серий К и длина максимальной серии t.
Считается, что тренд есть, если не выполнено хотя бы 1 из 2-х неравенств:
Т – объем выборки.
1,96 – квантиль нормального распределения.
После того, как определили наличие тренда, можно приступить к его моделированию. Метод аналитического выравнивания заключается в том, что трендовая составляющая ищется как функция от времени.
Для оценки точности построения тренда используют значимость коэффициентов и R2.
В практике статистических исследований различают следующие типы развития явления во времени, т.е.следующие типы трендов:
1. Равномерное развитие, т.е.развитие
с постоянным абсолютным
,
t – время
а0, а1 – неизвестные коэффициенты, которые находятся методом наименьших квадратов
а1>0 – рост
а1<0 – спад
2. Равноускоренное или
а2>0 – ускорение развития
а2<0 – замедление развития
а2 – коэффициент, характеризующий постоянное изменение скорости развития
а3>0
а3<0
у=f(t)
Это развитие явления, характеризуется стабильным темпом роста или снижения.
а1 – коэффициент, характеризующий степень интенсивности развития
Используя метод аналитического выравнивания на основании 100 ежедневных данных о курсе евро, можно получить следующее уравнение: Euro=30+0,03t-0,00007t2,
Тогда прогноз на следующий день,
полученный с помощью этой модели
будет выглядеть следующим
Замечания:1. Для того, чтобы построить уравнение тренда на компьютере, необходимо сначала создать новую переменную:
, …
затем строим обычную регрессию, вместо зависимой переменной подставляем новые ряды.
Полученные оценки коэффициентов и образуют уравнение регрессии.
2. Для того, чтобы с помощью данной методики действительно выявить основную тенденцию, необходим большой объем данных, а именно объем выборки. Т>300, в противном случае основная тенденция будет выявлена неправильно.
3. Трендовая модель в исследуемый период должна развиваться эволюционно, т.е.необходимо учесть резкие всплески, кризисы. Например: структурный сдвиг, который необходимо учитывать.
4. При моделировании временных рядов необходимо также учитывать автокорреляцию, т.е.зависимость сегодняшнего от прошлого
5. Если подбирая полученную модель получилась очень большая степень тренда (больше 3-4). Возможно имеет место сезонность. Например: у=f(t”)
Следует сначала избавиться от сезонности, а потом уже моделировать.