Автор работы: Пользователь скрыл имя, 01 Декабря 2014 в 10:10, курсовая работа
Состояние жилищной сферы и рынка жилья является одним из важнейших факторов, оказывающих влияние на уровень и динамику основных демографических показателей.
Социальная стабильности общества, уровень безработицы, мобильность рабочей силы и другие факторы во многом определяются наличием достаточного объема жилого фонда, отвечающего современным требованиям общества, возможностью приобретения жилья представителями самых широких слоев населения.
Введение…………………………………………………………………………2
Структура и состояние рынка жилья в РФ и основы статистического изучения динамики цен…………………………………………………………….
Проблемы формирования первичного рынка жилья и факторы динамики цен на жилье……………………………………………….. …………4
Вторичный рынок жилья: характеристика и факторы
изменения цен……………………………………………………………11
Теория статистического анализа динамики цен……………………….15
2 Применение статистических методов для анализа динамики развития цен на первичном и на вторичном рынках жилья РФ за 2000 – 2014 г.г.
2.1 Визуализация данных…………………………………………………22
2.2 Трендовый прогноз цен на жилье и оценка качества прогноза… ….23
2.3 Сравнительный факторный анализ динамики цен на жилье на основе корреляционно-регрессионной модели………………………………………… …………………………………28
Заключение………………………………………………………………………33
Список использованных источников………………………………………… 35
,
где у1 и у2 средние для первой и второй половины ряда динамики;
n1 и n2 - число наблюдений в этих рядах;
σ - среднеквадратическое отклонение разности средних, определяемое по зависимости
Дисперсии для первой и второй частей ряда рассчитываются по зависимости
Проверка гипотезы о равенстве дисперсий осуществляется с помощью F -критерия, основанного на сравнении расчетного отношения с табличным. Расчетное значение критерия определяется по формуле
Если расчетное значение F меньше табличного, при заданном уровне значимости то гипотеза о равенстве дисперсий принимается.
Если F больше, чем табличное значение, то гипотеза о равенстве дисперсий отклоняется и зависимость для расчета t не пригодна для использования.
При выполнении условия о равенстве дисперсий, определяется значение tα и проверяется гипотеза (Н0). При этом теоретическое значение tα определяется с числом степеней свободы равным n1 + n2 -2
Рассмотренный метод дает положительные результаты для рядов с монотонной тенденцией. Когда же ряд динамики меняет общее направление развития, то точка поворота тенденции оказывается близкой к середине ряда. Поэтому средние двух отрезков будут близки, а проверка может не показать наличие тенденции.
Является одним из наиболее простых методов непосредственного выявления основной тенденции. При использовании этого метода ряд динамики, состоящий из мелких интервалов, заменяется рядом, состоящим из более крупных интервалов.
Так как на каждый уровень исходного ряда влияют факторы, вызывающие их разнонаправленное изменение, то это мешает видеть основную тенденцию. При укрупнении интервалов влияние факторов нивелируется, и основная тенденция проявляется более отчетливо. Расчет среднего значения уровня по укрупненному интервалу осуществляется по формуле простой средней арифметической.
Недостатком этого способа является то, что сокращается число уровней ряда, а это не позволяет учитывать изменения внутри укрупненного интервала. К его преимуществам можно отнести сохранение природы явления.
Заключается в том, что вычисляется средний уровень из определенного числа первых по порядку уровней ряда, затем – средний уровень из такого же числа уровней, начиная со второго, далее – начиная с третьего и т. д.
Таким образом, при расчетах среднего уровня как бы «скользят» по ряду динамики от его начала к концу, каждый раз отбрасывая один уровень в начале и добавляя один следующий. Отсюда название – скользящая средняя.
Основное отличие от предыдущего метода состоит в том, что уровни, входящие в интервал усреднения суммируются с различными весами, так как аппроксимация в пределах интервала сглаживания осуществляется с использованием уровней, рассчитанных по полиному n –го порядка
где i - порядковый номер уровня интервала сглаживания.
Кривые роста, описывающие закономерности развития явлений во времени, получают путём аналитического выравнивания динамических рядов. Выравнивание ряда с помощью тех или иных функций (то есть их подгонка к данным) в большинстве случаев оказывается удобным средством описания эмпирических данных, характеризующих развитие во времени исследуемого явления. Это средство при соблюдении ряда условий можно применить и для прогнозирования. Процесс выравнивания состоит из следующих основных этапов:
- выбора типа кривой, форма которой соответствует характеру изменения динамического ряда;
- определения численных значений (оценивание) параметров кривой;
апостериорного контроля качества выбора тренда.
Найденная функция позволяет получить выровненные, или, как их иногда называют, теоретические значения уровней динамического ряда, то есть те уровни, которые наблюдались бы, если бы динамика явления полностью совпадала с кривой. Эта же функция с некоторой корректировкой или без неё, применяется и для экстраполяции.
Вопрос о выборе типа кривой является основным при выравнивании ряда. При всех прочих равных условиях ошибка в решении этого вопроса оказывается более значимой по своим последствиям (особенно для прогнозирования), чем ошибка, связанная со статистическим оцениванием параметров.
Весьма распространенным приемом выявления формы тренда является графическое изображение временного ряда. Но при этом весьма велико влияние субъективного фактора, даже при отображении выровненных уровней. Наиболее надежные методы выбора уравнения тренда основаны на свойствах различных кривых, применяемых при аналитическом выравнивании. Такой подход позволяет увязать тип тренда с теми или иными качественными свойствами развития явления.
Итак, рассмотрим следующие типы уравнений тренда:
;
;
yt =a0 +a1 lnt ,
;
;
где - уровень ряда, полученный в результате выравнивания по прямой,
- начальный уровень тренда;
, , - константы тренда.[10]
2 Применение статистических методов для анализа динамики развития цен на первичном и на вторичном рынках жилья РФ за 2000 – 2014 г.г.
2.1 Визуализация данных
Перед тем как переходить непосредственно к анализу данных, необходимо предварительно выбрать факторы, которые на первый взгляд могут оказывать влияние на цены на жилье. Для исследования были взяты данные Росстата[9]. Для исследования были выбраны следующие обозначения:
Price (Y) –Средняя цена на первичном рынке жилья по Российской Федерации на конец периода, рублей за 1 квадратный метр общей площади
Nedostr (X1) - количество недостроенных зданий на конец года
Postr (X2) - всего построено, млн м^2
Vtorich (X3) – Средняя цена на вторичном рынке жилья по Российской Федерации на конец периода, рублей за 1 квадратный метр общей площади
Bezrab (X4) - Количество безработных, тыс. чел
Inflation (X5) – уровень Инфляции в России, %
В ходе предварительной обработки информации необходимо проверить гипотезу, относительно однородности выборки и нормальности ее распределения. Для этого мы рассчитываем необходимые показатели:
Описательная статистика, наблюдения 1 - 14
для переменной 'Price' (использовано 14 наблюдений)
Среднее
Медиана
Минимум 8678,0
Максимум
Стандартное отклонение 16791,
Вариация 0,30140
Асимметрия -0,32136
Эксцесс -1,6016
Interquartile range 32674,
Пропущенные наблюдения 0
Коэффициент вариации равен 30,14%, что свидетельствует нам
о достаточной однородности выборки.
Рисунок 1 - Диаграмма распределения частот зависимого признака
Далее проверим распределение выборки на нормальность при помощи критерия . табличное=12,5916. Значение расчетного составило 0,851. Это говорит о том, что мы имеем нормальное распределение с вероятностью ошибки р = 0,2404.
2.2 Сравнительный факторный анализ динамики цен на жилье на основе корреляционно-регрессионной модели
Проведем анализ корреляционных связей.
Рассчитаем парные коэффициенты корреляции между зависимым и каждым из факторных признаков. Парный коэффициент корреляции характеризует тесноту линейной зависимости между двумя переменными. Он изменяется в пределах от -1 до +1, причем чем ближе коэффициент корреляции к 1, тем сильнее зависимость между переменными. Если коэффициент корреляции больше нуля, то связь прямая, а если меньше нуля — обратная.
Коэффициенты корреляции, наблюдения 1 - 14
5% критические значения (двухсторонние) = 0,5324 для n = 14
Price Nedostr Postr Vtorich Bezrab Inf
1,0000 -0,7619 0,9819 0,8804 -0,7800 -0,7969 Price
1,0000 -0,8177 -0,7953 0,5560 0,8019 Nedostr
1,0000 Inf
Проанализировав корреляционную таблицу, можно сказать, что наиболее существенная статистическая связь наблюдается между ценами на вторичное жилье и количеством построенных зданий.
Цена на первичное жилье имеет очень тесную связь с количеством построенных зданий.
Далее произведем оценку методом наименьших квадратов.
Модель 2: МНК, использованы наблюдения 1-14
Зависимая переменная: Price
Коэффициент Ст. ошибка t-статистика P-значение
------------------------------
const -20,7891 8,44563 -2,462 0,0392 **
Nedostr 1,57825e-05 3,02556e-05 0,5216 0,6161
Vtorich -2,62722e-06 5,17881e-05 -0,05073 0,9608
Bezrab 0,00178621 0,000840332 2,126 0,0662 *
Inf 0,151394 0,206546 0,7330 0,4845
Postr 0,219259 0,0893853 2,453 0,0398 **
Среднее зав. перемен 3,814286 Ст. откл. зав. перемен 1,947723
Сумма кв. остатков 17,59566 Ст. ошибка модели 1,483057
R-квадрат 0,643214 Испр. R-квадрат 0,420223
F(5, 8) 3,884481 Р-значение (F) 0,088540
Лог. правдоподобие -21,46531 Крит. Акаике 54,93061
Крит. Шварца 58,76496 Крит. Хеннана-Куинна 54,57567
Исключая константу, наибольшее р-значение получено для переменной 4 (Vtorich)
Примечание: * означает 10%-й ** означает 5%-й уровень ошибки, *** означает 1%-й уровень ошибки.
Построим уравнение регрессии:
Price=-20,7891+1,57825e-05*
F-статистика Фишера =3,89. Это означает, что уравнение регрессии значимо, т.к. F-статистика табличная равна 3,69. Уравнение регрессии в целом значимо с вероятностью ошибки р = 0,088540
Исходя из полученных данных методом наименьшего квадрата, можно сделать выводы:
1) Модель описывает 64% выборки(на основании R^2)
2) Значимыми факторами являются количество безработных и количество построенных зданий.
3) Остальные факторы незначимы на данном этапе.
Проверка на мультиколлениарность:
Метод инфляционных факторов
Минимальное возможное значение = 1.0
Значения > 10.0 могут указывать на наличие мультиколлинеарности
Nedostr 3,607
Vtorich 6,995
Bezrab 3,953
Inf 4,723
Postr 9,434
Мультиколлениарность отсутствует.
Далее, проведем проверку на гетероскедастичность при помощи теста Уайта. Так как МНК требует выполнения условий Гаусса-Маркова, которые гарантируют состоятельность, несмещенность и эффективность найденных оценок. Нарушение этих условий может давать оценки с плохими статистическими свойствами. Одной из ключевых предпосылок МНК является условие постоянства дисперсии случайных отклонений. Выполнимость данной предпосылки называется гомоскедастичностью (постоянством дисперсии отклонений). Её невыполнимость называется гетероскедастичностью (непостоянством дисперсии отклонений). Хи-квадрат равен 12,784618, что меньше табличного 47,33 при уровне значимости 5%. Гипотеза об отсутствии гетероскадестичности принимается т.к. расчетное меньше табличного.
Теперь исключаем из модели незначимые факторы.
Модель 5: МНК, использованы наблюдения 1-14
Зависимая переменная: Price
Коэффициент Ст. ошибка t-статистика P-значение
------------------------------