Автор работы: Пользователь скрыл имя, 12 Марта 2013 в 15:00, методичка
Дисциплины «Основы научных исследований на транспорте», «Основы научных исследований», «Планирование экспериментов и инженерных наблюдений», «Планирование экспериментов» являются специальными дисциплинами, так как при их изучении, студенты получают знания и навыки, необходимые для практической работы инженеро-техническим и научным работникам, преподавателям, менеджерам и позволяющие им продолжить обучение в магистратуре и аспирантуре.
ВВЕДЕНИЕ
3
1. Лабораторная работа №1 Доверительная вероятность, доверительный интервал…………………………………………………...
5
2. Лабораторная работа №2 Корреляционный анализ…………………...
8
2.1. Выявление наличия взаимосвязи между признаками…………….
9
2.1.1. Расчёт коэффициентов корреляции детерминации………….
9
2.2. Определение формы связи………………………………………….
10
2.3. Определение силы (тесноты) и направления связи……………….
12
2.4. Проверка статистической значимости коэффициентов корреляции…………………………………………………………………..
14
3. Лабораторная работа №3 Регрессионный анализ……………………...
15
3.1. Определение вида аналитической зависимости (спецификация модели)………………………………………………………………………
17
3.2. Оценка параметров модели…………………………………………
17
3.3. Проверка значимости регрессионной модели……………………..
18
3.4. Значимость коэффициентов регрессии…………………………….
18
4. Лабораторная работа №4 Оценка адекватности теоретических решений……………………………………………………………………...
20
4.1. Определение критерия Фишера…………………………………….
22
Рекомендуемая литература………………………………………………...
24
ПРИЛОЖЕНИЕ……………………………………………………………..
25
Необходимо подчеркнуть, что величина коэффициента корреляции еще не гарантирует его значимости: даже большой коэффициент может оказаться статистически незначимым (например, при малом объеме выборки), а небольшой коэффициент (если выборка велика) - значимым.
Задание
По данным из табл.4, 5, 6 (Приложение) определить
1. Вид зависимости.
2. Направление и вид связи в рядах данных.
3. Значение коэффициента
4. Сделать вывод о силе связи.
5. Определить статистическую значимость полученного коэффициента корреляции.
6. Сделать вывод.
Контрольные вопросы
Лабораторная работа №3
Тема: Регрессионный анализ
Цель: закрепление знаний, умений и навыков по выполнению регрессионного анализа.
В результате эксперимента мы получаем для значений аргумента (Х1, Х2, ..., Хn) набор значений функций (Y1, Y2, ..., Yn ). Если соединить последовательно точки Y1, Y2, ..., Yn ломаной линией, она не является графическим изображением функции Y = f (X), так как при повторении данной серии опытов мы получим ломаную линию, отличную от первой. Значит, измеренные значения Y будут отклоняться от истинной кривой Y’ вследствие статистического разброса. Наша задача состоит в том, чтобы аппроксимировать экспериментальные данные гладкой (не ломаной) кривой, которая проходила бы как можно ближе к истинной зависимости Y'.
Если корреляционный анализ
позволяет выявить сам факт наличия
зависимости между параметрами,
изменяющимися случайным
Регрессионный анализ – раздел математической статистики, объединяющий практические методы исследования регрессионной зависимости между величинами по статистическим данным.
Регрессия – зависимость величины от некоторой другой величины или от нескольких величин.
Регрессионная модель – уравнение, связывающее эти величины.
Цель регрессионного анализа состоит в определении общего вида уравнения регрессии, построении оценок неизвестных параметров, входящих в уравнение регрессии, и проверке статистических гипотез о регрессии. При изучении связи между двумя величинами по результатам наблюдений (xi, уi), ..., (хn, уn) в соответствии с теорией регрессии предполагается, что одна из них у имеет некоторое распределение вероятностей при фиксированном значении х другой.
В регрессионном анализе один из
признаков зависит от другого. Первый
(зависимый) признак называется в
регрессионном анализе результи
Ранее были рассмотрены основные положения
обнаружения связи между
Наиболее простым является случай, когда регрессия y по x линейна. Как известно, прямая линия описывается уравнением вида:
(9)
где y – результирующий признак;
x – факторный признак;
a0 и a1 – числовые параметры (коэффициенты) уравнения.
Коэффициенты a0 и a1 в уравнении регрессии называются коэффициентами регрессии.
Порядок выполнения работы
3.1. Определение вида аналитической зависимости (спецификация модели)
Обычно на зависимую переменную действуют сразу несколько факторов, среди которых трудно выделить единственный или главный. При этом факторы, влияющие на зависимую переменную, как правило, не являются независимыми друг от друга.
Пример:
• Уравнение парной регрессии для зависимости, изображённой на рис. 3 имеет вид:
Y = 0,1022+0,3084·X. (10)
Построение уравнения регрессии осуществляется в два этапа (предполагает решение двух задач):
– спецификация модели (определение вида аналитической зависимости);
– оценка параметров выбранной модели.
Парная регрессия применяется, если имеется доминирующий фактор, который и используется в качестве объясняющей переменной. Применяется три основных метода выбора вида аналитической зависимости:
– графический (на основе анализа поля корреляций);
– аналитический, т. е. исходя из теории изучаемой взаимосвязи;
– экспериментальный, т. е. путем сравнения величины остаточной дисперсии Dост или средней ошибки аппроксимации A, рассчитанных для различных моделей регрессии (метод перебора).
3.2. Оценка параметров модели
Для оценки параметров регрессий, линейных по этим параметрам, используется метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических значений при тех же значениях фактора x минимальна. Коэффициенты а0 и а1, называемые коэффициентами регрессии, определяются равенствами:
|
(11) | |
|
(12) |
Для определения
(13)
3.3. Проверка значимости регрессионной модели
В основе проверки значимости регрессии лежит идея разложения дисперсии (разброса) результативного признака на факторную и остаточную дисперсии, т.е. объясненную (за счет независимых факторов) часть дисперсии и часть, оставшуюся необъясненной в рамках данной модели.
Мерой значимости регрессии служит значение т.н. F- критерия – отношения факторной дисперсии к остаточной. Чем лучше регрессионная модель, тем выше доля факторной и ниже доля остаточной дисперсии. Fфакт определяется по следующему соотношению:
, (14)
где, – расчётное значение (по регрессионной модели);
n – число наблюдений;
m – число параметров при переменных;
– коэффициент корреляции.
Для линейной регрессии m = 1.
Fтабл – максимально возможное значение критерия под влиянием случайных факторов при степенях свободы k1 = m, k2 = n – m – 1 и уровне значимости α (табл.2).
Если Fтабл < Fфакт, то признается статистическая значимость и надежность оцениваемых характеристик. Если Fтабл > Fфакт, то признается статистическая незначимость, ненадежность уравнения регрессии.
3.4. Значимость коэффициентов регрессии
Свойства коэффициентов регрессии.
1. Коэффициент регрессии
2. Коэффициент регрессии не симметричен , т.е. изменяется, если X и Y поменять местами.
3. Единицей измерения коэффициента регрессии является отношение единицы измерения Y к единице измерения X ([ Y ] / [ X ]).
4. Коэффициент регрессии изменяет
Сравнение коэффициентов корреляции и регрессии
Коэффициент корреляции
• Принимает значения в диапазоне от -1 до +1
• Безразмерная величина
• Показывает силу связи между признаками
• Знак коэффициента говорит о направлении связи
Коэффициент регрессии
• Может принимать любые значения
• Привязан к единицам измерения обоих признаков
• Показывает структуру связи между признаками
• Знак коэффициента говорит о направлении связи
Проверка значимости коэффициентов регрессии означает проверку гипотезы об отсутствии связи между результативным и каждым из факторных признаков. Такая гипотеза означает, что ненулевые значения регрессионных коэффициентов обусловлены лишь случайностями выборки, а в генеральной совокупности все коэффициенты этого уравнения равны нулю.
Для проверки значимости каждого коэффициента регрессии вычисляется tфакт -статистика, которая показывает, во сколько раз этот коэффициент превышает свою среднюю ошибку в выборке.
; (15)
где ma1 и ma0 — стандартные ошибки параметров линейной регрессии.
Стандартные ошибки параметров линейной регрессии определяются по формулам:
(16)
(17)
Если tтабл < tфакт, то значение a0 и a1 не случайно отличается от нуля и сформировалось под влиянием систематически действующего фактора. Если tтабл > tфакт, то признается случайная природа формирования значения a0 и a1.
Проверка значимости коэффициентов регрессии важна потому, что коэффициенты регрессии, в отличие от коэффициентов корреляции, не имеют максимальных и минимальных значений и их величины зависят от единиц измерения соответствующих признаков.
Значит, сама по себе величина коэффициента регрессии никак не определяет силу влияния фактора на результат. Например, существенным в модели может оказаться и небольшой коэффициент регрессии, если этот коэффициент значимый.
Если же коэффициент незначимый, то независимо от его величины следует считать, что соответствующий фактор не оказывает реального влияния на результативный признак.
Использование регрессионного анализа.
• Построение моделей, объясняющих механизм влияния факторных признаков на результат.
• Статистический прогноз — вычисление значения результативной переменной для любых значений факторов.
• Восполнение пропусков в данных.
Задание
1. По имеющимся данным n наблюдений за совместным изменением двух параметров x и y (Лабораторная работа №1) необходимо определить аналитическую зависимость ŷ, наилучшим образом описывающую данные наблюдений.
2. Определить значимость регрессионной модели и проверить значимость коэффициентов регрессии (при α = 0,95).
3. Сделать вывод.
Контрольные вопросы
Лабораторная работа №4
Тема: Оценка адекватности теоретических решений
Цель: закрепление знаний, умений и навыков по оценке адекватности теоретических решений.
Дисперсионный анализ (от латинского Dispersio – рассеивание) – статистический метод, позволяющий анализировать влияние различных факторов на исследуемую переменную. Метод был разработан биологом Р. Фишером в 1925 году и применялся первоначально для оценки экспериментов в растениеводстве. В дальнейшем выяснилась общенаучная значимость дисперсионного анализа для экспериментов в психологии, педагогике, технике и др.
Целью дисперсионного анализа является проверка значимости различия между средними (нескольких группах наблюдений, выбранных из генеральной совокупности) с помощью сравнения дисперсий. Дисперсию измеряемого признака разлагают на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Последующее сравнение таких слагаемых позволяет оценить значимость каждого изучаемого фактора, а также их комбинации.
Обобщенно задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака выделить три частные вариативности: