Автор работы: Пользователь скрыл имя, 11 Января 2014 в 20:29, доклад
Выполненная самостоятельная работа охватывает основные разделы математической статистики, такие как равномерно распределенные случайные величин, их основные характеристики, создание и анализ выборок, работа с выборочными оценками и построение доверительных интервалов, работа с гистограммами, проверка статистических гипотез и другие.
В ходе работы создается выборка случайных величин, вычисляются ее параметры (как точечные, так и интервальные), выборка нормализуется, приводится к заданному виду, по выборке строятся гистограммы, находятся коэффициенты корреляции, автокорреляционные функции и спектральные плотности.
Федеральное агентство по образованию
Московский Государственный Горный Университет
Кафедра АСУ
Отчет
по самостоятельной работе
по дисциплине «Теория вероятностей,
математическая статистика и случайные процессы»
Выполнил:
Принял:
проф. Бахвалов Л.А.
Москва 2011
В данном отчете приведен обзор теоретического материала в объеме лекционного материала, в контексте выполнения данной работы. Помимо теоретических формул представлены некоторые упрощенные формулы для практических вычислений. Отчет выполнен в Microsoft Word, формулы написаны с помощью редактора формул Microsoft Equation 3.0. Так же представлены практические выкладки по выполнению задания в объеме лекционного материала.
Выполненная самостоятельная работа охватывает основные разделы математической статистики, такие как равномерно распределенные случайные величин, их основные характеристики, создание и анализ выборок, работа с выборочными оценками и построение доверительных интервалов, работа с гистограммами, проверка статистических гипотез и другие.
В ходе работы создается выборка случайных величин, вычисляются ее параметры (как точечные, так и интервальные), выборка нормализуется, приводится к заданному виду, по выборке строятся гистограммы, находятся коэффициенты корреляции, автокорреляционные функции и спектральные плотности.
Для выполнения работы написана часть программы в среде разработки Microsoft Visual C#.
Оглавление
1.1. получить выборку значений РРСВ объемом 150 элементов (четыре значащих цифры) на отрезке (0; 1) с помощью мультипликативного генератора случайных чисел,
1.2. построить гистограмму для этой случайной величины,
1.3. по гистограмме найти оценку математического ожидания и дисперсии и сравнить ее с оценкой, найденной по выборке.
2.1. построить выборку НРСВ по формуле скользящего суммирования k = 5 чисел (выборка №2),
2.2. построить гистограмму по выборке №2, по гистограмме определить математическое ожидание и дисперсию,
2.3. преобразовать полученные случайные величины к случайным величинам с математическим ожиданием равным числу лет и дисперсией равной 10. Назовем эту выборкой №3.
3.1. построить доверительные интервалы для математического ожидания и дисперсии выборки №3,
3.2. проверить
гипотезу о виде закона
3.3. найти вероятность того, что студент старше вас на 2 года,
4. Исследование случайных процессов:
4.1. для выборки №2 построить автокорреляционную функцию,
4.2. нормировать автокорреляционную функцию,
4.3. построить спектральную плотность по корреляционной функции.
Отчёт должен быть выполнен в Microsoft Word, напечатан, переплетён.
Графика в отчёте должна быть выполнена графическим редактором. Формулы должны набираться с использованием редактора формул Microsoft Word. Пояснительная записка должна содержать необходимые теоретические материалы в объёме лекционного материала.
Случайной называют величину, которая в результате испытания принимает только одно значение из всех возможных, наперед не известное и зависящее от случайных величин, которые заранее не могут быть учтены.
Равномерно распределённой случайной величиной называется случайная величина, которая с равной вероятностью принимает любое из возможных значений. На своей области определения она имеет равномерную плотность распределения (рис.1)1.
Числовыми характеристиками равномерно распределённой случайной величины являются математическое ожидание и дисперсия.
Математическое ожидание (mx) непрерывной случайной величины X имеет смысл среднего значения величины Х и является величиной неслучайной. Для непрерывной величины математическое ожидание определяется интегралом:
В случае для дискретной случайной величины математическое ожидание принимает вид:
Для нахождения оценки математического ожидания по выборке объемом N элементов данная формула может быть преобразована в следующую:
Математическое ожидание mx случайно величины Х, равномерно распределённой в интервале (a,b), равно полусумме концов интервала.
Дисперсия случайной величины имеет смысл меры разброса случайной величины относительно среднего значения и является величиной неслучайное. Для непрерывной величины дисперсия определяется интегралом:
Дисперсией дискретной математической величины называется математическое ожидание квадрата отклонения случайной величины:
Для практического вычисления дисперсии также можно пользоваться упрощенной формулой:
Для получения равномерно распределенных случайных величин можно использовать мультипликативный генератор. Принцип его работы может быть записан следующей формулой (здесь фигурными скобками обозначена операция взятия дробной части числа, M – целое нечетное число – модуль мультипликативного умножения):
Для работы требуется задать первое число (по возможности с большим количеством знаков после запятой), и по формуле найти необходимое количество чисел. Генератор выдает равномерно распределенные числа в пределах от 0<x<1.
Адаптивный мультипликативный генератор – чтобы избежать обнуления или периодизации получаемых с помощью генератора чисел, его формула была доработана.
Для работы адаптивного мультипликативного генератора нужно указать два первых числа, а также значения параметров (в данной самостоятельной работе M – модуль мультипликативного умножения, P – месяц рождения). Далее применяя эту формулу рекурсивно, находится необходимое количество равномерно распределенных случайных чисел.
Выборкой {x1, х2, …, хn} объёма N из совокупности, распределённой по F(x), называется N независимых наблюдений над случайной величиной Х с функцией распределения F(x).
Выборки больших объёмов труднообозримы. Найдем диапазон значений выборки, разобьём его на равные интервалы и подсчитаем для каждого интервала частоту – количество наблюдений, попавших в него. Частоты, отнесённые к общему числу наблюдений N, называют относительными частотами; а графическое представление распределения частот по интервалам – гистограммой; накопленной частотой для данного интервала называют сумму частот данного интервала и всех тех, что левее его.
Гистограмма – кусочно-постоянная функция значений случайной величины, характеризует частоту попадания в интервал.
Гистограмма – удобный инструмент для статического анализа. Число столбцов гистограммы обычно берут небольшим, что делает гистограмму удобной для обозрения. Однако она отражает все характеристики выборки с весьма малой погрешностью, и поэтому с помощью гистограммы можно оценить вид закона распределения и подобрать его аналитическое выражение.
Пусть Х – случайная величина, a≤x≤b (Х принимает произвольные значения в интервале [a,b]), и дана выборка {x0, x1, x2, x3, …,xN-1, xN}
Алгоритм:
1) Выберем xmin и xmax из выборки наблюдений. Например, xmin= a, xmax = b
2) Разобьём интервал (xmin ; xmax) на k подынтервалов. Обычно берут 5≤k≤10
3) Находим величину подынтервала:
4) Определяем границы подынтервалов:
5) Подсчитаем количество наблюдений, попавших в каждый интервал. Обозначим его nj, j = 1,2,3, … k
6) Подсчитаем
относительные частоты – то
есть вероятности попадания
7) Построим график диаграммы:
Гистограмме соответствуют числовые характеристики: среднее значение, средний квадрат и т.д. Эти числовые характеристики являются выборочными оценками соответствующих числовых характеристик случайной величины и представляют собой некоторые функции (статистики) от выборочных значений. Таким образом, по гистограмме возможно оценить числовые характеристики случайной величины 8.
Нахождение оценки математического ожидания (среднее значение выборочных наблюдений):
Нахождение оценки дисперсии:
Нормально распределенной случайной величиной называется величина, плотность распределения которой описывается формулой:
Нормально распределенные величины чаще всего встречаются в практике инженерных расчетов, так как при суммировании большого числа случайных факторов и величин результат имеет нормальное распределение.
Для упрощения расчетов можно привести СВ к стандартному виду, то есть к такому, что ее математическое ожидание равно нулю, а дисперсия – единице. При этом многие формулы примут более простой вид, и именно для стандартизированной СВ созданы таблицы вычисления функций φ(х), Ф(х), χ2 и т.д.
Для стандартизации применяется формула:
Скользящим суммированием называется операция сглаживания. Она часто применяется в задачах фильтрации и прогнозирования, так как позволяет увидеть глобальные закономерности значений случайной величины, не отвлекаясь на локальные колебания графика.
Реализация скользящего суммирования:
Пусть дана выборка {x0, x1, x2, … , xN}
Формула скользящего суммирования имеет вид:
Где k – коэффициент, отражающий глубину скользящего суммирования (k=5);
-начальное значение x; - преобразованное значение.
Как видно, в сглаженной выборке будет на k элементов меньше, чем в исходной.
Чтобы привести выборку к виду с заданными параметрами mx и σх2, требуется:
Наряду с точечными оценками параметров, представляющими из себя некоторую случайную функцию от выборки, в статистике широко используются интервальные оценки параметров. Интервальная оценка параметра указывает границы возможных значений выборочных оценок с некоторой наперед заданной степенью достоверности. Поэтому интервальные оценки параметров позволяют установить точность и надежность точечных оценок. Границы возможных значений называются доверительными интервалами. Заданная степень достоверности называется доверительной вероятностью.
Построение доверительного интервала для математического ожидания НРСВ.
Пусть Х – НРСВ, неизвестны математическое ожидание и дисперсия. Дана выборка {x1, x2, x3, … , xN}, по данной выборке наблюдений находятся выборочные оценки:
Необходимо построить доверительный интервал такой, что (принимаем значения отклонения от истинного mx в обе стороны равными):
Величина q=(1-Pдов)*100% – это уровень значимости, характеризующий вероятность того, что полученная оценка параметра не попадет в вычисленный интервал. Чем меньше q, тем точнее указан интервал значений параметра, но в то же время тем этот интервал шире. Для увеличения точности необходимо увеличивать количество наблюдений N.