Автор работы: Пользователь скрыл имя, 11 Октября 2013 в 23:02, лекция
Математическая статистика – раздел математики, посвященный математическим методам обработки, систематизации и использования статичных данных для практических и научных целей.
Задачей этого раздела является разработка практических методов, регистрации, описания, анализ экспериментальных данных, получаемых в опытах с массовыми явлениями.
Особенностью статистики является изучение массовых, случайных явлений в условной неопределенности.
1. Математическая статистика. Ее виды, особенности, задачи.
Математическая статистика – раздел математики, посвященный математическим методам обработки, систематизации и использования статичных данных для практических и научных целей.
Задачей этого раздела является разработка практических методов, регистрации, описания, анализ экспериментальных данных, получаемых в опытах с массовыми явлениями.
Особенностью статистики является изучение массовых, случайных явлений в условной неопределенности. Достоверность выводов зависит от числа объектов исследования. На основе анализов и прогнозов вырабатывается оптимальное решение.
Статистика подразделяется на:
- теоретическую (вырабатывает методы)
прикладную (общая, отраслевая (экономическая статистика, метеорологическая, медицинская))
Медицинская статистика:
Биологическая статистика (=биометрия) – включает статистические методы, используемые в различных биологических исследованиях (в цитологии, микробиологии).
Статистика:
Количество объектов, входящих в генеральную совокупность называется объемом генеральной совокупности (N)
Генеральная совокупность можно изучать по некоторой ее части.
Результаты исследования некоторого признака генеральной совокупности, будут более надежны, если выборку образовывать случайным образом. Элементы выборки берутся наугад. Каждый объект может попасть в выборку с одинаковой вероятностью. Главным вопросом является: как определить объем выборки, необходимой для получения необходимого результата.
Признаки могут быть
качественными и
Количественные делятся на непрерывные (масса тела) и дискретные (количество волос)
Признак, имеющий значение
от одного объекта к другому называется
варьирующимся. Если количественный признак
лежит в интервале –
xi 35 36 37 38 39 40 41
ni (pi): 2 4 5 6 7 7 2
3. Ряды распределения и способы их представления.
Ряд распределения – это последовательность качественых-количественных значений признака и частоты его встречаемости.
Ряд, составленного на
основе качественного признака –
атрибутивных
Рассмотрим подробнее распределение количественного признака. Значение признака, записанное для всех элементов выборки в том порядке, в каком они были получены образуют простой (упорядоченный) статистический ряд.
1 2 3 4 5 6
170 165 171 165 163 174
Из данных видно: некоторые значения вариант повторяются. Для сокращения записи данные располагаются в упорядоченном виде с указанием частот. Такой ряд называется упорядоченным (=ранжированным).
ni 1 2 1 1 1 1
xi 163 165 160 171 174
Вариационные ряды могут быть непрерывными и дискретными
Способы представления рядов:
Способы графического представления:
А) диаграмма в отрезках – совокупность вертикальных прямых /отрезков. Способ удобен для представления дискретных признаков при небольшом объеме совокупности.
Б) гистограмма – совокупность прилегающих друг к другу прямоугольников. Способ используется для изображения. для интервального ряда. На оси Х откладываются интервалы значения варианта. На каждом из них (на основании) строят прямоугольник. Его высота зависит от частоты встречаемости данной величины.
В) полигон частот – ломаная линия, соединяющая точки, являющиеся серединами интервалов.
Г) Вариационные кривые в зависимости от значения распределения.
ni
Прямоугольное распределение объема совокупности
ni
Колоколообразное (= унимодальное)
ni
Бимодальное
ni
Экспоненциальное
4. Основные меры положения и рассеяния.
На практике ряды распределения описываются различными числовыми характеристиками (мерами).
2
Медиана (Ме) – это величина, делящая
ранжированный ряд на 2 равные
части. Так же она делит
N/2 – Для четных, (N+1)/2 – Для нечетного количества объектов
3 Средняя арифметическая простая – это частное деление суммы всех
значений признака на их общее число объектов
X=(X1+X2+X3…+Xn)/N
Сумма всех <+> и <–> отклонений от х равно «0».
Среднюю арифметическую
простую вычисляют для
4 Средняя взвешенная
Если в совокупности отдельные варианты встречаются неоднократно, то вычисляется средняя взвешенная – это величина, полученная суммированием произведений числовых значений вариант на их частоты с последующим делением суммы на количество всех вариант.
=(х1n1+x2n2+x(n)n(n))/N x1n1+y2n2
5 Средняя квадратическая используется, если признаки выражаются мерами площади. Пример: размер колонии микробов, листовых пластинок.
Разброс числовых значений вариант (генеральной, выборочной совокупности) относительно средних значений характеризуется мерами рассеяния.
- для генеральной
- для выборочной совокупности
Если число объектов менее 30, то рассчитывается исправленная дисперсия (Сигма с крышей)
Где N-1 – число степеней свободы. Это число на 1 меньше, чем весь объем свободности
6. Коэффициент вариации - мера рассеяния равна, отношению стандартного отклонения к средней арифметической V=(S/X)100%
При нормальном распределении коэффициент вариации не > 50%, а часто гораздо ниже (приблизительно 20%)
5. Выборочный метод. Выборки, их виды и требования к ним.
Для того, чтобы получить исчерпывающую информацию о состоянии генеральной совокупности нужно учесть весь ее состав без исключения. Но не всегда есть возможность или необходимость прибегать к сплошному исследованию. В целях экономии времени и средств, анализу подвергается часть совокупности выборки, по ней судят о состоянии всей совокупности в целом.
Если число объектов менее 30, то выборка называется малой. В зависимости от способов формирования, выборки бывают повторные – с возвратом, неповторные – без возврата
Требования к выборкам
А) Рендомизация - каждая варианта генеральной совокупности имеет одинаковую вероятность для попадания в выборку.
Репрезентативность –
состав и структура выборки должны
соответствовать составу и
Генеральная совокупность |
Выборочная | |
Объем |
N |
n |
Среднее значение |
M |
|
Дисперсия |
S в квадрате | |
Стандартное отклонение |
S |
Возникающие отклонения выборочных показателей от параметров генеральной совокупности называются – ошибками репрезентативности. Параметрами называются характеристики, относящиеся к генеральной совокупности. Характеристики, относящиеся к выборке называются оценками параметров. Ошибки репрезентативности бывают случайными и систематическими, устранимыми и неустранимыим. Устранимая ошибка предотвращается правильной организацией исследования и четким ведение протокола.
Неустранимые ошибки заложены в природе статистических методов. Фактически они являются ошибками репрезентативности. Это своеобразные показатели вариаций выборочных характеристик по отношению к таким же характеристикам генеральной совокупности. Величина ошибки зависит от объема выборки, степени вариации признаков, способа отбора вариант. При увеличении числа вариантов выборки ошибки– 0.
Ошибка (Мх)
Мх=(S)/ корень квадратный из n
Mx=(S)/ корень квадратный из 2n
Mx=(V)/ корень квадратный из 2n
V-коэффициент вариации
Показатель точности оценки параметров.
Чтобы получить определенное представление о точности, с которой определяется тот или иной средний результат, принято использовать показатели точности.
C=( x/ )100%; Если известно значение коэффициента вариации, то используется C=V/корень квадратный из n
Точность достаточная, если С = 3-5%
Для того, чтобы оценить закон распределения переменной случайной величины, нужно найти функциональную зависимость между числовыми значениями, которые она может принимать и вероятностью этих значений. В пределах заданного интервала непрерываемая случайная величина может принимать любые числовые значения. Речь идет о значениях, которые она может принимать с определенной вероятностью.
Виды нормального распределения
А) Эмпирическое – получается опытным путем на основе статистического исследования. В этом случае объем совокупности всегда конечен
Б) Теоретическое – абстрактная математическая модель. Ее используют для сравения и оценки опытных распределений по разным статистическим критериям.
В) Стандартное – оно используется в качестве стандарта при оценке любых данных.
Г) Общее – нормальное
распределение – оно