Математическая статистика

Автор работы: Пользователь скрыл имя, 11 Октября 2013 в 23:02, лекция

Описание работы

Математическая статистика – раздел математики, посвященный математическим методам обработки, систематизации и использования статичных данных для практических и научных целей.
Задачей этого раздела является разработка практических методов, регистрации, описания, анализ экспериментальных данных, получаемых в опытах с массовыми явлениями.
Особенностью статистики является изучение массовых, случайных явлений в условной неопределенности.

Файлы: 1 файл

Statistika.doc

— 436.00 Кб (Скачать файл)

1. Математическая  статистика. Ее виды, особенности,  задачи.

Математическая статистика – раздел математики, посвященный  математическим методам обработки, систематизации и использования  статичных данных для практических и научных целей.

Задачей этого раздела является разработка практических методов, регистрации, описания, анализ экспериментальных данных, получаемых в опытах с массовыми явлениями.

Особенностью статистики является изучение массовых, случайных  явлений в условной неопределенности. Достоверность выводов зависит от числа объектов исследования. На основе анализов и прогнозов  вырабатывается оптимальное решение.

Статистика подразделяется на:

- теоретическую (вырабатывает  методы)

прикладную (общая, отраслевая (экономическая статистика, метеорологическая, медицинская))

 

Медицинская статистика:

  • ст. рождаемости
  • ст. заболеваемости
  • ст. смертности
  • ст. медицинских  учреждений

 

Биологическая статистика (=биометрия) – включает статистические методы, используемые в различных  биологических исследованиях (в  цитологии, микробиологии).

 

Статистика:

  • описательная (комплекс методов сбора, группировки данных и представления их в виде таблиц, графиков…)
  • аналитическая (делает заключения, выводы с целью практического применения)

2. Основные понятия  описательной статистики. Их характеристика

 

  1. Генеральная совокупность – подлежащая изучению совокупность однородных элементов, которая характеризуется некоторым признаком. Например, нас интересует распространенность данного заболевания в определенном регионе, тогда генеральная совокупность, это все население региона. Если необходимо выразить мужчин и женщин отдельно по этому заболеванию, то получаем 2 генеральные совокупности.

Количество объектов, входящих в генеральную совокупность называется объемом генеральной  совокупности (N)

      Генеральная  совокупность можно изучать по  некоторой ее части.

 

  1. Выборочная совокупность - часть генеральной совокупности, выбираемая для статистической обработки (выборка) ( объем выборки -n). Свойства объектов выборки должны соответствовать свойствам генеральной совокупности.

Результаты исследования некоторого признака генеральной совокупности, будут более надежны, если выборку  образовывать случайным образом. Элементы выборки берутся наугад. Каждый объект может попасть в выборку с  одинаковой вероятностью. Главным вопросом является: как определить объем выборки, необходимой для получения необходимого результата.

 

  1. Варианта – значение признака для каждого элемента выборки (х)

Признаки могут быть качественными и количественными

Количественные делятся  на непрерывные (масса тела) и дискретные (количество волос)

 

Признак, имеющий значение от одного объекта к другому называется варьирующимся. Если количественный признак  лежит в интервале – интервальный.

 

  1. Частота – количество объектов с конкретным числовым значением признака

xi        35 36 37 38    39 40    41

ni (pi): 2   4   5   6      7   7      2

                                      

 

  1. Частность или относительная частота – доля варианта с данным значением признака (ni/n)

 

3. Ряды распределения  и способы их представления.

 

Ряд распределения –  это последовательность качественых-количественных значений признака и частоты его  встречаемости.

Ряд, составленного на основе качественного признака –  атрибутивных                                                                          количественного – вариационный.

Рассмотрим подробнее  распределение количественного  признака. Значение признака, записанное для всех элементов выборки в  том порядке, в каком они были получены образуют простой (упорядоченный) статистический ряд.

 

1     2     3     4     5     6

170 165 171 165 163 174

 

Из данных видно: некоторые  значения вариант повторяются. Для  сокращения записи данные располагаются  в упорядоченном виде с указанием  частот. Такой ряд называется упорядоченным (=ранжированным).

ni  1 2 1 1 1 1

xi   163 165 160 171 174

Вариационные ряды могут  быть непрерывными и дискретными

Способы представления  рядов:

  1. Табличный (см. выше)
  2. Аналитический (с помощью формул)
  3. Графический  (строится на основании табличных данных)

 

Способы графического представления:

А) диаграмма в отрезках – совокупность вертикальных прямых /отрезков. Способ удобен для представления  дискретных признаков при небольшом  объеме совокупности.

 

Б) гистограмма – совокупность прилегающих друг к другу прямоугольников. Способ используется для изображения. для интервального ряда. На оси Х откладываются интервалы значения варианта. На каждом из них (на основании) строят прямоугольник. Его высота зависит от частоты встречаемости данной величины.

В) полигон частот –  ломаная линия, соединяющая точки, являющиеся серединами интервалов.

Г) Вариационные кривые в  зависимости от значения распределения.

 

 

 

 

ni

  Прямоугольное распределение объема совокупности

ni

  Колоколообразное (= унимодальное)

 

 

ni

  Бимодальное

ni 

  Экспоненциальное

 

 

4. Основные меры положения и рассеяния.

 

Меры положения частного распределения, их характеристика.

На практике ряды распределения  описываются различными числовыми  характеристиками (мерами).

 

  1. Мода (Мо) – это варианта, наиболее часто встречающаяся в совокупности (= модальное значение).

 

      2    Медиана (Ме) – это величина, делящая  ранжированный ряд на 2 равные  части. Так же она делит площадь  под кривой распределения. Для  того, чтобы определить Ме надо  ранжировать ряд (в порядке  возрастания), вычислить номер, под которым стоит медиана.

N/2 – Для четных,  (N+1)/2 – Для нечетного количества объектов

 

3      Средняя арифметическая  простая – это частное деление  суммы всех 

значений признака на их общее число объектов

X=(X1+X2+X3…+Xn)/N

Сумма всех <+> и <–> отклонений от х равно «0».

 

Среднюю арифметическую простую вычисляют для неупорядоченных  рядов в тех случаях, когда  каждая варианта встречается 1 раз.

     

       4    Средняя взвешенная

Если в совокупности отдельные варианты встречаются  неоднократно, то вычисляется средняя взвешенная – это величина, полученная суммированием произведений числовых значений вариант на их частоты с последующим делением суммы на количество всех вариант.

 

=(х1n1+x2n2+x(n)n(n))/N     x1n1+y2n2

 

 

 5  Средняя квадратическая используется, если признаки выражаются мерами площади. Пример: размер колонии микробов, листовых пластинок.

 

            

      6      Средняя  гармоническая, кубическая, геометрическая

Меры рассеяния частного распределения.

 

Разброс числовых значений вариант (генеральной, выборочной совокупности) относительно средних значений характеризуется  мерами рассеяния.

  1. Лимит – минимальная и максимальная варианта совокупности. (Xmin, Xmax)
  2. Вариационный размах – разность между максимальным и минимальным значением R=Xmax-Xmin
  3. Индивидуальное отклонение – разность между числовым значением варианты и средним арифметическим всей совокупности Di=Xi-
  4. Дисперсия – мера рассеяния, полученная суммированием квадратов индивидуальных отклонений и последующим делением суммы на объем совокупности.

 

- для генеральной

- для выборочной совокупности

 

Если число объектов менее 30, то рассчитывается исправленная дисперсия (Сигма с крышей)

Где N-1 – число степеней свободы. Это число на 1 меньше, чем весь объем свободности

 

  1. Стандартное (среднее квадратичное) отклонение. Эта мера рассеяния, равная корню квадрата дисперсии, S=корень квадратный из . Чем сильнее варьирует признак, тем больше величина среднего квадратного отклонения.

 

6. Коэффициент вариации - мера рассеяния равна, отношению стандартного отклонения к средней арифметической V=(S/X)100%

При нормальном распределении  коэффициент вариации не > 50%, а  часто гораздо ниже (приблизительно 20%)

 

5. Выборочный метод. Выборки, их виды и требования  к ним.

 

Для того, чтобы получить исчерпывающую информацию о состоянии генеральной совокупности нужно учесть весь ее состав без исключения. Но не всегда есть возможность или необходимость прибегать к сплошному исследованию. В целях экономии времени и средств, анализу подвергается часть совокупности выборки, по ней судят о состоянии всей совокупности в целом.

Если число объектов менее 30, то выборка называется малой. В зависимости от способов формирования, выборки бывают повторные – с  возвратом, неповторные – без  возврата

 

Требования к выборкам

А) Рендомизация - каждая варианта генеральной совокупности имеет одинаковую вероятность для попадания в выборку.

Репрезентативность –  состав и структура выборки должны соответствовать составу и структуре  генеральной совокупности.

 

Генеральная совокупность

Выборочная

Объем

N

n

Среднее значение

M

Дисперсия

S в квадрате

Стандартное отклонение

S


Ошибки репрезентативности, их особенности.

 

Возникающие отклонения выборочных показателей от параметров генеральной совокупности называются – ошибками репрезентативности. Параметрами называются характеристики, относящиеся к генеральной совокупности. Характеристики, относящиеся к выборке называются оценками параметров. Ошибки репрезентативности бывают случайными и систематическими, устранимыми и неустранимыим. Устранимая ошибка предотвращается правильной организацией исследования и четким ведение протокола.

Неустранимые ошибки заложены в природе статистических методов. Фактически они являются ошибками репрезентативности. Это своеобразные показатели вариаций выборочных характеристик по отношению к таким же характеристикам генеральной совокупности. Величина ошибки зависит от объема выборки, степени вариации признаков, способа отбора вариант. При увеличении числа вариантов выборки ошибки– 0.

 

 

Ошибка (Мх)

 

Мх=(S)/ корень квадратный из n

Mx=(S)/ корень квадратный из 2n

Mx=(V)/ корень квадратный из 2n

V-коэффициент вариации

 

Показатель точности оценки параметров.

 

Чтобы получить определенное представление о точности, с которой  определяется тот или иной средний результат, принято использовать показатели точности.

C=( x/ )100%; Если известно значение коэффициента вариации, то используется C=V/корень квадратный из n

Точность достаточная, если С = 3-5%

6. Нормальное распределение, его виды, формулы, графики, особенности.

 

Для того, чтобы оценить  закон распределения переменной случайной величины, нужно найти  функциональную зависимость между  числовыми значениями, которые она  может принимать и  вероятностью этих  значений. В пределах заданного  интервала непрерываемая случайная величина может принимать любые числовые значения. Речь идет о значениях, которые она может принимать с определенной вероятностью.

 

Виды нормального распределения

А) Эмпирическое – получается опытным путем на основе статистического исследования. В этом случае объем совокупности всегда конечен

Б) Теоретическое –  абстрактная математическая модель. Ее используют для сравения и оценки опытных распределений по разным статистическим критериям.

В) Стандартное – оно  используется в качестве стандарта при оценке любых данных.

Г) Общее – нормальное распределение – оно описывается  формулой Гаусса – Лапласа, которая  выражает зависимость между вероятностью и нормированным отклонением

Информация о работе Математическая статистика