Автор работы: Пользователь скрыл имя, 28 Ноября 2013 в 01:36, контрольная работа
Значение решения научных и технических проблем организации фармацевтического дела для народного хозяйства состоит в исследовании ранее неизвестных закономерностей в технологии изготовления лекарственных средств, их совместимости и разработке новых лекарственных форм; разработке основ государственного управления фармацевтической деятельностью в условиях рыночных отношений, методологии ценообразования в области лекарственных средств, проблем профессиональной подготовки фармацевтических специалистов, новых информационных технологий в фармации, разработке фармакоэкономических проблем.
Введение …………………………………………………………………..
3
Глава 1. Обзор литературы ……………………………………………....
4
1.1 Типы данных ………………………………………………………….
4
1.2 Обобщение данных …………………………………………………..
6
1.3 Выборка и выборочное распределение ……………………………..
13
Глава 2. Практическая часть ……………………………………………..
20
Заключение ………………………………………………………………..
23
Список литературы ……………………………………………………….
24
Размах, полученный из процентилей [4,12]
Предположим, что мы расположим наши данные упорядочении от самой маленькой величины переменной Х и до самой большой величины. Величина X, до которой расположен 1% наблюдений (и выше которой расположены 99% наблюдений), называется первым процентилем. Величина Х, до которой находится 2% наблюдений, называется 2-м процентилем, и т.д.
Величины X, которые делят упорядоченный набор значений на 10 равных групп, т. е. 10-й, 20-й, 30-й..., 90 и процентили, называются децилями. Величины X, которые делят упорядоченный набор значений на 4 равные группы, т. е. 25-й, 50-й и 75-й процентили, называются квартилями. 50-й процентиль — это медиана.
Применение процентилей [17]
Мы можем
добиться такой формы описания
рассеяния, на которую не повлияет выброс
(аномальное значение), исключая экстремальные
величины и определяя размах остающихся
наблюдений. Межквартильный размах —
это разница между 1-м и 3-м квартилями,
т.е. между 25-м и 75-м процентилями. В него
входят центральные 50% наблюдений в упорядоченном
наборе, где 25% наблюдений находятся ниже
центральной точки и 25% — выше. Интердецнльный
размах содержит в себе центральные 80%
наблюдений, т. е. те наблюдения, которые
располагаются между 10-м и 90-м процентнлями.
Мы часто используем размах, который содержит
95% наблюдений, т.е. он исключает 2,5% наблюдений
снизу и 2,5% сверху.
Мы можем применить этот интервал, осуществляя
диагностику болезни. В этом случае он
называется «референтный интервал», «референтный
размах» или «нормальный размах».
Дисперсия [10]
Один из способов измерения рассеяния данных
заключается в том, чтобы определить степень
отклонения каждого наблюдения от средней
арифметической. Очевидно, что чем больше
отклонение, тем больше изменчивость,
вариабельность наблюдений. Однако мы
не можем использовать среднее этих отклонений
как меру рассеяния, потому что положительные
отклонения компенсируют отрицательные
отклонения (их сумма равна нулю). Чтобы
решить эту проблему, мы возводим в квадрат
каждое отклонение и находим среднее возведенных
в квадрат отклонений;
эта величина называется вариацией, или
дисперсией.
Возьмем n наблюдений, х1, х2, хз,.... хn, средняя
которых равняется
Вычисляем дисперсию, обычно обозначаемую как s2 этих наблюдений:
Мы видим, что это не одно и то же, что и среднее арифметическое возведенных в квадрат отклонении, потому что мы разделили на (n - 1) вместо n. Причина состоит в том, что мы почти всегда полагаемся на выборочные данные в исследованиях. Теоретически можно показать, что получится более точная дисперсия, если разделить не на n, а на (n - 1).
Единицы измерения (размерность) вариации — это квадрат единиц измерения первоначальных наблюдений. Например, если измерения производятся в килограммах, то единица измерения вариации будет килограмм в квадрате.
Стандартное отклонение [10]
Стандартное (среднеквадратичное) отклонение — это положительный квадратный корень из дисперсии. На примере n наблюдений это выглядит
следующим образом:
Мы можем представить себе стандартное отклонение как своего рода среднее отклонение наблюдений от среднего. Оно вычисляется в тех же единицах (размерностях), что и исходные данные.
Если разделить стандартное отклонение на среднее арифметическое и выразить результат в процентах, получится коэффициент вариации. Он является мерой рассеяния, не зависит от единиц измерения (безразмерный), но имеет некоторые теоретические неудобства и поэтому не очень одобряется статистиками.
Вариация в пределах субъектов и между субъектами [10]
Если провести повторные измерения непрерывной переменной у пациента, то можно увидеть ее изменения (внутрисубъектные изменения). Это можно объяснить тем, что пациент не всегда даст точные и те же самые ответы, и/или ошибкой измерения. Однако при измерениях у одного пациента вариация обычно меньше, чем вариация единичного измерения в группе (межсубъектные изменения). Например, вместимость легкого 17-летнего мальчика составляет от 3,60 до 3,87 л, когда измерения повторяются не менее 10 раз; если провести однократное измерение у 10 мальчиков того же возраста, то объем будет между 2,98 и 4,33 л. Эти концепции важны в плане исследования.
Таблица 2
Преимущества и недостатки мер рассеяния [7, 8]
Мера рассеяния |
Преимущества |
Недостатки |
Размах |
• Легко определить |
• Использует даже 2 наблюдения • Искажается выбросами • Имеет тенденцию
к увеличению при росте |
Размахн, основанные |
• Не подвержены влиянию выбросов • Не зависят от размера выборки • Подходят для
асимметричных распределений |
• Грубый расчет • Невозможно рассчитать для маленьких выборок • Может использоваться даже при двух наблюдениях • Не имеет алгебраического выражения для вычисления |
Дисперсия |
• Использует каждое наблюдение • Имеет алгебраическое выражения для вычисления |
• Единица измерения — квадрат исходных данных • Восприимчива к выбросам • Не подходит для асимметричных распределений данных |
Стандартное |
• Те же самые преимущества, что и у вариации • Единицы измерения те же, что и у исходных данных • Легко объяснима |
• Восприимчива к выбросам • Не подходит для асимметричных распределений данных |
1.3 Выборка и выборочное распределение
Популяция представляет собой множество индивидуумов. Изучение целой популяции дорого и трудоемко, а иногда просто невозможно, так как популяция может быть гипотетической (например пациенты, которые будут лечиться в дальнейшем). В связи с этим собирают данные по выборке индивидуумов, которых считают представителями этой популяции, позволяющие делать выводы (т.е. заключения) относительно этой популяции. Информация в выборке не может точно и полно отражать то, что свойственно этой популяции. Изучая только часть популяции, исследователь предполагает ошибку, обусловленную выборкой. В этом разделе показано, как использовать теоретическое распределение вероятности (см. разделы 7 и 8) для определения величины этой ошибки.
Формирование репрезентативной (представительной) выборки [3, 6]
В идеале стремятся получить случайную (рандомизированную) выборку. Составляют список всех объектов в популяции (структура выборки) и случайно их отбирают, т. е. каждая выборка данного объема имеет одинаковую вероятность быть выбранной. Иногда могут возникнуть трудности при составлении списка или затраты могут оказаться недопустимыми, тогда берут приемлемую выборку. Например, при исследовании пациентов с тем или иным клиническим заболеванием можно выделить одну больницу и исследовать несколько или всех пациентов с этим заболеванием в этой больнице. Существуют и неслучайные схемы, такие, как квотированная выборка или систематическая выборка. Хотя статистические тесты (критерии), предполагают, что индивидуумы включены в выборку случайно, такие методы приемлемы, если выборка является представителем популяции.
Точечные оценки [4]
Мы часто заинтересованы в оценке параметра популяции, например среднего или пропорции (доли). Параметры обычно обозначают буквами греческого алфавита, например, среднее попук истинному значению параметра (генеральному параметру) в популяции и сами оценки должны быть подобны друг другу. Определяя вариабельность этих оценок, мы получим информацию относительно точности оценки и сможем представить себе ошибку, обусловленную выборкой. В действительности обычно берут только одну выборку из популяции. Однако знания о теоретическом распределении выборочных оценок позволяют сделать выводы относительно генерального параметра популяции.
Выборочное распределение среднего[12]
Для оценки среднего популяции можно брать много повторных выборок объема п из популяции и определять среднее в каждой выборке. Гистограмма оценок этих средних покажет их распределение; это распределение выборочных средних. Можно увидеть следующее:
- если объем выборки разумно большой, оценки среднего имеют нормальное распределение при любом распределении исходных данных в популяции (это следует из центральной предельной теоремы);
- если объем выборки небольшой, то оценки среднего отвечают нормальному распределению при условии, что данные в популяции также отвечают нормальному распределению;
- среднее этих оценок — это несмещенная оценка истинного среднего в популяции (генерального среднего), т.е. среднее этих оценок эквивалентно истинному среднему в популяции;
- вариабельность распределения выражается стандартным отклонением оценок, известным как стандартная ошибка среднего (часто обозначают как SEM — Standard Error Means). Если известно стандартное отклонение популяции (а), то стандартная ошибка среднего описывается, как
Обычно бывает только одна выборка, и лучшей оценкой среднего популяции будет выборочное среднее, а так как редко известно стандартное отклонение в популяции (генеральный стандарт), то стандартную ошибку среднего оценивают, как
где s — стандартное отклонение наблюдений в выборке. Стандартная ошибка среднего отражает точность оценки.
Интерпретация стандартной ошибки
Небольшая стандартная ошибка означает точную оценку. Стандартная ошибка уменьшится, т. е. оценка станет более точной, если:
- объем выборки увеличится;
- данные имеют небольшое рассеяние.
Выбор стандартное отклонение (SD) или стандартной ошибки среднего (SEM)
На первый взгляд эти два параметра схожи, но их используют в разных целях. Стандартное отклонение отражает вариабельность в значениях данных и должно быть указано, если вы хотите пояснить изменчивость в наборе данных. Наоборот, стандартная ошибка отображает точность выборочного среднего и должна быть указана, если интересует среднее значение набора данных [17].
Выборочное распределение пропорций [4, 10]
Исследователя может интересовать пропорция индивидуумов с некоторыми особенностями в популяции. Если взять выборку объема п из популяции, то лучшая оценка р пропорции тс в популяции вычисляется следующим образом:
где r — число индивидуумов с теми или иными особенностями в выборке. Если бы мы повторно извлекали выборки объемом п из популяции и нанесли бы оценки пропорции на гистограмму, то исходное выборочное распределение пропорций почти отвечало бы нормальному распределению со средним значением тс. Стандартное отклонение распределения оцененных пропорций — это стандартная ошибка пропорции. Когда берут только одну выборку, ее оценка производится так:
Это предоставляет показатель точности нашей оценки т.е; малая стандартная ошибка отражает высокую точность оценки.
Выборка из популяции позволяет получить точечную оценку (интересующего параметра и вычислить стандартную ошибку для того, чтобы указать точность оценки. Однако для большинства исследователей стандартная ошибка как таковая неприемлема. Гораздо полезнее объединить эту меру точности с интервальной оценкой для параметра популяции. Это можно сделать, используя знания о теоретическом распределении вероятности выборочной статистики (параметра), чтобы вычислить доверительный интервал (ДИ) для параметра. Вообще ДИ расширяет оценки в обе стороны некоторой величиной, кратной стандартной ошибке (данного параметра); два значения (доверительные границы), определяющие интервал, обычно отделяют запятой и ставят в скобки.
Доверительный интервал для среднего
Использование нормального распределения
Выборочное среднее х имеет нормальное распределение, если объем выборки большой. В связи с этим можно применить знания о нормальном распределении при рассмотрении выборочного среднего. В частности, 95% распределения выборочных средних находится в пределах 1,96 стандартного отклонения (SD) среднего популяции. Когда есть только одна выборка, это называют стандартной ошибкой среднего (SEM) и вычисляют 95% ДИ для среднего следующим образом:
Если повторить этот эксперимент много раз, то интервал будет содержать истинное среднее популяции в 95% случаев. Обычно этот ДИ представляют как, например интервал значений, в котором с доверительной вероятностью 95% находится истинное среднее популяции (генеральное среднее). Хотя такая интерпретация ДИ не вполне строга (среднее в популяции есть фиксированное значение и не может иметь вероятность, отнесенную к нему), она концептуально нагляднее.
Использование t-распределения [7, 8]
Можно использовать нормальное распределение, если известно значение дисперсии в популяции. Кроме того, в выборке небольшого объема выборочное среднее отвечает нормальному распределению, если Данные распределены в популяции нормально. Там, где данные популяции распределены ненормально и/или не известна генеральная дисперсия (дисперсия в популяции), выборочное среднее подчиняется распределению Стьюдента. 95% ДИ для генерального среднего в популяции вычисляют следующим образом:
где 0,05 — это процентная точка (процентиль) i-pacпределения Стьюдента с (n — 1) степенями свободы, которая дает двустороннюю вероятность, равную 0,05. Вообще она обеспечивает более широкий ДИ, чем нормальное распределение, поскольку учитывает дополнительную неопределенность, которую ввели, оценивая стандартное отклонение популяции и/или из-за небольшого объема выборки. Когда объем выборки большой, разница между двумя распределениями (i-Стьюдента и нормальным) незначительна. При вычислении ДИ всегда используют t-распределение, далее если объем выборки большой.
Информация о работе Статистическая обработка результатов исследований в фармации