Автор работы: Пользователь скрыл имя, 25 Ноября 2012 в 19:04, курс лекций
Работа содерждит курс лекций по дисциплине "Статистика"
где ni – число единиц в группе
Межгрупповая дисперсия (дисперсия групповых средних) ( ) характеризует систематическую вариацию, т.е. различия в величине исследуемого признака, возникающие под влиянием признака-фактора, который положен в основу группировки. Эта дисперсия рассчитывается по формуле
где - средняя величина по отдельной группе.
Все три вида дисперсии связаны между собой: общая дисперсия равна сумме средней внутригрупповой дисперсии и межгрупповой дисперсии:
Данное соотношение отражает закон, который называют правилом сложения дисперсий. Согласно этому закону (правилу), общая дисперсия, которая возникает под влиянием всех факторов, равна сумме дисперсий, которые появляются как под влиянием признака-фактора, положенного в основу группировки, так и под влиянием других факторов. Благодаря правилу сложения дисперсий можно определить, какая часть общей дисперсии находится под влиянием признака-фактора, положенного в основу группировки.
Тема 7. Ряды распределения
1. Ряды распределения и их построение
2. Медиана и мода – структурные (распределительные) средние величины
1. Ряды распределения и их построение
Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. Выделяют следующие виды рядов динамики:
1. атрибутивный
2. вариационный
Атрибутивный ряд динамики – за основу группировки взят качественный признак (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Вариационный ряд динамики – ряд распределения построен по количественному признаку. Построить вариационный ряд – значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Выделяют три формы вариационного ряда:
1. ранжированный ряд,
2. дискретный ряд,
3. интервальный ряд.
Ранжированный ряд – это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака. Ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются.
Групповая таблица – это форма вариационного ряда, составленная по характеру вариации значений изучаемого признака. Данные признаки бывают двух видов:
1. дискретные (прерывные),
2. непрерывные.
Дискретный вариационный ряд – в основу построения положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений. Дискретный вариационный ряд представляет собой таблицу, которая состоит из двух граф. В первой графе указывается конкретное значение признака, а во второй – число единиц совокупности с определенным значением признака.
Интервальный вариационный ряд – признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения). Интервальный вариационный ряд представляет собой таблицу, которая состоит из двух граф. В первой указывается значение признака в интервале «от – до» (варианты), во второй – число единиц, входящих в интервал (частота).
Частота (частота повторения) – число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается
Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.:
При построении вариационного ряда с интервальными значениями прежде всего необходимо установить величину интервала h, которая определяется как отношение размаха вариации R к числу групп m:
где R = xmax – xmin;
m = 1 + 3,322 lgn (формула Стерджесса);
2. Медиана и мода – структурные (распределительные) средние величины
Для определения структуры
Медиана (Ме) – это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда.
Для ранжированного ряда с нечетным числом индивидуальных величин медианой будет величина, которая расположена в центре ряда.
Для ранжированного ряда с четным числом индивидуальных величин медианой будет средняя арифметическая величина, которая рассчитывается из двух смежных величин.
То есть для нахождения медианы сначала необходимо определить ее порядковый номер (ее положение в ранжированном ряду) по формуле
где n – число единиц в совокупности.
Численное значение медианы обычно определяют по формуле
где xМе – нижняя граница медианного интервала;
h – величина интервала;
– накопленная частота интервала, которая предшествует медианному;
fMe – частота медианного интервала.
Модой (Мо) называют значение признака, которое встречается наиболее часто у единиц совокупности. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.
Чтобы найти конкретное значение моды, необходимо использовать формулу
где xМо – нижняя граница модального интервала;
iМо – величина модального интервала;
fМо – частота модального интервала;
fМо-1 – частота интервала, предшествующего модальному;
fМо+1 – частота интервала, следующего за модальным.
Тема 8. Корреляционная связь и ее анализ
1. Сущность корреляционной связи
2. Корреляционно-регрессионный ме
3. Непараметрические показатели связи
1. Сущность корреляционной связи
Важнейшей целью статистики является изучение объективно существующих связей между явлениями. В ходе статистического исследования этих связей необходимо выявить причинно-следственные зависимости между показателями, т.е. насколько изменение одних показателей зависит от изменения других показателей.
Существует две категории зависимостей (функциональная и корреляционная) и две группы признаков (признаки-факторы и результативные признаки). В отличие от функциональной связи, где существует полное соответствие между факторными и результативными признаками, в корреляционной связи отсутствует это полное соответствие.
Корреляционная связь – это связь, где воздействие отдельных факторов проявляется только как тенденция (в среднем) при массовом наблюдении фактических данных. Примерами корреляционной зависимости могут быть зависимости между размерами активов банка и суммой прибыли банка, ростом производительности труда и стажем работы сотрудников.
2. Корреляционно-регрессионный метод анализа
Наиболее простым вариантом корреляционной зависимости является парная корреляция, т.е. зависимость между двумя признаками (результативным и факторным или между двумя факторными). Важнейшей задачей является определение формы связи с последующим расчетом параметров уравнения, или, иначе, нахождение уравнения связи (уравнения регрессии).
Могут иметь место различные формы связи:
1. прямолинейная (8.1)
2. криволинейная в виде:
2.1. параболы второго порядка (8.2)
2.2. гиперболы (8.3)
2.3. показательной функции (8.4)
Другая важнейшая задача – измерение тесноты зависимости – для всех форм связи может быть решена при помощи вычисления эмпирического корреляционного отношения :
где – дисперсия в ряду выравненных значений результативного показателя ;
– дисперсия в ряду фактических значений у.
Для определения степени тесноты парной линейной зависимости служит линейный коэффициент корреляции r, для расчета которого можно использовать, следующую формулу:
Линейный коэффициент корреляции может принимать значения в пределах от -1 до + 1 или по модулю от 0 до 1. Чем ближе он по абсолютной величине к 1, тем теснее связь. Знак указывает направление связи: «+» – прямая зависимость, «-» имеет место при обратной зависимости.
3. Непараметрические показатели связи
В статистической практике
могут встречаться такие
Наибольшее распространение имеют ранговые коэффициенты корреляции, в основу которых положен принцип нумерации значений статистического ряда. При использовании коэффициентов корреляции рангов коррелируются не сами значения показателей х и у, а только номера их мест, которые они занимают в каждом ряду значений. В этом случае номер каждой отдельной единицы будет ее рангом.
Коэффициенты корреляции, основанные на использовании ранжированного метода, были предложены К. Спирмэном и М. Кендэлом.
К непараметрическим методам исследования можно отнести коэффициент ассоциации Кас и коэффициент контингенции Ккон, которые используются, если, например, необходимо исследовать тесноту зависимости между качественными признаками, каждый из которых представлен в виде альтернативных признаков. Причем для одних и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации.
Если необходимо оценить
тесноту связи между альтернати
Коэффициент Фехнера, характеризующий элементарную степень тесноты связи, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации. Коэффициент Фехнера может изменяться в пределах -1,0 Кф +1,0.
Тема 9. Ряды динамики и их применение в анализе
1. Ряды динамики и их виды
2. Показатели
изменений уровней
3. Способы обработки динамического ряда
1. Ряды динамики и их виды
Изменение социально-экономических явлений во времени изучается статистикой методом построения и анализа динамических рядов. Ряды динамики – это значения статистических показателей, которые представлены в определенной хронологической последовательности.
Каждый динамический ряд содержит две составляющие:
1) показатели периодов времени (годы, кварталы, месяцы, дни или даты);
2) показатели, характеризующие исследуемый объект за временные периоды или на соответствующие даты, которые называют уровнями ряда.
Уровни ряда выражаются как абсолютными, так и средними или относительными величинами. В зависимости от характера показателей строят динамические ряды абсолютных, относительных и средних величин. Ряды динамики из относительных и средних величин строят на основе производных рядов абсолютных величин. Различают интервальные и моментные ряды динамики.
Динамический интервальный ряд содержит значения показателей за определенные периоды времени. В интервальном ряду уровни можно суммировать, получая объем явления за более длительный период, или так называемые накопленные итоги.
Динамический моментный ряд отражает значения показателей на определенный момент времени (дату времени). В моментных рядах исследователя может интересовать только разность явлений, отражающая изменение уровня ряда между определенными датами, поскольку сумма уровней здесь не имеет реального содержания. Накопленные итоги здесь не рассчитываются.
Важнейшим условиями правильного построения динамических рядов являются:
1. сопоставимость уровней рядов, относящихся к различным периодам,
2. уровни должны быть представлены в однородных величинах,