Место количественных методов в ист. исследованиях

Автор работы: Пользователь скрыл имя, 14 Октября 2013 в 21:29, контрольная работа

Описание работы

Задача – раскрыть свойства присущие этим процессам и явления, их место и роль в обществ. развитии.
Теория научного познания – представления ученого, совокупность посылок и идей.
Исторические материализм – теория научного познания, позволяющая наиболее объективно и глубоко объяснить ход исторического развития.

Файлы: 1 файл

матан зачет.doc

— 411.50 Кб (Скачать файл)

Предельная ошибка малой выборки вычисляется по формуле:

где t рассчитывают исходя из так  называемого закона распределения  Стьюдента с k степенями свободы (в отличие от больших выборок, где t вычисляется на основе нормального  закона распределения). Связь между t и вероятностью (уровнем надежности) Р в распределении Стьюдента сложнее, чем в нормальном распределении и опосредствуется через объем выборки. При возрастании объема выборки распределение Стьюдента приближается к нормальному, практически с ним совпадая при достаточно больших n.

При вычислении предельной ошибки малой  выборки значение t(k) определяется по таблице распределения Стьюдента  с k степенями свободы (табл. 2 приложения), с учетом заданного уровня надежности Р и объема выборки (для подстановки  в таблицу фактический объем выборки надо предварительно уменьшить на единицу: k=n—1).                                            

ГЛАВА 6. Анализ взаимосвязей.

 

1. Общие понятия  об изучении связей.

формы взаимосвязей явлений:

функциональная зависимость  – каждому значению одной переменной всегда соответствует одно определенное значение другой.

1. линейная зависимость. Графическим изображением анализируемой зависимости служит прямая линия. Такая зависимость называется прямой пропорциональной зависимостью. Ее аналитическим выражением является уравнение y=kx, где k — коэффициент пропорциональности (в нашем случае &=100). Прямая пропорциональная зависимость представляет собой частный случай линейной зависимости, которая характеризуется уравнением

y=kx+b.

В случае если прямая линия не соответствует характеру используемых данных, можно использовать параболу. Аналитическое выражение ее имеет вид:

Наличие в этом уравнении члена a2x2 является простейшей формой учета  нелинейности.

В том случае, когда мы имеем  дело с затуханием роста или падения, удобно использовать гиперболические либо логарифмические зависимости Математические выражения для гиперболической и логарифмической зависимостей выглядят так:

y=k/x; y=a lgx

Процессы демографического и экономического роста описываются экспоненциальными зависимостями вида:

y=ke(λx)-степень.

Статистическая зависимость – одному и том же значению одного признака могут соответствовать различные значения другого.

Регрессионный анализ сводится к описанию статистической связи с помощью подходящей функциональной зависимости. Корреляционный анализ позволяет оценивать тесноту связи посредством специальных показателей, причем выбор их зависит от вида функциональной зависимости, пригодной для адекватного описания рассматриваемой статистической взаимосвязи.

содержательный анализ первостепенен в определении признака как результативного или факторного.

 

2. Линейная  корреляция.

С помощью парного линейного  коэффициента корреляции измеряется теснота  связи между двумя признаками. Линейный коэффициент корреляции чаще всего рассчитывается по формуле: 
 
 
 
где xи y— значения признаков х и у соответственно для i-ro объекта, i=1,.., n; n — число объектов;   и  — средние арифметические значения признаков х и у соответственно
 
Линейный коэффициент корреляции изменяется в пределах от —1 до +1. Равенство коэффициента нулю свидетельствует об отсутствии линейной связи. Равенство коэффициента —1 или +1 показывает наличие функциональной связи. Знак «+» указывает на связь прямую (увеличение или уменьшение одного признака сопровождается аналогичным изменением другого признака), знак «—» — на связь обратную (увеличение или уменьшение одного признака сопровождается противоположным по направлению изменением другого признака).

Коэффициенты корреляции, как правило, рассчитываются для выборочных данных. Чтобы распространить полученные частные результаты на генеральную совокупность, приходится допустить некоторую ошибку, которую можно оценить с помощью средней квадратической ошибки. Средняя квадратическая ошибка для парного линейного коэффициента корреляции достаточно большой выборки вычисляется по формуле

задачи измерения комплексного влияния на результативную переменную нескольких переменных решаются с помощью множественных коэффициентов корреляции. Множественный, или совокупный, коэффициент корреляции для случая трех признаков, один из которых — результативный (с номером 1) и два —факторных (с порядковыми номерами 2 и 3) рассчитывается по формуле:

задачи определения тесноты связи между двумя переменными при фиксированных значениях остальных переменных - с помощью частных коэффициентов корреляции. Частный, или чистый, коэффициент корреляции между двумя признаками при исключении влияния третьего признака (обозначим его символом r12.3) рассчитывается по формуле:

Коэффициент детерминации – показатель, определяющий долю (степень воздействия одного признака на другой) изменений, обусловленных влиянием факторного признака, в общей изменчивости результативного признака:

                              D = r (квадрат) 100% ,                           

где r - коэффициент  корреляции.

Корреляционная таблица имеет такое устройство: по строкам располагаются значения одного признака, по столбцам — другого признака. Число, стоящее в клетке на пересечении i-й строки и j-го столбца, показывает, как часто i-e значение первого признака встречается совместно с j-м значением второго признака.

 

3. Линейная  регрессия.

Регрессионный анализ позволяет приближенно определить форму связи между результативным и факторными признаками, а также решить вопрос о том, значима ли эта связь.

Математическое решение задачи основано на методе наименьших квадратов.

В вычислительном аспекте метод наименьших квадратов сводится к составлению и решению системы так называемых нормальных уравнений. Исходным этапом для этого является подбор вида функции, отображающей статистическую связь.

Уравнение регрессии

не только определяет форму анализируемой  связи, но и показывает, в какой  степени изменение одного признака сопровождается изменением другого признака. Выбор «наилучшего» уравнения регрессии. Эта проблема связана с двойственным отношением к вопросу о включении в регрессионное уравнение независимых переменных. С одной стороны, естественно стремление учесть все возможные влияния на результативный признак и, следовательно, включить в модель полный набор выявленных переменных. С другой стороны, возрастает сложность расчетов и затраты, связанные с получением максимума информации, могут оказаться неоправданными.

Метод всех возможных  регрессий заключается в переборе и сравнении всех потенциально возможных уравнений. В качестве критерия сравнения используется коэффициент детерминации R2. «Наилучшим» признается уравнение с наибольшей величиной R2.

Методы исключения и включения являются усовершенствованными вариантами предыдущего метода. В методе исключения в качестве исходного рассматривается регрессионное уравнение, включающее все возможные переменные.

Метод включения состоит в том, что в уравнение включаются переменные по степени их важности до тех пор, пока уравнение не станет достаточно «хорошим».

Шаговый регрессионный  метод кроме процедуры метода включения содержит анализ переменных, включенных в уравнение на предыдущей стадии.

Ступенчатый регрессионный  метод -Сначала выбирается наиболее тесно связанная с результативным признаком переменная и составляется уравнение регрессии. Затем находят разности фактических и выравненных значений и эти разности (остатки) рассматриваются как значения результативной переменной. Для остатков подбирается одна из оставшихся независимых переменных и т. д. На каждой стадии проверяется значимость регрессии. Как только обнаружится незначимость, процесс прекращается и окончательное уравнение получается суммированием уравнений, полученных на каждой стадии за исключением последней.

Коэффициент при х, называемый коэффициентом регрессии, показывает, на какую величину в среднем изменяется результативный признак у при  изменении факторного признака х  на единицу.

Средняя и предельная ошибки коэффициента регрессии. Поскольку уравнения регрессии рассчитываются, как правило, для выборочных данных, обязательно встают вопросы точности и надежности полученных результатов. Вычисленный коэффициент регрессии, будучи выборочным, с некоторой точностью оценивает соответствующий коэффициент регрессии генеральной совокупности. Представление об этой точности дает средняя ошибка коэффициента регрессии ( ), рассчитываемая по формуле

уi, — i-e значение результативного  признака; ŷi — i-e выравненное значение, полученное из уравнения ; xi—i-e значение факторного признака; σx—среднее квадратическое отклонение х; n — число значений х или, что то же самое, значений у; m—число факгорных признаков (независимых переменных).

 

на результат действует обычно не один фактор, а несколько, что необходимо учитывать для достаточно полного анализа связей.

В математической статистике разработаны  методы множественной регрессии, позволяющие анализировать влияние на результативный признак нескольких факторных.

 

4. Нелинейная регрессия и нелинейная корреляция.

Одним из простейших видов нелинейной зависимости является парабола, которая в общем виде может быть представлена функцией

Кроме класса парабол для анализа  нелинейных связей можно применять  и другие виды функций. Для расчета  неизвестных параметров этих функций рекомендуется использовать метод наименьших квадратов, как наиболее мощный и широко применяемый.

Однако метод наименьших квадратов  не универсален, поскольку он может  использоваться только при условии, что выбранные для выравнивания функции линейны по отношению к своим параметрам. Не все функции удовлетворяют этому условию, но большинство применяемых на практике с помощью специальных преобразований могут быть приведены к стандартной форме функции с линейными параметрами.

Функция  не является линейной относительно своих параметров.

Прологарифмировав обе части приведенного равенства

и переобозначив

 

получим функцию, линейную относительно своих новых параметров:

Для измерения тесноты связи  при криволинейной зависимости используется индекс корреляции, вычисляемый по формуле

где уi—i-e значение результативного  признака; ŷi—i-e выравненное значение этого признака;  —среднее арифметическое значение результативного признака.

Числитель формулы характеризует разброс выравненных значений результативного признака.

Знаменатель же измеряет разброс признака-результата, который определен влиянием на него всех факторов, в том числе и учтенного.


Информация о работе Место количественных методов в ист. исследованиях