Контрольная работа по "Статистике"

Автор работы: Пользователь скрыл имя, 12 Марта 2013 в 07:26, контрольная работа

Описание работы

При выполнении контрольного задания Вы должны сделать вторичную перегруппировку для несложного примера (пример выбрать самостоятельно) и объяснить, как и при выполнении каких условий справедлив такой перерасчет. При использовании компьютерных программ и более сложного примера указать также эффект и особенности применения ИТ.
В письменном ответе на задание Вы должны:
1. Объяснить связь между формулой сложения дисперсий и корреляционным отношением, разъяснить его статистический смысл.
2. Выполнить сравнение вариации для двух различных распределений с различными средними, объяснить условия сопоставимости при различии средних.

Файлы: 1 файл

итоговый контроль.doc

— 235.50 Кб (Скачать файл)

МОСКОВСКИЙ УНИВЕРСИТЕТ  им С.Ю. ВИТТЕ

 

 

Дисциплина  «Экономическая теория»

Факультет : Управления

Специальность: Прикладная информатика

Ф.И.О. преподавателя:  Степанов В.Г.

Работу  выполнил: Савинова А.Г.

 

 

Итоговый  контроль

Контрольное задание

 

 

 

 

 

 

 

 

г.Москва

 

Задание :

При выполнении контрольного задания Вы должны сделать вторичную перегруппировку  для несложного примера (пример выбрать  самостоятельно) и объяснить, как  и при выполнении каких условий  справедлив такой перерасчет. При использовании компьютерных программ и более сложного примера указать также эффект и особенности применения ИТ.

В письменном ответе на задание Вы должны:

1. Объяснить связь между формулой сложения дисперсий и корреляционным отношением, разъяснить его статистический смысл.

2. Выполнить сравнение вариации для двух различных распределений с различными средними, объяснить условия сопоставимости при различии средних.

3. Дать наиболее полное объяснение смысла предельной ошибки, связать с понятием репрезентативности выборки и ее необходимым объемом.

4. Объяснить соотношение оценивания неизвестных параметров по МНК и проверку значимости полученных результатов по критериям проверки статистических гипотез.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.

В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения. Рассмотрим приемы вторичной группировки на примере.

Произвести  укрупнение интервалов на основе данных таблицы 1:

 

Таблица 1.

Группы магазинов по размеру товарооборота за IV квартал, тыс.руб.

Число магазинов

Товарооборот  за IV квартал, тыс.руб.

До 10

15

93

10 — 15

8

112

15 — 20

13

200

20 — 30

3

68

30 — 50

9

378

50 — 60

7

385

60 — 70

3

180

70 — 100

8

600

100 — 200

22

2400

Свыше 200

12

3744

Итого

100

8160


 

 

Приведенная группировка  недостаточно наглядна, потому что  не показывает четкой и строгой закономерности в изменении товарооборота по группам.

Уплотним ряды распределения, образовав шесть  групп. Новые группы образованы путем  суммирования первоначальных групп (табл. 2).

 

Таблица 2.

Группы магазинов  по размеру товарооборота за IV квартал, тыс.руб.

Число магазинов

Товарооборот  за IV квартал, тыс.руб.

Товарооборот  в среднем на 1 магазин, тыс.руб.

До 10

15

93

6,2

10 — 20

21

312

14,8

20 — 50

12

446

37,1

50 — 100

18

1165

64,8

100 — 200

22

2400

109,0

Свыше 200

12

3744

312,0

Итого

100

8160

81,6


 

Совершенно  четко видно, чем крупнее магазины, тем выше уровень товарооборота.

1.

По аналитической группировке можно измерить связь с помощью эмпирического корреляционного отношения. Этот, показатель обозначается греческой буквой η (эта). Он основан на правиле разложения дисперсии, согласно которому общая дисперсия s2 равна сумме внутригрупповой и межгрупповой дисперсий.

Дисперсия результативного признака внутри группы при относительном постоянстве признака-фактора возникает за счет других факторов. Эта дисперсия называется остаточной. Она определяется по формуле:

где уij - значение признака у для i-й единицы в j-й группе;

ӯj - среднее значение признака в j-й группе;

nj - число единиц j-й группе;

j = 1, 2, 3, ..., т.

Внутригрупповые дисперсии, рассчитанные для отдельных групп, объединяются в средней величине внутригрупповой дисперсии:

Межгрупповая дисперсия относится на счет изучаемого фактора (и факторов, связанных с ним), поэтому эта дисперсия называется факторной. Она определяется по формуле

Правило сложения дисперсий может быть записано:

или

Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Соответственно оно рассчитывается как отношение факторной дисперсии к общей дисперсии результативного признака:

             


 

 

Этот показатель принимает значения в интервале [0,1]: чем ближе к 1, тем теснее связь, и наоборот.

2.

Таблица 3.  Исходные данные

Количество  деталей, изготовленных за смену

Число

рабочих

280 - 300

3

300-320

9

320-340

15

340-360

12

360-380

6

380 - 400

6


 

Таблица 4. Рабочая таблица

X

f

X*f

X - Xср

(X-Xср)2

f*(X-Xср)2

290

3

870

-50,58

2558,336

7675,01

310

9

2790

-30,58

935,1364

8416,23

330

15

4950

-10,58

111,9364

1679,05

350

12

4200

9,42

88,7364

1064,84

370

6

2220

29,42

865,5364

5193,22

390

6

2340

49,42

2442,336

14654,02

ИТОГО

51

17370

   

38682,36


Средний товарооборот = ∑X*f / f= 17370/51 = 340,58 тыс. руб.

Дисперсия равна:

G2 =∑ f*(X-Xср)2 /  ∑ f  = 38682,36/51 =  758,48

Среднее квадратическое отклонение:

                 G = 2 = = 27,54

Коэффициент вариации равен:

V = G / Xср = 27,54/758,48 = 0,081; 8,1%.

Коэффициент вариации меньше 33%, следовательно, совокупность однородна.

 

 

 

 

Таблица 5. Исходные данные.

Затраты времени на проезд к месту работы, мин

Затраты времени на проезд к месту работы, мин,  х

Число рабочих

f

До 30

25

70

30-40

35

80

40-50

45

200

50-60

55

55

60-70

65

15


 

1) средние затраты  времени на проезд к месту  работы у рабочих = Х ср =∑ Xf / ∑f = (25*70 + 35*80 + 45*200 + 55*55 + 65*15) / 420 = 41,8 мин.

2) расчет дисперсии

х

f

X – Xср

(X-Xср)2

f*(X-Xср)2

25

70

-16,8

282,24

19756,8

35

80

-6,8

46,24

3699,2

45

200

3,2

10,24

2048

55

55

13,2

174,24

9583,2

65

15

23,2

538,24

8073,6

ИТОГО

420

16

1051,2

43160,8


Дисперсия равна:

G2 =∑ f отклонение:

                 G = 2 = 10,14

3) Коэффициент*(X-Xср)2 /  ∑ f = 43160,8/420 = 102,8

Среднее квадратическое вариации равен:

V = G / Xср = 10,14/41,8  = 0,24; 24%

Ккоэффициент  вариации меньше 33%, следовательно, рассмотренная  совокупность однородна и средняя  для нее достаточно типична.

3.

Выборочную  совокупность можно сформировать по количественному признаку статистических величин, а также по альтернативному  или атрибутивному. В первом случае обобщающей характеристикой выборки  служит выборочная средняя величина, обозначаемая , а во втором — выборочная доля величин, обозначаемая w. В генеральной совокупности соответственно: генеральная средняя и генеральная доля р.

Разности  — и W — р называются ошибкой выборки, которая делится на ошибку регистрации и ошибку репрезентативности. Первая часть ошибки выборки возникает из-за неправильных или неточных сведений по причинам непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая часть ошибки возникает из-за постоянного или спонтанного несоблюдения принципа случайности отбора. Ее трудно обнаружить и устранить, она гораздо больше первой и потому ей уделяется основное внимание.

Исключительно важную роль для обоснования и  применения выборочного наблюдения играет закон больших чисел. Использование законы больших чисел состоит в том, что при определенных условиях и при достаточно большом объеме наблюдений сводные характеристики, полученные на основе выборочного наблюдения, будут мало отличаться от соответствующих характеристик генеральной доверенности. Основываясь на этом, можно, увеличивая объем выборочной совокупности, уменьшить пределы возможных ошибок репрезентативности, довести их до наименьших размеров. С другой стороны, зная пределы ошибок репрезентативности, можно определить необходимую численность выборочной совокупности.

Одной из наиболее важных и ответственных задач  при организации и проведении выборочного наблюдения является установление необходимой численности выборочной совокупности, т.е. такой ее численности, которая обеспечивала бы получение данных, достаточно правильно отражающих изучаемые свойства генеральной совокупности.

При этом должно быть учтено: 1) с какой степенью точности следует получить предельную ошибку выборки; 2) какова должна быть вероятность того, что будет обеспечена обусловленная точность результатов выборочного наблюдения; 3)степень колеблемости изучаемых свойств в исследуемой генеральной совокупности.

Это значит, что  необходимая численность выборки  устанавливается в зависимости от размеров предельной ошибки выборки, от величины коэффициента доверия (t) и от размеров величины дисперсии.

 

4.

Метод оценивания параметров линейной регрессии, минимизирующий сумму квадратов отклонений наблюдений зависимой переменной от искомой линейной функции, называется методом наименьших квадратов.

Суть метода заключается в том, что критерием  качества рассматриваемого решения  является сумма квадратов ошибок, которую стремятся свести к минимуму. Для применения этого метода требует провести как можно большее число измерений неизвестной случайной величины (чем больше – тем выше точность решения) и некоторое множество предполагаемых решений, из которого требуется выбрать наилучшее. Если множество решений параметризировано, то нужно найти оптимальное значение параметров.

МНК используется в математике, в частности –  в теории вероятностей и математической статистике. Наибольшее применение этот метод имеет в задачах фильтрации, когда необходимо отделить полезный сигнал от наложенного на него шума. Его применяют и в математическом анализе для приближённого представления заданной функции более простыми функциями. Ещё одна из областей применения МНК – решение систем уравнений с количеством неизвестных меньшим, чем число уравнений.

  • Этапы проверки статистических гипотез:

    1. Формулировка основной гипотезы H0 и конкурирующей гипотезы H1. Гипотезы должны быть чётко формализованы в математических терминах.
    2. Задание вероятности α, называемой уровнем значимости и отвечающей ошибкам первого рода, на котором в дальнейшем и будет сделан вывод о правдивости гипотезы.
    3. Расчёт статистики φ критерия такой, что:
      • её величина зависит от исходной выборки ;
      • по её значению можно делать выводы об истинности гипотезы H0;
      • сама статистика φ должна подчиняться какому-то известному закону распределения, т.к. сама φ является случайной в силу случайности .
    4. Построение критической области. Из области значений φ выделяется подмножество таких значений, по которым можно судить о существенных расхождениях с предположением. Его размер выбирается таким образом, чтобы выполнялось равенство . Это множество и называется критической областью.
    5. Вывод об истинности гипотезы. Наблюдаемые значения выборки подставляются в статистику φ и по попаданию (или непопаданию) в критическую область выносится решение об отвержении (или принятии) выдвинутой гипотезы H0.

    Информация о работе Контрольная работа по "Статистике"