Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор работы: Пользователь скрыл имя, 24 Июня 2013 в 19:58, контрольная работа

Описание работы

При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные по 32-м предприятиям, выпускающим однородную продукцию (выборка 10%-ная, механическая), о среднегодовой стоимости основных производственных фондов и о выпуске продукции за год.
В проводимом статистическом исследовании обследованные предприятия выступают как единицы выборочной совокупности, а показатели Среднегодовая стоимость основных производственных фондов и Выпуск продукции – как изучаемые признаки единиц.
Для проведения автоматизированного статистического анализа совокупности выборочные данные представлены в формате электронных таблиц процессора Excel в диапазоне ячеек B4:C35.

Файлы: 1 файл

Статистика лаб.раб вариант 7.doc

— 577.50 Кб (Скачать файл)

 

Задача 3.

3.а) Степень колеблемости признака определяется по значению коэффициента вариации Vs  в соответствии с оценочной шкалой колеблемости признака.

Для признака Среднегодовая стоимость основных производственных фондов показатель Vs =17,25%

Для признака Выпуск продукции показатель Vs =21,96%

 

Вывод Т.к. для каждого признака коэффициент вариации находится в границах от 0 до 40 (0% < Vs ≤ 40%), то согласно оценочной шкале, можно сказать, что колеблемость признаков в обоих случаях незначительная.

 

 

3.б) Однородность совокупности по изучаемому признаку для нормального и близких к нормальному распределений устанавливается по значению коэффициента вариации V. Если его значение невелико (Vs<33%), то индивидуальные значения признака xi мало отличаются друг от друга, единицы наблюдения количественно однородны.

Для признака Среднегодовая стоимость основных производственных фондов показатель Vs =17,25%

Для признака Выпуск продукции показатель Vs =21,96%

 

Вывод Отсюда видно, что коэффициент вариации в обоих случаях Vs≤33%, следовательно, статистическая совокупность по изучаемым признакам однородная, средняя является надежной величиной.

 

 

3.в). Сопоставление средних отклонений  – квадратического s и линейного позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.

В условиях симметричного  и нормального, а также близких  к ним распределений между  показателями s и имеют место равенства s 1,25 , 0,8s, поэтому отношение показателей и s может служить индикатором устойчивости данных.

Если   >0,8, то значения признака неустойчивы, в них имеются «аномальные» выбросы. Следовательно, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдений при выполнении Задания 1, некоторые аномалии в первичных данных продолжают сохраняться. В этом случае их следует выявить (например, путем поиска значений, выходящих за границы ( )) и рассматривать в качестве возможных «кандидатов» на исключение из выборки.

210,47

266,06




Для признака Среднегодовая стоимость основных производственных фондов показатель =                                                             =0,791

 

240,39

317,39




Для признака Выпуск продукции показатель =       =0,7573

 

Вывод: В первом случае значение признака равно немногим меньше 0,8, следовательно, значения признака неустойчивы, в них могут быть «аномальные» явления. Для второго признака показатель намного меньше <0,8, следовательно, значения признака устойчивы.

 «Кандидаты» на исключение из выборки:

  =1542,14 ± 2∙266,06; «Кандидаты» на исключение из выборки выходят за пределы интервала (1010,02; 2074,26). Это предприятия под номерами № 11, 30 (см. табл. 1).

 

3г) Для оценки количества  попаданий индивидуальных значений  признаков xi в тот или иной диапазон отклонения от средней , а также для установления процентного соотношения рассеяния значений xi по 3-м диапазонам необходимо сформировать табл.9 (с конкретными числовыми значениями границ диапазонов).

Таблица 9

Распределение значений признака по диапазонам рассеяния признака относительно

 

Границы диапазонов

Количество значений xi, находящихся в диапазоне

Процентное соотношение рассеяния  значений xi по диапазонам, %

 

Первый признак

Второй признак

Первый признак

Второй признак

Первый признак

Второй признак

[1276,08;1808,2]

[1127,78.;1762,56]

19

20

63,33

66,66

[1010,02;2074,26]

[810,39;2079,95]

28

27

93,33

90

[743,96.;2340,32]

[493.;2397,34]

30

30

100

100


 

На основе данных табл.9 сопоставить процентное соотношение  рассеяния значений признака по трем диапазонам с рассеянием по правилу  «трех сигм», справедливому для  нормальных и близких к нему распределений:

68,3% располагаются в диапазоне ( )

95,4% располагаются в диапазоне ( )

99,7% располагаются в диапазоне ( )

Если полученное в табл. 9 процентное соотношение рассеяния хi по 3-м диапазонам незначительно расходится с правилом «3-х сигм», можно предположить, что изучаемое распределение признака близко к нормальному.

Расхождение с правилом «3-х сигм» может быть существенным. Например, менее 60% значений хi попадают в центральный диапазон ( ) или значительно более 5% значения хi выходит за диапазон ( ). В этих случаях распределение нельзя считать близким к нормальному.

 

 

 

 

Вывод: из таблицы видно, что процентное соотношение рассеяния обоих признаков по трем диапазонам относительно незначительно расходится с правилом «3-х сигм» (9.0) (не более 5%), можно считать, что изучаемое распределение признаков близко к нормальному.

 

Задача 4. Для ответа на вопросы 4а) – 4г) необходимо воспользоваться табл.8 и сравнить величины показателей для двух признаков.

Для сравнения вариации признаков применяется коэффициент  вариации

4 а) Для сравнения колеблемости значений признаков, используется коэффициент вариации (когда сравнивается вариация признаков, имеющие разные средние )..     Vσ(1)= 17,25; Vσ(2)= 21,96

 

Вывод: Так как Vs по первому признаку меньше Vs по второму признаку, то колеблемость значений первого признака (вариация) меньше колеблемости значений второго признака.

 

4 б) Сравнение количественной  однородности единиц.

Чем меньше значение коэффициента вариации Vs, тем более однородна совокупность.

 

Вывод: Так как Vs по первому признаку меньше, чем Vs по второму признаку, то первая совокупность более однородна.

 

4 в) Сравнение  надежности (типичности) средних значений признаков.

Чем более однородна  совокупность, тем надежнее среднее  значение признака

 

Вывод: Так как первая совокупность более однородна, то среднее значение первого признака надежнее, среднего значения второго признака.

 

 

4 г) Сравнение симметричности  распределений в центральной  части ряда.

В нормальных и близких  к нему распределениях основная масса  единиц (63,8%) располагается в центральной  части ряда, в диапазоне ( ). Для оценки асимметрии распределения в этом центральном диапазоне служит коэффициент К.Пирсона – Asп.

При правосторонней асимметрии Asп>0, при левосторонней Asп<0. Если Asп=0, вариационный ряд симметричен.

 

Вывод: Асимметрия распределения признака Среднегодовая стоимость основных производственных фондов в центральной части ряда является левосторонней, так как Asп=-0,16, а асимметрия признака Выпуск продукции - правосторонней, так как Asп=0,05. Сравнение абсолютных величин |Аsп| для обоих рядов показывает, что ряд распределения признака Среднегодовая стоимость основных производственных фондов более асимметричен (0,16>0,05), чем ряд распределения признака Выпуск продукции.

 

 

Задача 5. Интервальный вариационный ряд распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов представлен в табл.7., а гистограмма и кумулята - на рис.2.

Возможность отнесения  распределения признака «Среднегодовая стоимость основных производственных фондов» к семейству нормальных распределений устанавливается путем анализа формы гистограммы распределения - количества вершин в гистограмме, ее асимметричности и выраженности «хвостов», т.е. частоты появления значений, выходящих за диапазон ( ).

1. При анализе формы гистограммы  прежде всего следует оценить  распределение вариантов признака  по интервалам (группам). Если на  гистограмме четко прослеживаются  два-три «горба» частот вариантов,  это говорит о том, что значения  признака концентрируются сразу в нескольких интервалах, что не соответствует нормальному закону распределения.

Если гистограмма имеет одновершинную форму, есть основания предполагать, что выборочная совокупность может иметь характер распределения, близкий к нормальному.

Заключение  по п. По рис.2 видно, что гистограмма имеет одновершинную форму. Таким образом, есть основания предполагать, что выборочная совокупность является однородной по данному признаку (имеет характер распределения, близкий к нормальному).

 

2. Для дальнейшего анализа  формы распределения используются описательные параметры выборки - показатели центра распределения ( , Mo, Me), вариации ( ), асимметрии в центральной части распределения (Asn), - совокупность которых позволяет дать качественную оценку близости эмпирических данных к нормальной форме распределения.

Нормальное  распределение является симметричным, и для него выполняется соотношения:

=Mo=Me, Asп=0, Rn=6sn.

Нарушение этих соотношений  свидетельствует о наличии асимметрии распределения. Распределение с небольшой или умеренной асимметрией в большинстве случаев по своему типу относится к нормальному.

Заключение по п.2 Наблюдается умеренное отклонение от соотношений:

=Mo=Me, Asп=0.

=1542,14 млн. руб.; Mo=1585 млн. руб.; Me=1552 млн. руб. Следовательно, значения , Mo, Me отличаются мало;

 Аsп =-0,16, но |Аsп|≤0,25, значит, асимметрия кривой распределения незначительная;

 

3. В нормальном и близким к нему распределениях крайние варианты значения признака (близкие к хmin и хmax) встречаются много реже (5-7 % всех случаев), чем серединные (лежащие в диапазоне ( )). Следовательно, по проценту выхода значений признака за пределы диапазона ( ) можно судить о соответствии длины «хвостов» распределения нормальному закону.

Заключение  по п 3 Крайние варианты значения признака встречаются намного реже чем серединные (лежащие в диапазоне ( )), гистограмма приблизительно симметрична, ее «хвосты» не очень длинны, т.к. 6,67% вариантов лежат за пределами интервала ( ) (табл.9).

 

 

Вывод Гистограмма является одновершинной, приблизительно симметричной хвосты” распределения не очень длинны), т.к. 6,67% вариантов лежат за пределами интервала ( ),

Следовательно, распределение признака «Среднегодовая стоимость основных производственных фондов» можно отнести к нормальному распределению.

  Так же  для данного признака можно выявить характер распределения по показателям ассиметрии As и эксцесса Ek:

Показатель  асимметрии As оценивает смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.

В изучаемом признаке наблюдается незначительные левосторонняя асимметрия, что свидетельствует о том, что то левая часть оказывается длиннее правой (As=-0,16)- выполняется неравенство <Me<Mo, означающее, что в распределении чаще встречаются более низкие значения признака (среднее значение меньше серединного и модального).

Показатель  эксцесса Ek характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой.

Для признака Среднегодовая стоимость основных производственных фондов Ek<0 (см. табл. 3), что свидетельствует о том, что вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Значения признака не концентрируются в центральной части ряда, а достаточно равномерно рассеяны по всему диапазону от xmax до xmin.

 

         Мода полученного интервального ряда:

 ,   где:

 – нижняя граница модального  интервала;

i – размер модального интервала;

fMo – частота модального интервала;

fMo-1 – частота интервала, предшествующего модальному;

fMo+1 – частота интервала, следующего за модальным.

=1574 млн.руб.

Расхождения между полученным значением моды (1574 млн.руб.) и значением моды  для несгруппированных данных (1585 млн.руб)  объясняется тем, что значение моды для несгруппированных данных получено по фактическим значениям признака, а для интервального ряда  - по центральным значениям интервалов.

 

II. Статистический анализ  генеральной совокупности

Задача 1. Рассчитанные генеральные показатели представлены в табл.10.

Таблица 10

Описательные статистики генеральной совокупности

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel