Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Автор работы: Пользователь скрыл имя, 29 Марта 2013 в 11:04, лабораторная работа

Описание работы

1. Выявить наличие среди исходных данных резко выделяющихся значений признаков (аномалий в данных) и исключить их из выборки.
2. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую ( ), моду (Мо), медиану (Ме), размах вариации (R), дисперсию( ), среднее квадратическое отклонение ( ), коэффициент вариации (Vσ).
3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) количество попаданий индивидуальных значений признаков в диапазоны ( ), ( ), ( )..
4. Сравнить распределения единиц совокупности по двум изучаемым признакам на основе анализа:
а) колеблемости признаков;
б) однородности единиц;
в) надежности (типичности) средних значений признаков.
5. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения.

Файлы: 1 файл

статистика 1,2,3.doc

— 675.00 Кб (Скачать файл)

Предприятия с наименьшими  значениями показателя входят в интервал от 665 млн. руб.  до 815 млн. руб.  Их удельный вес 10 %. Это предприятия №№ 5,23,27,1


  1. Носит ли распределение предприятий по группам закономерный характер и какие предприятия (с более высокой или более низкой стоимостью основных фондов) преобладают в совокупности?

Ответ на вопрос следует  из вывода к задаче 5 и значения коэффициента асимметрии (табл.8).

Распределение предприятий  на группы по среднегодовой стоимости основных производственных фондов носит закономерный характер, близкий к нормальному. В совокупности преобладают предприятия с более (низкой) стоимостью основных фондов.


  1. Каковы ожидаемые средние величины среднегодовой стоимости основных фондов и выпуска продукции на предприятиях корпорации в целом? Какое максимальное расхождение в значениях каждого показателя можно ожидать?

Ответ на первый вопрос следует  из данных табл.11. Максимальное расхождение в значениях показателя определяется величиной размаха вариации RN.

По корпорации в целом  ожидаемые с вероятностью 0,954 средние  величины показателей находятся  в интервалах:

для среднегодовой стоимости основных производственных фондов - от 970, 95 млн. руб. до 1122,37 млн. руб.;

для выпуска продукции - от 895,88 млн. руб. до 1060,62 млн. руб.;

Максимальные расхождения  в значениях показателей:

для среднегодовой стоимости основных производственных фондов -1088, 48 млн. руб.;

для выпуска продукции - 1298, 84 млн. руб.


 

 

 

ПРИЛОЖЕНИЕ

 

Результативные  таблицы и графики

 

Распечатка Рабочего файла (Лист 1)

 

 


 

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ  ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ

 

КАФЕДРА СТАТИСТИКИ

 

 

 

 

 

 

О Т Ч Е  Т 

о результатах выполнения

компьютерной лабораторной работы

 

Автоматизированный  корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS Excel

 

 

Вариант № 13

 

 

 

 

 

 

 

 

 

Выполнил: ст. III курса гр. 21

Седелкина М.П.

ФИО

Проверил: Лысенко С.Н.

ФИО

 

 

 

 

 

Москва 2009г.

 

1. Постановка задачи статистического исследования

Корреляционно-регрессионный  анализ взаимосвязи признаков является составной частью проводимого статистического  исследования деятельности 30-ти предприятий  и частично использует результаты ЛР-1.

В ЛР-2 изучается взаимосвязь  между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные ЛР-1 после исключения из них аномальных наблюдений.

Номер предприятия

Среднегодовая стоимость  основных производственных фондов, млн.руб.

Выпуск продукции, млн. руб.

5

665,00

525,00

23

717,50

697,50

27

777,50

600,00

1

800,00

772,50

8

830,00

825,00

32

845,00

870,00

22

905,00

742,50

19

927,50

712,50

2

942,50

847,50

3

972,50

945,00

13

980,00

1005,00

26

1002,50

922,50

9

1017,50

967,50

4

1025,00

1050,00

28

1047,50

937,50

17

1055,00

960,00

6

1077,50

900,00

14

1077,50

1095,00

25

1077,50

975,00

7

1107,50

1215,00

31

1152,50

975,00

18

1167,50

1140,00

10

1175,00

1207,50

20

1182,50

975,00

24

1205,00

1117,50

29

1212,50

1027,50

15

1235,00

1327,50

12

1287,50

1275,00

21

1317,50

1312,50

16

1415,00

1425,00


В процессе статистического  исследования необходимо решить ряд  задач.

    1. Установить наличие статистической связи между факторным признаком Х и результативным признаком Y графическим методом.
    2. Установить наличие корреляционной связи между признаками Х и Y методом аналитической группировки.
    3. Оценить тесноту связи признаков Х и Y на основе эмпирического корреляционного отношения η.
    4. Построить однофакторную линейную регрессионную модель связи признаков Х и Y, используя инструмент Регрессия надстройки Пакет анализа, и оценить тесноту связи признаков Х и Y на основе линейного коэффициента корреляции r.
    5. Определить адекватность и практическую пригодность построенной линейной регрессионной модели, оценив:

а) значимость и доверительные  интервалы коэффициентов а0, а1;

б) индекс детерминации R2 и его значимость;

в) точность регрессионной  модели.

    1. Дать экономическую интерпретацию:

а) коэффициента регрессии а1;

б) коэффициента эластичности КЭ;

в) остаточных величин εi.

    1. Найти наиболее адекватное нелинейное уравнение регрессии с помощью средств инструмента Мастер диаграмм.

 

2. Выводы по результатам  выполнения лабораторной работы3

Задача 1. Установление наличия статистической связи между факторным признаком Х и результативным признаком Y графическим методом.

Статистическая связь  является разновидностью стохастической (случайной) связи, при которой с изменением факторного признака X закономерным образом изменяется какой–либо из обобщающих статистических показателей распределения результативного признака Y.

Вывод:

Точечный график  связи  признаков  (диаграмма рассеяния, полученная в ЛР-1 после удаления аномальных наблюдений) позволяет сделать  вывод, что имеет место статистическая связь. Предположительный вид связи – линейная прямая.


Задача 2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.

Корреляционная связь  – важнейший частный случай стохастической статистической связи, когда под  воздействием вариации факторного признака Х закономерно изменяются от группы к группе средние групповые значения результативного признака Y (усредняются результативные значения , полученные под воздействием фактора ). Для выявления наличия корреляционной связи используется метод аналитической группировки.

Вывод:

Результаты выполнения аналитической группировки предприятий  по факторному признаку Среднегодовая стоимость основных производственных фондов даны в табл. 2.2 Рабочего файла, которая показывает, что с увеличением значений факторного признака Х закономерно увеличиваются средние групповые значения  результативного признака . Следовательно, между признаками Х и Y имеется корреляционная  связь.


Задача 3.Оценка тесноты связи признаков Х и Y на основе эмпирического корреляционного отношения.

Для анализа тесноты  связи между факторным и результативным признаками рассчитывается показатель η – эмпирическое корреляционное отношение, задаваемое формулой

           ,

где и - соответственно межгрупповая и общая дисперсии результативного признака Y - Выпуск продукции (индекс х дисперсии означает, что оценивается мера влияния признака Х на Y).

Для качественной оценки тесноты  связи на основе показателя эмпирического корреляционного отношения служит шкала Чэддока:

Значение η

0,1 – 0,3

0,3 – 0,5

0,5 – 0,7

0,7 – 0,9

0,9 – 0,99

Сила связи

Слабая

Умеренная

Заметная

Тесная

Весьма тесная


Результаты выполненных  расчетов представлены в табл. 2.4 Рабочего файла.

Вывод:

Значение коэффициента η = 0,979790289

, что в соответствии  с оценочной шкалой Чэддока  говорит о  весьма тесной степени связи изучаемых признаков.


Задача 4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа и оценка тесноты связи на основе линейного коэффициента корреляции r.

4.1. Построение регрессионной  модели заключается в нахождении  аналитического выражения связи  между факторным признаком X и результативным признаком Y.

Инструмент Регрессия на основе исходных данных (xi , yi), производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии , а также вычисление ряда показателей, необходимых для проверки адекватности построенного уравнения исходным (фактическим) данным.

Примечание. В результате работы инструмента Регрессия получены четыре результативные таблицы (начиная с заданной ячейки А75). Эти таблицы выводятся в Рабочий файл без нумерации, поэтому необходимо присвоить им номера табл.2.5 – табл.2.8 в соответствии с их порядком.

Вывод:

Рассчитанные в табл.2.7 (ячейки В91 и В92) коэффициенты а0 и а1 позволяют построить линейную регрессионную модель связи изучаемых признаков в виде уравнения -154,68+ 1,09 х


4.2. В случае линейности  функции связи для оценки тесноты связи признаков X и Y, устанавливаемой по построенной модели, используется линейный коэффициент корреляции r.

Значение коэффициента корреляции r приводится в табл.2.5 в ячейке В78 (термин "Множественный R").

Вывод:

Значение коэффициента корреляции r = 0,913, что в соответствии с оценочной шкалой Чэддока говорит о весьма тесной степени связи изучаемых признаков.


Задача 5. Анализ адекватности и практической пригодности построенной линейной регрессионной модели.

Анализ адекватности регрессионной модели преследует цель оценить, насколько построенная  теоретическая модель взаимосвязи  признаков отражает фактическую зависимость между этими признаками, и тем самым оценить практическую пригодность синтезированной модели связи.

Оценка соответствия построенной регрессионной модели исходным (фактическим) значениям признаков X и Y выполняется в 4 этапа:

  1. оценка статистической значимости коэффициентов уравнения а0, а1 и определение их доверительных интервалов для заданного уровня надежности;
  2. определение практической пригодности построенной модели на основе оценок линейного коэффициента корреляции  r  и индекса детерминации R2;
  3. проверка значимости уравнения регрессии в целом по F-критерию Фишера;
  4. оценка погрешности регрессионной модели.
    1. Оценка статистической значимости коэффициентов уравнения а0, а1 и определение их доверительных интервалов

Так как коэффициенты уравнения а0 , а1 рассчитывались, исходя из значений признаков только для 30-ти пар (xi , yi), то полученные значения коэффициентов являются лишь приближенными оценками фактических параметров связи а0 , а1. Поэтому необходимо:

      1. проверить значения коэффициентов на неслучайность (т.е. узнать, насколько они типичны для всей генеральной совокупности предприятий отрасли);
      2. определить (с заданной доверительной вероятностью 0,95 и 0,683) пределы, в которых могут находиться значения а0, а1 для генеральной совокупности предприятий.

Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel