Автор работы: Пользователь скрыл имя, 29 Марта 2013 в 11:04, лабораторная работа
1. Выявить наличие среди исходных данных резко выделяющихся значений признаков (аномалий в данных) и исключить их из выборки.
2. Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую ( ), моду (Мо), медиану (Ме), размах вариации (R), дисперсию( ), среднее квадратическое отклонение ( ), коэффициент вариации (Vσ).
3. На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) количество попаданий индивидуальных значений признаков в диапазоны ( ), ( ), ( )..
4. Сравнить распределения единиц совокупности по двум изучаемым признакам на основе анализа:
а) колеблемости признаков;
б) однородности единиц;
в) надежности (типичности) средних значений признаков.
5. Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения.
Предприятия с наименьшими значениями показателя входят в интервал от 665 млн. руб. до 815 млн. руб. Их удельный вес 10 %. Это предприятия №№ 5,23,27,1
Ответ на вопрос следует из вывода к задаче 5 и значения коэффициента асимметрии (табл.8).
Распределение предприятий на группы по среднегодовой стоимости основных производственных фондов носит закономерный характер, близкий к нормальному. В совокупности преобладают предприятия с более (низкой) стоимостью основных фондов.
Ответ на первый вопрос следует из данных табл.11. Максимальное расхождение в значениях показателя определяется величиной размаха вариации RN.
По корпорации в целом ожидаемые с вероятностью 0,954 средние величины показателей находятся в интервалах:
для среднегодовой стоимости основных производственных фондов - от 970, 95 млн. руб. до 1122,37 млн. руб.;
для выпуска продукции - от 895,88 млн. руб. до 1060,62 млн. руб.;
Максимальные расхождения в значениях показателей:
для среднегодовой стоимости основных производственных фондов -1088, 48 млн. руб.;
для выпуска продукции - 1298, 84 млн. руб.
ПРИЛОЖЕНИЕ
Результативные таблицы и графики
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ
ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ
КАФЕДРА СТАТИСТИКИ
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы
Автоматизированный
корреляционно-регрессионный
Вариант № 13
Выполнил: ст. III курса гр. 21
Седелкина М.П.
ФИО
Проверил: Лысенко С.Н.
ФИО
Москва 2009г.
Корреляционно-регрессионный анализ взаимосвязи признаков является составной частью проводимого статистического исследования деятельности 30-ти предприятий и частично использует результаты ЛР-1.
В ЛР-2 изучается взаимосвязь между факторным признаком Среднегодовая стоимость основных производственных фондов (признак Х) и результативным признаком Выпуск продукции (признак Y), значениями которых являются исходные данные ЛР-1 после исключения из них аномальных наблюдений.
Номер предприятия |
Среднегодовая стоимость основных производственных фондов, млн.руб. |
Выпуск продукции, млн. руб. |
5 |
665,00 |
525,00 |
23 |
717,50 |
697,50 |
27 |
777,50 |
600,00 |
1 |
800,00 |
772,50 |
8 |
830,00 |
825,00 |
32 |
845,00 |
870,00 |
22 |
905,00 |
742,50 |
19 |
927,50 |
712,50 |
2 |
942,50 |
847,50 |
3 |
972,50 |
945,00 |
13 |
980,00 |
1005,00 |
26 |
1002,50 |
922,50 |
9 |
1017,50 |
967,50 |
4 |
1025,00 |
1050,00 |
28 |
1047,50 |
937,50 |
17 |
1055,00 |
960,00 |
6 |
1077,50 |
900,00 |
14 |
1077,50 |
1095,00 |
25 |
1077,50 |
975,00 |
7 |
1107,50 |
1215,00 |
31 |
1152,50 |
975,00 |
18 |
1167,50 |
1140,00 |
10 |
1175,00 |
1207,50 |
20 |
1182,50 |
975,00 |
24 |
1205,00 |
1117,50 |
29 |
1212,50 |
1027,50 |
15 |
1235,00 |
1327,50 |
12 |
1287,50 |
1275,00 |
21 |
1317,50 |
1312,50 |
16 |
1415,00 |
1425,00 |
В процессе статистического исследования необходимо решить ряд задач.
а) значимость и доверительные интервалы коэффициентов а0, а1;
б) индекс детерминации R2 и его значимость;
в) точность регрессионной модели.
а) коэффициента регрессии а1;
б) коэффициента эластичности КЭ;
в) остаточных величин εi.
2. Выводы по результатам
выполнения лабораторной работы
Задача 1. Установление наличия статистической связи между факторным признаком Х и результативным признаком Y графическим методом.
Статистическая связь является разновидностью стохастической (случайной) связи, при которой с изменением факторного признака X закономерным образом изменяется какой–либо из обобщающих статистических показателей распределения результативного признака Y.
Вывод:
Точечный график связи признаков (диаграмма рассеяния, полученная в ЛР-1 после удаления аномальных наблюдений) позволяет сделать вывод, что имеет место статистическая связь. Предположительный вид связи – линейная прямая.
Задача 2. Установление наличия корреляционной связи между признаками Х и Y методом аналитической группировки.
Корреляционная связь – важнейший частный случай стохастической статистической связи, когда под воздействием вариации факторного признака Х закономерно изменяются от группы к группе средние групповые значения результативного признака Y (усредняются результативные значения , полученные под воздействием фактора ). Для выявления наличия корреляционной связи используется метод аналитической группировки.
Вывод:
Результаты выполнения
аналитической группировки
Задача 3.Оценка тесноты связи признаков Х и Y на основе эмпирического корреляционного отношения.
Для анализа тесноты
связи между факторным и
,
где и - соответственно межгрупповая и общая дисперсии результативного признака Y - Выпуск продукции (индекс х дисперсии означает, что оценивается мера влияния признака Х на Y).
Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения служит шкала Чэддока:
Значение η |
0,1 – 0,3 |
0,3 – 0,5 |
0,5 – 0,7 |
0,7 – 0,9 |
0,9 – 0,99 |
Сила связи |
Слабая |
Умеренная |
Заметная |
Тесная |
Весьма тесная |
Результаты выполненных расчетов представлены в табл. 2.4 Рабочего файла.
Вывод:
Значение коэффициента η = 0,979790289
, что в соответствии с оценочной шкалой Чэддока говорит о весьма тесной степени связи изучаемых признаков.
Задача 4. Построение однофакторной линейной регрессионной модели связи изучаемых признаков с помощью инструмента Регрессия надстройки Пакет анализа и оценка тесноты связи на основе линейного коэффициента корреляции r.
4.1. Построение регрессионной
модели заключается в
Инструмент Регрессия на основе исходных данных (xi , yi), производит расчет параметров а0 и а1 уравнения однофакторной линейной регрессии , а также вычисление ряда показателей, необходимых для проверки адекватности построенного уравнения исходным (фактическим) данным.
Примечание. В результате работы инструмента Регрессия получены четыре результативные таблицы (начиная с заданной ячейки А75). Эти таблицы выводятся в Рабочий файл без нумерации, поэтому необходимо присвоить им номера табл.2.5 – табл.2.8 в соответствии с их порядком.
Вывод:
Рассчитанные в табл.2.7 (ячейки В91 и В92) коэффициенты а0 и а1 позволяют построить линейную регрессионную модель связи изучаемых признаков в виде уравнения -154,68+ 1,09 х
4.2. В случае линейности
функции связи для оценки тесно
Значение коэффициента корреляции r приводится в табл.2.5 в ячейке В78 (термин "Множественный R").
Вывод:
Значение коэффициента корреляции r = 0,913, что в соответствии с оценочной шкалой Чэддока говорит о весьма тесной степени связи изучаемых признаков.
Задача 5. Анализ адекватности и практической пригодности построенной линейной регрессионной модели.
Анализ адекватности регрессионной модели преследует цель оценить, насколько построенная теоретическая модель взаимосвязи признаков отражает фактическую зависимость между этими признаками, и тем самым оценить практическую пригодность синтезированной модели связи.
Оценка соответствия
построенной регрессионной
Так как коэффициенты уравнения а0 , а1 рассчитывались, исходя из значений признаков только для 30-ти пар (xi , yi), то полученные значения коэффициентов являются лишь приближенными оценками фактических параметров связи а0 , а1. Поэтому необходимо:
Информация о работе Автоматизированный априорный анализ статистической совокупности в среде MS Excel