Використання Microsoft Office Excel для перевірки статистичних гіпотез

Автор работы: Пользователь скрыл имя, 27 Марта 2013 в 16:21, реферат

Описание работы

Розвиток сучасної науки характеризується її математизацією, що виражається у використанні математичних методів і моделей не тільки у технічних та економічних дослідженнях, але й у менеджменті, соціології, педагогіці, біології, медицині. В соціальних науках використовуються різноманітні статистичні методи для перевірки висунутих гіпотез, побудови статистичних моделей соціальних та економічних об’єктів, явищ, закономірностей і процесів. Зазвичай застосовують пакета Excel під час перевірки статистичних гіпотез використовуючи методи статистичної обробки даних «Двох-вибірковий z-тест для середніх», “Двох-вибірковий t-тест с різноманітними дисперсіями», «Двох-вибірковий F-тест для дисперсії», які входять у Пакет аналізу, пункт Аналіз даних.

Содержание работы

ВСТУП……………………………………………………………………………..3
1. Поняття про статистичні гіпотези……………………………………………..4
2. Перевірка гіпотези про вид закону розподілу досліджуваної величини……6
3. Перевірка гіпотези про рівність генеральних дисперсій. F-критерій (Фішера)……………………………………………………………………………8
4. Перевірка статистичних гіпотез із використанням Microsoft Excel………...9
5. Доведення статистичної гіпотези в середовищі EXCEL…………………...11
ВИСНОВКИ……………………………………………………………………..12
СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ…………………

Файлы: 1 файл

Використання Exel для перевірки стат гіпотез Осняч Я 02 2013.doc

— 6.66 Мб (Скачать файл)

МІНІСТЕРСТВО ОСВІТИ І НАУКИ, МОЛОДІ ТА СПОРТУ УКРАЇНИ

БЕРДЯНСЬКИЙ ДЕРЖАВНИЙ  ПЕДАГОГІЧНИЙ УНІВЕРСИТЕТ

 

Інститут соціально-педагогічної та колекційної освіти

 

 

 


 

 

 

 

 

РЕФЕРАТ

з дисципліни «_______________________»

на тему:

 «Використання Microsoft Office Excel  для перевірки статистичних гіпотез»

 

 

Реферат виконала

студентка ІІ курсу

202 (а) групи

ОСНЯЧ ЯНА

 

 

 

 

 

 

 

 

 

 

 

 

БЕРДЯНСЬК-2013

 

ЗМІСТ

 

ВСТУП……………………………………………………………………………..3

1. Поняття про статистичні  гіпотези……………………………………………..4

2. Перевірка гіпотези про вид закону розподілу досліджуваної величини……6

3. Перевірка гіпотези  про рівність генеральних дисперсій. F-критерій (Фішера)……………………………………………………………………………8

4. Перевірка статистичних  гіпотез із використанням Microsoft Excel………...9

5. Доведення статистичної гіпотези в середовищі EXCEL…………………...11

ВИСНОВКИ……………………………………………………………………..12

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ…………………………………..13

 

 

 

 

 

 



 

 

 

 

 

 

 

 

ВСТУП

Розвиток сучасної науки  характеризується її математизацією, що виражається у використанні математичних методів і моделей не тільки у технічних та економічних дослідженнях, але й у менеджменті, соціології, педагогіці, біології, медицині. В соціальних науках використовуються різноманітні статистичні методи для перевірки висунутих гіпотез, побудови статистичних моделей соціальних та економічних об’єктів, явищ, закономірностей і процесів. Зазвичай застосовують пакета Excel під час перевірки статистичних гіпотез використовуючи методи статистичної обробки даних «Двох-вибірковий z-тест для середніх», “Двох-вибірковий t-тест с різноманітними дисперсіями», «Двох-вибірковий F-тест для дисперсії», які входять у Пакет аналізу, пункт Аналіз даних.

Табличні процесори  належать до класу прикладних програм, які призначені для опрацювання  відомостей, матеріалів поданих у  табличній формі. Найбільш поширеною програмою цього класу є табличний процесор Microsoft Office Excel. Табличний процесор Excel – це  пакет прикладних програм, орієнований на опрацювання даних, поданих у табличній формі.

Окрім опрацювання та аналізу табличних даних, за допомогою Excel можна створювати, форматувати та сортувати списки, шукати і вибирати їх елементи за заданими критеріями; використовувати опрацьовані дані у інших програмах; формувати зведені таблиці, звіти і навіть карти з географічним прив'язуванням даних; створювати макроси, тобто макрокоманди, які використовуються для автоматизації процедур розв'язання задач, що часто повторюються.

 В цілому пакет  прикладних програм Excel дає змогу  розв'язувати багато видів складних  фінансово-економічних задач і здатний задовольнити потреби соціальних працівників для перевірки статистичних гіпотез. В основі будь-якого табличного процесора є електронна таблиця (засіб організації даних, надання їм певної структури, вдалий вибір якої суттєво спрощує аналіз даних та їх опрацювання).

Усі книги-файли Excel мають  розширення .xls, .xlsm, .xlsb, .xlsx.

1. Поняття про статистичні гіпотези

 

При застосуванні певних статистичних методів обробки даних  вибірки часто ставляться вимоги до розподілу даних або до числових характеристик. Статистичною гіпотезою називається будь-яке припущення про властивості досліджуваної величини, висунуте на основі статистичних даних.

За змістом статистичні  гіпотези можна віднести до таких  типів:

1) Гіпотези про вид  закону розподілу досліджуваної величини.

2) Гіпотези про числові  характеристики досліджуваної величини.

3) Гіпотези про рівність  числових характеристик досліджуваних  величин.

4) Гіпотези про належність  досліджуваних величин до одній  генеральної

сукупності.

5) Гіпотези про вид  моделі, що описує взаємозв’язок між досліджуваними величинами.

6) Гіпотези про належність  досліджуваних величин до одного  класу.

Статистичні гіпотези позначаються латинськими буквами Н0, Н1, і т.д. Гіпотеза Н0 формулюється як основна в тому розумінні, що при перевірці бажано було б встановити її справедливість. Основній гіпотезі Н0 протиставляються інші гіпотези Н1, Н2, …, які називаються альтернативними.

Прийняття основної або  однієї з альтернативних гіпотез  здійснюється на основі дослідження статистичних даних. Дослідження проводиться за певним критерієм, який обирається відповідно до змісту гіпотези і виду наявних статистичних даних.

Якщо сформульовані  гіпотези Н0 – основна та Н1 альтернативна (конкуруюча) і обраний критерій перевірки справедливості основної гіпотези, то прийняття Н0 означає відкидання Н1, а відкидання Н0 означає справедливість Н1.

Оскільки прийняття  гіпотези здійснюється на основі статистичних даних, то завжди існує ймовірність помилки.

Ймовірність відкидання гіпотези Н0, якщо вона справедлива, називається ймовірністю помилки першого роду або рівнем значущості і позначається α.

Величина 1− α є ймовірністю прийняття справедливої гіпотези і називається рівнем довіри. Ймовірність прийняття гіпотези Н0, якщо вона не вірна, називається ймовірністю помилки другого роду і позначається β. Величина 1− β є ймовірністю відкидання невірної гіпотези і називається потужністю критерію.

Чим менше значення рівня  значущості, тим менша ймовірність  відкинути вірну гіпотезу. Зазвичай рівень значущості обирається дослідником рівним 0,1; 0,05; 0,01 або 0,001.

Якщо, наприклад, обраний  рівень значущості α = 0,01, то ризик відкинути вірну гіпотезу виникає в одному випадку із ста.

Перевірка статистичної гіпотези не надає точного висновку щодо її вірності або невірності. Прийняття гіпотези означає, що на прийнятому рівні значущості вона не суперечить статистичним даним.

Перевірка статистичних гіпотез здійснюється за етапами, вказаним на рис. 1.

ЕТАПИ ПЕРЕВІРКИ СТАТИСТИЧНИХ ГІПОТЕЗ

1) Висунення  припущень про вид розподілу досліджуваної величини (величин) або про її числові характеристики.

   

2) Формулювання  статистичних гіпотез.

   

3) Вибір критерію  перевірки відповідно до змісту  гіпотез і статистичних даних.

   

4) Вибір рівня  значущості залежно від вимог  до точності результатів дослідження.

   
 

5) Розрахунок  значення обраного критерію за  статистичними даними.

   
 

6) Порівняння  розрахованого значення критерію  з його критичним значенням і прийняття або відкидання основної гіпотези.


 

Рис.1. Етапи перевірки статистичних гіпотез

2. Перевірка гіпотези  про вид закону розподілу досліджуваної величини

 

Перевірка гіпотези про  вид закону розподілу досліджуваної  величини має велике значення для прикладних досліджень. Необхідність такої перевірки виникає при виборі критерію, оскільки для багатьох з них висувається вимога нормального розподілу статистичних даних. Означені гіпотези перевіряються при проектуванні систем масового обслуговування, перевірки якості продукції або праці і т. ін.

Припустимо, що з деякої генеральної сукупності Х, яка розглядається як випадкова величина, обрана вибірка {х1, х2, …хт}. За даними вибірки побудовано статистичний ряд (табл. 1), що містить варіанти хi та відповідні частоти пi, i 1,k , де k – кількість варіант у випадку дискретного ряду. У випадку інтервального ряду хi – середини інтервалів, k – кількість інтервалів.


Таблиця 1

хi

х1

х2

хk

пi

п1

п2

пk


 

Отриманий на основі вибіркових даних статистичний ряд називається емпіричним законом розподілу величини Х.

За даними статистичного ряду можна знайти числові характеристики, які є вибірковими параметрами закону розподілу Х. Вид закону розподілу визначається відповідно до умов формування вибірки або залежно від виду графіка емпіричної щільності розподілу (гістограми) у випадку неперервної випадкової величини Х і полігону частот, якщо величина Х дискретна. Параметри обраного закону розподілу змінюються відповідними вибірковими параметрами.

Закон розподілу випадкової величини Х, параметрами якого є відповідні вибіркові числові характеристики, називається теоретичним законом розподілу.

При здійсненні такої заміни немає  впевненості, що закон розподілу обраний правильно. Тому розроблено процедуру, яка дозволяє оцінити степінь відповідності обраного закону даним вибірки. Критерії здійснення такої перевірки називаються критеріями згоди, найбільш відомим з яких є критерій Пірсона Х 2 (хі-квадрат).

Критерій Пірсона Х 2 обчислюється за формулою:

                                     (2.1)

де  n´і – частоти, отримані за теоретичним законом розподілу (теоретичні).

З формули (2.1) видно, що у  випадку, коли відповідні теоретичні та емпіричні частоти співпадають, χ2 = 0. Тобто, чим ближче χ2 до нуля, тим краще узгоджуються вибіркові дані та обраний теоретичний закон розподілу.

Розраховане значення критерія χ2 порівнюється з його критичним значенням Х 2а, 1, яке знаходиться за статистичними таблицями, або за допомогою вбудованої статистичної функції Excel ХИ2ОБР (а , l), або за допомогою описових статистик пакету програм SPSS. Параметрами функції ХИ2ОБР є:

α – рівень значущості;

l – степінь свободи, l = k – r – 1,

де k – кількість груп емпіричного розподілу,

r – кількість параметрів теоретичного розподілу (наприклад, для нормального розподілу r = 2, оскільки параметрів два – а і σ).

Якщо Х2 < Х2а,l, то гіпотеза про закон розподілу приймається. У противному випадку гіпотеза відкидається.

У деяких статистичних таблицях критичне значення χ2 надається залежно від рівня довіри γ, а γ =1− а.

Отже, перевірка гіпотези про закон розподілу величини Х здійснюється за такими етапами:

1) З генеральної сукупності Х формується вибірка і будується статистичний ряд.

2) Висувається гіпотеза  про закон розподілу випадкової  величини Х.

3) Знаходяться вибіркові параметри обраного закону розподілу.

4) Розраховуються теоретичні  частоти.

5) Розраховується критерій  χ2 за формулою (2.1).

6) Обирається рівень  значущості а (або рівень довіри γ ) і знаходиться критичне значення Х 2 а,l (або Х 2 γ,l).

7) Порівнюються розраховане і критичне значення критерію χ2 і робиться висновок про справедливість запропонованої гіпотези.

 

 

 

3. Перевірка гіпотези  про рівність генеральних дисперсій. F-критерій (Фішера)

Перевірка гіпотези про  рівність генеральних дисперсій  здійснюється за F-критерієм (Фішера) тільки тоді, коли статистичні дані незалежні і розподілені за нормальним законом. Формулюються гіпотези:

Н0 – дисперсії двох нормально розподілених генеральних сукупностей рівні, тобто ;

Н1 - дисперсії двох нормально розподілених генеральних сукупностей не рівні, тобто .

F-критерій (Фішера) розраховується за формулою:

,                                           (2.2)

Гіпотеза Н0 приймається, якщо розраховане значення F менше критичного значення розподілу Фішера Fкрит, взятого із рівнем значущості і ступенями волі l1 та l2 для чисельнику і знаменнику відповідно: l1=п1 – 1, l2=п2 – 1, де п1, п2 – об’єми вибірок. Fкрит можна знайти за допомогою вбудованої статистичної функції Excel FРАСПОБР ( ; l1; l2).

Дисперсія у чисельнику дроби у формулі (2.2) повинна бути більше дисперсії у знаменнику, тобто  значення F-критерію повинно бути більше одиниці.

 

4. Перевірка статистичних гіпотез із використанням Microsoft Excel

Информация о работе Використання Microsoft Office Excel для перевірки статистичних гіпотез