Ahamiyatli testlar

Har bir muhim test H 0 gipotezasi bilan boshlanadi. H 0, bu haqiqat deb ishonilganligi yoki argument uchun asos sifatida ishlatilgani uchun ilgari surilgan, lekin isbotlanmagan nazariyani ifodalaydi. Masalan, yangi dori -darmonni klinik tadkikotida, yangi dori, hozirgi dori -darmondan o'rtacha, yaxshiroq emas, degan gipoteza bo'lishi mumkin. Biz H 0 ni yozardik: bu ikki dori o'rtasida o'rtacha farq yo'q.

Muqobil gipoteza, H a, statistik gipoteza testini o'rnatish uchun nima o'rnatilganligi haqidagi bayonot. Masalan, yangi dori -darmonning klinik tadkikotida, muqobil gipoteza, yangi dori -darmon, hozirgi dori -darmonga qaraganda, o'rtacha, boshqacha ta'sir ko'rsatadi. Biz H a deb yozgan bo'lardik: bu ikki dori o'rtacha ta'sir ko'rsatadi. Muqobil gipoteza, yangi dori, o'rtacha, hozirgi dori -darmonga qaraganda yaxshiroq bo'lishi mumkin. Bu holda biz H a ni yozardik: yangi dori o'rtacha hisobda hozirgi doridan yaxshiroq.

Sinov o'tkazilgandan so'ng yakuniy xulosa har doim nol gipoteza nuqtai nazaridan beriladi. Biz "H 0 ni H a foydasiga rad etamiz" yoki "H 0 ni rad qilmaymiz"; biz hech qachon "H a rad" yoki hatto "H a qabul" degan xulosaga kelmaymiz.

Agar biz "H 0 ni rad qilmang" degan xulosaga kelsak, bu haqiqiy gipoteza to'g'ri degani emas, faqat H 0 foydasiga H 0 ga qarshi etarli dalillar yo'qligini ko'rsatadi; null gipotezani rad etish, muqobil gipoteza haqiqat bo'lishi mumkinligini ko'rsatadi.

(Valeriy J. Easton va Jon X. Makkollning Statistik lug'ati v1.1 dan olingan ta'riflar)

Gipotezalar har doim populyatsiya parametrlari bo'yicha, masalan, o'rtacha. Muqobil gipoteza bir tomonlama yoki ikki tomonlama bo'lishi mumkin. Bir tomonlama gipoteza shuni ko'rsatadiki, parametr nol gipoteza bergan qiymatdan kattaroq yoki kichikroq. Ikki tomonlama gipoteza shuni ko'rsatadiki, parametr oddiy gipoteza bergan qiymatga teng emas-yo'nalish muhim emas.

Populyatsiya uchun bir tomonlama test gipotezasi quyidagi shaklni oladi:

H 0: = k

H a:>k

yoki

H 0: = k

H a:

Populyatsiya uchun ikki tomonlama test gipotezasi quyidagi shaklni oladi:

H 0: = k

H a: k.

Ishonch oralig'i noma'lum populyatsion parametrni o'z ichiga olishi mumkin bo'lgan taxminiy qiymatlar diapazonini beradi, taxminiy diapazon ma'lum namunaviy ma'lumotlar to'plamidan hisoblanadi. (Ta'rif Valeri J. Easton va Jon X. Makkollning Statistik lug'ati v1.1 dan olingan)

Misol

H 0 nol gipotezasi talaba qizlarning o'rtacha ballari va butun aholi uchun o'rtacha ko'rsatkichlar o'rtasida hech qanday farq yo'qligini da'vo qiladi, shuning uchun = 70. Muqobil gipoteza talaba qizlarning o'rtacha ko'rsatkichi talabalarning umumiy sonidan yuqori ekanligini, shuning uchun>70.

Noma'lum o'rtacha va ma'lum standart og'ish uchun ahamiyatlilik testlari

Sinov statistikasi standart normal taqsimotga mos keladi (o'rtacha = 0 va standart og'ish = 1). Z test statistikasi standart normal taqsimot uchun P-qiymatini hisoblash uchun ishlatiladi, ehtimol noldan gipotezada test statistikasi kabi ekstremal qiymat kuzatiladi. Nopok gipotezani hisobga olsak, o'rtacha qiymat berilgan 0 ga teng, H 0 ni har bir mumkin bo'lgan alternativ gipotezaga nisbatan sinab ko'rish uchun P-qiymatlari:

H a:>0

P (Z z). ) H a uchun:
2P (Z>| z |) H a: 0 uchun.

Ikki tomonlama test uchun ehtimollik ikki barobar ko'payadi, chunki ikki tomonlama muqobil gipoteza oddiy taqsimotning har ikki uchida ham haddan tashqari qiymatlarni kuzatish imkoniyatini ko'rib chiqadi.

Misol

Ahamiyat darajalari

Bir tomonlama testda z * kritik qiymatiga mos keladi, shuning uchun P (Z>z *) =. Masalan, agar natija uchun kerakli ahamiyatlilik darajasi 0,05 bo'lsa, z uchun mos keladigan qiymat z * = 1,645 dan katta yoki teng bo'lishi kerak (yoki o'rtacha bir xil deb da'vo qiladigan bir tomonlama muqobil uchun -1,645 dan kam yoki teng bo'lishi kerak). nol gipotezadan kamroq). Ikki tomonlama test uchun biz 2P (Z>z *) = ehtimolligi bilan qiziqamiz, shuning uchun z * kritik qiymati /2 ahamiyat darajasiga to'g'ri keladi. Ikki tomonlama test uchun 0,05 ahamiyatlilik darajasiga erishish uchun test statistikasining mutlaq qiymati (| z |) 1,96 kritik qiymatidan katta yoki unga teng bo'lishi kerak (bu bir tomonlama test uchun 0,025 darajasiga to'g'ri keladi). ).

Qaror nazariyasiga asoslangan ahamiyatlilik darajasining yana bir talqini, H 0 nol gipotezasini rad etish yoki qabul qilish uchun tanlagan qiymatga mos keladi. Yuqoridagi misolda 0,0082 qiymati 0,01 darajadagi nol gipotezani rad etishga olib keladi. Bu xato bo'lishi ehtimoli-z-statistikani hisobga olmaganda, haqiqiy bo'lmagan gipoteza-0,01 dan kam. Qaror nazariyasida, bu I turdagi xato deb nomlanadi. Birinchi turdagi xato ehtimoli ahamiyat darajasiga teng, va haqiqiy bo'lmagan gipotezani rad etish ehtimoli (to'g'ri qaror) 1 - ga teng. Birinchi turdagi xato ehtimolini minimallashtirish uchun ahamiyatlilik darajasi odatda kichik deb tanlanadi.

Misol

Farmatsevtika kompaniyasi barcha shaxslar uchun o'rtacha tiklanish vaqtidan farqi bilan qiziqqanligi sababli, H a muqobil gipotezasi ikki tomonlama: 30. Sinov statistikasi z = (28,5 - 30)/(8/sqrt ( 100)) = -1,5/0,8 = -1,875. Bu statistikaning P-qiymati 2P (Z>1.875) = 2 (1- P ((Z

Misol

Noma'lum o'rtacha va noma'lum standart og'ish uchun ahamiyatlilik testlari

Noma'lum standart og'ish bilan oddiy taqsimotga ega bo'lgan populyatsiyadan yoki katta miqdordagi n (har bir namunaning o'rtacha chegarasi teoremasi bo'yicha normal taqsimotga mos keladigan) namunadagi populyatsiyaga tegishli da'volar uchun tegishli ahamiyatlilik testi ma'lum. t-test sifatida, bu erda test statistikasi t = sifatida belgilanadi.

Sinov statistikasi n-1 erkinlik darajasi bilan t taqsimotiga amal qiladi. Z test statistikasi t taqsimot uchun P-qiymatini hisoblash uchun ishlatiladi, ehtimol, hech bo'lmaganda test statistikasi kabi haddan tashqari qiymat nol gipotezada kuzatiladi.

Misol

"Oddiy tana harorati, jinsi va yurak urish tezligi" ma'lumotlar bazasida har bir kishining jinsi va uning yurak urish tezligi bilan birga tana haroratining 130 kuzatuvi mavjud. MINITAB "DESCRIBE" buyrug'i yordamida quyidagi ma'lumotlar beriladi: Oddiy tana harorati odatda Farengeytda 98,6 daraja deb hisoblansa, quyidagi bir tomonlama gipotezani tekshirish uchun ma'lumotlardan foydalanish mumkin:



H 0: = 98.6 ga qarshi

H a:

T test statistikasi (98.249 -98.6) /0.064 = -0.351/0.064 = -5.48 ga teng. P (t 5.48). 129 darajali erkinlikdagi t taqsimotini 100 graduslik erkinlikdagi t taqsimoti bilan taxmin qilish mumkin (Mur va Makkeybdagi E -jadvalda topilgan), bu erda P (t>5.48) 0.0005 dan kam. Bu natija 0,01 darajasida va undan yuqori darajada ahamiyatli bo'lib, nol gipotezalarni ishonch bilan rad etish mumkinligini ko'rsatadi.

Bu t-testni MINITABda bajarish uchun "ALTERNATIVE" pastki buyrug'i bilan "TTEST" buyrug'i quyidagicha qo'llanilishi mumkin: Bu natijalar t (129) taqsimoti uchun aniq hisob-kitoblarni bildiradi.

Ma'lumot manbai: Ma'lumotlar Mackowiak, PA, Wasserman, SS va Levine, MM (1992), "98,6 darajali F tanqidiy bahosi, normal tana haroratining yuqori chegarasi va Karl Reinxold Avgust Vunderikning boshqa meroslari" da keltirilgan. Amerika tibbiyot assotsiatsiyasi jurnali, 268, 1578-1580. Ma'lumotlar to'plami JSE ma'lumotlar bazasi arxivi orqali mavjud.

Mos keladigan juftliklar

Mos keluvchi juftlik tajribasidan olingan ma'lumotlarni tahlil qilish, ikkita o'lchovni bir -biridan ajratish va farqlar asosida test gipotezalarini asoslash orqali solishtiradi. Odatda, H 0 noaniq gipotezasi bu farqlarning o'rtacha qiymati 0 ga teng deb taxmin qiladi, alternativ gipoteza esa farqlarning o'rtacha qiymati nolga teng emasligini tasdiqlaydi (muqobil gipoteza bir yoki ikki tomonlama bo'lishi mumkin). , tajribaga qarab). Juft o'lchovlar orasidagi farqni bitta kuzatish sifatida ishlatib, erkinlik n-1 darajali standart t protseduralari yuqoridagi kabi bajariladi.

Misol

MINITAB-da, har bir sinov uchun geliy bilan to'ldirilgan o'lchovdan havo bilan to'ldirilgan o'lchovni olib tashlash va "DESCRIBE" buyrug'ini hosil bo'lgan farqlarga qo'llash quyidagi natijalarni beradi: H 0 nol gipotezasining t-testini o'tkazish uchun: = 0 va boshqalar H a:>0 quyidagi tahlilni beradi: 0,34 qiymatining P-qiymati bu natijaning maqbul darajada muhim emasligini ko'rsatadi. O'lchovlar farqi uchun 38 daraja erkinlikdagi t-taqsimot uchun 95% ishonch oralig'i (-1.76, 2.69), MINITAB "TINTERVAL" buyrug'i yordamida hisoblangan.

Ma'lumot manbai: Lafferty, MB (1993), "OSU olimlari sport mojarosidan xalos bo'lishadi", Kolumb dispetcheri (1993 yil 21 noyabr), B7. Ma'lumotlar to'plami Statlib ma'lumotlar va hikoyalar kutubxonasi (DASL) orqali mavjud.

Belgilar testi

Mos keladigan juftlik ma'lumotlari bo'yicha belgi testini o'tkazish uchun har bir juftlikdagi ikkita o'lchov o'rtasidagi farqni oling va nol bo'lmagan farqlar sonini hisoblang. Ulardan ijobiy farqlar sonini hisoblang X. B (n, 1/2) taqsimot uchun X ijobiy farqlarni kuzatish ehtimolini aniqlang va bu ehtimolni nol gipoteza uchun P-qiymati sifatida ishlating.