Mavzu: personning X
Download 0.59 Mb.
|
2-Mavzu
Diskret bir xil taqsimot
Ushbu holatda N kuzatuvlar o'rtasida bo'linadi n hujayralar. Oddiy dastur - bu umumiy populyatsiyada har bir hujayrada teng chastotada qiymatlar paydo bo'lishi haqidagi gipotezani sinash. Har qanday hujayra uchun "nazariy chastota" (a nol gipotezasi ostida diskret bir xil taqsimot) shunday qilib hisoblanadi Ei= va erkinlik darajasining pasayishi p=1, kuzatilgan chastotalar sababli Oi yig'indisi bilan cheklangan N. Uni qo'llashning o'ziga xos misollaridan biri log-rank testi uchun dastur bo'lishi mumkin. Boshqa tarqatishlar Kuzatuvlar tasodifiy o'zgaruvchilar bo'ladimi yoki yo'qmi, ularning tarqalishi ma'lum bir taqsimot oilasiga tegishli ekanligini tekshirganda, "nazariy chastotalar" ushbu oiladan qandaydir standart tarzda o'rnatilgan taqsimot yordamida hisoblanadi. Erkinlik darajasining pasayishi quyidagicha hisoblanadi p=s+1, qayerda S soni birgalikda o'zgaradi taqsimotni moslashtirishda ishlatiladi. Masalan, uch xil o'zgaruvchan Weibull tarqatilishini tekshirishda, p=4 va normal taqsimotni tekshirishda (parametrlar o'rtacha va o'rtacha og'ish bo'lgan joyda),p=3 va Poisson taqsimotini tekshirganda (parametr kutilgan qiymat), p=2 Shunday qilib, bo'ladi n-p erkinlik darajasi, qaerda n toifalar soni. Erkinlik darajasi a kabi kuzatuvlar soniga asoslangan emas Talaba t yoki F-tarqatish. Masalan, adolatli, olti tomonlama sinovlar o'tkazilsa o'lmoq, besh daraja erkinlik bo'lar edi, chunki oltita toifalar / parametrlar mavjud (har bir raqam). Zarlar necha marta aylantirilishi erkinlik darajalariga ta'sir qilmaydi. Sinov-statistikani hisoblash Kvadratchalar bo'yicha taqsimlash, ko'rsatish X2 x o'qi va y o'qi bo'yicha P qiymati. Keyinchalik chi-kvadrat statistikadan a ni hisoblash uchun foydalanish mumkin p-qiymati tomonidan statistika qiymatini taqqoslash a kvadratchalar bo'yicha taqsimlash. Soni erkinlik darajasi hujayralar soniga teng n, erkinlik darajasining pasayishi minus, P. Erkinlik darajalari soniga oid natija asl ma'lumotlar multinomial bo'lganida va shuning uchun taxminiy parametrlar xi-kvadrat statistikani minimallashtirish uchun samarali bo'lganda amal qiladi. Umuman olganda, ehtimol, maksimal ehtimoliy taxmin minimal chi-kvadratik bahoga to'g'ri kelmasa, taqsimot chi-kvadrat taqsimot o'rtasida bo'ladi n-1-p va n-1 erkinlik darajasi (masalan, Chernoff va Lehmann, 1954 ga qarang). Bayes usuli Advertisement Qo'shimcha ma'lumotlar:Kategorik taqsimot § oldin konjugat yordamida Bayes xulosasi Yilda Bayes statistikasi Buning o'rniga, Dirichlet tarqatish kabi oldingi konjugat. Agar kimdir oldin forma kiygan bo'lsa, unda maksimal ehtimollik smetasi chunki populyatsiya ehtimoli kuzatilgan ehtimollikdir va ulardan birini hisoblash mumkin ishonchli mintaqa bu yoki boshqa taxmin atrofida. Statistik mustaqillik uchun test Bunday holda, "kuzatuv" ikkita natijaning qiymatlaridan iborat va nol gipoteza shundaki, bu natijalarning paydo bo'lishi statistik jihatdan mustaqil. Har bir kuzatuv ikki o'lchovli hujayralar qatorining bitta hujayrasiga ajratiladi (a deb nomlanadi favqulodda vaziyatlar jadvali ) ikkita natijaning qiymatlariga ko'ra. "Mustaqillik" modelini o'rnatish erkinlik sonini kamaytiradi p = r + v - 1. Soni erkinlik darajasi hujayralar soniga teng rc, erkinlik darajasining pasayishi minus, p bu kamayadi (r−1)(v−1). Mustaqillik testi uchun, bir xillik testi deb ham ataladigan xi-kvadrat ehtimoli 0,05 dan kam yoki unga teng (yoki chi-kvadrat statistikasi 0,05 kritik nuqtada yoki undan kattaroq bo'lsa), odatda qo'llaniladigan ishchilar tomonidan izohlanadi satr o'zgaruvchisi ustun o'zgaruvchisidan mustaqil degan nol gipotezani rad etish uchun asos.[4]The muqobil gipoteza bu munosabatlarning tuzilishi aniqlanmagan assotsiatsiyaga yoki munosabatlarga ega o'zgaruvchilarga mos keladi. Taxminlar Xi-kvadratik taqsimot qo'llanilishi mumkin bo'lgan standart taxmin bilan ishlatilganda, quyidagi taxminlarga ega:[iqtibos kerak ] Oddiy tasodifiy tanlov Namunaviy ma'lumotlar - bu belgilangan taqsimot yoki populyatsiyaning tasodifiy tanlovi, bu erda tanlangan miqdordagi populyatsiya a'zolarining har bir to'plami tanlov ehtimoli tengdir. Sinovning variantlari, masalan, ma'lumotlar tortiladigan joy kabi murakkab namunalar uchun ishlab chiqilgan. Kabi boshqa shakllardan foydalanish mumkin maqsadli namuna olish.[5] Namuna hajmi (butun jadval) Etarli darajada katta bo'lgan namuna qabul qilinadi. Agar chi kvadratik sinovi kichikroq hajmdagi namunada o'tkazilsa, u holda chi kvadratik sinovi noto'g'ri xulosa chiqaradi. Tadqiqotchi, kichik namunalarda chi kvadratik testini ishlatib, oxiriga etkazishi mumkin II turdagi xato. Kutilayotgan hujayra soni Kutilayotgan hujayra soni etarli. Ba'zilariga 5 yoki undan ko'p, boshqalarga esa 10 va undan ko'proq talab qilinadi. Umumiy qoida 2 dan 2 gacha jadvalning barcha katakchalarida 5 va undan ko'pni, kattaroq jadvallardagi katakchalarning 80 foizida 5 va undan ko'pni tashkil qiladi, ammo kutilgan soni nolga teng hujayralar yo'q. Ushbu taxmin bajarilmaganda, Yeytsning tuzatishi qo'llaniladi. Mustaqillik Kuzatishlar har doim bir-biridan mustaqil deb qabul qilinadi. Bu shuni anglatadiki, chi-kvadrat yordamida o'zaro bog'liq ma'lumotlarni sinash uchun foydalanish mumkin emas (mos keluvchi juftliklar yoki panel ma'lumotlari kabi). Bunday hollarda, MakNemarning sinovi ko'proq mos bo'lishi mumkin. Turli xil taxminlarga asoslangan sinov Fisherning aniq sinovi; agar uning belgilangan marginal taqsimotlari haqidagi taxminlari bajarilsa, u ahamiyatlilik darajasini olishda ancha aniqroq, ayniqsa kam kuzatuvlar bilan. Ilovalarning aksariyat qismida bu taxmin amalga oshirilmaydi va Fisherning aniq sinovi konservativ va to'g'ri qamrovga ega bo'lmaydi.[6] Hosil qilish Markaziy chegara teoremasidan foydalanib hosil qilish Pearson statistikasining null taqsimoti j qatorlar va k ustunlari kvadratchalar bo'yicha taqsimlash bilan (k−1)(j- 1) erkinlik darajasi.[7] Agar taxmin qilingan qiymat a bilan berilgan bo'lsa, bu taxmin null gipoteza bo'yicha haqiqiy taqsimot sifatida paydo bo'ladi multinomial taqsimot. Katta namuna o'lchamlari uchun markaziy chegara teoremasi ushbu tarqatish ma'lum tomonga intilishini aytadi ko'p o'zgaruvchan normal taqsimot. Ikki hujayra Advertisement Jadvalda faqat ikkita katak bo'lgan maxsus holatda kutilgan qiymatlar a dan keyin keladi binomial taqsimot, qayerda p = ehtimol, nol gipoteza ostida, n = namunadagi kuzatuvlar soni. Yuqoridagi misolda erkaklar kuzatuvining taxmin qilingan ehtimoli 0,5, 100 ta namunadan iborat. Shunday qilib, biz 50 erkakni kuzatishni kutmoqdamiz. Agar n etarlicha katta, yuqoridagi binomial taqsimot Gauss (normal) taqsimoti bilan taqqoslanishi mumkin va shuning uchun Pearson test statistikasi chi-kvadrat taqsimotga yaqinlashadi, Ruxsat bering O1 birinchi katakchada bo'lgan namunadagi kuzatuvlar soni. Pearson test statistikasi quyidagicha ifodalanishi mumkin bu o'z navbatida quyidagicha ifodalanishi mumkin Binomga normal yaqinlashish bo'yicha bu bitta standart normal o'zgaruvchining kvadrati va shuning uchun 1 darajali erkinlik bilan chi-kvadrat shaklida taqsimlanadi. E'tibor bering, maxraj Gauss yaqinlashuvining bitta standart og'ishidir, shuning uchun yozish mumkin Shunday qilib, xi-kvadrat taqsimotining ma'nosiga mos ravishda, biz o'rtacha qiymatdan chetga chiqadigan kuzatilgan standart og'ishlar sonining Gauss taxminida qanchalik katta ekanligini o'lchaymiz (bu katta uchun yaxshi taxmin n). Keyin chi-kvadrat taqsimot, olish uchun statistik qiymatning o'ng tomoniga birlashtiriladi P qiymati, bu nol gipotezani nazarda tutgan holda, kuzatilganidan teng yoki kattaroq statistikani olish ehtimoliga teng. Ikki-ikkita favqulodda vaziyat jadvallari Sinov a ga qo'llanilganda favqulodda vaziyatlar jadvali ikki qator va ikkita ustunni o'z ichiga olgan test a ga teng Z-sinovi mutanosibliklar.[iqtibos kerak ] Ko'p hujayralar Yuqoridagi kabi dalillar kerakli natijaga olib keladi.[iqtibos kerak ] Har bir hujayra (oxirgisi bundan mustasno, uning qiymati boshqalar tomonidan to'liq aniqlanadi) mustaqil binomial o'zgaruvchi sifatida ko'rib chiqiladi va ularning hissalari yig'iladi va har biri bir daraja erkinlikni beradi. Kutilayotgan chastotalar juda past bo'lsa, xi-kvadrat taqsimotiga yaqinlashish buziladi. Hodisalarning 20 foizdan ko'prog'i kutilmagan chastotalar 5 dan past bo'lgan taqdirda, odatda, bu maqbul bo'ladi, faqat 1 daraja erkinlik bo'lgan joyda, taxmin qilingan chastotalar 10 dan past bo'lsa, taxminiy ishonch ishonchli bo'lmaydi. kvadratga tortishdan oldin kuzatilgan va kutilayotgan chastotalar orasidagi har bir farqning absolyut qiymatini 0,5 ga kamaytirish orqali olish mumkin; bu deyiladi Yeytsning doimiylik uchun tuzatishi. Muammolar Kutilayotgan qiymat E (kichik populyatsiya ehtimoli va / yoki ozgina kuzatuvlarni ko'rsatib turibdi) kichik deb topilgan hollarda, multinomial taqsimotning normal yaqinlashuvi muvaffaqiyatsiz bo'lishi mumkin va bunday hollarda u dan foydalanish uchun ko'proq mos keladi G-test, a ehtimollik darajasi - test sinovlari asosida. Namunaning umumiy hajmi kichik bo'lsa, mos keladigan aniq testdan foydalanish kerak, odatda binomial sinov yoki (favqulodda vaziyatlar jadvallari uchun) Fisherning aniq sinovi. Ushbu testda marginal jami berilgan test statistikasining shartli taqsimoti qo'llaniladi; ammo, ma'lumotlar cheklangan jami aniqlangan eksperiment natijasida hosil bo'lgan deb o'ylamaydi[shubhali – muhokama qilish] va shunday bo'lsa ham, bo'lmasa ham amal qiladi.[shubhali – muhokama qilish][iqtibos kerak ] Bu ko'rsatilishi mumkin X2 test - ning past darajadagi yaqinlashishi sinov.[8] Yuqoridagi masalalarning yuqoridagi sabablari yuqori buyurtma muddatlari o'rganilganda aniq bo'ladi. Download 0.59 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling