Ko'p regressiya natijalarini sharhlash


-jadval. k = 3 uchun ^-o‘zgaruvchilarning barcha mumkin bo‘lgan kichik to‘plamlari ro‘yxati


Download 0.55 Mb.
bet19/43
Sana07.01.2023
Hajmi0.55 Mb.
#1081865
1   ...   15   16   17   18   19   20   21   22   ...   43
Bog'liq
12.ru.uz

12.2.8-jadval. k = 3 uchun ^-o‘zgaruvchilarning barcha mumkin bo‘lgan kichik to‘plamlari ro‘yxati


Regressiyada X o'zgaruvchilarning eng yaxshi to'plamini tanlash uchun yaxshi o'lchov Mallow's Cp statistik hisoblanadi. Bu va boshqa yondashuvlar Draper NR va Smith H. Applied Regression Analysis (Nyu-York: Wiley, 1981), 6-bobda keltirilgan; va Seber GAF chiziqli regressiya tahlilida (Nyu-York: Wiley, 1977), 12-bob.


12-BOB. KO'P REGRESSIYA: PROGNOZLASH ...


659

bitta

Bo'sh to'plam (prognozlash uchun /" faqat foydalanish mumkinY)

2




3

L

to'rtta

L

5

LL

6

ll

7

ll

sakkiz

ll




Bosqichli tanlash protsedurasining yakuniy natijasi odatda Y ni tushuntirish uchun ko'p regressiya tahlilida ishlatilishi mumkin bo'lgan mustaqil ("tushuntiruvchi") X o'zgaruvchilarning juda foydali va etarlicha ixcham ro'yxatidir.
Modelni noto'g'ri tanlash: ehtimol regressiya tenglamasi noto'g'ri shaklga ega?
Agar siz Y ni tushuntirish uchun zarur bo'lgan ma'lumotlarni o'z ichiga olgan X o'zgaruvchilarning yaxshi ro'yxatini olishga muvaffaq bo'lsangiz ham, bu barcha muammolar allaqachon hal qilingan degani emas. Modelning noto'g'ri tanloviga duch kelishingiz mumkin, ya'ni. ko'p chiziqli regressiya modelidan foydalangan holda o'rganilayotgan aniq vaziyatni muvaffaqiyatsiz ifodalash bilan. Quyida regressiya modelini noto'g'ri tanlash holatlari keltirilgan.

  1. Y ning X o'zgaruvchilarga kutilgan javobi chiziqli bo'lmasligi mumkin. Boshqacha qilib aytganda, a + bjXt + b2X2 + ... + bkXk regressiya tenglamasi Y va X o'zgaruvchilari o'rtasidagi haqiqiy munosabatni etarli darajada tasvirlamasligi mumkin.

  2. Yda teng bo'lmagan o'zgaruvchanlik bo'lishi mumkin. Bu ko'p chiziqli regressiya modelidagi standart og'ish X o'zgaruvchilarning qiymatlaridan qat'iy nazar doimiy bo'lishi haqidagi taxminni buzadi.

  3. Ma'lumotlarda regressiya baholarini jiddiy ravishda buzishi mumkin bo'lgan bir yoki bir nechta chetlab o'tishlar yoki klasterlar bo'lishi mumkin.

  4. Vaqt seriyalari bilan shug'ullanishingiz mumkin. Keyin ko'p chiziqli regressiya modelining tasodifiy komponenti endi turli vaqt davrlaridan mustaqil bo'lmaydi. Umuman olganda, vaqt seriyalarini tahlil qilish juda murakkab (14-bobga qarang). Biroq, bu holatda ham asl o'zgaruvchilar o'rniga o'zgaruvchilardagi (turli vaqt oralig'ida) mos keladigan foiz o'zgarishlaridan foydalanib, ko'p regressiya bilan ishlash imkoniyati mavjud.

Ushbu muammolarning ba'zilarini har bir mumkin bo'lgan o'zgaruvchilar juftligi uchun tuzilgan barcha tarqalish chizmalarini tahlil qilish yo'li bilan aniqlash mumkin (masalan, k = 3 bo'lsa, siz oltita tarqalish chizmalarini qurishingiz mumkin: [XY], [X2,Y], [X3, Y], [Xi , X2], [Xi, X3], [X2, X3]). Vaziyatni to'liq tahlil qilish uchun ushbu tarqoqliklarning barchasi potentsial muammolar va qiyinchiliklarni aniqlashga harakat qilish uchun kamida qisqacha ko'rib chiqilishi kerak. Ammo shuni yodda tutingki, bu tarqoqliklar tuzatishga bo'lgan ehtiyojni oshirib yuborishi mumkin. Masalan, Y ning Xj ga bog'liqligi chiziqli bo'lmasligi mumkin, buning o'zi siz uchun muammo bo'lmasligi mumkin.
Yaxshiyamki, ko'pincha jiddiy muammolar mavjudligini ko'rsatadigan to'g'ridan-to'g'ri usul mavjud. Tashxis syujeti prognoz qilingan qiymatlarga nisbatan qoldiqlarning alohida tarqalishi; bunday diagramma eng ko'p ochib berishi mumkin


660


IV QISM. REGRESSIYA VA VAQT SERIASI




jiddiy muammolar, jumladan, chiziqli bo'lmaganlik, teng bo'lmagan o'zgaruvchanlik va chetga chiqish (chiqib ketish) mavjudligi. Shunday qilib, asosiy o'zgaruvchilar uchun barcha tarqalish sxemalari fon ma'lumoti sifatida ishlatilishi mumkin, keyin diagnostika sxemasi tahlilga o'zgartirishlar kiritish zarurligini hal qilish uchun asos sifatida ishlatilishi mumkin.
Chiziqsiz yoki teng bo'lmagan o'zgaruvchanlikni aniqlash uchun ma'lumotlarni tahlil qilish
Barcha mumkin bo'lgan tarqalish chizmalarini tahlil qilish orqali (har bir diagramma ma'lum bir juft o'zgaruvchilarga mos keladi), ushbu o'zgaruvchilar o'rtasidagi munosabatlarning ko'p tuzilishini o'rganish mumkin. Bunday tahlil ko'pincha o'rganilayotgan vaziyat haqida juda foydali ma'lumotlarni berishi mumkin. Biroq, munosabatlarning butun tuzilishini shu tarzda o'rganish hali ham mumkin emas. Misol uchun, siz har bir holatda faqat ikkita o'zgaruvchini ko'rib chiqayotganingiz uchun ikkita o'zgaruvchining uchinchi o'zgaruvchiga qo'shma ta'sirini e'tibordan chetda qoldirishingiz mumkin.
Oldingi jurnal reklamasi misolimizga qaytaylik, bu yerda jurnal reklamasi stavkasini (Y) o‘quvchilar soni (XJ), erkak kitobxonlar foizi (Xr) va o‘rtacha daromad (X3) bilan izohlash kerak. boshqa o'zgaruvchiga qarab ushbu to'rtta o'zgaruvchining har birining qiymatlarining tarqalish chizmalari (12.2.1-12.2.6-rasm).
Korrelyatsiya matritsasi biz uchun ham foydali bo'ladi, chunki u bizga ushbu tarqalishlarning har biridagi munosabatlarning kuchi va yo'nalishi haqida umumiy tasavvurga ega bo'lishga imkon beradi (12.2.9-jadval).
Tarqalish chizmalari va korrelyatsiya tahlilini o'rganishni qanday umumlashtirish mumkin? O'quvchilarning kattaligi va jurnallardagi reklama uchun tarif hajmi o'rtasida eng kuchli bog'liqlik kuzatiladi (12.2.1-rasm); o'rtacha daromad va erkak kitobxonlar ulushi o'rtasida ham ancha kuchli bog'liqlik kuzatiladi (12.2.6-rasm). Biz, shuningdek, eng ko'p o'quvchilar soni va eng yuqori reklama stavkalariga ega bo'lgan jurnallar o'rtacha daromadli o'quvchilarni maqsad qilib olishini, bu esa tengsiz o'zgaruvchanlikni keltirib chiqarishini, shuningdek, scatterplotsdan bilib olamiz (12.2.3, 12.2.5-rasmlar).
Bu muammo tug'diradimi? Diagnostika jadvali qanday muammolarga (agar mavjud bo'lsa) alohida e'tibor berish kerakligini aniqlashga yordam beradi va muammoni hal qilish uchun tanlangan echim ishlayotganligini ko'rsatadi.


Ba'zi kompyuter tizimlari scatterplotni real vaqtda aylantirishi mumkin, bu sizga bir vaqtning o'zida uchta o'zgaruvchi uchun 3D chizmalarini vizual tahlil qilish imkonini beradi! Ko'p o'lchovli ma'lumotlarni o'rganishning turli usullari Chambers J. M., Cleveland W. S., Kleiner B. va Tukey P. A. Graphical Methods for Data Analysis (Boston: Duxbury Press, 1983) da muhokama qilingan.


12-BOB. KO'P REGRESSIYA: PROGNOZLASH ...


661

Muammolar mavjudligini aniqlash uchun diagnostika jadvalidan foydalaning


Ko'p regressiya uchun diagnostika diagrammasi bashorat qilingan qiymatlarga nisbatan bashorat qilish xatolarining (qoldiqlarning) tarqalishi; dastlabki ma'lumotlardagi tegishli muammolardan xalos bo'lish orqali prognozlash sifatini yaxshilash mumkinmi yoki yo'qligini aniqlash imkonini beradi.18 Qoldiqlarning qiymatlari, Y - [a + djXj + b2X2 + ... I. - ... + 6fcX*, - gorizontal. Muammoni hal qilish usullari ancha murakkab bo'lganligi sababli (chetlarni olib tashlash, ma'lumotlarni o'zgartirish va boshqalar), muammoni faqat aniq va aniq bo'lsa aniqlash mumkin.

Download 0.55 Mb.

Do'stlaringiz bilan baham:
1   ...   15   16   17   18   19   20   21   22   ...   43




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling