Ko'p regressiya natijalarini sharhlash


Standartlashtirilgan regressiya koeffitsienti


Download 0.55 Mb.
bet15/43
Sana07.01.2023
Hajmi0.55 Mb.
#1081865
1   ...   11   12   13   14   15   16   17   18   ...   43
Bog'liq
12.ru.uz

Standartlashtirilgan regressiya koeffitsienti,bt regressiya koeffitsientini SXl ga ko'paytirish va hosil bo'lgan mahsulotni SY ga bo'lish yo'li bilan hisoblangan Y ning kutilayotgan o'zgarishi (SY standartlashtirilgan birliklarida) X ni bitta mos standartlashtirilgan birlikka (ya'ni Sx.) oshirish natijasida yuzaga keladigan barcha boshqa X - o'zgaruvchilar bir xil bo'lib qoladi­


12-BOB. KO'P REGRESSIYA: PROGNOZLASH ...


645

e.9 Standartlashtirilgan regressiya koeffitsientlarining mutlaq qiymatlarini solishtirish mumkin, shu bilan birga tegishli o'zgaruvchilarning nisbiy ahamiyati to'g'risida ma'lumot beriladi.1 Har bir standartlashtirilgan regressiya koeffitsienti Xj standart og'ish uchun Y standart og'ish birliklarida o'lchanadi. Bular har bir oʻzgaruvchi uchun odatiy namunaviy standart ogʻishlar boʻlib, biz ularni 5-bobda muhokama qildik. Bunday birliklardan foydalanish juda tabiiy, chunki ular maʼlumotlar toʻplamidagi har bir oʻzgaruvchining haqiqiy oʻzgarishiga mos keladigan oʻlchov shkalasini yaratadilar.


Standartlashtirilgan regressiya koeffitsienti
b|5x, / Sr.
Har bir regressiya koeffitsienti namunaviy standart og'ishlar nisbati yordamida o'rnatiladi. Mutlaq qiymatlar X o'zgaruvchilarning nisbiy ahamiyati haqida taxminiy tasavvur beradi.
Jurnal reklamalari misolidagi regressiya koeffitsientlarini standartlashtirish uchun avval quyida ko'rsatilganidek, har bir o'zgaruvchi uchun standart og'ishlarni hisoblashingiz kerak.

Quyidagi regressiya koeffitsientlari ham kerak.


Nihoyat, standartlashtirilgan regressiya koeffitsientlarini hisoblash mumkin.


g
Standartlashtirilgan regressiya koeffitsientlari ba'zan beta koeffitsientlari deb ataladi. Biz ushbu atamani ishlatmaslikka harakat qilamiz, chunki u populyatsiya regressiya koeffitsientlari (shuningdek, P yoki beta) va moliyadagi riskning diversifikatsiya qilinmaydigan komponenti (qimmatli qog'ozlar beta deb ataladi va an'anaviy, standartlashtirilmagan namuna) bilan osongina chalkashib ketadi. regressiya koeffitsienti, bu erda X - bozor indeksining foiz o'zgarishi va Y - qimmatli qog'ozlar sertifikati qiymatining foiz o'zgarishi).
o'nEslatib o'tamiz, mutlaq qiymat oddiygina minus belgisini e'tiborsiz qoldiradi.


646


IV QISM REGRESSIYA VA VAQT KESILASI













Keling, ushbu standartlashtirilgan koeffitsientlardan birini to'g'ridan-to'g'ri talqin qilaylik. O'quvchilar sonining 0,935 qiymati shuni ko'rsatadiki, auditoriyaning standart og'ishlaridan biriga (11,212) ko'payishi jurnal reklama tezligining standart og'ishlaridan (45,446) 0,935 ga kutilgan o'sishiga olib keladi. Boshqacha qilib aytadigan bo'lsak, auditoriyaning 11 212 ga ko'payishi (bir standart og'ish) jurnalning reklama stavkasini 0,935 x 45,446 = 42,492 dollarga (reklama tezligining bir standart og'ishidan bir oz kamroq, 0,935) kutilayotgan o'sishiga olib keladi.
Ammo bundan ham muhimi shundaki, bu standartlashtirilgan regressiya koeffitsientlarini endi bir-biri bilan solishtirish mumkin. Eng yuqori mutlaq qiymat - o'quvchilar uchun 0,935 koeffitsienti; bu shuni ko'rsatadiki, bu o'zgaruvchi uchta X o'zgaruvchining eng muhimi hisoblanadi. Buning ortidan o'rtacha daromad keladi, buning uchun koeffitsient 0,203 ga teng. Koeffitsientning eng kichik mutlaq qiymati |-0,070| = 0,070 erkak kitobxonlar foiziga to'g'ri keladi.
Regressiya koeffitsientlarini avval standartlashtirmasdan to'g'ridan-to'g'ri solishtirish noto'g'ri bo'lar edi. E'tibor bering, erkak kitobxonlar ulushi eng katta (mutlaq qiymatda) regressiya koeffitsientiga ega, |-123,6| = 123.6. Biroq, u boshqa regressiya koeffitsientlariga qaraganda turli birliklarda ifodalanganligi sababli, to'g'ridan-to'g'ri taqqoslash ma'nosizdir.
Standartlashtirilgan regressiya koeffitsientlarining mutlaq qiymatlarini bir-biri bilan solishtirish mumkin, bu esa tegishli o'zgaruvchilarning ahamiyati haqida taxminiy tasavvurni beradi. Yana bir bor ta'kidlash kerakki, bu natijalar ideal emas, chunki X o'zgaruvchilari o'rtasidagi munosabatlar X o'zgaruvchilardan qaysi biri Y o'zgaruvchisining xatti-harakati uchun "mas'ul" ekanligini aniqlashni tubdan imkonsiz qilishi mumkin.
Korrelyatsiya koeffitsientlarini solishtirish
Umuman olganda, biz ko'p regressiyadan olingan va har bir o'zgaruvchining ta'sirini ifodalovchi regressiya koeffitsientlariga unchalik qiziqmasligimiz mumkin, sharti boshqa barcha o'zgaruvchilar o'zgarishsiz qoladi. Agar biz faqat X o'zgaruvchilarining har biri Y ga qanchalik ta'sir qilishi bilan qiziqadigan bo'lsak, boshqa barcha X o'zgaruvchilari "tabiiy harakat qilishda" davom etishi sharti bilan (ya'ni, biz ularni o'zgartirishga majburlamasak), biz taqqoslashimiz mumkin. Y va X o'zgaruvchilarning har biri o'rtasidagi korrelyatsiya koeffitsientlarining mutlaq qiymatlarini aylantiring.
Korrelyatsiya - bunday munosabatlarning mustahkamligi o'lchovidir (biz 11-bobda muhokama qilganimizdek), lekin nima uchun mutlaq qiymatlardan foydalanish kerak? Eslatib o'tamiz, 1 yoki -1 ga yaqin korrelyatsiya kuchli munosabatlarni ko'rsatadi, nolga yaqin korrelyatsiya esa hech qanday aloqa yo'qligini ko'rsatadi. Korrelyatsiyaning mutlaq qiymati, uning yo'nalishini aniqlamasdan, munosabatlarning mustahkamligini ko'rsatadi.


12-BOB. KO'P REGRESSIYA: BASHOROT


647




Ko'p regressiya boshqa o'zgaruvchilar uchun moslashadi, lekin korrelyatsiya koeffitsienti mos kelmaydi.11 Agar siz boshqa o'zgaruvchilarning ta'sirini hisobga olishingiz kerak bo'lsa, u holda ko'p regressiyadan foydalanish kerak. Agar siz bunday tuzatishni hisobga olishingiz shart bo'lmasa, siz korrelyatsiya tahlilidan foydalanishingiz mumkin.
Quyida jurnal reklamasi misolida X o'zgaruvchilarning har biri bilan Y korrelyatsiya koeffitsientlari keltirilgan. Masalan, jurnal reklama stavkalari va o'quvchilarning o'rtacha daromadi o'rtasidagi bog'liqlik -0,167 ni tashkil qiladi.


Jurnal reklama stavkalari bilan bog'liqligi nuqtai nazaridan (boshqa X o'zgaruvchilari uchun tuzatishlarsiz) o'quvchilar soni eng katta mutlaq korrelyatsiya qiymatiga ega - 0,872. Korrelyatsiyaning keyingi mutlaq qiymati o'rtacha daromad - |-0,167| = 0,167. Erkak kitobxonlar ulushi korrelyatsiyaning eng kichik mutlaq qiymatiga to'g'ri keladi — |-0,081| = 0,081. Hamma narsa jurnallardagi reklama uchun tarif hajmini deyarli to'liq belgilaydigan o'quvchilarning kattaligi kabi ko'rinadi. Darhaqiqat, boshqa ikkita o'zgaruvchining hech biri (qolgan o'zgaruvchilarni belgilamasdan, o'z-o'zidan) jurnallarda reklama uchun tarifning muhim qismini aniqlamaydi.
Ko'p regressiya biroz boshqacha rasmni bo'yadi, chunki u boshqa o'zgaruvchilarning qiymatlarini boshqarishga imkon beradi. O'quvchilar soniga moslashtirilgandan so'ng, o'rtacha daromad uchun ko'p regressiya koeffitsienti mos keladigan o'zgaruvchining reklama stavkasi qiymatiga sezilarli ta'sirini ko'rsatadi. Buni quyidagicha talqin qilish mumkin. O'quvchilar soniga tuzatishlar kiritishda ko'proq daromadlar kichikroq kitobxonlar bilan kelishini hisobga oladi. O'quvchilar sonining ta'siri tekislanadi - faqat sof shaklda daromadning ta'siri qoladi (bu o'quvchilar sonining maskalash effekti olib tashlanganligi sababli o'zini namoyon qiladi).
Korrelyatsiya koeffitsientlari Y bilan individual munosabatlarni ko'rsatsa-da, bir nechta regressiyadan olingan standartlashtirilgan regressiya koeffitsientlari sizga muhim qo'shimcha ma'lumotlarni taqdim etishi mumkin.


Qisman korrelyatsiya koeffitsientining yanada rivojlangan statistik kontseptsiyasi mavjud bo'lib, biz ushbu kitobda tasvirlamaymiz. Bunday koeffitsient bir yoki bir nechta qo'shimcha o'zgaruvchilar uchun moslashtirilgan ikkita o'zgaruvchi o'rtasidagi korrelyatsiyani aniqlaydi.


648


IV QISM. REGRESSIYA VA VAQT SERIASI







  1. Ko'p regressiya bilan bog'liq murakkabliklar va muammolar

Afsuski, amalda ko'p regressiya har doim ham darsliklarda yozilgan natijalarni olishga imkon bermaydi. Ushbu bo'limda yuzaga kelishi mumkin bo'lgan muammolar ro'yxati va ularni hal qilish bo'yicha ba'zi takliflar (mumkin bo'lganda) keltirilgan.
Muammolarning uchta asosiy turi mavjud. Quyida ushbu navlarning har biri haqida qisqacha ma'lumot, keyin esa batafsilroq tavsif berilgan.

  1. Multikollinearlik muammosi sizning ba'zi tushuntirish o'zgaruvchilaringiz (X) juda o'xshash bo'lganda paydo bo'ladi. Ushbu o'zgaruvchilar Y ni yaxshi tushuntirishi va bashorat qilishi mumkin bo'lsa-da (yuqori R2 va muhim y-test bilan ko'rsatilgan), individual regressiya koeffitsientlarini baholash qiyin. Buning sababi, o'zgaruvchilardan qaysi biri (yoki qaysi biri) bu tushuntirishni taqdim etishini hal qilish uchun bizda etarli ma'lumotga ega emasmiz. Mumkin echimlardan biri shubhalarni bartaraf etish uchun tenglamadan ba'zi o'zgaruvchilarni olib tashlashdir. Yana bir yechim - bir o'zgaruvchini boshqasidan ajratish uchun ba'zi o'zgaruvchilarni qayta aniqlash (ehtimol bo'lish yo'li bilan).

  2. O'zgaruvchilarni tanlash muammosi potentsial foydali tushuntiruvchi (mustaqil) X-o'zgaruvchilarning uzoq ro'yxati bilan shug'ullanish va bu o'zgaruvchilardan qaysi birini regressiya tenglamasiga kiritish kerakligini hal qilish kerak bo'lganda paydo bo'ladi. Bir tomondan, agar sizda juda ko'p X o'zgaruvchilari bo'lsa, qo'shimchalar natijalar sifatini pasaytiradi (ehtimol, bir xil multikollinearlik tufayli). Ma'lumotlardagi ma'lumotlarning bir qismi keraksiz parametrlarni baholash uchun sarflanadi. Boshqa tomondan, agar siz kerakli X-o'zgaruvchidan voz kechsangiz, prognozlar sifati pasayadi, chunki siz foydali ma'lumotlarni e'tiborsiz qoldirasiz. Mumkin bo'lgan yechimlardan biri, bunga ishonch hosil qilish uchun u yoki bu X o'zgaruvchisi nima uchun muhimligi haqida yaxshilab o'ylab ko'rishdir ko'rib chiqishga kiritilgan har bir o'zgaruvchining haqiqatda muhim funktsiyani bajarishi. Yana bir yondashuv - eng muhim o'zgaruvchilarni tanlashga harakat qiladigan avtomatik protseduradan foydalanish.

  3. Model tanlash muammosi sizning maxsus muammongiz va ko'p chiziqli regressiya tahlilining asosi va asosi bo'lgan ko'p chiziqli regressiya modeli o'rtasidagi ko'plab turli xil potentsial nomuvofiqliklar bilan bog'liq. Muayyan muammoingiz chiziqli ko'p regressiya modelining shartlari va taxminlariga javob bermasligi mumkin. Ma'lumotlarni tahlil qilish orqali siz chiziqli bo'lmaganlik, teng bo'lmagan o'zgaruvchanlik va o'zgaruvchanlik bilan bog'liq ba'zi potentsial muammolarni aniqlashingiz mumkin. Biroq, bunday muammolarning mavjudligi ham hech narsani anglatmaydi. Garchi ba'zi o'zgaruvchilarning histogramlari bo'lishi mumkin


12-BOB. KO'P REGRESSIYA: bashorat qilish.


649




juda qiyshiq (nosimmetrik bo'lmagan) bo'lishi va ba'zi tarqalish chizmalari chiziqli bo'lmasligi mumkin, bunday hollarda ko'p chiziqli regressiya modeli qo'llanilishi mumkin. Aniqlangan muammo haqiqatan ham jiddiymi yoki yo'qligini tushunishga yordam beradigan diagnostika jadvali mavjud, shuning uchun uni qandaydir tarzda hal qilish kerak. Mumkin echimlardan biri mavjud o'zgaruvchilardan olingan yangi X-o'zgaruvchilarni yaratish va/yoki bu o'zgaruvchilarning bir qismini yoki barchasini o'zgartirishdir. Yana bir jiddiy muammo, individual kuzatishlar mustaqilligining chiziqli ko'p regressiya modelining farazlari bajarilmaydigan vaqt seriyalari bilan ishlashda yuzaga keladi. Vaqt seriyasi muammosi oson yechimga ega emas,
Multikollinearlik: tushuntirish o'zgaruvchilari juda o'xshashmi?
Izohlovchi X o'zgaruvchilardan birortasi juda o'xshash bo'lsa, sizda multikollinearlik muammosi bo'lishi mumkin, chunki ko'p regressiya bitta o'zgaruvchining ta'sirini boshqa o'zgaruvchining ta'siridan ajrata olmaydi. Multikollinearlikning oqibatlari statistik yoki hisoblash bo'lishi mumkin.

  1. StatistikMultikollinearlikning oqibatlari standart xatolarning ko'payishi tufayli individual regressiya koeffitsientlari bo'yicha statistik testlarni o'tkazish qiyinligi bilan bog'liq. Natija shunday bo'lishi mumkinki, X o'zgaruvchisi, hatto bu o'zgaruvchining (o'zi) Y bilan kuchli aloqaga ega bo'lsa ham, muhim deb e'lon qilinishi mumkin emas.

  2. Hisoblashmultikollinearlikning oqibatlari qiyin bilan bog'liq­

kompyuterda hisob-kitoblarni tashkil etishda "hisoblashlarning beqarorligi" tufayli yuzaga kelgan muammolar. Haddan tashqari holatlarda kompyuter nolga bo'lishga urinishi mumkin va shuning uchun ma'lumotlarni tahlil qila olmaydi. Bundan ham yomoni, kompyuter tahlilni tugatib, _ chiqarishi mumkin. _ 12
mazmunli va noto'g'ri natijalar.
Ko'p kollinearlik sizning tahlilingizning aniq maqsadlariga va multikollinearlik darajasiga qarab muammolarni keltirib chiqarishi mumkin yoki bo'lmasligi mumkin. Kichik va o'rtacha multikollinearlik odatda muammo emas. Juda kuchli multikollinearlik (masalan,


Nolga bo'lish matematik jihatdan mumkin emas: masalan, 5/0 ni bajarish natijasi aniqlanmagan. Biroq, hisoblash paytida kichik yaxlitlash xatolari tufayli kompyuter 5 ni 0 ga emas, balki 5,0000000000968 ni 0,0000000000327 ga bo'lishi mumkin. Bunday holda, kompyuter xatoni to'xtatish va xabar berish o'rniga, keyingi hisob-kitoblarda bunday bo'linishning ma'nosiz va ulkan natijasidan foydalanadi: 152,905,198,779,72.


650


IV QISM. REGRESSIYA VA VAQT SERIASI




shu jumladan ikki marta bir xil o'zgaruvchi) har doim muammo tug'diradi va jiddiy xatolarga olib kelishi mumkin (hisoblash natijalari). Yaxshiyamki, agar sizning maqsadingiz birinchi navbatda Y ni bashorat qilish yoki bashorat qilish bo'lsa, kuchli multikollinearlik katta muammo bo'lmasligi mumkin, chunki yaxshi ko'p regressiya dasturi barcha X o'zgaruvchilari asosida optimal Y bashoratlarini (eng kichik kvadratlar) yaratishi mumkin. Biroq, agar X o'zgaruvchilarning har biri Y ga qanday ta'sir qilishini bilish uchun individual regressiya koeffitsientlaridan foydalanmoqchi bo'lsangiz, multikollinearlikning statistik oqibatlari ba'zi muammolarni keltirib chiqarishi mumkin, chunki bu ta'sirlarni bir-biridan ajratib bo'lmaydi. Jadvalda. 12.2.
Haqiqatan ham multikollinearlik muammosi mavjudligini qanday aniqlash mumkin? Bu savolga javob berishning eng oddiy usullaridan biri har bir oʻzgaruvchi juftligi uchun odatiy ikki oʻzgaruvchan korrelyatsiyalarni tahlil qilishdir.13 Korrelyatsiya matritsasi koʻp oʻzgaruvchan maʼlumotlar toʻplamidagi har bir oʻzgaruvchi juftligi uchun korrelyatsiya koeffitsientlarini oʻz ichiga olgan jadvaldir. Ikki X o'zgaruvchisi orasidagi korrelyatsiya koeffitsienti qanchalik yuqori bo'lsa, multikollinearlik shunchalik katta bo'ladi. Buning sababi shundaki, yuqori korrelyatsiya (1 yoki -1 ga yaqin) kuchli assotsiatsiyani ko'rsatadi va ikkita X o'zgaruvchisi juda o'xshash xususiyatlarni o'lchashini ko'rsatadi, shuning uchun tahlilga "bir-biriga mos keladigan" ma'lumotlarni kiritadi.
Multikollinearlikning asosiy statistik natijasi regressiya koeffitsientlarining (Sb) bir qismi yoki hammasining standart xatolarining ortishidir. Bu juda tabiiy: agar ikkita X o'zgaruvchisi "kesishuvchi" ma'lumotni o'z ichiga olsa, ularning har birining ta'sirini alohida aniqlash qiyin. Yuqori standart xato kompyuter sizga shunday deyishiga olib keladi: "Men siz uchun regressiya koeffitsientini hisoblab chiqdim, ammo natija noto'g'ri, chunki u yoki boshqa o'zgaruvchi hissa qo'shayotganini aytish qiyin." Natijada, tegishli regressiya koeffitsientlari uchun ishonch intervallari sezilarli darajada kengayadi va f-testlari ahamiyatli bo'lishi dargumon.
Kuchli multikollinearlik holatida regressiya juda katta ahamiyatga ega ekanligi ma'lum bo'lishi mumkin (t-test natijalariga ko'ra), lekin individual X-o'zgaruvchilar uchun t-testlarining hech biri muhim emas. Kompyuter sizga bitta guruh sifatida qaraladigan X o'zgaruvchilari Y ga juda kuchli ta'sir ko'rsatishini aytadi, ammo biron bir o'zgaruvchining ahamiyatini aniqlash deyarli mumkin emas. Shuni esda tutish kerakki, ma'lum bir X o'zgaruvchisi uchun f-testi boshqa o'zgaruvchilarning qiymatlari o'zgarishsiz qolishi sharti bilan Y ga ta'sirini o'lchaydi. Shunday qilib, X o'zgaruvchisi uchun f-testi faqat X o'zgaruvchisi keltirgan qo'shimcha ma'lumotni ochib beradi


Afsuski, multikollinearlikning keng qamrovli diagnostikasi bu erda tasvirlangan usulga qaraganda ancha qiyin, chunki barcha X o'zgaruvchilarni juftlikda emas, balki bir vaqtning o'zida ko'rib chiqish kerak. Tegishli usullarning to'liq texnik tavsifini, masalan, Belsley DA, Kuh E. va Welsch R. E. Regression Diagnostics: Identifying Influential Data and Sources of Collinearity (Nyu-York: Wiley, 1980) kitoblarida topish mumkin.


12-BOB. KO'P REGRESSIYA: PROGNOZLASH ...


651






Download 0.55 Mb.

Do'stlaringiz bilan baham:
1   ...   11   12   13   14   15   16   17   18   ...   43




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling