Ko'p regressiya natijalarini sharhlash


-jadval. Fortune 500 kompyuter va ofis uskunalari kompaniyalari


Download 0.55 Mb.
bet18/43
Sana07.01.2023
Hajmi0.55 Mb.
#1081865
1   ...   14   15   16   17   18   19   20   21   ...   43
Bog'liq
12.ru.uz

12.2.2-jadval. Fortune 500 kompyuter va ofis uskunalari kompaniyalari




Bozor narxi
(million dollar), Y

Aktivlar (million dollar), X,

Xodimlar soni, X2

Inti. Biznes mashinalari

98 322

81 449

269465

Hewlett Packard

65 060

31 749

121 900

Compaq kompyuter

36 052

14 631

37 004

Xerox

31 829

27 732

91 400

raqamli uskunalar

7 101

9 693

54 900

Dell kompyuter

41 294

4268

16160

Quyosh mikrotizimlari

16614

4 697

21 500

Apple kompyuteri

3449

4 233

9306

NCR

3 386

5 293

38300

Gateway 2000

6 242

2039

13 369

Pitni Bouz

14 036

7 893

29901

Silikon grafika

2636

3 345

10 930

Umumiy ma'lumotlar

869

1 135

5100

Intergraf

452

727

7 653


dan olingan ma'lumotlarhttp://www.pathfinder.com/fortune/fortune500/
ind8. html, 1998 yil kuzi.





12-BOB. KO'P REGRESSIYA: PROGNOZ ..


653





ma'lumotlar to'plamlari. Ikki X o'zgaruvchisi o'rtasidagi juda yuqori korrelyatsiyaga e'tibor bering: aktivlar qiymati va xodimlar soni o'rtasidagi 0,991. Bunday yuqori korrelyatsiya shuni ko'rsatadiki, hech bo'lmaganda raqamlar nuqtai nazaridan, bu ikki X o'zgaruvchisi deyarli bir xil ma'lumotni olib yuradi. Regressiya tahlili bu o'zgaruvchilarni farqlamasligi ajablanarli emas.
Agar biz ikkita X o'zgaruvchidan faqat bittasini saqlagan bo'lsak, ikkita X o'zgaruvchidan qaysi birini saqlashni tanlaganimizdan qat'iy nazar, biz ushbu o'zgaruvchi uchun juda muhim 1-test bilan regressiyaga erishamiz. Boshqacha qilib aytganda, ushbu o'zgaruvchilarning har biri o'z-o'zidan bozor qiymatini aniqlashga katta hissa qo'shadi.
Agar siz ikkala X o'zgaruvchisidagi barcha ma'lumotlarni saqlamoqchi bo'lsangiz, ulardan birini kompaniya hajmini ifodalovchi o'zgaruvchi sifatida ishlatishingiz mumkin, ikkinchisini esa nisbat sifatida belgilashingiz mumkin. Keling, kompaniyaning hajmini, uning aktivlarini ifodalovchi o'zgaruvchi sifatida tanlaylik, chunki ular tegishli kompaniya tomonidan talab qilinadigan asosiy kapital qo'yilmalarini ko'rsatadi. Shundan so'ng, ikkinchi o'zgaruvchini xodimlar sonining aktivlar qiymatiga nisbati bilan almashtirish mumkin (bir million dollar aktivlarga ishchilar sonini ko'rsatadi). Endi aktivlar kompaniya hajmini tavsiflovchi yagona o'zgaruvchidir va boshqa o'zgaruvchi xodimlardan foydalanish samaradorligi haqida yangi ma'lumotlarni beradi. Yangi ma'lumotlar to'plami Jadvalda keltirilgan. 12.2.5.
12.2.3-jadval. Kompyuter va orgtexnika kompaniyalarining regressiya tahlili
Aktivlar va xodimlar soni asosida bozor qiymatini bashorat qilish uchun bir nechta regressiya.
Prognoz tenglamasi quyidagi shaklga ega:

bozor qiymati = 6998,40 + 1,68 (aktivlar) - 0,1442 (xodimlar soni).

0,817

R kvadrat

13428

Baholashning standart xatosi

o'n to'rt

Kuzatuvlar soni

24.61

G-statistika

0,00009

p-qiymati




Koeffitsient

95% ishonch oralig'ining pastki chegarasi

95% ishonch oralig'ining yuqori chegarasi

standart xato

t

R

Doimiy

6998.40

-3660.98

17657.77

4843.00

1.45

0,176

Aktivlar

1.68

-1,17

4.53

1.30

1.30

0,221

Miqdori

-0,14

-1.01

0,72

0,39

-0,37

0,720

xodimlar




















12.2.4-jadval. Kompyuter va orgtexnika kompaniyalari uchun korrelyatsiya matritsasi




Bozor qiymati, Y

Aktivlar, X,

Xodimlar soni, X2

Bozor qiymati, Y

1000

0,903

0,888

Aktivlar, X,

0,903

1000

0,991

Xodimlar soni, X2

0,888

0,991

1000


654


IV QISM. REGRESSIYA VA VAQT SERIASI





Endi Jadvalda keltirilgan korrelyatsiya matritsasiga yana qaraylik. 12.2.6 va bizda multikollinearlik bilan bog'liq muammolar bor yoki yo'qligini ko'ring. Bu korrelyatsiyalar ancha yaxshi ko'rinadi. X o'zgaruvchilari orasidagi korrelyatsiya (-0,317) endi avvalgidek katta emas va statistik jihatdan ahamiyatli emas.
Ko'p regressiya natijalaridan nimani kutish mumkin? Regressiya hali ham muhim bo'lishi kerak va aktivlar uchun f-testi kompaniya hajmini tavsiflovchi "raqobatdosh" o'zgaruvchilar yo'qligi sababli bu safar muhim bo'lishi kerak. Bizda quyidagi noaniqlik qoladi: aktivlar to'g'risidagi ma'lumotlarni hisobga olgan holda, xodimlar soni va aktivlar o'rtasidagi nisbat bozor qiymatiga sezilarli darajada ta'sir qiladi, deb bahslasha olamizmi? Tegishli natijalar jadvalda keltirilgan. 12.2.7.
Bu natijalar bizning taxminlarimizni tasdiqlaydi. Regressiya (g-test) muhim va aktivlar uchun t-testi, endi biz kuchli multikollinearlikdan xalos bo'lishga muvaffaq bo'ldik. Bundan tashqari, biz boshqa o'zgaruvchining (bir million dollarlik aktivlarga ishchilar soni) ahamiyatli emasligini aniqlashga muvaffaq bo'ldik.


12.2.5-jadval. Kompyuterlar va orgtexnika ishlab chiqaruvchi kompaniyalar uchun yangi .^-o'zgaruvchilarni aniqlash; xodimlarning aktivlarga nisbatidan foydalanish




Bozor qiymati, (million dollar), Y

Aktivlar, (million dollar), X,

Xodimlar sonining aktivlar hajmiga nisbati, X2

Inti. Biznes mashinalari

98 322

81449

3.308

Hewlett Packard

65 060

31 749

3.839

Compaq kompyuter

36 052

14 631

2.529

Xerox

31 829

27 732

3.296

raqamli uskunalar

7101

9693

5.664

Dell kompyuter

41 294

4268

3.786

Quyosh mikrotizimlari

16614

4697

4.577

Apple kompyuteri

3449

4 233

2.198

NCR

3386

5 293

7.236

Gateway 2000

6242

2039

6.557

Pitni Bouz

14 036

7 893

3.788

Silikon grafika

2636

3 345

3.268

Umumiy ma'lumotlar

869

1 135

4.493

Intergraf

452

727

10.527


12.2.6-jadval. Kompyuterlar va ofis uskunalarini ishlab chiqaruvchi kompaniyalar uchun korrelyatsiya matritsasi (yangi ^-o'zgaruvchilar ishlatiladi)




Bozor narxi
(million dollar), Y

Aktivlar
(million dollar), X,

Xodimlar sonining aktivlar hajmiga nisbati, X2

Bozor qiymati, Y

1000

0,903

-0,400

Aktivlar, X,

0,903

1000

-0,317

Xodimlar sonining aktivlar hajmiga nisbati, X2

-0,400

-0,317

1000


12-BOB. KO'P REGRESSIYA: PROGNOZ ..


655





12.2.7-jadval. Kompyuter va ofis uskunalari kompaniyalarining regressiya tahlili (yangi Z-o'zgaruvchilari yordamida)


Aktivlar hajmi va aktivlarning million dollariga to'g'ri keladigan xodimlar soni asosida bozor qiymatini bashorat qilish uchun bir nechta regressiya.
Bashorat tenglamasi shaklga ega

bozor qiymati = 14673,67 + 1,154 (aktivlar) - 1655,524 (aktivlar million dollariga ishchilar).

0,830
12967
o'n to'rt
26.787
0,00006

R kvadrat
Baholashning standart xatosi
Kuzatuvlar soni
G-statistika
p-qiymati










Koeffitsient Pastki chiziq - Yuqori chegara Standart t R
95% ishonch 95% ishonch xato
interval interval

Doimiy

14673.67 -6637.27 35984.61 9682.45 1,52 0,158

Aktivlar

1.15 0,77 1.54 0,18 6,57 0,000

Bir million dollarlik aktivlar uchun xodimlar soni

-1655.52 -5413.44 2102.39 1707.38 -0,97 0,353


Shubhasiz, kompyuterlar va orgtexnika ishlab chiqaruvchi yirik kompaniyalarning ushbu kichik guruhi (n = 14) uchun bozor qiymatidagi o'zgarishlarning katta qismini ushbu kompaniyalarning aktivlari hajmi bilan izohlash mumkin. Bundan tashqari, inson resurslari (xodimlar soni) to'g'risidagi ma'lumotlar ushbu gullab-yashnagan kompaniyalarning bozor qiymati haqida juda kam yoki umuman yangi ma'lumotlarni o'z ichiga olmaydi. Ehtimol, kompaniyalarning kengroq namunasini tahlil qilish ushbu o'zgaruvchining ta'sirini ham ochib beradi.

O'zgaruvchan tanlash: ehtimol biz "noto'g'ri" o'zgaruvchilardan foydalanayotgandirmiz?
Statistik tahlil natijalari ko'p jihatdan mavjud ma'lumotlarga bog'liq, ya'ni. tahlil qilish uchun foydalanilgan ma'lumotlardan. Xususan, ko'p regressiya tahlili uchun mustaqil ("tushuntiruvchi") X-o'zgaruvchilarni tanlashga alohida e'tibor qaratish lozim. Iloji boricha ko'proq X o'zgaruvchilarni "har qanday holatda" yoki "ularning har biri Y ga qandaydir tarzda ta'sir qilganga o'xshaydi" deb kiritish eng yaxshi yechim emas. Shunday qilib, siz o'zingizni regressiya uchun ahamiyatlilikni aniqlashda mumkin bo'lgan qiyinchiliklarga duch kelasiz (P-testi) yoki ortiqcha o'zgaruvchilar mavjudligi sababli multikollinearlik tufayli - ba'zi individual regressiya koeffitsientlari uchun ahamiyatlilik to'g'risida qaror qabul qilishda qiyinchiliklarga duch kelishingiz mumkin.
Agar bitta qo'shimcha, noto'g'ri X o'zgaruvchini kiritsangiz nima bo'ladi? Bu holda R2 qiymati biroz kattaroq bo'ladi, chunki Y ning biroz kattaroq qismini ushbu yangi tasodifiylik bilan izohlash mumkin.

656


IV QISM. REGRESSIYA VA VAQT SERIASI




o'zgaruvchan.14 Biroq, regressiyaning muhimligi uchun F-testi bu o'sishni hisobga oladi, shuning uchun D2 ning bu o'sishini afzallik deb hisoblash mumkin emas.
Aslida, qo'shimcha X-o'zgaruvchining kiritilishi ozgina yoki hatto o'rtacha zarar keltirishi mumkin. Bir yoki boshqa noto'g'ri joylashtirilgan parametrni baholash (bu holda noto'g'ri joylashtirilgan regressiya koeffitsienti) smetaning standart xatosi uchun kamroq ma'lumot qoldiradi, Se. Texnik sabablarga ko'ra, buning oqibati kamroq kuchli E testi bo'lib, hatto populyatsiyadagi X o'zgaruvchilari Y ni tushuntirsa ham ahamiyatini aniqlamasligi mumkin.
Agar kerakli X o'zgaruvchiga e'tibor bermasangiz nima bo'ladi? Natijada, muhim va foydali ma'lumotlar ma'lumotlar to'plamidan o'tkazib yuboriladi va sizning Y bashoratingiz ushbu X o'zgaruvchidan foydalanganingizdan ko'ra kamroq aniq bo'ladi. Baholashning standart xatosi Se, bu holatda kattaroq bo'ladi (katta bashorat qilish xatolarini ko'rsatadi) va R2 kichikroq bo'lishga intiladi (Y dagi dispersiyaning kichikroq ulushini tushuntirishni ko'rsatadi). Tabiiyki, agar siz tanqidiy X o'zgaruvchisini e'tiborsiz qoldirsangiz, bu regressiya uchun E-test shunchaki ahamiyatsiz bo'lishi mumkin.
Bu holda sizning vazifangiz kerak bo'lganda ko'p X o'zgaruvchilarni (ya'ni, juda ko'p emas va juda oz emas) kiritish va aynan shu X o'zgaruvchilarni kiritishdir. Agar shubhangiz bo'lsa, siz ishonchingiz komil bo'lmagan ba'zi X o'zgaruvchilarni kiritishingiz mumkin. Bunday holda, sub'ektiv usul (X o'zgaruvchilarning ustuvor ro'yxatiga asoslangan) foydalidir. Bundan tashqari, juda ko'p turli xil avtomatik usullar mavjud.
X-o'zgaruvchilar ro'yxatini ustuvorliklar bo'yicha tasniflash
Muhim X o'zgaruvchilar diapazonini aniqlashning yaxshi usuli bu siz hal qilayotgan muammoni, mavjud ma'lumotlarni va erishmoqchi bo'lgan maqsadlarni sinchkovlik bilan tahlil qilishdir. Keyin ustuvorlik bo'yicha tasniflangan X-o'zgaruvchilar ro'yxatini tuzishingiz kerak. Buni quyidagi tarzda amalga oshirish mumkin.

  1. Tushuntirish, tushunish yoki bashorat qilish kerak bo'lgan Y o'zgaruvchisini tanlang.

  2. Y ni aniqlash yoki tushuntirishda eng muhim deb hisoblagan X o‘zgaruvchisini tanlang. Agar buni qiyin deb hisoblasangiz, chunki barcha X o‘zgaruvchilar siz uchun bir xil darajada muhim bo‘lib tuyulsa, ixtiyoriy qaror qabul qiling.

  3. Qolgan X o'zgaruvchilardan eng muhimini tanlang: "Birinchi o'zgaruvchini hisobga olgan holda, qolgan X o'zgaruvchilardan qaysi biri Y o'zgaruvchisining harakatini tushuntirish uchun ko'proq yangi ma'lumot beradi?"

o'n to'rt R
R har qanday holatda ham bir xil yoki kattaroq bo'lsa-da, R2 uchun moslashtirilgan R2 deb ataladigan o'xshash qiymat mavjud bo'lib, keraksiz X o'zgaruvchisi kiritilganda kattaroq yoki kichikroq bo'lishi mumkin. Agar berilgan X o'zgaruvchisi noto'g'ri joylashtirilgan X-o'zgaruvchidan shunchaki tasodif tufayli kutilganidan ko'proq narsani tushuntirsa, sozlangan R2 ko'payadi. Sozlangan R2 ni 1 - (n - 1)(1) formulasi yordamida normal, sozlanmagan R2 qiymatidan hisoblash mumkin.-R2)/(n - k -biri).

12-BOB. KO'P REGRESSIYA: bashorat qilish.


657




  1. X o'zgaruvchilarning butun ro'yxatini birinchi o'ringa qo'ymaguningizcha, shu tarzda qolgan X o'zgaruvchilardan eng muhimini tanlashda davom eting. Har bir bosqichda o'zingizga savol bering: "Allaqachon tanlangan X o'zgaruvchilarni hisobga olgan holda, qolgan X o'zgaruvchilardan qaysi biri Y o'zgaruvchisining harakatini tushuntirish uchun ko'proq yangi ma'lumot beradi?"

Keyin ro'yxatingizdagi faqat muhim deb hisoblagan X o'zgaruvchilari yordamida regressiyani hisoblang. Yana bir nechta regressiyalarni, shu jumladan, qolgan X o‘zgaruvchilarning ba’zilarini (yoki ularning barchasini) tahlil qiling va ular Y ning bashoratiga haqiqatan ham ta’sir qiladimi yoki yo‘qligini tekshiring. Nihoyat, sizga eng foydali bo‘lgan regressiya natijasini tanlang.
Ta'riflangan protsedura juda sub'ektiv ko'rinsa ham (chunki bu sizning sub'ektiv fikringizga bog'liq), uning ikkita muhim afzalligi bor. Birinchidan, Y ning xatti-harakatlarini deyarli bir xil tarzda tushuntiradigan ikkita X o'zgaruvchisi o'rtasida tanlov qilish kerak bo'lganda, yakuniy tanlov sizniki bo'ladi (avtomatlashtirilgan protsedura keyinchalik kamroq mazmunli tanlov qilishi mumkin). Ikkinchidan, mustaqil X o'zgaruvchilaringizga diqqat bilan ustunlik berish orqali siz o'rganilayotgan vaziyatni chuqurroq tushunishingiz mumkin. Yechilayotgan muammoning bunday aniqlanishi ko'p regressiya natijalaridan kam bo'lmagan foydali bo'lishi mumkin!
O'zgaruvchilarni tanlash jarayonini avtomatlashtirish
Agar siz o'zingizning vaziyatingiz haqida chuqur o'ylashga vaqt sarflashni istamasangiz va sizda mavjud bo'lgan ma'lumotlar asosida X-o'zgaruvchilarni tanlash jarayonini avtomatlashtirishni afzal ko'rsangiz, kerakli natijaga erishishning ko'plab usullari mavjud. Afsuski, o'zgaruvchan tanlashni har tomonlama avtomatlashtirishning "eng yaxshi" usuli yo'q. Olimlar bunday usulni izlashda davom etmoqdalar, ammo hozirda juda yaxshi avtomatik usullar mavjud bo'lib, ular X-o'zgaruvchilarning nisbatan ixcham ro'yxatini olish imkonini beradi, ular Y ni yuqori sifatli prognoz qilishni ta'minlaydi.
O'zgaruvchilarni avtomatik tanlashning eng yaxshi usuli X o'zgaruvchilarning barcha kichik to'plamlarini tahlil qilishdir. Agar, masalan, sizda uchta mustaqil X o'zgaruvchisi bo'lsa, jadvalda ko'rsatilganidek, tanlash mumkin 12.2.8, ushbu o'zgaruvchilarning sakkizta kichik to'plamini tekshirish kerak. Agar sizda o'nta X o'zgaruvchi bo'lsa, siz 1024 xil kichik to'plamni o'rganishingiz kerak.15 Agar shuncha ko'p regressiyalarni hisoblashingiz mumkin bo'lsa ham, qaysi kichik to'plam eng yaxshi ekanligini qanday bilasiz? Statistik olimlar qo'shimcha ma'lumot sifatida hisobga olinadigan formulalar asosida bir qator texnik usullarni taklif qilishdi­


Umumiy formula quyidagi ko'rinishga ega: k X-o'zgaruvchilardan 2* kichik to'plamlar tuzilishi mumkin.


658


IV QISM. REGRESSIYA VA VAQT SERIASI





kattaroq kichik to'plamlarda mavjud, shuningdek, baholashning qo'shimcha murakkabligi.16
Keng qo'llaniladigan yondashuvlardan biri qo'shimcha tanlash deb ataladi. Har bir bosqichda o'zgaruvchi "foydaliligi" ga qarab ro'yxatga qo'shiladi yoki ro'yxatdan o'chiriladi. Bu jarayon o'zgaruvchilar ro'yxati barqarorlashguncha davom etadi. Ushbu protsedura o'zgaruvchilarning barcha kichik to'plamlarini tahlil qilishdan ko'ra tezroq, lekin ba'zi hollarda kerakli natijaga olib kelmasligi mumkin. Bu erda bosqichma-bosqich tanlash jarayoniga oid ba'zi tafsilotlar mavjud.

  1. Initializatsiya.Y ni tushuntirishga yordam beradigan X o'zgaruvchisi bormi? Agar yo'q bo'lsa, bosqichma-bosqich tanlash jarayonini to'xtating va hech qanday foydali X termini topilmasligi haqida xabar bering. Agar bunday o'zgaruvchi topilsa, ro'yxatga eng foydali X o'zgaruvchisini qo'ying (bu Y bilan korrelyatsiyaning eng yuqori mutlaq qiymatiga ega bo'lgan o'zgaruvchilardan biridir).

  2. O'zgaruvchini yoqish bosqichi.Ro'yxatga kiritilmagan barcha X o'zgaruvchilarni tahlil qiling. Xususan, Y uchun eng qo'shimcha tushuntirishni ta'minlaydigan X o'zgaruvchisini ko'rib chiqing. Agar bu tushuntirish siz uchun etarlicha muhim bo'lib tuyulsa, ro'yxatga mos keladigan X o'zgaruvchisini kiriting.

  3. O'zgaruvchilarni o'chirish bosqichlari.Yaratilgan ro'yxatda shunday X-o'zgaruvchi bormiki, hozirda (ro'yxatga yangi o'zgaruvchilar qo'shilgandan keyin) sizga foydasizdek tuyuladi? Agar ro'yxatda shunday o'zgaruvchi bo'lsa, uni olib tashlang, lekin keyinroq uni ro'yxatga kiritish kerak bo'lishi mumkinligini unutmang. Ro'yxatda hech kim qolmaguncha keraksiz X o'zgaruvchilarni olib tashlashni davom eting.

  4. Jarayon tugagunga qadar takroriy bajarish.Paragraflardagi amallarni takrorlang. Ro'yxatga qo'shadigan hech narsa va olib tashlash uchun hech narsa bo'lmaguncha 2 va 3.


Download 0.55 Mb.

Do'stlaringiz bilan baham:
1   ...   14   15   16   17   18   19   20   21   ...   43




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling