1-topshiriq. Mashinani o’qitish. Lobe dasturida ishlash
-topshiriq.Tahlil qilingan ma’lumotlar asosida model yaratish
Download 1.52 Mb.
|
aaaaaaaaaaaaaa
7-topshiriq.Tahlil qilingan ma’lumotlar asosida model yaratish
Regressiya tahlili kerak. Regressiya - bu o'zgaruvchilar o'rtasidagi korrelyatsiyani topishga yordam beradigan va bir yoki bir nechta bashorat qiluvchi o'zgaruvchilar asosida uzluksiz chiqish o'zgaruvchisini bashorat qilish imkonini beradigan nazoratli o'rganish usuli. U asosan bashorat qilish, prognozlash, vaqt seriyalarini modellashtirish va o'zgaruvchilar o'rtasidagi sabab-ta'sir munosabatlarini aniqlash uchun ishlatiladi . Regressiyada biz berilgan ma'lumotlar nuqtalariga eng mos keladigan o'zgaruvchilar o'rtasida grafik chizamiz, ushbu sxemadan foydalanib, mashinaviy o’qitish modeli ma'lumotlar haqida bashorat qilishi mumkin. Oddiy so'z bilan aytganda, "Regressiya maqsadli bashorat qiluvchi grafikdagi barcha ma'lumotlar nuqtalaridan o'tadigan chiziq yoki egri chiziqni ko'rsatadi, shunda ma'lumotlar nuqtalari va regressiya chizig'i orasidagi vertikal masofa minimal bo'ladi." Ma'lumotlar nuqtalari va chiziq o'rtasidagi masofa model kuchli munosabatlarga ega yoki yo'qligini ko'rsatadi. Regressiya tahlili bilan bog'liq atamalar: Bog'liq o'zgaruvchi: Biz bashorat qilmoqchi bo'lgan yoki tushunmoqchi bo'lgan regressiya tahlilidagi asosiy omilga bog'liq o'zgaruvchi deyiladi. U maqsadli o'zgaruvchi deb ham ataladi . Mustaqil o'zgaruvchi: bog'liq o'zgaruvchilarga ta'sir qiluvchi yoki bog'liq o'zgaruvchilar qiymatlarini bashorat qilish uchun foydalaniladigan omillar mustaqil o'zgaruvchi deb ataladi, shuningdek, bashorat qiluvchi deb ham ataladi . Chiqib ketishlar: Chiqib ketish - bu boshqa kuzatilgan qiymatlarga nisbatan juda past yoki juda yuqori qiymatni o'z ichiga olgan kuzatish. Chiqib ketish natijaga xalaqit berishi mumkin, shuning uchun undan qochish kerak. Multikollinearlik: Agar mustaqil o'zgaruvchilar boshqa o'zgaruvchilarga qaraganda bir-biri bilan yuqori korrelyatsiya bo'lsa, bunday holat Multikollinearlik deb ataladi. U ma'lumotlar to'plamida bo'lmasligi kerak, chunki u eng ko'p ta'sir qiluvchi o'zgaruvchini tartiblashda muammo yaratadi. Noto'g'ri moslashtirish va haddan tashqari moslashtirish: Agar bizning algoritmimiz o'quv ma'lumotlar to'plami bilan yaxshi ishlasa, lekin test ma'lumotlar to'plami bilan yaxshi ishlamasa, bunday muammo Overfitting deb ataladi . Va agar bizning algoritmimiz hatto o'quv ma'lumotlar to'plamida ham yaxshi ishlamasa, bunday muammo deyiladi underfitting . Oddiy chiziqli regressiya modeli quyidagi tenglama yordamida ifodalanishi mumkin: 𝑦 = 𝑎0 + 𝑎1𝑥 + 𝜀 𝑎0 va 𝑎1 konstantalar regressiya chizig’ining yo’nalishini belgilab beradi. 𝜀 = xatolik (yaxshi model uchun bu ahamiyatsiz bo'ladi). Python yordamida oddiy chiziqli regressiya algoritmini amalga oshirish Oddiy chiziqli regressiya uchun muammo misoli: Keyin, ma'lumotlar to'plamini yuklaymiz: data={ 'Hudud':['Urgut','Urgut','satepo','jonboy','ishthon','gum','motered','vagzal','pavarot','toshkent'], 'Xona':[2,3,2,1,2,3,4,1,3,2], 'Maydon':[42.0,65.0,42.0,35.0,45.0,60.0,72.0,32.0,58.0,47.0], 'Qavat':[3,4,2,5,7,4,2,5,7,5], 'Narxi':[60000.0,32000.0,22000.0,17000.0,27000.0,35000.0,47000.0,19000.0,33000.0,24000.0] } Uyjoy=pd.DataFrame(data) Uyjoy X o’zgaruvchiga rusum ustunidagi qiymatlarni , Y o’zgaruvchiga narx ustunidagi qiymatlarni massiv ko’rinishida ta’minlaymiz import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline import numpy as np karzenka={ 'market':['olma','anor','nok','mandarin','uzum','bodom','kanfed','kola','yog','gush'], 'narxi':[8000.0,12000.0,15000.0,9000.0,11000.0,13000.0,14000.0,16000.0,13000.0,11000.0], 'kilo':[1.0,1.5,2.0,2.0,1.0,1.5,1.5,2.0,1.5,1.0], 'qancha':[12,3,9,6,5,7,8,14,11,15] } df=pd.DataFrame(karzenka) df Narx va kilosi o'rtasida chiziqli bog'liqlik bor ekanini tekshirib ko'ramiz. Quyidagi kod qatorini bajarib, biz quyidagi natijani olamiz: Yuqoridagi grafikda biz ko’k nuqtalarda kuzatilgan haqiqiy qiymatlarni ko'rishimiz mumkin va taxmin qilingan qiymatlar sariq regressiya chizig'i bilan qoplangan. Regressiya chizig'i bog'liq va mustaqil o'zgaruvchilar o'rtasidagi korrelyatsiyani ko'rsatadi. Chiziqning yaxshi mosligini haqiqiy qiymatlar va bashorat qilingan qiymatlar o'rtasidagi farqni hisoblash orqali kuzatish mumkin. x va y o’zgaruvchilardan quyidagi formuladan foydalangan holda a va b koeffisientlarni hisoblaymiz Bu yerda x~- x ustun uchun o'rtracha qiymat, 𝑦̃ - y ustun uchun o'rtacha qiymat. Download 1.52 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling