from
sklearn.model_selection
import
train_test_split
x_train, x_test, y_train, y_test =
train_test_split
(
x, y, test_size=
0.2
)
Bu
funkciya,
shuningdek, bir argument sifatida test_size oladi,
qaysi bir qismini
belgilaydi, test namunasi uchun ajratilgan.
Endi
eng muhimi, chiziqli regressiya modelini o'rganishdir.
Scikit-learn-da
Pythonda biz uchun ishlaydigan LinearRegression klassi mavjud:
from
sklearn.linear_model
import
LinearRegression
model =
LinearRegression
()
.
fit
(
x_train, y_train
)
Fit usulida biz ML modeli o'qitiladigan ma'lumotlarni yuboramiz. Keling, test
namunasi asosida prognozlarni olishga harakat qilaylik:
y_pred = model.
predict
(
x_test
)
Ishning bajarilishi
1. Siz tekshirmoqchi bo'lgan sohada ishlash uchun ma'lumotlarni to'plang va
korrelyatsiyani o'lchang.
2. Ma'lumotlarni yuklab oling va kodni yozing va ma'lumotlarni ta'lim va
testga bo'lishni unutmang.
3. Boshqalarni bashorat qilish uchun ba'zi o'zgaruvchilardan
foydalanishingiz
mumkinligini hal qiling.
4. O'quv va test ma'lumotlari yordamida modelning aniqligini baholash.
5. Qaram o'zgaruvchining argumentga bog'liqligini grafik jihatdan tasvirlash va
oddiy bir o'lchovli chiziqli regressiyani amalga oshirish.
Qaysi model eng
yaxshi determinatsiya koeffitsientini beradi?
6. Test ma'lumotlarining eng yaxshi determinatsiya koeffitsientini olish uchun
qancha o'zgaruvchiga ehtiyoj borligini aniqlang. Unutmang, agar modomiki
sifatida faqat bir o'zgaruvchi qo'shishingiz mumkin, o'zgaruvchi qo'shib
o'quv majmui aniqlash omil qiymatini yaxshilaydi.