Sinov va o'quv ma'lumotlar to'plamini tayyorlang
Jadvalda to'q sariq kvadratchalar ko'p emas.
Shunday qilib, siz aytishingiz mumkinki, hech qanday qiymat 80% diabet (natija) keltirishi mumkin emas .
Bu individual
o'zgaruvchilar o'rtasida unchalik bog'liqlik yo'qdek. Ammo shuni ko'ramizki, jami olinganda, biz ushbu omillarning barchasini
hisobga
olgan holda, qandli diabetni kim rivojlanishini deyarli 75% aniqlik bilan bashorat qilishimiz mumkin.
data.corr(ma'lumotlar)
Ma'lumotlarni trening va test ma'lumotlar to'plamlariga bo'lish uchun tran_test_split(X, y, test_size=0,33, tasodifiy_state=42)
scikit-learn funksiyasidan foydalanamiz, bunda test ma'lumotlari to'plamiga yozuvlarning 33 foizi berilgan. Trening
ma'lumotlar to'plami rejimni o'rgatish
uchun ishlatiladi, ya'ni og'irliklar va noaniqliklarni topadi . Sinov ma'lumotlari
to'plami
uning to'g'riligini tekshirish uchun ishlatiladi.
Do'stlaringiz bilan baham: