Mashinani o'rganish algoritmlari uchun giperparametr qidirish Hisoblash murakkabligini optimallashtirish


Download 261.42 Kb.
Pdf ko'rish
bet6/24
Sana17.06.2023
Hajmi261.42 Kb.
#1535168
1   2   3   4   5   6   7   8   9   ...   24
Bog'liq
processes-11-00349-v4 (1)

Shakl 1. Tavsiya etilgan oqim ma'lumotlar to'plami tavsifi.
Biz PIMA (diabet) va yurak xastaliklariga oid maÿlumotlar toÿplamini kaggle.com saytidan
oldik, PIMA (diabet) va yurak xastaliklari maÿlumotlar toÿplamini kaggle.com saytidan oldik,
2022-yil 18-noyabrda foydalanilgan. Bu maÿlumotlar Milliy Diabet institutidan toÿplangan. Noyabr
2022. Bu maÿlumotlar Milliy diabet kasalligi va ovqat hazm qilish va buyrak kasalliklari institutidan
toÿplangan . Da- va ovqat hazm qilish va buyrak kasalliklariga kiritilgan diagnostik parametrlar.
Ma'lumotlar to'plamiga kiritilgan diagnostika parametrlari diabet tashxisida yordam berish uchun
to'plangan. Qandli diabet tashxisida yordam berish uchun to'plangan kattaroq ma'lumotlardan .
Kattaroq ma'lumotlar havzasidan ushbu misollar qat'iy mezonlar yordamida qo'lda tanlangan.
Mavzular Pima ayollari qattiq mezonlar yordamida qo'lda tanlangan. Mavzular kamida 21 yoshda
bo'lgan Pima hindu kelib chiqishi hindistonlik ayollar edi . Ma'lumotlar xom shaklda edi va biz
kamida 21 yoshda bo'lganlarga murojaat qildik. Ma'lumotlar xom shaklda edi va biz undan keyingi
foydalanish uchun samarali bo'lishi uchun mo'yna texnikasi uchun samarali bo'lishi uchun, ya'ni,
chetni aniqlash va olib tashlash uchun oldindan ishlov berishdan oldingi ishlov berish usullarini
qo'lladik.
2-
rasmda foydalaning. 2-rasmda chastota taqsimoti bilan ma'lumotlar to'plamining
xususiyatlari ko'rsatilgan. chastota taqsimoti bilan ma'lumotlar to'plamining xususiyatlarini ko'rsatadi.
vakillikni o'rganish - bu mashinani o'rganishning kichik sohasi bo'lib, u 2023, 11, 349 jarayonlari to'plamini o'z
ichiga oladi - xom
ma'lumotlardan xususiyatlarni aniqlash yoki tasniflash uchun zarur bo'lgan taqdimotlarni avtomatik ravishda aniqlash.
1-rasmda tadqiqotning ish jarayoni ko'rsatilgan.
6 / 21
Shakl 1. Tavsiya etilgan oqim ma'lumotlar to'plami tavsifi.
To'rt xil ma'lumotlar bazasi (Klivlend, Vengriya, Shveytsariya va Long Beach V) ushbu 1988
yilgi ma'lumotlar to'plamini tashkil qiladi. U 76 xususiyatga ega bo'lsa-da (shu jumladan kutilgan
atribut), faqat 14 tasi xabar qilingan tadqiqotlarda ishlatilgan. Maqsad - bemorda yurak xastaligi
bor yoki yo'qligini ko'rsatadigan maydon . Kasallik 1 qiymati, kasallikning yo'qligi esa 0 qiymati
sifatida ifodalanadi.
3-
rasmda Yurak ma'lumotlar to'plamida maqsadli natija ko'rsatilgan.
Machine Translated by Google


Jarayonlar 2023, 11, x KO'RISH UCHUN
24 tadan 7 tasi
ML modelini ishlab chiqish jarayonida bu birinchi va, ehtimol, eng muhim bosqichdir.
Birinchi va, ehtimol, eng muhim bosqich, toza, yaxshi tuzilgan ma'lumotlarga ega
bo'lish . Toza, yaxshi tuzilgan ma'lumotlarga ega bo'lish mashinani o'rganish
loyihasini ishlab chiqishda katta afzallikdir, lekin mashinani o'rganish loyihasini
ishlab chiqishda har doim ham katta afzallik emas, lekin har doim ham
kafolatlanmaydi . Ma'lumotlarni oldindan qayta ishlash to'rt bosqichga bo'linadi -
ma'lumotlarni tozalash, ma'lumotlar 3.1. Ma'lumotlarni oldindan qayta ishlash
integratsiyasi, ma'lumotlarni qisqartirish va ma'lumotlarni o'zgartirish - jarayonni
osonlashtirish uchun.
4
-rasmda ma'lumotlarni oldindan qayta ishlashdan keyin
ma'lumotlar to'plamining taqsimlanishi ko'rsatilgan. Ma'lumotlarni tayyorlash - bu
xom ma'lumotlarni tozalash va formatlash uchun ko'rilgan qadamlar, shuning uchun
ular mashinani o'rganish algoritmida ishlatilishi mumkin. ML modelini ishlab chiqish
jarayonida bu birinchi va, ehtimol, eng muhim bosqichdir. Toza, yaxshi tuzilgan
ma'lumotlarga ega bo'lish mashinani o'rganish loyihasini ishlab chiqishda katta
afzallikdir, lekin bu har doim ham shunday emas.
To'rt xil ma'lumotlar bazasi (Klivlend, Vengriya, Shveytsariya va Long Beach V) ushbu 1988
yilgi ma'lumotlar to'plamini tashkil qiladi. U 76 xususiyatga ega bo'lsa-da (shu jumladan kutilgan
atribut), faqat 14 tasi xabar qilingan tadqiqotlarda ishlatilgan. Maqsad - bemorda yurak xastaligi
bor yoki yo'qligini ko'rsatadigan maydon. Kasallik 1 qiymati, kasallikning yo'qligi esa 0 qiymati
sifatida ifodalanadi. 3-rasmda Yurak ma'lumotlar to'plamida maqsadli natija ko'rsatilgan.
3.1. Ma'lumotlarni
oldindan qayta
ishlash 3.1. Ma'lumotlarni oldindan qayta ishlash Ma'lumotlarni tayyorlash - bu
xom ma'lumotlarni tozalash va ulardan foydalanish uchun ularni formatlash
uchun ko'rilgan qadamlar Ma'lumotlarni tayyorlash - bu xom ma'lumotlarni
mashinani o'rganish algoritmida ishlatish uchun tozalash va formatlash uchun
ko'rilgan qadamlar . ML modelini ishlab chiqish jarayonida bu mashinada
o'rganish algoritmidir.
Jarayonlar 2023, 11, 349
7 / 21
To'rt xil ma'lumotlar bazasi (Klivlend, Vengriya, Shveytsariya va Long Beach V) ushbu 1988 yilgi ma'lumotlar to'plamini
tashkil qiladi. U 76 xususiyatga ega bo'lsa-da (shu jumladan kutilgan atribut), faqat 14 tasi xabar qilingan tadqiqotlarda
ishlatilgan. Maqsad - bemorda yurak xastaligi bor yoki yo'qligini ko'rsatadigan maydon. Kasallik 1 qiymati va 2-rasmda
yo'qligi bilan ifodalanadi . Chastotani taqsimlash bilan ma'lumotlar to'plamining xususiyatlari. kasallik 0 qiymati sifatida.

Download 261.42 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   ...   24




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling