Mashinani o'rganish algoritmlari uchun giperparametr qidirish Hisoblash murakkabligini optimallashtirish
Download 261.42 Kb. Pdf ko'rish
|
processes-11-00349-v4 (1)
Shakl 1. Tavsiya etilgan oqim ma'lumotlar to'plami tavsifi.
Biz PIMA (diabet) va yurak xastaliklariga oid maÿlumotlar toÿplamini kaggle.com saytidan oldik, PIMA (diabet) va yurak xastaliklari maÿlumotlar toÿplamini kaggle.com saytidan oldik, 2022-yil 18-noyabrda foydalanilgan. Bu maÿlumotlar Milliy Diabet institutidan toÿplangan. Noyabr 2022. Bu maÿlumotlar Milliy diabet kasalligi va ovqat hazm qilish va buyrak kasalliklari institutidan toÿplangan . Da- va ovqat hazm qilish va buyrak kasalliklariga kiritilgan diagnostik parametrlar. Ma'lumotlar to'plamiga kiritilgan diagnostika parametrlari diabet tashxisida yordam berish uchun to'plangan. Qandli diabet tashxisida yordam berish uchun to'plangan kattaroq ma'lumotlardan . Kattaroq ma'lumotlar havzasidan ushbu misollar qat'iy mezonlar yordamida qo'lda tanlangan. Mavzular Pima ayollari qattiq mezonlar yordamida qo'lda tanlangan. Mavzular kamida 21 yoshda bo'lgan Pima hindu kelib chiqishi hindistonlik ayollar edi . Ma'lumotlar xom shaklda edi va biz kamida 21 yoshda bo'lganlarga murojaat qildik. Ma'lumotlar xom shaklda edi va biz undan keyingi foydalanish uchun samarali bo'lishi uchun mo'yna texnikasi uchun samarali bo'lishi uchun, ya'ni, chetni aniqlash va olib tashlash uchun oldindan ishlov berishdan oldingi ishlov berish usullarini qo'lladik. 2- rasmda foydalaning. 2-rasmda chastota taqsimoti bilan ma'lumotlar to'plamining xususiyatlari ko'rsatilgan. chastota taqsimoti bilan ma'lumotlar to'plamining xususiyatlarini ko'rsatadi. vakillikni o'rganish - bu mashinani o'rganishning kichik sohasi bo'lib, u 2023, 11, 349 jarayonlari to'plamini o'z ichiga oladi - xom ma'lumotlardan xususiyatlarni aniqlash yoki tasniflash uchun zarur bo'lgan taqdimotlarni avtomatik ravishda aniqlash. 1-rasmda tadqiqotning ish jarayoni ko'rsatilgan. 6 / 21 Shakl 1. Tavsiya etilgan oqim ma'lumotlar to'plami tavsifi. To'rt xil ma'lumotlar bazasi (Klivlend, Vengriya, Shveytsariya va Long Beach V) ushbu 1988 yilgi ma'lumotlar to'plamini tashkil qiladi. U 76 xususiyatga ega bo'lsa-da (shu jumladan kutilgan atribut), faqat 14 tasi xabar qilingan tadqiqotlarda ishlatilgan. Maqsad - bemorda yurak xastaligi bor yoki yo'qligini ko'rsatadigan maydon . Kasallik 1 qiymati, kasallikning yo'qligi esa 0 qiymati sifatida ifodalanadi. 3- rasmda Yurak ma'lumotlar to'plamida maqsadli natija ko'rsatilgan. Machine Translated by Google Jarayonlar 2023, 11, x KO'RISH UCHUN 24 tadan 7 tasi ML modelini ishlab chiqish jarayonida bu birinchi va, ehtimol, eng muhim bosqichdir. Birinchi va, ehtimol, eng muhim bosqich, toza, yaxshi tuzilgan ma'lumotlarga ega bo'lish . Toza, yaxshi tuzilgan ma'lumotlarga ega bo'lish mashinani o'rganish loyihasini ishlab chiqishda katta afzallikdir, lekin mashinani o'rganish loyihasini ishlab chiqishda har doim ham katta afzallik emas, lekin har doim ham kafolatlanmaydi . Ma'lumotlarni oldindan qayta ishlash to'rt bosqichga bo'linadi - ma'lumotlarni tozalash, ma'lumotlar 3.1. Ma'lumotlarni oldindan qayta ishlash integratsiyasi, ma'lumotlarni qisqartirish va ma'lumotlarni o'zgartirish - jarayonni osonlashtirish uchun. 4 -rasmda ma'lumotlarni oldindan qayta ishlashdan keyin ma'lumotlar to'plamining taqsimlanishi ko'rsatilgan. Ma'lumotlarni tayyorlash - bu xom ma'lumotlarni tozalash va formatlash uchun ko'rilgan qadamlar, shuning uchun ular mashinani o'rganish algoritmida ishlatilishi mumkin. ML modelini ishlab chiqish jarayonida bu birinchi va, ehtimol, eng muhim bosqichdir. Toza, yaxshi tuzilgan ma'lumotlarga ega bo'lish mashinani o'rganish loyihasini ishlab chiqishda katta afzallikdir, lekin bu har doim ham shunday emas. To'rt xil ma'lumotlar bazasi (Klivlend, Vengriya, Shveytsariya va Long Beach V) ushbu 1988 yilgi ma'lumotlar to'plamini tashkil qiladi. U 76 xususiyatga ega bo'lsa-da (shu jumladan kutilgan atribut), faqat 14 tasi xabar qilingan tadqiqotlarda ishlatilgan. Maqsad - bemorda yurak xastaligi bor yoki yo'qligini ko'rsatadigan maydon. Kasallik 1 qiymati, kasallikning yo'qligi esa 0 qiymati sifatida ifodalanadi. 3-rasmda Yurak ma'lumotlar to'plamida maqsadli natija ko'rsatilgan. 3.1. Ma'lumotlarni oldindan qayta ishlash 3.1. Ma'lumotlarni oldindan qayta ishlash Ma'lumotlarni tayyorlash - bu xom ma'lumotlarni tozalash va ulardan foydalanish uchun ularni formatlash uchun ko'rilgan qadamlar Ma'lumotlarni tayyorlash - bu xom ma'lumotlarni mashinani o'rganish algoritmida ishlatish uchun tozalash va formatlash uchun ko'rilgan qadamlar . ML modelini ishlab chiqish jarayonida bu mashinada o'rganish algoritmidir. Jarayonlar 2023, 11, 349 7 / 21 To'rt xil ma'lumotlar bazasi (Klivlend, Vengriya, Shveytsariya va Long Beach V) ushbu 1988 yilgi ma'lumotlar to'plamini tashkil qiladi. U 76 xususiyatga ega bo'lsa-da (shu jumladan kutilgan atribut), faqat 14 tasi xabar qilingan tadqiqotlarda ishlatilgan. Maqsad - bemorda yurak xastaligi bor yoki yo'qligini ko'rsatadigan maydon. Kasallik 1 qiymati va 2-rasmda yo'qligi bilan ifodalanadi . Chastotani taqsimlash bilan ma'lumotlar to'plamining xususiyatlari. kasallik 0 qiymati sifatida. Download 261.42 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling