Mashinani o'rganish algoritmlari uchun giperparametr qidirish Hisoblash murakkabligini optimallashtirish
Download 261.42 Kb. Pdf ko'rish
|
processes-11-00349-v4 (1)
3. Tavsiya etilgan metodologiya
Ushbu bo'limda biz har bir algoritmning samaradorligini ko'rsatish uchun Diabet ma'lumotlar to'plamida tavsiya etilgan optimallashtirish algoritmlarini solishtiramiz. Biz 70:30 qandli diabet ma'lumotlar to'plamidan foydalandik ( mos ravishda trening va test). Biz qo'llab-quvvatlash vektor mashinasidan mashinani o'rganish modeli sifatida foydalandik va keyin to'rt xil optimallashtirish texnikasi (chumolilar koloniyasi, genetik algoritm, kit optimallashtirish va zarrachalar to'dasini optimallashtirish) yordamida uning giper-sozlashdan keyingi hisoblash narxini sinab ko'rdik . Algoritmning giperpa rametrlarini nozik sozlashning eng samarali strategiyalarini aniqlash uchun ushbu optimallashtirish algoritmlari hisoblash murakkabligi nuqtai nazaridan solishtirildi. Ikkala ma'lumotlar to'plami ham keng qamrovli balanslashdan o'tkazildi va keyin tasniflash uchun foydalanildi. Bundan tashqari, 4-bo'limda ma'lumotlar to'plamlari 70:30 nisbatda qo'llaniladi. Nozik sozlash giperparametrlari mashinani o'rganishni optimallashtiradi. Yuqori yoki ko'p parametrli maqsad funktsiyalari uchun giperparametrlar ko'p vaqt talab etadi [9]. Neyron tarmoqlari bir vaqtning o'zida ko'plab parametrlarni boshqarganligi sababli, giperparametrlarni nozik sozlash ko'p vaqt talab etadi. Optimal giperparametr tanlashdan tashqariga chiqadigan avtomatlashtirilgan ish faoliyatini baholash rivojlanmagan [25]. Mualliflar SVM, RF va Adaboost giperparametrlarini aniqlash uchun OpenML-ning eksperimental meta-ma'lumotlaridan foydalanganlar . Ushbu natijalar inson tomonidan boshqariladigan algoritmlarni loyihalash va giperparametrlarni optimallashtirishda ishlatilishi mumkin . Oldingi tadqiqotlar shuni ko'rsatdiki, ushbu strategiyaning giperparametrlari optimallashtirishga ta'sir qiladi. Bu katta biologik ma'lumotlar to'plamlari uchun baholash protseduralari va giperparametr qiymatlarini avtonom tanlash bo'yicha ko'proq tadqiqotlarga olib keladi. Parametrlar haqiqiy mashinani o'rganish uchun kerak . Giperparametrlar model ishlashiga ta'sir qiladi, chunki mashinani o'rganish modellari murakkablashadi. Yangi algoritmlar [27] tezda giperparametrlarni topadi. Biz ikkita SG++ Sparse Grid usulini yaratdik va sinab ko'rdik. Bayesian optimallashtirish optimal giperparametr sozlamalarini aniqlash uchun o'tmishdagi kashfiyotlardan foydalanadi, Garmonika esa qidiruv maydonini toraytiradi. Biz regressiya va zichlikni baholash yondashuvlaridan foydalanadiganlarni solishtirdik. Xususiyat muhandisligi muvaffaqiyatli bo'lishi uchun biznes muammosi va mavjud ma'lumotlarni to'liq tushunish kerak . Xususiyatlarni o'rganish, shuningdek, vakillik o'rganish sifatida ham tanilgan , mashinani o'rganishning kichik sohasi bo'lib, u xom ma'lumotlardan xususiyatlarni aniqlash yoki tasniflash uchun zarur bo'lgan taqdimotlarni avtomatik ravishda aniqlash usullari to'plamini o'z ichiga oladi . 1 -rasmda tadqiqotning ish jarayoni ko'rsatilgan. Harmonika osongina parallellashadi va chuqur izlaydi, lekin ko'proq resurslarni talab qiladi. Bayesian optimallashtirish yechim qidirishni tezlashtiradi. "Mashinani o'rganish" o'z-o'zini takomillashtirish algoritmlarini o'z ichiga oladi. Katta biotibbiyot ma'lumotlari biotibbiyot tadqiqotlari va sog'liqni saqlash xizmatlarini taqdim etishda ishtirok etadi [26]. Modelni o'rgatishdan oldin usul va giperparametrlar tanlanadi. Model strategiyasi va giperparametr qiymatlarini aniqlash qiyin. Kompyuter olimlari nazorat qilinadigan mashinani o'rganish vazifalari uchun avtomatlashtirilgan tanlash texnikasi va/yoki giperparametr sozlamalariga ega bo'lib, ularni mutaxassis bo'lmaganlar uchun ochiq qiladi. Trening davomida mashinani oÿrganish modellarining ishlashi va aniqligini oshirish uchun maÿlumotlarni yigÿishda injenerlik qoÿshish, olib tashlash, birlashtirish va mutatsiyalash funksiyalarini qoÿshing. Modelning aniqligi nozik sozlashga qarab 25% dan 90% gacha. Grid qidiruvi, Ran dom Forest va Bayesian optimallashtirish chuqur o'rganish giperparametrlarini aniq sozlaydi. Har bir yondashuvning afzalliklari va kamchiliklari mavjud. Grid qidiruvi giperparametrlarni o'zgartirishi mumkin, lekin bir vaqtning o'zida bir nechta emas. Tadqiqotchilar sintetik polimer ma'lumotlaridan foydalangan holda sozlash parametrlari va protseduralarini baholadilar . Giperparametrlarni optimallashtirish usullari ma'lumotlarni qazib olishda foydalidir. Ushbu maqola katta biotibbiyot ma'lumotlar to'plamlarida ushbu usullarni qo'llash usullarini taqdim etadi. Qarorlar daraxtining murakkabligi tizimning ishlashiga ta'sir qilmasdan qisqartirilishi mumkin ( mos ravishda polinom va kvazipolinom). Ref. [8] Mashina oÿrganish giperparametrlarini optimallashtiradi. Jarayonlar 2023, 11, 349 5 / 21 Machine Translated by Google |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling