Mashinani o'rganish algoritmlari uchun giperparametr qidirish Hisoblash murakkabligini optimallashtirish


Download 261.42 Kb.
Pdf ko'rish
bet5/24
Sana17.06.2023
Hajmi261.42 Kb.
#1535168
1   2   3   4   5   6   7   8   9   ...   24
Bog'liq
processes-11-00349-v4 (1)

3. Tavsiya etilgan metodologiya
Ushbu bo'limda biz har bir algoritmning samaradorligini ko'rsatish uchun Diabet ma'lumotlar to'plamida
tavsiya etilgan optimallashtirish algoritmlarini solishtiramiz. Biz 70:30 qandli diabet ma'lumotlar to'plamidan
foydalandik ( mos ravishda trening va test). Biz qo'llab-quvvatlash vektor mashinasidan mashinani o'rganish
modeli sifatida foydalandik va keyin to'rt xil optimallashtirish texnikasi (chumolilar koloniyasi, genetik algoritm,
kit optimallashtirish va zarrachalar to'dasini optimallashtirish) yordamida uning giper-sozlashdan keyingi
hisoblash narxini sinab ko'rdik . Algoritmning giperpa rametrlarini nozik sozlashning eng samarali strategiyalarini
aniqlash uchun ushbu optimallashtirish algoritmlari hisoblash murakkabligi nuqtai nazaridan solishtirildi. Ikkala
ma'lumotlar to'plami ham keng qamrovli balanslashdan o'tkazildi va keyin tasniflash uchun foydalanildi. Bundan
tashqari, 4-bo'limda ma'lumotlar to'plamlari 70:30 nisbatda qo'llaniladi.
Nozik sozlash giperparametrlari mashinani o'rganishni optimallashtiradi. Yuqori yoki ko'p parametrli maqsad
funktsiyalari uchun giperparametrlar ko'p vaqt talab etadi [9]. Neyron tarmoqlari bir vaqtning o'zida ko'plab
parametrlarni boshqarganligi sababli, giperparametrlarni nozik sozlash ko'p vaqt talab etadi.
Optimal giperparametr tanlashdan tashqariga chiqadigan avtomatlashtirilgan ish faoliyatini baholash
rivojlanmagan
[25].
Mualliflar SVM, RF va Adaboost giperparametrlarini aniqlash uchun OpenML-ning
eksperimental meta-ma'lumotlaridan foydalanganlar . Ushbu natijalar inson tomonidan boshqariladigan
algoritmlarni loyihalash va giperparametrlarni optimallashtirishda ishlatilishi mumkin . Oldingi tadqiqotlar shuni
ko'rsatdiki, ushbu strategiyaning giperparametrlari optimallashtirishga ta'sir qiladi.
Bu katta biologik ma'lumotlar to'plamlari uchun baholash protseduralari va giperparametr qiymatlarini avtonom
tanlash bo'yicha ko'proq tadqiqotlarga olib keladi. Parametrlar haqiqiy mashinani o'rganish uchun kerak .
Giperparametrlar model ishlashiga ta'sir qiladi, chunki mashinani o'rganish modellari murakkablashadi. Yangi
algoritmlar
[27]
tezda giperparametrlarni topadi. Biz ikkita SG++ Sparse Grid usulini yaratdik va sinab ko'rdik.
Bayesian optimallashtirish optimal giperparametr sozlamalarini aniqlash uchun o'tmishdagi kashfiyotlardan
foydalanadi, Garmonika esa qidiruv maydonini toraytiradi. Biz regressiya va zichlikni baholash yondashuvlaridan
foydalanadiganlarni solishtirdik.
Xususiyat muhandisligi muvaffaqiyatli bo'lishi uchun biznes muammosi va mavjud ma'lumotlarni
to'liq tushunish kerak . Xususiyatlarni o'rganish, shuningdek, vakillik o'rganish sifatida ham
tanilgan , mashinani o'rganishning kichik sohasi bo'lib, u xom ma'lumotlardan xususiyatlarni
aniqlash yoki tasniflash uchun zarur bo'lgan taqdimotlarni avtomatik ravishda aniqlash usullari
to'plamini o'z ichiga oladi .
1
-rasmda tadqiqotning ish jarayoni ko'rsatilgan.
Harmonika osongina parallellashadi va chuqur izlaydi, lekin ko'proq resurslarni talab qiladi. Bayesian
optimallashtirish yechim qidirishni tezlashtiradi.
"Mashinani o'rganish" o'z-o'zini takomillashtirish algoritmlarini o'z ichiga oladi. Katta biotibbiyot
ma'lumotlari biotibbiyot tadqiqotlari va sog'liqni saqlash xizmatlarini taqdim etishda ishtirok etadi
[26].
Modelni
o'rgatishdan oldin usul va giperparametrlar tanlanadi. Model strategiyasi va giperparametr qiymatlarini
aniqlash qiyin. Kompyuter olimlari nazorat qilinadigan mashinani o'rganish vazifalari uchun avtomatlashtirilgan
tanlash texnikasi va/yoki giperparametr sozlamalariga ega bo'lib, ularni mutaxassis bo'lmaganlar uchun ochiq qiladi.
Trening davomida mashinani oÿrganish modellarining ishlashi va aniqligini oshirish uchun maÿlumotlarni
yigÿishda injenerlik qoÿshish, olib tashlash, birlashtirish va mutatsiyalash funksiyalarini qoÿshing.
Modelning aniqligi nozik sozlashga qarab 25% dan 90% gacha. Grid qidiruvi, Ran dom Forest va Bayesian
optimallashtirish chuqur o'rganish giperparametrlarini aniq sozlaydi. Har bir yondashuvning afzalliklari va
kamchiliklari mavjud. Grid qidiruvi giperparametrlarni o'zgartirishi mumkin, lekin bir vaqtning o'zida bir
nechta emas. Tadqiqotchilar sintetik polimer ma'lumotlaridan foydalangan holda sozlash parametrlari va
protseduralarini baholadilar . Giperparametrlarni optimallashtirish usullari ma'lumotlarni qazib olishda foydalidir.
Ushbu maqola katta biotibbiyot ma'lumotlar to'plamlarida ushbu usullarni qo'llash usullarini taqdim etadi.
Qarorlar daraxtining murakkabligi tizimning ishlashiga ta'sir qilmasdan qisqartirilishi mumkin ( mos
ravishda polinom va kvazipolinom). Ref.
[8]
Mashina oÿrganish giperparametrlarini optimallashtiradi.
Jarayonlar 2023, 11, 349
5 / 21
Machine Translated by Google


sses 2023, 11, x KO'RISH UCHUN
6 / 24

Download 261.42 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   ...   24




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling