Alomatlarning to'liq tanlovi. Bu barcha alomatlarni tanlashning eng ishonchli usuli. Uning mohiyati - funktsiyalarning har bir kichik to'plamini saralash orqali baholashdan iborat. Bu shuni anglatadiki, usul o'zgaruvchilarning barcha mumkin bo'lgan kombinatsiyalarini algoritm orqali o'tkazadi va eng samarali to'plam ostisini topadi.
Alomatlari rekursiv ravishda o’chirish. Boshda model barcha alomatlarda o’rgatiladi va har bir alomatning muhimlik darajasi aniqlanadi. Keyinchalik, past ahamiyatli alomatlar to’plamdan o’chiriladi. Amal, oxir-oqibatda tanlanma uchun ma’qul sondagi alomatlar qolguncha rekursiv ravishda davom etadi.
3. Joylangan usullar (embedded methods)
Bu usullar filtrlash va o’rab olish usullarining afzallik tomonlarini o’z ichiga oladi, hamda hisoblash sarflarini kamaytiradi. Joylangan usullarning o’ziga xosligi aniq bir itaratsiya qadamida alomatlarni ajratib oladi.
LASSO regulyatsiyasi (L1)
Regulayrizatsiya haddn tashqari msolashishni oldini olish uchun modelning ayrim parametrlariga jarimalar (penalty) qo’shishdan iborat bo’ladi. Chiziqli modellar regulyarizatsiyada jarimalar har bir prediktga ko’paytiriluvchi koeffisentlarga qo’llaniladi. Lasso-regulayrizatsiya koeffisentlarni nolggacha kamaytirish xossasiga ega. Natijada bunday alomatlar o’chirilishi mumkin.
Tasoddifiy o’rmon yordamida saralash (Random Forest Importance)
Bu usulda tabiiy ravishda berilganlarga ko’ra alomatlar model tozaligini qanchalik yaxshilashi bo’yicha tartiblanadi. Aniq bir koeffitsentdan past daraxt shoxlarini “kesish” orqali eng muhim alomatlarni tanlab olishimiz mumkin bo’ladi.
O’qituvchisiz o’rgatish
Dispersiya. Dispersiya bahosi alomatlarni saralashda samarali usullardan hisoblanadi. Odatda deyarli nol dispersiyali alomat muhim hisoblanmaydi va ularni o’chirish mumkin.
O’rtacha absolyut farqlanish. Alomatning qiymati va uning o’rtacha qiymati o’rtasidagi o’rtacha absolyut farqlanish hisoblanadi
Yuqori qiymat odatda nisbatan yuqori qaror qilish kuchiga ega bo’ladi.
Do'stlaringiz bilan baham: |