Mustaqil ishi mavzu: Bajardi


Bir o'zgaruvchan xususiyatni tanlash


Download 53.54 Kb.
bet2/6
Sana31.01.2023
Hajmi53.54 Kb.
#1145144
1   2   3   4   5   6
Bog'liq
AI

2. Bir o'zgaruvchan xususiyatni tanlash
Bir o'zgaruvchan xususiyatni tanlash bir o'zgaruvchan statistik testlar asosida eng yaxshi xususiyatlarni tanlash orqali ishlaydi. Buni taxmin qiluvchiga oldindan ishlov berish bosqichi sifatida ko'rish mumkin. Scikit-learn xususiyat tanlash tartiblarini usulni amalga oshiradigan ob'ektlar sifatida ko'rsatadi transform:

  • SelectKBesttashqari hammasini olib tashlaydikeng yuqori ball xususiyatlari

  • SelectPercentilefunksiyalarning foydalanuvchi tomonidan belgilangan eng yuqori ball foizidan tashqari barchasini olib tashlaydi

  • har bir xususiyat uchun umumiy bir oʻzgaruvchan statistik testlardan foydalanish: notoʻgʻri musbat koʻrsatkich SelectFpr, notoʻgʻri kashfiyot darajasi SelectFdryoki oilaviy xatolik SelectFwe.

  • GenericUnivariateSelectkonfiguratsiya qilinadigan strategiya bilan bir xil xususiyatni tanlash imkonini beradi. Bu giperparametrli qidiruv hisoblagichi yordamida eng yaxshi bir o'zgaruvchan tanlov strategiyasini tanlash imkonini beradi.

Masalan, biz a bajarishimiz mumkin. χ2 Quyidagi kabi faqat ikkita eng yaxshi xususiyatni olish uchun namunalarni sinab ko'ring:
>>> from sklearn.datasets import load_iris
>>> from sklearn.feature_selection import SelectKBest
>>> from sklearn.feature_selection import chi2
>>> X, y = load_iris(return_X_y=True)
>>> X.shape
(150, 4)
>>> X_new = SelectKBest(chi2, k=2).fit_transform(X, y)
>>> X_new.shape
(150, 2)


SelectKBestUshbu ob'ektlar kirish sifatida bir o'zgaruvchan ballar va p-qiymatlarni (yoki faqat va uchun ballarni SelectPercentile) qaytaruvchi ball funksiyasini oladi :

  • Regressiya uchun: r_regressionf_regression,mutual_info_regression

  • Tasniflash uchun: chi2f_classif,mutual_info_classif

F-testiga asoslangan usullar ikkita tasodifiy o'zgaruvchi o'rtasidagi chiziqli bog'liqlik darajasini baholaydi. Boshqa tomondan, o'zaro axborot usullari har qanday statistik bog'liqlikni qo'lga kiritishi mumkin, ammo parametrik bo'lmagani uchun ular aniq baholash uchun ko'proq namunalarni talab qiladi.

Download 53.54 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling