Andijon davlat pedagogika instituti
m alohida yorliqli toifali xususiyatga qo'llanilganda, biz m - 1
Download 0.84 Mb.
|
Aniq o’lchamli atributlar vektorlari
- Bu sahifa navigatsiya:
- {0, 1,…, m-1} 0
m alohida yorliqli toifali xususiyatga qo'llanilganda, biz m - 1 ikkilik xususiyatlarni olamiz. Shunday qilib, kategorik o'zgaruvchining har bir qiymati m - 1 o'lchamdagi vektorga aylantiriladi . Qo'shimcha xususiyat butunlay e'tiborga olinmaydi va shuning uchun toifa qiymatlari {0, 1,…, m-1} 0 yoki m oralig'ida bo'lsa - ob'ektning birinchi ustuni olib tashlanadi va tegishli toifadagi qiymatlar odatda barcha nollarning vektori (0) bilan ifodalanadi . Keling, Pokemonda qo'g'irchoq kodlash sxemasini qo'llashga harakat qilaylik.Generation birinchi darajali ikkilik kodli elementni olib tashlash ( Gen 1).
gen_dummy_features = pd.get_dummies(poke_df['Generation'], drop_first=True) pd.concat([poke_df[['Name', 'Generation']], gen_dummy_features], eksen =1).iloc[4:10] Pokemon g uchun qo'g'irchoq funktsiyalarieneration Agar xohlasangiz, oxirgi darajadagi ikkilik kodlash funktsiyasidan ( Gen 6) quyidagini ham o'chirib qo'yishingiz mumkin. gen_onehot_features = pd.get_dummies(poke_df['Generation']) gen_dummy_features = gen_onehot_features.iloc[:,:-1] pd.concat([poke_df[['Name', 'Generation']], gen_dummy_features =1) .iloc[4:10] Pokemon g uchun qo'g'irchoq funktsiyalarieneration Yuqoridagi raqamlarga asoslanib, etishmayotgan element bilan bog'liq toifalar biz ilgari muhokama qilganimizdek , nol ( 0) vektori sifatida ifodalanganligi aniq . Effektlarni kodlash sxemasi Effektni kodlash sxemasi aslida qo'g'irchoq kodlash sxemasiga juda o'xshaydi, bundan tashqari kodlangan xususiyat yoki xususiyat vektorini kodlash jarayonida qo'g'irchoq kodlash sxemasidagi barcha 0 larni ifodalovchi toifa qiymatlari effekt kodlash sxemasida -1 ga almashtiriladi . Bu quyidagi misolda aniqroq bo'ladi. gen_onehot_features = pd.get_dummies(poke_df['Generation']) gen_effect_features = gen_onehot_features.iloc[:,:-1] gen_effect_features.loc[np.all(gen_effect_features == 0, eksa=1)] - pd.concat([poke_df[['Ism', 'Avlod']], gen_effekt_features], eksa=1).iloc[4:10] Pokémon g da kodlangan effektlareneration Yuqoridagi ma'lumotlar shuni ko'rsatadiki, Generation6 ga tegishli Pokemon endi qo'g'irchoq kodlashda nolga nisbatan -1 qiymat vektori bilan ifodalanadi. Axlat qutilarini hisoblash sxemasi Biz hozirgacha muhokama qilgan kodlash sxemalari umuman kategorik ma'lumotlar bilan juda yaxshi ishlaydi, lekin ular har qanday xususiyatdagi alohida toifalar soni juda ko'p bo'lganda muammolarni keltirib chiqara boshlaydi. Har qanday kategoriyali Download 0.84 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling