Andijon davlat pedagogika instituti


m alohida yorliqli toifali xususiyatga qo'llanilganda, biz m - 1


Download 0.84 Mb.
bet5/8
Sana19.09.2023
Hajmi0.84 Mb.
#1681435
1   2   3   4   5   6   7   8
Bog'liq
Aniq o’lchamli atributlar vektorlari

m alohida yorliqli toifali xususiyatga qo'llanilganda, biz m - 1 ikkilik xususiyatlarni olamiz. Shunday qilib, kategorik o'zgaruvchining har bir qiymati m - 1 o'lchamdagi vektorga aylantiriladi . Qo'shimcha xususiyat butunlay e'tiborga olinmaydi va shuning uchun toifa qiymatlari {0, 1,…, m-1} 0 yoki m oralig'ida bo'lsa - ob'ektning birinchi ustuni olib tashlanadi va tegishli toifadagi qiymatlar odatda barcha nollarning vektori (0) bilan ifodalanadi . Keling, Pokemonda qo'g'irchoq kodlash sxemasini qo'llashga harakat qilaylik.Generation birinchi darajali ikkilik kodli elementni olib tashlash ( Gen 1).
gen_dummy_features = pd.get_dummies(poke_df['Generation'],
drop_first=True)
pd.concat([poke_df[['Name', 'Generation']], gen_dummy_features], eksen
=1).iloc[4:10]

Pokemon g uchun qo'g'irchoq funktsiyalarieneration
Agar xohlasangiz, oxirgi darajadagi ikkilik kodlash funktsiyasidan ( Gen 6) quyidagini ham o'chirib qo'yishingiz mumkin.
gen_onehot_features = pd.get_dummies(poke_df['Generation'])
gen_dummy_features = gen_onehot_features.iloc[:,:-1]
pd.concat([poke_df[['Name', 'Generation']], gen_dummy_features
=1) .iloc[4:10]

Pokemon g uchun qo'g'irchoq funktsiyalarieneration
Yuqoridagi raqamlarga asoslanib, etishmayotgan element bilan bog'liq toifalar biz ilgari muhokama qilganimizdek , nol ( 0) vektori sifatida ifodalanganligi aniq .
Effektlarni kodlash sxemasi
Effektni kodlash sxemasi aslida qo'g'irchoq kodlash sxemasiga juda o'xshaydi, bundan tashqari kodlangan xususiyat yoki xususiyat vektorini kodlash jarayonida qo'g'irchoq kodlash sxemasidagi barcha 0 larni ifodalovchi toifa qiymatlari effekt kodlash sxemasida -1 ga almashtiriladi . Bu quyidagi misolda aniqroq bo'ladi.
gen_onehot_features = pd.get_dummies(poke_df['Generation'])
gen_effect_features = gen_onehot_features.iloc[:,:-1]
gen_effect_features.loc[np.all(gen_effect_features == 0,
eksa=1)] -
pd.concat([poke_df[['Ism', 'Avlod']], gen_effekt_features],
eksa=1).iloc[4:10]

Pokémon g da kodlangan effektlareneration
Yuqoridagi ma'lumotlar shuni ko'rsatadiki, Generation6 ga tegishli Pokemon endi qo'g'irchoq kodlashda nolga nisbatan -1 qiymat vektori bilan ifodalanadi.
Axlat qutilarini hisoblash sxemasi
Biz hozirgacha muhokama qilgan kodlash sxemalari umuman kategorik ma'lumotlar bilan juda yaxshi ishlaydi, lekin ular har qanday xususiyatdagi alohida toifalar soni juda ko'p bo'lganda muammolarni keltirib chiqara boshlaydi. Har qanday kategoriyali 
Download 0.84 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling