Andijon davlat pedagogika instituti


b hujayralar to'plami sifatida tasavvur qilishingiz mumkin, shuning uchun xesh funktsiyasi bir xil qiymatlar\toifalarga qo'llanilganda, ular b


Download 0.84 Mb.
bet7/8
Sana19.09.2023
Hajmi0.84 Mb.
#1681435
1   2   3   4   5   6   7   8
Bog'liq
Aniq o’lchamli atributlar vektorlari

b hujayralar to'plami sifatida tasavvur qilishingiz mumkin, shuning uchun xesh funktsiyasi bir xil qiymatlar\toifalarga qo'llanilganda, ular b paqiridan bir xil elementga (yoki elementlarning kichik to'plamiga) tayinlanadi. xesh qiymati funktsiyalari. Biz xeshlash sxemasi yordamida kodlangan har bir kategorik atribut uchun kodlangan vektor xususiyatining yakuniy o'lchamiga aylanadigan b qiymatini oldindan belgilashimiz mumkin .
Shunday qilib, agar bizda 1000 dan ortiq alohida toifalar mavjud bo'lsa ham va biz yakuniy xususiyat vektor o'lchami sifatida b = 10 ni o'rnatgan bo'lsak ham , agar biz issiq kodlash sxemasidan foydalansak , chiqish to'plami 1000 ta ikkilik xususiyatga nisbatan faqat 10 xususiyatga ega bo'ladi. Keling , video o'yinlar ma'lumotlar to'plamimizdagi atributni ko'rib chiqaylik.Genre
unique_janr = np.unique(vg_df[['Janr']])
print("Jami oʻyin janrlari:", len(noyob_janrlar))
chop etish(noyob_janrlar) Chiqish
------

Jami oʻyin janrlari: 12
['Harakat' ' Sarguzashtlar' 'Jang' 'Har xil' 'Platforma' 'Jumboq' 'Poyga'
'Rolli o'ynash' 'Otishma' 'Simulyatsiya' 'Sport' 'Strategiya']
Hammasi bo'lib 12 ta video o'yin janri mavjudligini ko'rishimiz mumkin. Agar biz har bir xususiyat uchun bitta issiq kodlash sxemasidan foydalansak Genre , biz 12 ta ikkilik xususiyatga ega bo'lamiz. Buning o'rniga, biz Murmurhash3scikit-learn’sFeatureHasher xesh funksiyasining imzolangan 32-bitli versiyasidan foydalanadigan sinf yordamida ob'ektni xeshlash sxemasidan foydalanamiz.Bu holda biz oxirgi vektor ob'ekt hajmini 6 ga oldindan belgilaymiz.
sklearn.feature_extraction importidan FeatureHasherfh = FeatureHasher(n_features=6, input_type='string')
hash_features = fh.fit_transform(vg_df['Genre'])
hasshed_features = hasshed_features.toarray()
pd.g_mef[' , 'Janr']], pd.DataFrame(hashed_features)],
axis=1).iloc[1:7]

Janr atributi bo'yicha xesh funktsiyasi
Yuqoridagi ma'lumotlarga asoslanib, toifali atribut 
Download 0.84 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling