Andijon davlat pedagogika instituti


Download 0.84 Mb.
bet2/8
Sana19.09.2023
Hajmi0.84 Mb.
#1681435
1   2   3   4   5   6   7   8
Bog'liq
Aniq o’lchamli atributlar vektorlari

Chiqish
------
{ 0: “Harakat”, 1: “Sarguzasht”, 2: “Jang”, 3: “Xar xil”,
4: “Platforma”, 5: “Jamroq”, 6: “Poyga”, 7: “Rol o‘ynash”,
8: “O‘q otish”, 9: “Simulyatsiya”, 10: “Sport”, 11: “Strategiya”}
Shunday qilib, xaritalash sxemasi yaratildi, unda har bir janr qiymati LabelEncoderob'ekt yordamida raqamga o'tkaziladi.O'zgartirilgan teglar biz ma'lumotlar ramkamizga yozishimiz mumkin glebo'lgan qiymatda saqlanadi.genre_labels
vg_df['GenreLabel'] = genre_labels
vg_df[['Ism', 'Platforma', 'Yil', 'Janr', 'GenreLabel']].iloc[1:7]

Kodlangan teglar bilan video o'yin janrlari
Ushbu teglar bevosita tez-tez ishlatilishi mumkin, ayniqsa tuzilmalar bilan, masalan, scikit-learnagar siz ularni bashoratli javob o'zgaruvchilari sifatida ishlatishni rejalashtirmoqchi bo'lsangiz, lekin yuqorida muhokama qilinganidek, ularni xususiyat sifatida ishlatishdan oldin ularni kodlashning qo'shimcha bosqichi kerak bo'ladi.
Tartibiy atributlarni konvertatsiya qilish
Tartibiy atributlar - bu qiymatlar o'rtasida tartib hissi bo'lgan kategorik atributlar. Keling , ushbu seriyaning 1 -qismida foydalangan Pokemon ma'lumotlar to'plamini ko'rib chiqaylik. Keling, atributga ko'proq e'tibor qarataylik .Generation
poke_df = pd.read_csv('datasets/Pokemon.csv', encoding='utf-8')
poke_df = poke_df.sample(tasodifiy_state=1,
frac=1).reset_index(drop=True)np.unique(poke_df[' Avlod']) Chiqish
------

massivi(['Gen 1', 'Gen 2', 'Gen 3', 'Gen 4', 'Gen 5', 'Gen 6'],
dtype=object)
Yuqoridagi ma'lumotlarga asoslanib, biz jami 6 avlod mavjudligini va har bir Pokemon video o'yinlarga asoslangan (ular chiqarilganda) ma'lum bir avlodga tegishli ekanligini ko'rishimiz mumkin, shuningdek, teleseriallar shunga o'xshash vaqt jadvaliga amal qiladi. Bu atribut odatda ordinaldir (bu yerda domen bilimi talab qilinadi), chunki 1-avlodga mansub Pokemonlarning aksariyati bir marta 2-avlodga qaraganda video oʻyinlar va telekoʻrsatuvlarda ilgari kiritilgan . Muxlislar har bir avlodning mashhur Pokemonlarini eslab qolish uchun quyidagi rasmga murojaat qilishlari mumkin (fikrlar muxlisdan muxlisga farq qilishi mumkin!).

Avlod va turga asoslangan mashhur pokemon (manba: https://www.reddit.com/r/pokemon/comments/2s2upx/heres_my_favorite_pokemon_by_type_and_gen_chart )
Demak, ular orasida tartib hissi bor. Umuman olganda, ushbu funktsiyalarni avtomatik tartib asosida raqamli ko'rinishlarga xaritalash va aylantirish uchun universal modul yoki funksiya mavjud emas. Shunday qilib, biz o'zimizning kodlash / ko'rsatish sxemasidan foydalanishimiz mumkin.
gen_ord_map = {'Gen 1': 1, 'Gen 2': 2, 'Gen 3': 3,
'Gen 4': 4, 'Gen 5': 5, 'Gen 6': 6}poke_df['GenerationLabel' ] = poke_df['Generation'].map(gen_ord_map)
poke_df[['Name', 'Generation', 'GenerationLabel']].iloc[4:10]

Pokemon avlodini kodlash
Yuqoridagi koddan ko'rinib turibdiki map(…), funktsiyasi pandasushbu tartibli xususiyatni o'zgartirishda juda foydali.
Kategorik atributlarni kodlash
Yuqorida aytib o'tganimizni eslayotgan bo'lsangiz, odatda toifali ma'lumotlar uchun xususiyatni ishlab chiqish biz oldingi bo'limda tasvirlangan transformatsiya jarayonini va majburiy kodlash jarayonini o'z ichiga oladi, bu erda biz ma'lum bir kategoriyadagi har bir toifa\qiymat uchun soxta o'zgaruvchilar yoki xususiyatlarni yaratish uchun maxsus kodlash sxemalarini qo'llaymiz. xususiyat.
Sizni qiziqtirgandirsiz, biz avvalgi bo'limda toifalarni raqamli belgilarga aylantirdik, nega endi bu kerak? Sababi juda oddiy. Video o'yin janrlarini hisobga oladigan bo'lsak, agar biz atributni GenreLabelmashinani o'rganish modelidagi xususiyat sifatida to'g'ridan-to'g'ri oziqlantirsak, u 10 ( Sport ) 6 dan katta ( Poyga ) fikrlash xususiyatining uzluksiz raqamli qiymati sifatida qaraladi, ammo bu ma'nosiz, chunki Sport janri, albatta, poygadan ko'p va kam emasular tubdan farq qiladigan qiymatlar yoki toifalar bo'lib, ularni to'g'ridan-to'g'ri taqqoslab bo'lmaydi. Shuning uchun bizga kodlash sxemalarining qo'shimcha qatlami kerak bo'ladi, unda har bir atribut uchun barcha alohida toifalardan har bir noyob qiymat yoki toifa uchun soxta ob'ektlar yaratiladi.
Issiq kodlash sxemasi

Download 0.84 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling