Andijon davlat pedagogika instituti


Download 0.84 Mb.
bet1/8
Sana19.09.2023
Hajmi0.84 Mb.
#1681435
  1   2   3   4   5   6   7   8
Bog'liq
Aniq o’lchamli atributlar vektorlari


O’ZBEKISTON RESPUBLIKASI
OLIY VA O’RTA MAXSUS TA’LIM VAZIRLIGI
ANDIJON DAVLAT PEDAGOGIKA INSTITUTI
Ta'limda axborot texnologiyalari
yo'nalishi magistranti
Xakimova Mohinaning
Mashinali ta'limi fanidan

MUSTAQIL ISHI


Mavzu: Aniq o’lchamli atributlar vektorlari




Andijon 2022
Kategorik ma'lumotlarni tushunish
Xususiyat muhandislik strategiyalariga sho'ng'ishdan oldin ma'lumotlarning toifali ko'rinishini tushunib olaylik. Umuman olganda, tabiatan kategorik bo'lgan har qanday ma'lumotlar atributi ma'lum bir cheklangan toifalar yoki sinflar to'plamiga tegishli diskret qiymatlardir. Ular odatda model tomonidan bashorat qilinadigan atributlar yoki o'zgaruvchilar kontekstida sinflar yoki teglar deb ataladi (odatda javob o'zgaruvchilari sifatida tanilgan). Ushbu diskret qiymatlar matnli yoki raqamli bo'lishi mumkin (yoki hatto tasvirlar kabi tuzilmagan ma'lumotlar!). Kategorik ma'lumotlarning ikkita asosiy klassi mavjud: aniq va tartibli.
Kategorik ma'lumotlarning har qanday aniq atributida ushbu atributning qiymatlari orasida tartiblash tushunchasi mavjud emas. Quyidagi rasmda ko'rsatilganidek, ob-havo toifalarining oddiy misolini ko'rib chiqing. Biz ushbu stsenariyda hech qanday tushuncha yoki tartib tushunchasisiz oltita asosiy sinf yoki toifaga ega ekanligimizni ko'rishimiz mumkin ( Shamol har doim Quyoshdan oldin sodir bo'lmaydi , kam emas va ko'proq Quyosh emas ).

Ob-havo kategorik atribut sifatida

Xuddi shunday, kino, musiqa va video o'yin janrlari, mamlakat nomlari, oziq-ovqat turlari va oshxonalar aniq kategorik atributlarning boshqa misollaridir.


Tartibiy kategorik atributlar o'z qadriyatlari orasida qandaydir tartib ma'nosi yoki tushunchasiga ega. Misol uchun, ko'ylak o'lchamlari uchun quyidagi rasmga qarang. Ko'ylak haqida o'ylash tartibi yoki bu holda "o'lcham" muhimligi aniq ( S - M dan kichik, L dan kichik va hokazo).

Ko'ylak o'lchami tartibli kategorik atribut sifatida
Poyafzal o'lchamlari, ta'lim darajasi va bandlik tartibli toifali atributlarning boshqa misollaridir. Kategorik ma'lumotlarni yaxshi tushungan holda, endi ba'zi bir xususiyat muhandislik strategiyalarini ko'rib chiqaylik.
Kategorik ma'lumotlar bo'yicha xususiyat muhandisligi
Mashinani o'rganishning turli tizimlarida juda ko'p yutuqlarga erishilgan bo'lsa-da, bu matn yorliqlari kabi murakkab kategorik ma'lumotlar turlariga imkon beradi. Odatda, dizayndagi har qanday standart ish jarayoni ushbu kategorik qiymatlardan raqamli belgilarga o'tkazishning ba'zi shakllarini o'z ichiga oladi va keyin ushbu qiymatlarga ba'zi kodlash sxemalarini qo'llashni o'z ichiga oladi . Ishni boshlashdan oldin kerakli narsalarni yuklaymiz.
pandalarni pd sifatida
import qilish numpy np sifatida import qilish
Aniq atributlarni konvertatsiya qilish
Aniq atributlar diskret kategorik qiymatlardan iborat bo'lib, ular orasida kontseptsiya yoki tartib hissi yo'q. Bu erda g'oya ushbu atributlarni quyi oqim kodlari va quvurlar orqali oson tushunilishi mumkin bo'lgan yanada ishonchli raqamli formatga aylantirishdir. Keling, video o'yinlar savdosi bilan bog'liq yangi ma'lumotlar to'plamini ko'rib chiqaylik. Ushbu ma'lumotlar to'plami Kaggle va mening GitHub -da ham mavjudombori.
vg_df = pd.read_csv('datasets/vgsales.csv', encoding='utf-8')
vg_df[['Ism', 'Platforma', 'Yil', 'Janr', 'Nashriyot']].iloc[1 :7]

Video o'yinlar savdosi ma'lumotlar to'plami
GenreYuqoridagi dataframeda ko'rsatilganidek , video o'yin atributiga e'tibor qarataylik. Bu xuddi va kabi aniq kategorik atribut ekanligi aniq.Biz noyob video o'yin janrlari ro'yxatini quyidagi tarzda osongina olishimiz mumkin Publisher.Platform
janrlar = np.unique(vg_df['Genre'])
janrlar Chiqish
------

massiv(['Action', 'Sarguzasht', 'Jang', 'Har xil', 'Platforma',
'Puzl', 'Poyga ', 'Rol o'ynash', 'Shoter', 'Simulyatsiya',
'Sport', 'Strategiya'], dtype=ob'ekt)
Bu bizga 12 xil janrdagi video o'yinlar mavjudligini ko'rsatadi. Endi biz har bir toifani raqamli qiymatga moslashtirish uchun yorliq kodlash sxemasini yaratishimiz mumkin scikit-learn.
sklearn.preprocessing importidan LabelEncodergle = LabelEncoder()
genre_labels = gle.fit_transform(vg_df['Genre'])
genre_mappings = {indeks: indeks uchun yorliq,
enumerate(gle.classes_) ichida yorliq}
genre_mappings

Download 0.84 Mb.

Do'stlaringiz bilan baham:
  1   2   3   4   5   6   7   8




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling