Bo'sh hujayralar ma'lumotlarni tahlil qilganda noto'g'ri natija berishi mumkin


Download 12.84 Kb.
Sana16.06.2023
Hajmi12.84 Kb.
#1500972
Bog'liq
Python Pandas


dropna()
Bo'sh hujayralar
Bo'sh hujayralar ma'lumotlarni tahlil qilganda noto'g'ri natija berishi mumkin.

Qatorlarni olib tashlash


Bo'sh hujayralar bilan ishlashning bir usuli - bo'sh katakchalarni o'z ichiga olgan qatorlarni olib tashlashdir.

Bu odatda yaxshi, chunki ma'lumotlar to'plamlari juda katta bo'lishi mumkin va bir nechta qatorlarni olib tashlash natijaga katta ta'sir ko'rsatmaydi.


fillna()
Bo'sh qiymatlarni almashtiring


Bo'sh hujayralar bilan ishlashning yana bir usuli - bu o'rniga yangi qiymat kiritish.

Shunday qilib, ba'zi bo'sh katakchalar tufayli butun qatorlarni o'chirishingiz shart emas.


Fillna() usuli bizga bo'sh kataklarni qiymat bilan almashtirishga imkon beradi:


Faqat belgilangan ustunlar uchun almashtiring


Yuqoridagi misol butun ma'lumotlar ramkasidagi barcha bo'sh kataklarni almashtiradi.

Faqat bitta ustun uchun bo'sh qiymatlarni almashtirish uchun DataFrame uchun ustun nomini belgilang:


df["Calories"].fillna(130, inplace = True)


mean()

O'rtacha, Median yoki Mode yordamida almashtiring


Bo'sh kataklarni almashtirishning keng tarqalgan usuli bu ustunning o'rtacha, median yoki rejim qiymatini hisoblashdir.

Pandas belgilangan ustun uchun mos qiymatlarni hisoblash uchun mean() median() va mode() usullaridan foydalanadi:


“Fixing Wrong Data”


for x in df.index:
if df.loc[x, "Duration"]> 120:
df.loc[x, "Duration"] = 120
duplicated()
df.drop_duplicates(inplace = True)
Download 12.84 Kb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling