Bo'sh hujayralar ma'lumotlarni tahlil qilganda noto'g'ri natija berishi mumkin
Download 12.84 Kb.
|
Python Pandas
dropna() Bo'sh hujayralar Bo'sh hujayralar ma'lumotlarni tahlil qilganda noto'g'ri natija berishi mumkin. Qatorlarni olib tashlash Bo'sh hujayralar bilan ishlashning bir usuli - bo'sh katakchalarni o'z ichiga olgan qatorlarni olib tashlashdir. Bu odatda yaxshi, chunki ma'lumotlar to'plamlari juda katta bo'lishi mumkin va bir nechta qatorlarni olib tashlash natijaga katta ta'sir ko'rsatmaydi. fillna()
Bo'sh hujayralar bilan ishlashning yana bir usuli - bu o'rniga yangi qiymat kiritish. Shunday qilib, ba'zi bo'sh katakchalar tufayli butun qatorlarni o'chirishingiz shart emas. Fillna() usuli bizga bo'sh kataklarni qiymat bilan almashtirishga imkon beradi: Faqat belgilangan ustunlar uchun almashtiring Yuqoridagi misol butun ma'lumotlar ramkasidagi barcha bo'sh kataklarni almashtiradi. Faqat bitta ustun uchun bo'sh qiymatlarni almashtirish uchun DataFrame uchun ustun nomini belgilang: df["Calories"].fillna(130, inplace = True) mean() O'rtacha, Median yoki Mode yordamida almashtiring Bo'sh kataklarni almashtirishning keng tarqalgan usuli bu ustunning o'rtacha, median yoki rejim qiymatini hisoblashdir. Pandas belgilangan ustun uchun mos qiymatlarni hisoblash uchun mean() median() va mode() usullaridan foydalanadi: “Fixing Wrong Data” for x in df.index: if df.loc[x, "Duration"]> 120: df.loc[x, "Duration"] = 120 duplicated() df.drop_duplicates(inplace = True) Download 12.84 Kb. Do'stlaringiz bilan baham: |
ma'muriyatiga murojaat qiling