Samarqand davlat universiteti intellektual tizimlar va axborot texnologiyalari fakulteti


Pandas yordamida ma'lumotlarni ajratib olish


Download 0.86 Mb.
bet3/9
Sana23.01.2023
Hajmi0.86 Mb.
#1112602
1   2   3   4   5   6   7   8   9
Bog'liq
407-guruh.Big data amaliy topshiriq

5.Pandas yordamida ma'lumotlarni ajratib olish
Python Pandas aloqador yoki etiketli ma'lumotlar uchun ishlatiladi va bunday ma'lumotlar va vaqt seriyalarini boshqarish uchun turli xil ma'lumotlar tuzilmalarini taqdim etadi. Bu kutubxona NumPy kutubxonasi ustiga qurilgan. Ushbu modul odatda import qilinadi.
6.Pandaslarni pd sifatida import qilish
Bu erda pd Pandalarga taxallus deb ataladi. Biroq, taxallus yordamida kutubxonani import qilish shart emas, u har safar usul yoki xususiyat chaqirilganda kamroq miqdor kodini yozishga yordam beradi. Pandalar odatda ma'lumotlarni manipulyatsiya qilish uchun ikkita ma'lumotlar tuzilmasini taqdim etadilar, ular:

  1. Seriya

  2. Dataframe

  3. Seriya:

Pandas Series - bu har qanday turdagi ma'lumotlarni (butun son, satr, float, python ob'ektlari va boshqalar) saqlashga qodir bo'lgan bir o'lchovli etiketli massiv. Eksa teglari birgalikda indekslar deb ataladi. Pandalar seriyasi Excel varaqidagi ustundan boshqa narsa emas. Yorliqlar noyob boʻlishi shart emas, lekin xeshlanadigan turdagi boʻlishi kerak. Ob'ekt butun son va tegga asoslangan indekslashni qo'llab-quvvatlaydi va indeks bilan bog'liq operatsiyalarni bajarish uchun ko'plab usullarni taqdim etadi.

U Series () funktsiyasidan foydalanib, ma'lumotlar to'plamini SQL, ma'lumotlar bazasi, CSV fayllari, Excel fayllari va boshqalar kabi mavjud xotiradan yoki ro'yxatlar, lug'atlar va boshqalar kabi ma'lumotlar tuzilmalaridan yuklash orqali yaratilishi mumkin.
import pandas as pd
import numpy as np
ser = pd.Series()
print(ser)
data = np.array(['g', 'e', 'e', 'k', 's'])
ser = pd.Series(data)
print(ser)
Natija:

7.Dataframe
Pandas DataFrame bu ikki oʻlchamli oʻlchamli oʻzgaruvchan, yorliqlangan oʻqlari (satrlar va ustunlar) bilan potentsial heterojen jadvalli maʼlumotlar strukturasidir. Ma'lumotlar ramkasi - bu ikki o'lchovli ma'lumotlar strukturasi, ya'ni ma'lumotlar satr va ustunlarda jadval shaklida tekislanadi. Pandas DataFrame uchta asosiy komponentdan, ma'lumotlar, qatorlar va ustunlardan iborat.

U Dataframe() usuli yordamida yaratilishi mumkin va xuddi seriyalar kabi turli fayl turlari va ma'lumotlar tuzilmalaridan ham bo'lishi mumkin.

Download 0.86 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling