Numpy kutubxonasi muhitini sozlash


Python Dataframe to'plamini yaratishning 3 ta oson yo'li


Download 0.78 Mb.
Pdf ko'rish
bet6/6
Sana10.11.2023
Hajmi0.78 Mb.
#1760960
1   2   3   4   5   6
Bog'liq
2- dedlineMIT

Python Dataframe to'plamini yaratishning 3 ta oson yo'li 
Salom, o'quvchilar! Ushbu maqolada biz turli xilPython Dataframe-ning pastki 
to'plamini yaratish usullariga batafsil to'xtalamiz. 
Xo'sh, keling, boshlaylik! 
Birinchidan, Python Dataframe nima? 
Python Pandas moduli bizga qiymatlarni saqlash uchun ikkita ma'lumotlar 
tuzilmasi, ya'ni Series va Dataframe bilan ta'minlaydi. 
Dataframebu ma'lumotlarni matritsa ko'rinishida saqlaydigan ma'lumotlar 
strukturasidir, ya'ni u satr va ustunlar qiymat ko'rinishidagi ma'lumotlarni o'z 
ichiga oladi. Shunday qilib, u bilan bog'liq holda, biz quyidagi formatlarda uning 
kichik to'plamini yaratishimiz va unga kirishimiz mumkin: 
Qatorlar boʻyicha maʼlumotlarga quyi toʻplam sifatida kirish 
Ustunlar bo'yicha ma'lumotlarni quyi to'plam sifatida oling 
Ba'zi qatorlar va ustunlar ma'lumotlariga quyi to'plam sifatida kirish 
Dataframe va quyi to'plamlar haqida tushunganimizdan so'ng, keling, 
Dataframe-dan kichik to'plam yaratishning turli usullarini tushunamiz. 
Ishlash uchun Dataframe yaratish! 
Dataframening quyi to'plamlarini yaratish uchun biz dataframe yaratishimiz 
kerak. Keling, avvalo buni yo'ldan chiqaraylik: 


import pandas as pd
data = {"Roll-num": [10,20,30,40,50,60,70], "Age":[12,14,13,12,14,13,15], 
"NAME":['John','Camili','Rheana','Joseph','Amanti','Alexa','Siri']} 
block = pd.DataFrame(data) 
print("Original Data frame:\n") 
print(block) 
Chiqish: 
Original Data frame: 
Roll-num Age NAME 
0 10 12 John 
1 20 14 Camili 
2 30 13 Rheana 
3 40 12 Joseph 
4 50 14 Amanti 
5 60 13 Alexa 
6 70 15 Siri 
Bu yerda biz pandas.DataFrame() usuli yordamida ma'lumotlar ramkasini 
yaratdik. Biz ushbu maqola davomida yuqorida yaratilgan ma'lumotlar 
to'plamidan foydalanamiz 
Keling, boshlaymiz! 
1. Loc() funksiyasidan foydalanib, Python dataframening kichik to'plamini 
yarating 
Python loc() funktsiyasi ma'lum bir satr yoki ustunga yoki ikkalasining 
kombinatsiyasiga muvofiq ma'lumotlar ramkasining kichik to'plamini yaratishga 
imkon beradi. 
loc() funksiyasi teglar asosida ishlaydi ya'ni moslashtirilgan kichik to'plamni 
tanlash va yaratish uchun biz uni qator/ustun yorlig'i bilan ta'minlashimiz kerak. 
Sintaksis: 
pandas.dataframe.loc[] 
1-misol: Dataframening ma'lum qatorlari ma'lumotlarini ajratib oling 
block.loc[[0,1,3]] 
Chiqish: 


Quyida ko'rib turganimizdek, biz 0, 1 va 3-qatorning barcha ma'lumotlarini o'z 
ichiga olgan kichik to'plamni yaratdik. 
Roll-num Age NAME 
0 10 
12 
John 
1 20 
14 
Camili 
3 40 
12 
Joseph 
2-misol: Kesish yordamida qatorlar to‘plamini yarating 
block.loc[0:3] 
Bu erda biz loc() funksiyali slicing operatori yordamida indeks 0 dan indeks 3 
gacha bo'lgan barcha qatorlar ma'lumotlarini chiqarib oldik. 
Chiqish: 
Roll-num Age NAME 
0 10 
12 
John 
1 20 
14 
Camili 
2 30 
13 
Rheana 
3 40 
12 
Joseph 
3-misol: Yorliqlar yordamida alohida ustunlar to‘plamini yarating 
block.loc[0:2,['Age','NAME']] 
Chiqish: 
Age 
NAME 
0 12 
John 
1 14 
Camili 
2 13 
Rheana 
Bu erda biz 0 dan 2-qatorgacha bo'lgan ma'lumotlarni o'z ichiga olgan kichik 
to'plamni yaratdik, lekin faqat ba'zi maxsus ustunlarni, masalan, Yosh va 
NAMEni o'z ichiga oladi. 
2. Dataframening kichik to'plamini yaratish uchun Python iloc() funksiyasidan 
foydalanish 
Python iloc() funksiyasi bizga indekslar asosida satr va ustunlardan maʼlum 
qiymatlarni tanlab kichik toʻplam yaratish imkonini beradi. 
Ya'ni, yorliqlarda ishlaydigan loc() funksiyasidan farqli o'laroq, iloc() 
funksiyasi indeks qiymatlarida ishlaydi. Biz satrlar va ustunlar indeks raqamlarini 
ta'minlovchi ma'lumotlardan Python ma'lumotlar ramkasining kichik to'plamini 
tanlashimiz va yaratishimiz mumkin. 


Sintaksis: 
pandas.dataframe.iloc[] 
Misol: 
block.iloc[[0,1,3,6],[0,2]] 
Bu erda biz 0,1,3 va 6-qatorlar ma'lumotlarini hamda 0 va 2-ustun raqamlarini, 
ya'ni Roll-num va NAME ni o'z ichiga olgan kichik to'plamni yaratdik. 
Chiqish: 
Roll-num NAME 
0 10 
John 
1 20 
Camili 
3 40 
Joseph 
6 70 
Siri 
3. Dataframening kichik to'plamini yaratish uchun indekslash operatori 
Oddiy qilib aytganda, biz ma'lumotlarning kichik to'plamini yaratish uchun 
indekslash operatoridan, ya'ni kvadrat qavslardan foydalanishimiz mumkin. 
Sintaksis: 
dataframe[['col1','col2','colN']] 
Misol: 
block[['Age','NAME']] 
Bu erda biz mos ravishda Yosh va NAME ustunlarining barcha ma'lumotlar 
qiymatlarini tanladik. 
Chiqish: 
Age 
NAME 
0 12 
John 
1 14 
Camili 
2 13 
Rheana 
3 12 
Joseph 
4 14 
Amanti 
5 13 
Alexa 
6 15 
Siri 
Xulosa 


Shu bilan biz mavzuni yakuniga yetdik. Agar biron bir savolga duch kelsangiz, 
quyida sharh qoldiring. Python bilan bog'liq ko'proq shunday postlar uchun bizni 
kuzatib boring va shu vaqtgacha, Happy Learning!! :) 
Statistikada va tadqiqot dizaynida indeks kompozit statistik ko'rsatkichdir. 
Boshqacha qilib aytganda, bir nechta ko'rsatkichlarni jamlaydigan murakkab 
o'lchov[1]. 
Indekslar - kompozit ko'rsatkichlar sifatida ham tanilgan. Ular aniq 
kuzatishlarni umumlashtiradi va tartiblaydi[2]. 
Ijtimoiy fanlar va barqarorlik sohasidagi ko'plab ma'lumotlar Gender farqi 
indeksi, Inson taraqqiyoti indeksi yoki Dow Jones sanoat o'rtacha indeksi kabi 
turli indekslarda taqdim etilgan. 2009-yilda Jozef Stiglits, Amartya Sen va Jean-
Paul Fitoussi tomonidan yozilgan "Iqtisodiy samaradorlik va ijtimoiy 
taraqqiyotni o'lchash bo'yicha komissiyaning hisoboti" shuni ko'rsatadiki[3], bu 
chora-tadbirlar so'nggi yillarda uchta omil tufayli keskin o'sishni boshdan 
kechirgan. Mos keladigan omillar: 
savodxonlik darajasini oshirish (shu jumladan statistik) 
zamonaviy jamiyatlar va iqtisodiyotlarning murakkabligi ortishi 
axborot texnologiyalarining keng tarqalganligi. 
Erl Babbining so'zlariga ko'ra, indeksdagi elementlar odatda teng darajada 
tortiladi, agar bunga qarshi biron bir sabab bo'lmasa (masalan, agar ikkita element 
o'zgaruvchining deyarli bir xil tomonini aks ettirsa, ularning har birining vazni 
0,5 bo'lishi mumkin)[4]. 
Xuddi shu muallifga ko'ra[5], buyumlarni qurish to'rt bosqichni o'z ichiga 
oladi. Birinchidan, ob'ektlarni ularning mazmuni haqiqiyligi, bir o'lchovliligi, 
o'lchovni o'lchash kerak bo'lgan o'ziga xoslik darajasi va ularning farqlari miqdori 
asosida tanlash kerak. Ob'ektlar bir-biri bilan empirik bog'liq bo'lishi kerak, bu 
ularning ko'p o'lchovli munosabatlarini tekshirishning ikkinchi bosqichiga olib 
keladi. Uchinchidan, indekslar ballari ishlab chiqilgan bo'lib, bu ularning ballar 
diapazonini va ob'ektlar uchun og'irliklarini aniqlashni o'z ichiga oladi. Nihoyat, 
indekslar tasdiqlanishi kerak, bu ularning qurilishida foydalanilmagan 
o'lchanadigan o'zgaruvchiga tegishli ko'rsatkichlarni bashorat qila oladimi yoki 
yo'qligini tekshirishni o'z ichiga oladi[5]. 
2008-yilda OECD va Yevropa Komissiyasining Qo'shma tadqiqot markazi 
tomonidan qo'shma ko'rsatkichlarni (CI) qurish bo'yicha qo'llanma nashr 
etilgan[6]. OECDning yuqori darajadagi statistika qo'mitasi tomonidan rasman 
ma'qullangan qo'llanma indeksni ishlab chiqish uchun o'nta rekursiv qadamni 
tavsiflaydi[7]: 
1-qadam: Nazariy asos 
2-qadam: Ma'lumotlarni tanlash 
3-qadam: Yetishmayotgan ma'lumotlarni hisoblash 
4-qadam: Ko'p o'lchovli tahlil 
5-qadam: Normalizatsiya 
6-qadam: Og'irlik 


7-qadam: Ko'rsatkichlarni umumlashtirish 
8-qadam: Sezuvchanlikni tahlil qilish 
9-qadam: Boshqa chora-tadbirlar bilan bog'lanish 
10-qadam: Vizualizatsiya 
Ro'yxatda ta'kidlanganidek, kompozit indikatorni yaratish uchun ko'plab 
modellashtirish tanlovlari talab qilinadi, bu esa ulardan foydalanishni munozarali 
qiladi[6]. Og'irliklarni belgilash va tasdiqlashning nozik masalasi[8], muhokama 
qilinadi. Kompozit ko'rsatkichlarning tabiatini sotsiologik o'qishni Paul-Marie 
Boulanger taklif qiladi, u ushbu chora-tadbirlarni uchta harakatning kesishmasida 
ko'radi[9]: 
tajribani demokratlashtirish, yagona mutaxassislar tomonidan taqdim etilishi 
mumkin bo'lgan ijtimoiy va ekologik muammolarni hal qilish uchun ko'proq 
bilim zarurligi haqidagi tushuncha - bu fikrlash yo'nalishi postnormal fan 
tomonidan ishlab chiqilgan kengaytirilgan tengdoshlar hamjamiyatining 
kontseptsiyasi bilan bog'liq. 
John Dewey kabi pragmatistlar faoliyati bilan qayta bog'lanishi mumkin 
bo'lgan ijtimoiy kashfiyotlar jarayoni orqali yangi jamoatchilikni yaratishga 
turtki. 
Charlz Sanders Peircening semiotikasi; Shunday qilib, CI shunchaki belgi yoki 
raqam emas, balki harakat yoki xatti-harakatni taklif qiladi. 
Boulangerning keyingi ishi taraqqiyotning turli o'lchovlari qanday qabul 
qilinishi yoki olinmasligini o'rganish uchun Niklas Luhmanning ijtimoiy tizim 
nazariyalari asosida kompozit ko'rsatkichlarni tahlil qiladi 


Foydalanilgan adabiyotlar: 
• 
Python for Data Analysis – Wes McKinney 
• 
NumPy 1.5 – Ivan Irdis 
• 
SciPy and NumPy 
• 
https://numpy.org/doc/stable/user/absolute_beginners.html
 
• 
https://havola.uz/e/numpy
 
https://community.uzbekcoders.uz/post/ma-lumotlar-tahlili-
data-
 
analysis-uchun-python-dasturlash-tili-distributorl--
5ee9f044d73750310952c31a
 
• 
https://techcult.com/how-to-install-numpy/
 
• 
https://www.youtube.com/watch?v=I-E09N5-lzk
 

Download 0.78 Mb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling