Big data Modelni rejalashtirish bosqichi ? Katta ma’lumotlarni raqamlashtirishning paydo bo'lishi?


R dasturlash tilida ma’lumotlar tahlili kutubxonalari


Download 110.31 Kb.
bet6/9
Sana17.02.2023
Hajmi110.31 Kb.
#1208483
1   2   3   4   5   6   7   8   9
R dasturlash tilida ma’lumotlar tahlili kutubxonalari.
R - statistika va ma'lumotshunos dasturchilar tomonidan qo'llaniladigan ommabop statistik modellashtirish tili. Bu ma'lumotlarni tahlil qilish va ma'lumotlarni modellashtirish uchun eng ko'p ishlatiladigan turli xil statistik paketlarni qo'llab-quvvatlaydi. Rose Ihaka va Robert Gentleman birgalikda 1995 yilda Oklend Universitetida R ni ishlab chiqdilar.
R-ning CRAN omborida 10 000 dan ortiq to'plam mavjud, bu to'plamlar turli xil statistik dasturlar uchun moslashtirilgan. R juda qiyin statistik til bo'lishi mumkin bo'lsa-da , sog'liqni saqlashdan astronomiya va genomikaga qadar turli sohalarda keng qo'llanilib kelmoqda.
R-ning mashhur kutubxonalari;Ma'lumotlar manipulyatsiyasi uchun dplyr, plyr va ma'lumotlar jadvali.Satrlar uchun stringr.Muntazam va tartibsiz vaqt seriyalari bilan ishlash uchun ZOO.ggvis, lattice va ggplot2 ma'lumotlarini vizualizatsiyasi.

R dasturlash tilida ma’lumotlar tahlili kutubxonalaridan amaliy masalalarni yechishda foydlanaish
Ma'lumotlarni manipulyatsiya qilish;dplyr
dplyr ma'lumotlar to'plamlarini to'plash, umumlashtirish, qayta tartibga solish va birlashtirish uchun muhim funktsiyalarni taqdim etadi. dplyr - bu tezkor ma'lumotlarni manipulyatsiya qilish uchun mo'ljallangan paketimiz. Dplyr bilan ishlash uchun asosiy funktsiyalar filtrlash, tanlash, tartibga solish, mutatsiya qilish va umumlashtirish (guruh bo'yicha)
ma'lumotlar.jadval
data.table - bu R formatidagi ma'lumotlarni asosan saralaydigan data.framesning takomillashtirilgan versiyasidir. Uning yordamida siz quyi to'plam , guruh , yangilash , qo'shilishdata.table, va hokazo kabi ma'lumotlarni boshqarish operatsiyalarini bajarishingiz mumkin , ularning barchasi bir-biriga bog'liqdir. Ushbu bog'liq operatsiyalarni birgalikda saqlash R ga tezroq manipulyatsiya qilish imkonini beradi
o'quvchi
To'rtburchak matn ma'lumotlarini o'qish (readr) csv (vergul bilan ajratilgan qiymatlar), tsv (yorliq bilan ajratilgan qiymatlar), chegara (ajratilgan qiymatlar) va fwf (belgilangan kenglikdagi fayllar) kabi to'rtburchaklar ma'lumotlarni o'qishning tez va qulay usulini taqdim etadi. U yovvoyi tabiatda topilgan ma'lumotlarning ko'p turlarini moslashuvchan tahlil qilish uchun mo'ljallangan, ammo ma'lumotlar kutilmaganda o'zgarganda hamon muvaffaqiyatsizlikka uchraydi. readr asosiy tidyversening bir qismidir, shuning uchun tidyverse o'rnatish ham ishlashi kerak.

Download 110.31 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling