Big data Modelni rejalashtirish bosqichi ? Katta ma’lumotlarni raqamlashtirishning paydo bo'lishi?


Download 110.31 Kb.
bet7/9
Sana17.02.2023
Hajmi110.31 Kb.
#1208483
1   2   3   4   5   6   7   8   9
tartibli
tidyr tom ma'noda R ma'lumotlarini tartibli qiladi. Tozalangan ma’lumotlar juda muhim, chunki buni ta’minlasangiz, asboblar bilan kurashishga kamroq va tahlilingiz ustida ishlashga ko‘proq vaqt sarflaysiz. Ushbu paket ma'lumotlaringizni tartibli formatga aylantirish uchun yig'ish va tarqatish funksiyalaridan foydalangan holda ma'lumotlar to'plamlaringiz tartibini o'zgartirish vositalarini taqdim etadi.
stringr
Tidy oyat oilasining yana bir foydali a'zosi bo'lgan stringr to'plami oddiy iboralar va belgilar qatorlari bilan oson ishlash uchun mo'ljallangan keng qamrovli funktsiyalar to'plamini taqdim etadi.
moylash
Davrlar, davrlar, intervallar bo'yicha sana va vaqtlar bilan ishlashni osonlashtiradigan vositalar. Yog 'olishning eng oson yo'li - butun tizimni o'rnatish emas, balki faqat moylash moyini o'rnatish.



R tilida ma’lumotlar tahlili kutubxonalari
Bugungi kunda ma'lumotlar joy haqidagi barcha ma'lumotlarning ahamiyatini yaratdi, shuningdek, ushbu ma'lumotlar bo'yicha amalga oshirilgan tahlillar, so'rovlar va vizualizatsiya qaror qabul qiluvchilar uchun katta ahamiyatga ega. Makon ma'lumotlarini taqdim etish jarayonida turli dasturlash tillari bilan ishlash mumkin. Geofazoviy ma'lumotlarni tahlil qilish va taqdim etishda R dasturlash va Python tillari foydalanish qulayligi va amaliyligi bilan keng qo'llaniladi. Ushbu tadqiqotda Aksaray viloyatidagi Mamasin to'g'onida to'plangan namunaviy maydonlarning fazoviy ma'lumotlari "Mamasin to'g'onining suv sifatiga ta'sir qiluvchi yerdan foydalanishning GIS va masofadan zondlash ma'lumotlarini baholash va modellashtirish" loyihasi doirasida suv sifati uchun ishlatilgan. TUBITAK bakalavriat talabalarini qo'llab-quvvatlash dasturi tomonidan. Loyiha doirasida birinchi navbatda suv sifatiga ta'sir qiluvchi xususiyatlar va talablar byudjet doirasida baholash yo'li bilan aniqlanadi. Ushbu baholashdan so'ng, namuna hududlarida kenglik, uzunlik, ellipsoidal balandlik, harorat, pH, erigan kislorod, SO4 va o'tkazuvchanlik qiymatlari jadvalga kiritilgan va .csv formatida qayd etilgan. Yozib olingan ma'lumotlar R dasturlash tili yordamida RStudio 1.0.143 interfeysiga uzatiladi. RStudio muhitida ma'lumotlarni uzatgandan so'ng, fazoviy ma'lumotlarni tahlil qilish uchun rgdal, raster, maptools, sp kabi kutubxonalar ishlatiladi. Tegishli kutubxonalar yordamida birinchi navbatda Turkiya va Aksaray viloyatlarining shayfayl fayllari yulka xaritalariga yotqiziladi. Keyin, nuqtaning kenglik uzunlik qiymatlaridan foydalangan holda, namuna nuqtalari geografik koordinatalar tizimida (WGS84) xaritaga joylashtiriladi. Har bir nuqtaning ma'lumotlari atribut ma'lumotlari sifatida mos ravishda nuqtaga qo'shiladi. Nuqtalarning statistik ma'lumotlari jadval kodlash yordamida ingl. Tahlillardan so'ng aylantirilgan ma'lumotlarning diagrammalari tuziladi. Kalit so'zlar: R Programming, RStudio, Spatial Data Analysis 2098

R tilida ma’lumotlar tahlili kutubxonalaridan amaliy masalalarni yechishda foydlanaish
R - bu asosan statistik hisoblash uchun mo'ljallangan dasturiy muhit . Interfeys va struktura algoritmlar va ma'lumotlarni modellashtirish bilan bog'liq vazifalar uchun juda mos keladi. 100 dan ortiq kutubxonalar bilan R turli xil muammolarni hal qilish uchun minglab paketlarni hisoblaydigan eng rivojlangan kutubxona tizimlaridan biri bo'ldi.
Statistik dasturiy ta'minot va ma'lumotlar tahlilini ishlab chiqish uchun statistiklar va ma'lumotlar konchilari orasida mashhur bo'lgan R-ning eskirganligi yoki uni Python bilan taqqoslash haqida munozaralar davom etmoqda. Python va R ikki xil dasturlash tillari bo'lib, ular turli xil ilovalarga ega va shuning uchun ularni texnik jihatdan taqqoslamaslik kerak.
Shunga qaramay, bu erda biz ro'yxatimizni ma'lumotlar bilan ishlash, vizualizatsiya, raqobatbardosh tadqiqotlar va mashinalarni o'rganish kabi turli xil Data Science operatsiyalari bilan boshlaymiz.
Barafsil: https://towardsdatascience.com/top-r-libraries-for-data-science-54f6eba4a78f

Regression tahlil masalasining qo’yilishi

Regression tahlilining asosiy g‘oyasini tavsiflab bering

R-Studio da ma'lumotlar tahlilini bajarish
R-Studio - bu Windows, Mac va Linux uchun ishonchli va doimiy yangilanib turadigan yordamchi dasturlarga ega bo'lgan o'zaro platforma ma'lumotlarini tiklash tizimi. R-Studio for WIndows, R-Studio for Mac va R-Studio for Linux foydalanuvchilarning qulay interfeysi tegishli operatsion tizimda maʼlumotlarni qayta tiklash utilitalarining barcha imkoniyatlaridan samarali foydalanish imkonini beradi. Ishlatilgan operatsion tizimdan qat'i nazar, R-Studio sizga Windows, Mac yoki Linuxda yaratilgan disklar, bo'limlar va fayllarni o'qish, yozish va tiklash imkonini beradi. Masalan, Windows uchun R-Studio Unix qattiq diskidan ma'lumotlarni qayta tiklashga qodir (Linux uchun ext4 yoki BSD uchun UFS), Mac uchun R-Studio Windows qattiq diskidan (FAT/NTFS), R -Studio for Linux - qattiq diskdan Mac diskidan (HFS+) va hokazo.
* Shuni esda tutingki, mahsulotni ro'yxatdan o'tkazish kalitlari bir-birini almashtirib bo'lmaydi va siz aynan kerakli mahsulot uchun ro'yxatdan o'tish kalitini sotib olishingiz kerak - Windows uchun R-Studio, Linux uchun R-Studio yoki Mac uchun R-Studio (masalan, siz ro'yxatdan o'tishdan foydalana olmaysiz. Mac uchun R-Studio-ni ro'yxatdan o'tkazish uchun Windows versiyasi uchun kalit yoki aksincha).

Download 110.31 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling