2. Ma'lumotlaringiz bilan tanishish


Download 282.17 Kb.
Pdf ko'rish
bet4/5
Sana18.03.2023
Hajmi282.17 Kb.
#1282842
1   2   3   4   5
Bog'liq
muhriddin (1)

harorat bo'yicha reytingini olamiz. Bundan tashqari, biz qiymatlar orasidagi farqni miqdoriy jihatdan aniqlashimiz
mumkin. Misol uchun, 20 ° S harorat 15 ° S haroratdan besh daraja yuqori. Taqvim sanalari yana bir misol.
Masalan, 2002 va 2010 yillar orasidagi farq sakkiz yil.
Nisbatan masshtabli atributlar
koordinatalar (masalan, uylarni klasterlashda) va pul miqdori (masalan, 100 dollar bilan siz 1 dollarga qaraganda
100 barobar boysiz).
Selsiy va Farengeytdagi haroratlar haqiqiy nol nuqtasiga ega emas, ya'ni 0 ° C ham, 0 ° F ham "harorat yo'q"
degan ma'noni anglatmaydi. (Masalan, Selsiy shkalasi boÿyicha, oÿlchov birligi erish harorati va atmosfera
bosimidagi suvning qaynash harorati oÿrtasidagi farqning 1/100 qismidir.) Garchi biz farqni hisoblashimiz mumkin.
Taqdimotimizda biz atributlarni nominal, ikkilik, tartibli va sonli turlarga ajratdik. Atribut turlarini tartibga solishning
ko'plab usullari mavjud. Turlar bir-birini istisno qilmaydi.
harorat qiymatlari o'rtasida biz bir harorat qiymatini boshqasining ko'paytmasi sifatida gapira olmaymiz . Haqiqiy
nol bo'lmasa, masalan, 10 ° C 5 ° C dan ikki baravar issiq deb ayta olmaymiz. Ya'ni, biz nisbatlar bo'yicha
qadriyatlar haqida gapira olmaymiz. Xuddi shunday, kalendar sanalari uchun haqiqiy nol nuqtasi yo'q. (0 yil vaqt
boshiga to'g'ri kelmaydi.)
Mashinani o'rganish sohasida ishlab chiqilgan tasniflash algoritmlari ko'pincha atributlar haqida diskret yoki
uzluksiz deb gapiradi. Har bir tur boshqacha tarzda qayta ishlanishi mumkin. Diskret atribut chekli yoki sanab
bo'ladigan cheksiz qiymatlar to'plamiga ega, ular bo'lishi mumkin yoki bo'lmasligi mumkin.
Bu bizni nisbat miqyosidagi atributlarga olib keladi, ular uchun haqiqiy nol nuqtasi chiqadi.
[MA'LUMOTLARNI QAZIB OLISH: TUSHUNCHALAR VA TEXNIKALAR 3-NASHI]
Intervalli o'lchovli atributlar sonli bo'lganligi sababli, biz markaziy tendentsiyaning median va rejim o'lchovlaridan
tashqari, ularning o'rtacha qiymatini hisoblashimiz mumkin.
Intervalli masshtabli atributlar
qiymatlar reytingini taqdim etgan holda, bunday atributlar qiymatlar orasidagi farqni solishtirish va miqdoriy
aniqlash imkonini beradi .
Tselsiy va Farengeytdagi haroratlardan farqli o'laroq, Kelvin (K) harorat shkalasi haqiqiy nol nuqtasi hisoblanadi
(0 ° K = -273,15 ° C): Bu moddani tashkil etuvchi zarralar nol kinetik energiyaga ega bo'lgan nuqtadir. Nisbatan
o'lchovli atributlarning boshqa misollariga tajriba_yillari (masalan, ob'ektlar xodimlar) va so'zlar_soni (masalan,
ob'ektlar hujjatlar) kabi hisoblash atributlarini o'z ichiga oladi . Qo'shimcha misollar orasida vazn, balandlik,
kenglik va uzunlikni o'lchash uchun atributlar mavjud
Nisbatan masshtabli atribut nol nuqtasiga ega bo'lgan raqamli atributdir. Ya'ni, agar o'lchov nisbatli bo'lsa, biz
qiymat haqida boshqa qiymatning ko'pligi (yoki nisbati) sifatida gapirishimiz mumkin. Bundan tashqari, qiymatlar
tartiblangan va biz qiymatlar orasidagi farqni, shuningdek, o'rtacha, median va rejimni hisoblashimiz mumkin.
Harorat atributi intervalli o'lchovdir . Aytaylik, bizda tashqi harorat bor
45
Jiawei Xan
2.1.6. Diskret va uzluksiz atributlar
Nisbatan masshtabli atributlar
Machine Translated by Google


Jiawei Xan
46
2.2.1. Markaziy tendentsiyani o'lchash: o'rtacha, median va rejim
2.2. Ma'lumotlarning asosiy statistik tavsiflari
Ma'lumotni oldindan qayta ishlash muvaffaqiyatli bo'lishi uchun ma'lumotlaringiz haqida umumiy tasavvurga ega bo'lishingiz
kerak. Asosiy statistik tavsiflar ma'lumotlarning xususiyatlarini aniqlash va qaysi ma'lumotlar qiymatlari shovqin yoki chetga
chiqish sifatida ko'rib chiqilishi kerakligini ta'kidlash uchun ishlatilishi mumkin.
Ma'lumotlar to'plamining "markazi" ning eng keng tarqalgan va samarali raqamli o'lchovi (arifmetik) o'rtacha hisoblanadi. N
qiymat yoki kuzatishlar toÿplami boÿlsin , masalan, ish haqi kabi X raqamli atribut uchun . Ushbu qiymatlar to'plamining
o'rtacha qiymati
Nihoyat, biz ma'lumotlarimizni vizual tekshirish uchun asosiy statistik tavsiflarning ko'plab grafik displeylaridan foydalanishimiz
mumkin
(2.2.3-bo'lim).
Ko'pgina statistik yoki grafik ma'lumotlarni taqdim etish dasturiy paketlari shtrixli diagrammalar,
doiraviy diagrammalar va chiziqli grafiklarni o'z ichiga oladi. Ma'lumotlar sarhisoblari va taqsimotlarining boshqa mashhur
ko'rinishlariga kvantli chizmalar, kvant-kvantillar, gistogrammalar va tarqalish chizmalari kiradi.
(2.1)
[MA'LUMOTLARNI QAZIB OLISH: TUSHUNCHALAR VA TEXNIKALAR 3-NASHI]
Ma'lumotlar to'plamimizning markaziy tendentsiyasini baholashdan tashqari, biz ma'lumotlarning tarqalishi haqida ham

Download 282.17 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling