2. Ma'lumotlaringiz bilan tanishish
Download 282.17 Kb. Pdf ko'rish
|
muhriddin (1)
harorat bo'yicha reytingini olamiz. Bundan tashqari, biz qiymatlar orasidagi farqni miqdoriy jihatdan aniqlashimiz
mumkin. Misol uchun, 20 ° S harorat 15 ° S haroratdan besh daraja yuqori. Taqvim sanalari yana bir misol. Masalan, 2002 va 2010 yillar orasidagi farq sakkiz yil. Nisbatan masshtabli atributlar koordinatalar (masalan, uylarni klasterlashda) va pul miqdori (masalan, 100 dollar bilan siz 1 dollarga qaraganda 100 barobar boysiz). Selsiy va Farengeytdagi haroratlar haqiqiy nol nuqtasiga ega emas, ya'ni 0 ° C ham, 0 ° F ham "harorat yo'q" degan ma'noni anglatmaydi. (Masalan, Selsiy shkalasi boÿyicha, oÿlchov birligi erish harorati va atmosfera bosimidagi suvning qaynash harorati oÿrtasidagi farqning 1/100 qismidir.) Garchi biz farqni hisoblashimiz mumkin. Taqdimotimizda biz atributlarni nominal, ikkilik, tartibli va sonli turlarga ajratdik. Atribut turlarini tartibga solishning ko'plab usullari mavjud. Turlar bir-birini istisno qilmaydi. harorat qiymatlari o'rtasida biz bir harorat qiymatini boshqasining ko'paytmasi sifatida gapira olmaymiz . Haqiqiy nol bo'lmasa, masalan, 10 ° C 5 ° C dan ikki baravar issiq deb ayta olmaymiz. Ya'ni, biz nisbatlar bo'yicha qadriyatlar haqida gapira olmaymiz. Xuddi shunday, kalendar sanalari uchun haqiqiy nol nuqtasi yo'q. (0 yil vaqt boshiga to'g'ri kelmaydi.) Mashinani o'rganish sohasida ishlab chiqilgan tasniflash algoritmlari ko'pincha atributlar haqida diskret yoki uzluksiz deb gapiradi. Har bir tur boshqacha tarzda qayta ishlanishi mumkin. Diskret atribut chekli yoki sanab bo'ladigan cheksiz qiymatlar to'plamiga ega, ular bo'lishi mumkin yoki bo'lmasligi mumkin. Bu bizni nisbat miqyosidagi atributlarga olib keladi, ular uchun haqiqiy nol nuqtasi chiqadi. [MA'LUMOTLARNI QAZIB OLISH: TUSHUNCHALAR VA TEXNIKALAR 3-NASHI] Intervalli o'lchovli atributlar sonli bo'lganligi sababli, biz markaziy tendentsiyaning median va rejim o'lchovlaridan tashqari, ularning o'rtacha qiymatini hisoblashimiz mumkin. Intervalli masshtabli atributlar qiymatlar reytingini taqdim etgan holda, bunday atributlar qiymatlar orasidagi farqni solishtirish va miqdoriy aniqlash imkonini beradi . Tselsiy va Farengeytdagi haroratlardan farqli o'laroq, Kelvin (K) harorat shkalasi haqiqiy nol nuqtasi hisoblanadi (0 ° K = -273,15 ° C): Bu moddani tashkil etuvchi zarralar nol kinetik energiyaga ega bo'lgan nuqtadir. Nisbatan o'lchovli atributlarning boshqa misollariga tajriba_yillari (masalan, ob'ektlar xodimlar) va so'zlar_soni (masalan, ob'ektlar hujjatlar) kabi hisoblash atributlarini o'z ichiga oladi . Qo'shimcha misollar orasida vazn, balandlik, kenglik va uzunlikni o'lchash uchun atributlar mavjud Nisbatan masshtabli atribut nol nuqtasiga ega bo'lgan raqamli atributdir. Ya'ni, agar o'lchov nisbatli bo'lsa, biz qiymat haqida boshqa qiymatning ko'pligi (yoki nisbati) sifatida gapirishimiz mumkin. Bundan tashqari, qiymatlar tartiblangan va biz qiymatlar orasidagi farqni, shuningdek, o'rtacha, median va rejimni hisoblashimiz mumkin. Harorat atributi intervalli o'lchovdir . Aytaylik, bizda tashqi harorat bor 45 Jiawei Xan 2.1.6. Diskret va uzluksiz atributlar Nisbatan masshtabli atributlar Machine Translated by Google Jiawei Xan 46 2.2.1. Markaziy tendentsiyani o'lchash: o'rtacha, median va rejim 2.2. Ma'lumotlarning asosiy statistik tavsiflari Ma'lumotni oldindan qayta ishlash muvaffaqiyatli bo'lishi uchun ma'lumotlaringiz haqida umumiy tasavvurga ega bo'lishingiz kerak. Asosiy statistik tavsiflar ma'lumotlarning xususiyatlarini aniqlash va qaysi ma'lumotlar qiymatlari shovqin yoki chetga chiqish sifatida ko'rib chiqilishi kerakligini ta'kidlash uchun ishlatilishi mumkin. Ma'lumotlar to'plamining "markazi" ning eng keng tarqalgan va samarali raqamli o'lchovi (arifmetik) o'rtacha hisoblanadi. N qiymat yoki kuzatishlar toÿplami boÿlsin , masalan, ish haqi kabi X raqamli atribut uchun . Ushbu qiymatlar to'plamining o'rtacha qiymati Nihoyat, biz ma'lumotlarimizni vizual tekshirish uchun asosiy statistik tavsiflarning ko'plab grafik displeylaridan foydalanishimiz mumkin (2.2.3-bo'lim). Ko'pgina statistik yoki grafik ma'lumotlarni taqdim etish dasturiy paketlari shtrixli diagrammalar, doiraviy diagrammalar va chiziqli grafiklarni o'z ichiga oladi. Ma'lumotlar sarhisoblari va taqsimotlarining boshqa mashhur ko'rinishlariga kvantli chizmalar, kvant-kvantillar, gistogrammalar va tarqalish chizmalari kiradi. (2.1) [MA'LUMOTLARNI QAZIB OLISH: TUSHUNCHALAR VA TEXNIKALAR 3-NASHI] Ma'lumotlar to'plamimizning markaziy tendentsiyasini baholashdan tashqari, biz ma'lumotlarning tarqalishi haqida ham Download 282.17 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling