2. Ma'lumotlaringiz bilan tanishish


Download 282.17 Kb.
Pdf ko'rish
bet1/5
Sana18.03.2023
Hajmi282.17 Kb.
#1282842
  1   2   3   4   5
Bog'liq
muhriddin (1)



41
Jiawei Xan
2. Ma'lumotlaringiz bilan tanishish
Ma'lumotlaringiz haqidagi bilim ma'lumotlarni oldindan qayta ishlash uchun foydalidir ( 3
-bobga
qarang ), ma'lumotlarni
qazib olish jarayonining birinchi asosiy vazifasi. Siz quyidagilarni bilishni xohlaysiz: Sizning ma'lumotlaringizni tashkil etuvchi
atributlar yoki maydonlarning turlari qanday? Har bir atribut qanday qiymatlarga ega? Qaysi atributlar diskret va qaysilari
uzluksiz baholanadi? Ma'lumotlar qanday ko'rinishga ega? Qadriyatlar qanday taqsimlanadi? Bularning barchasini yaxshiroq
tushunish uchun ma'lumotlarni vizualizatsiya qilishning usullari bormi? Biz har qanday cheklovni aniqlay olamizmi? Ba'zi
ma'lumotlar ob'ektlarining boshqalarga nisbatan o'xshashligini o'lchay olamizmi? Ma'lumotlarga nisbatan bunday tushunchaga
ega bo'lish keyingi tahlillarga yordam beradi.
[MA'LUMOTLARNI QAZIB OLISH: TUSHUNCHALAR VA TEXNIKALAR 3-NASHI]
Har bir atribut bo'yicha bunday asosiy statistik ma'lumotlarni bilish etishmayotgan qiymatlarni to'ldirishni, shovqinli qiymatlarni
silliqlashni va ma'lumotlarni oldindan qayta ishlash jarayonida chetlanishlarni aniqlashni osonlashtiradi. Atributlar va atribut
qiymatlarini bilish ma'lumotlar integratsiyasi paytida yuzaga kelgan nomuvofiqliklarni tuzatishga yordam beradi. Markaziy
tendentsiya o'lchovlarini tuzish bizga ma'lumotlarning nosimmetrik yoki egri ekanligini ko'rsatadi. Kvantil chizmalari,
gistogrammalar va scatter chizmalari asosiyning boshqa grafik ko'rinishlaridir
To'g'ridan-to'g'ri konchilikka o'tish jozibador, lekin birinchi navbatda, biz ma'lumotlarni tayyorlashimiz kerak. Bu atributlar va
ma'lumotlar qiymatlarini yaqindan ko'rib chiqishni o'z ichiga oladi. Haqiqiy dunyo ma'lumotlari odatda shovqinli, katta hajmli
(ko'pincha bir necha gigabayt yoki undan ko'p) va turli xil manbalardan kelib chiqishi mumkin. Ushbu bob sizning
ma'lumotlaringiz bilan tanishish haqida.
“Maÿlumotni oldindan qayta ishlashda foydali boÿlgan maÿlumotlarimiz haqida nimani bilib olishimiz mumkin?” Biz
2.1-
boÿlimda
turli atribut turlarini oÿrganishdan boshlaymiz . Ularga nominal atributlar, ikkilik atributlar, tartib atributlar va raqamli
atributlar kiradi. Asosiy statistik tavsiflar
2.2-bo'limda
tavsiflanganidek, har bir atributning qiymatlari haqida ko'proq ma'lumot olish uchun foydalanish mumkin .
Masalan, harorat atributini hisobga olsak , biz uning o'rtacha (o'rtacha qiymat), median (o'rta qiymat) va rejimini (eng keng
tarqalgan qiymat) aniqlashimiz mumkin. Bu markaziy tendentsiya ko'rsatkichlari bo'lib, ular bizga "o'rta" yoki tarqatish
markazi haqida fikr beradi.
Machine Translated by Google


Jiawei Xan
42
2.1. Ma'lumotlar obyektlari va atribut turlari
2.1.1. Atribut nima?
[MA'LUMOTLARNI QAZIB OLISH: TUSHUNCHALAR VA TEXNIKALAR 3-NASHI]
Ma'lumotlar to'plami ma'lumotlar ob'ektlaridan iborat. Ma'lumotlar ob'ekti ob'ektni ifodalaydi - savdo ma'lumotlar bazasida
ob'ektlar mijozlar, do'kon buyumlari va savdo bo'lishi mumkin; tibbiy ma'lumotlar bazasida ob'ektlar bemorlar bo'lishi mumkin;
universitet ma'lumotlar bazasida ob'ektlar talabalar, professorlar va kurslar bo'lishi mumkin. Ma'lumotlar obyektlari odatda
atributlar bilan tavsiflanadi. Ma'lumotlar ob'ektlarini namunalar, misollar, misollar, ma'lumotlar nuqtalari yoki ob'ektlar deb
ham atash mumkin . Agar ma'lumotlar ob'ektlari ma'lumotlar bazasida saqlansa, ular ma'lumotlar kortejlaridir. Ya’ni
ma’lumotlar bazasi satrlari ma’lumotlar obyektlariga, ustunlari esa atributlarga mos keladi. Ushbu bo'limda biz atributlarni
aniqlaymiz va har xil atribut turlarini ko'rib chiqamiz.
Nihoyat, biz ma'lumotlar ob'ektlarining qanchalik o'xshash (yoki o'xshash) ekanligini tekshirishni xohlashimiz mumkin. Misol
uchun, bizda ma'lumotlar bazasi mavjud bo'lib, ularning belgilari bilan tavsiflangan ma'lumotlar ob'ektlari bemorlardir. Biz
individual bemorlar o'rtasidagi o'xshashlik yoki o'xshashlikni topishni xohlashimiz mumkin.
Bunday ma'lumotlar bizga ma'lumotlar to'plamida o'xshash bemorlarning klasterlarini topishga imkon beradi. Ob'ektlar
o'rtasidagi o'xshashlik/o'xshashlik ma'lumotlardagi chegaralarni aniqlash yoki eng yaqin qo'shni tasnifini amalga oshirish
uchun ham ishlatilishi mumkin. (Klasterlash
10
-
bob va 11-
bob mavzulari , eng yaqin qoÿshnilar tasnifi esa 9
-bobda
muhokama qilinadi. ) Oÿxshashlik va oÿxshashlikni baholash uchun koÿplab chora-tadbirlar mavjud. Umuman olganda,
bunday choralar yaqinlik choralari deb ataladi. Ikki ob'ektning yaqinligini ularning atribut qiymatlari orasidagi masofaning
funktsiyasi sifatida o'ylab ko'ring , garchi yaqinlik haqiqiy masofadan ko'ra ehtimollik asosida ham hisoblanishi mumkin.
Ma'lumotlarning yaqinligi o'lchovlari
2.4-bo'limda tasvirlangan.
statistik tavsiflar. Bularning barchasi ma'lumotlarni qayta ishlash jarayonida foydali bo'lishi mumkin va qazib olish sohalari
haqida tushuncha berishi mumkin.
Ma'lumotlarni vizualizatsiya qilish sohasi grafik vositalar orqali ma'lumotlarni ko'rish uchun ko'plab qo'shimcha usullarni
taqdim etadi. Bu tuzilmagan ma'lumotlar to'plamlarida "yashirin" munosabatlar, tendentsiyalar va noaniqliklarni aniqlashga
yordam beradi. Texnikalar scatter-slot matritsalari kabi oddiy bo'lishi mumkin (bu erda ikkita atribut 2 o'lchovli tarmoqqa
joylashtiriladi) daraxt xaritalari kabi murakkabroq usullarga (bu erda atribut qiymatlari asosida ekranning ierarxik bo'linishi
ko'rsatiladi).
Xulosa qilib aytganda, ushbu bobning oxirida siz atribut ma'lumotlarining markaziy tendentsiyasi va tarqalishini (tarqalishini)
tavsiflash uchun turli xil atribut turlari va asosiy statistik ko'rsatkichlarni bilib olasiz. Shuningdek, siz atribut taqsimotlarini
vizualizatsiya qilish texnikasini va ob'ektlar orasidagi o'xshashlik yoki o'xshashlikni qanday hisoblashni bilib olasiz.
Atribut - bu ma'lumotlar ob'ektining xarakteristikasi yoki xususiyatini ifodalovchi ma'lumotlar maydoni. Atribut , o‘lchov,

Download 282.17 Kb.

Do'stlaringiz bilan baham:
  1   2   3   4   5




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling