Ma’lumotlar majmuasi va ularning atributlari Grafikli ma’lumotlar


Download 54.51 Kb.
bet2/7
Sana28.12.2022
Hajmi54.51 Kb.
#1018496
1   2   3   4   5   6   7
Bog'liq
DATA MINING 01

Atributlar




Mijoz kodi

YOshi

Oilaviy ahvoli

Daromadi

Toifa

1

18

YOlg‘iz

125

1

2

22

Oilali

100

1

3

30

YOlg‘iz

70

1

4

32

Oilali

120

1

5

24

Ajrashgan

95

2

6

25

Oilali

60

1

7

32

Ajrashgan

220

1

8

19

YOlg‘iz

85

2

9

22

Oilali

75

1

10

40

YOlg‘iz

90

2

Jadvalning gorizontal qismida ob’ektning atributlari yoki uning belgilari. Vertikal qismida esa ob’ektlar berilgan.
Ko‘rinib turibdiki, ob’ektlar atributlar yoki belgilar majmuasi sifatida tasniflanadi.
Atribut – bu ob’ektni tavsiflab beruvchi xossa, xususiyatdir.
Masalan: inson ko‘zining rangi, suv harorati va boshqalar.
Bundan tashqari atributni o‘zgaruvchi, jadval maydoni, tavsif deb ham atashadi.
O‘zgaruvchi (variable) – barcha o‘rganilayotgan ob’ektlar uchun umumiy bo‘lgan xossa yoki tavsif bo‘lib, uning ko‘rinishi bir ob’ektdan boshqa ob’ektga o‘tilganda o‘zgarishi mumkin.
O‘zgaruvchi qiymati (value) belgini namoyish bo‘lishini anglatadi.
Ma’lumotlar tahlil qilinayotganda, umuman olganda, bizni qiziqtiruvchi ob’ektlarni barchasini, ya’ni ob’ektlar to‘la majmuasini qarab chiqish imkoniyati bo‘lmaydi. Katta xajmdagi ma’lumotlarni o‘rganish juda ko‘p vaqt talab qiluvchi va ancha qimmatga tushuvchi jarayondir. SHu bilan birga ma’lumotlar xajmi qancha katta bo‘lsa, inson omiliga bog‘liq bo‘lgan xatoliklar ortib boradi.
SHu sababli, barcha ob’ektlar majmuasini emas, balki uning biror bir qandaydir qismini, ya’ni tanlanma ajratib olib, mazkur tanlanmaga asoslangan holda bizga zarur bo‘lgan axborotni olish etarli bo‘ladi.SHuni esdan chiqarmaslik lozimki, tanlanma o‘lchami bosh to‘plamni tashkil qiluvchi ob’ektlarning turli tumanligiga bog‘liq ravishda aniqlanadi. Tanlanmada bosh to‘plamning ma’lum ma’noda (ya’ni, qo‘yilgan masalani hal qilish ma’nosida) ifodalab beruvchi ob’ektlar bo‘lishi lozim.
Bosh to‘plam (Generalnaya sovokupnost) (population) – tadqiqotchini qiziqtiruvchi barcha ob’ektlar majmuasi.
Tanlanma (sample) – bosh to‘plam xususiyatlari va tavsiflarni o‘rganish va tadqiq qilish maqsadida, ma’lum bir qoida bilan, tanlab olingan bosh to‘plam qismi.
Parametrlar – bosh to‘plamning sonli tavsiflari.
Statistika – tanlanmaning soni tavsiflari.
Ma’lumki, ko‘pincha, tadqiqotlar gipotezalarga asoslanadi. Gipotezalar esa o‘z navbatida ma’lumotlar yordamida tekshiriladi. Gipoteza – bu ob’ektlar majmuasi parametrlariga nisbatan taxmin bo‘lib, u mazkur majmua qismida tekshirilishi lozim.
Gipoteza – turli hil emprik dalillar orasidagi bog‘liqlikni yoki dalil yoki dalillar majmuasini tushuntirish uchun xizmat qiluvchi qisman asoslangan bilimlar qonuniyatidir.
Gipotezaga misol: xayot davomiyligi bilan ovqatlanish sifati ko‘rsatkichi orasida bog‘liqlik mavjud. Ushbu holat uchun tadqiqot maqsadi konkret o‘zgaruvchini o‘zgarishini tushuntirish lozim, ya’ni bir o‘zgaruvchini boshqasiga nisbatan, mazkur holatda o‘zgaruvchi – xayot davomiyligi. Faraz qilamiz, shunday gipoteza mavjudki, bog‘liqli (erksiz) o‘zgaruvchi (xayot davomiyligi), ba’zi bir sabablarga (ovqatlanish sifati, xayot tarzi, yashash joyi va boshqalar – erkli o‘zgaruvchilar) bog‘liq ravishda o‘zgaradi.
Umuman olganda, ixtiyoriy o‘zgaruvchi boshida erkli yoki erksiz bo‘lmaydi. Ular biror bir konkret (aniq. tayin) gipoteza shakllantirilganda erkli yoki erksiz bo‘lib qoladi. Erksiz o‘zgaruvchi o‘z navbatida boshqa gipoteza uchun erkli bo‘lishi mumkin.
O‘lchash – ma’lum bir kelishilgan qoidaga ko‘ra tadqiq qilinayotgan ob’ekt tavsiflariga sonlarni o‘zlashtirish jarayonidir, ya’ni ob’ektni tavsiflab beruvchi kattaliklarga sonlarni mos qo‘yish jarayoni.
Ma’lumotlarni tayyorlash jarayonida ob’ektni o‘zi emas, balki uning xarakteristikalari (tavsiflari) o‘lchanadi.
SHkala – bu shunday qoidaki, unga mos ravishda ob’ektlarga son o‘zlashtiriladi. Data Miningning ko‘plab instrumentlari boshqa manbalardan ma’lumotlarni import qilayotgan vaqtda har bir o‘zgaruvchi uchun shkalalar turini va/yoki kiruvchi va chiquvchi o‘zgaruvchilar uchun ma’lumotlar turini (belgili, sonli, diskret va uzliksiz) tanlashni taklif qiladi. SHu kabi instrumentlardan foydalanilayotgan vaqtda foydalanuvchilar bunday tushunchalarga ega bo‘lishlari talab qilinadi.
Umuman olganda, o‘zgaruvchilar sonli yoki belgili ma’lumotlar bo‘lishi mumkin. Sonli ma’lumotlar o‘z navbatida yo diskret yoki uzliksiz bo‘lishi mumkin.

Download 54.51 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling