Milliy iqtisodiyotda axborot tizimlar va texnologiyalar


Data Mining dasturlarini ishlab chiquvchilar


Download 3.28 Mb.
Pdf ko'rish
bet126/168
Sana16.09.2023
Hajmi3.28 Mb.
#1679167
1   ...   122   123   124   125   126   127   128   129   ...   168
Data Mining dasturlarini ishlab chiquvchilar. Data Mining 
sohasida ishlab chiqilgan dasturiy ilovalar Business Intelligence deb 
nomlanadi va umuman olganda arzon hisoblanmaydi. Ushbu sohada
Business Objects, Cognos, Information Builders, SAS Institute, 
Microsoft va Oracle kompaniyalari yetakchi hisoblanadi. Korxona 
doirasida Enterprise BI Suites zamonaviy ilovasi qo‘llaniladi. 
Microsoft kompaniyasining Data Mining vositalari. Microsoft 
SQL Server 2000 tarkibida Data Mining vositasiga mansub 2 ta 
algoritm mavjud: 
• Microsoft Decision Trees, bunda yechim daraxti algoritmi asos qilib 
olingan; 
• Microsoft Clustering, bunda klasterli modellar algoritmi asos qilib 
olingan.
Microsoft 
bevosita 
boshqa 
kompaniyalarning 
mustaqil 
ishlanmalarini qo‘shib olish imkoniga ega. Microsoft SQL Server keyingi 
Yukon variantida qo‘shimcha algoritm kiritilgan. 
Microsoft Clustering ilovasi. Birinchi navbatda 
klaster 
tushunchasini anglab olish uchun quyidagi misolni ko‘rib chiqamiz. 
Misol sifatida uy telefonlari bilan foydalanuvchilari tahlil 
qilinganda quyidagilar aniqlandi. Birinchidan, foydalanuvchilarning bir 
qismi, asosan, o‘smir yoshidagi yigitlar bo‘lib chiqdi, chunki ular 
ajratilgan 
kanal 
orqali 
Internetda 
ishlashadilar. 
Ikkinchidan, 
foydalanuvchilarning yana bir qismi, asosan, katta yoshdagi ayollar bo‘lib 


215 
chiqdi. Chunki bu yoshdagilar uchun telefon do‘stlar bilan, deyarli, 
yagona muloqot vositasi hisoblanadi. Bunda o‘rta yoshdagi 
foydalanuvchilar bunday telefon aloqasiga qiziqish bildirmaydilar. 
Quyidagi chizmada ikkala toifali foydalanuvchilar keltirilgan:
E’tibor bering, ma’lumotlar chizmada ikki guruhga ajratilganligi 
yaqqol ko‘rinib turibdi, ammo murakkab vaziyatlarda ma’lumotlar 
o‘rtasida klasterlarni mavjudligini taxmin qilish qiyin. 
Klaster tushunchasini aniq misolda ko‘rib chiqamiz va misolni 
yechishda Microsoft SQL Server 2000 (Enterprise Edition, Standard 
Edition yoki Personal Edition) paketi talab etiladi va bunda tahlil 
xizmatlari o‘rnatilgan bo‘lishi kerak.
Misol sifatida antispam filtrini shakllantirish tamoyilini ko‘rib 
chiqamiz. Ushbu filtrning asosiy funksiyasi – bu elektron pochtaga 
kelgan xatni spam ekanligini aniqlashdan iborat. Antispam filtrining 
algoritmini quyidagi g‘oya asosida tuzish mumkin: Spam xatlari 
to‘planib, unda uchraydigan so‘zlar tahlil qilinadi, masalan, so‘zlarning 
chastotasi hisoblanadi. Ushbu ma’lumotlar to‘plami klasterlarni 
aniqlashda qo‘llaniladi. Natijada qabul qilingan xatni spam ekanligi uning 
qaysi klasterga mansubligi orqali aniqlanadi. 
Boshlang‘ich ma’lumotlar sifatida Hewlett-Packard kompaniyasi 
tomoni-dan to‘plangan ma’lumotlar bazasidan foydalanamiz. Ushbu baza
www.ics.uci.edu/~mlearn/MLRepository.html manzilida CSV formatida 
joylash-tirilgan, unda spam bilan bog‘liq jadval mavjud. Ushbu jadvalda 
IsSpam ustuni (u ikki qiymat qabul qiladi: 1 – agar xat spam bo‘lsa, 
10 20 30 40 50 60 70 80
Yoshi

Jinsi 



216 
aksincha 0), shu bilan birga unda ingliz tilida ko‘p uchraydigan so‘zlar 
chastotasi keltirilgan. Ushbu ma’lumotlarni Access formatiga o‘girtirib 
olamiz, va unda hisoblagich maydonini ham kiritamiz:
Ushbu jadval asosida klasterlarni aniqlaymiz, buning uchun 
Microsoft SQL Server ilovasining Analysis Manager xizmatidan 
foydalanamiz. Ushbu muhitda yangi ma’lumotlar bazasini yaratamiz va 
uni MyMiningData deb nomlaymiz va uni yuqoridagi ma’lumotlar 
bazasiga bog‘laymiz: 
Shundan keyin, daraxtsimon ro‘yxatdan yoki menyuning New 
bandidan Mining Models tanalanadi. Ekrandagi Wizard masteridagi 
quyidagi savollarga javob berish kerak bo‘ladi: relyatsion ma’lumotlar, 

Download 3.28 Mb.

Do'stlaringiz bilan baham:
1   ...   122   123   124   125   126   127   128   129   ...   168




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling