Matematika-informatika akulteti axborot texnologiyalari kafedrasi big data va ma


Download 161.55 Kb.
bet19/20
Sana17.06.2023
Hajmi161.55 Kb.
#1553428
1   ...   12   13   14   15   16   17   18   19   20
Bog'liq
Big data va MT

1-rasm. Tarkiblangan ma'lumotlarga doir misol
Таркибланмаган маълумотлар
Tarkiblanmagan ma'lumotlarni ma'lum bir ma'lumotlar modeliga moslashtirish qiyin, chunki uning mazmuni kontekstga bog'liq yoki o'zgaruvchandir. Tarkibi bo'lmagan ma'lumotlarning bir misoli oddiy elektron pochta xabarlaridir (2-rasm). Xabarda tuzilgan elementlar (jo'natuvchi, sarlavha, korpus) bo'lsada, bir xil vazifalarni turli yo'llar bilan bajarish mumkin, masalan, xabarlarda ma'lum bir shaxsni eslatishning son-sanoqsiz usullari mavjud. Muammo minglab tillar va dialektlarning mavjudligi bilan yanada murakkablashadi.

2-rasm. Pochta xabarlari
Inson tomonidan yozilgan elektron pochta xabari (2-rasmda ko'rsatilgandek) ham tabiiy til ma'lumotlarining ideal namunasidir.
Табиий тилдаги маълумотлар
Tabiiy til ma'lumotlari - tuzilmagan ma'lumotlarning maxsus turi bo`lib, bunday ma'lumotlarni qayta ishlash ancha murakkab, chunki u ham tilshunoslik, ham Datasceince ining maxsus usullarini bilishni talab qiladi.
Tabiiy tildagi ma'lumotlarni qayta ishlash hamjamiyati ob'ektni tanib olish, mavzu maydonini aniqlash, umumlashtirish, matnni to'ldirish va hissiyotlarni tahlil qilishda muvaffaqiyatlarga erishdi, biroq bir domenga moslashtirilgan modellar boshqa domenlar uchun yaxshi umumlashtirilmaydi. Hatto eng zamonaviy usullar ham o'zboshimchalik bilan matnning ma'nosini hal qila olmaydi. Va bu haqiqat hech kimni ajablantirmaydi; odamlar ham tabiiy tilni tushunishda muammolarga duch kelishadi. Bu tabiatan noaniq. Ma'no tushunchasining o'zi bahsli. Ikki kishi bitta suhbatni tinglayapti; Ular undan bir xil ma'noni oladilarmi? Bundan tashqari, alohida so'zlarning ma'nosi so'zlovchining kayfiyatiga qarab o'zgarishi mumkin. (3-rasm)

3-rasm. Ijtimoiy tarmoq yoki pochtadan kelgan habarlar.

Mashina ma'lumotlari inson aralashuvisiz kompyuter, jarayon, dastur yoki qurilma tomonidan avtomatik ravishda yaratilgan ma'lumotlarni anglatadi. Mashina ma'lumotlari asosiy ma'lumot manbalaridan biriga aylanib bormoqda va vaziyat o'zgarishi dargumon. Wikibon prognozlariga ko'ra, sanoat Internetining bozor qiymati (bu atama Frost & Sullivan tomonidan tarmoq sensorlari va dasturiy ta'minotga ega murakkab jismoniy qurilmalarga ishora qilish uchun yaratilgan) 2020 yilga kelib taxminan 540 milliard dollarni tashkil qiladi. IDC (International Data Corporation) hisob-kitoblariga ko‘ra, 2020 yilga borib tarmoq tugunlari soni aholi sonidan 26 baravar oshadi. Ushbu tarmoq ko'pincha narsalar Interneti deb ataladi.


Машинали маълумотлар.


Download 161.55 Kb.

Do'stlaringiz bilan baham:
1   ...   12   13   14   15   16   17   18   19   20




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling