Bajardi: 19. 06-guruh talabasi G. Turdiqulova
Tabiiy tilni qayta ishlash (NLP)
Download 0.83 Mb.
|
ppt big datadan
- Bu sahifa navigatsiya:
- NLP quyidagi sohalarda yordam berishimumkin.
- E’tiboringiz uchun rahmat
Tabiiy tilni qayta ishlash (NLP)Ushbu turdagi ma'lumotlar tarkibini tahlil qilish uchun mashinani o'rganish algoritmining bir shakli bo'lgan Natural Language Processing (NLP) ni talab qiladi. NLP bozor tendentsiyalari - joriy yoki prognozlar haqida foydali tushunchalarni ishlab chiqarish uchun innovatsion usullardan foydalangan holda ma'lumot olish uchun katta ma'lumotlardan foydalanish qobiliyatini ta'minlaydigan ma'lumotlar tahlilidagi navbatdagi katta narsa sifatida qaraladi. NLP bo'yicha tadqiqotlar bir necha o'n yillardan beri olib borilayotgan bo'lsa-da, bu soha faqat so'nggi 3 yil ichida sezilarli yutuqlarga erishdi. NLP-dan foydalanadigan mashinani o'rganish metodologiyalari hozirda katta ma'lumotlar bo'yicha hamkorlar bo'yicha konsalting kompaniyasi orqali korxonalar bo'ylab keng tarqalgan. NLP statistika va mashinani o'rganish orqali tilshunoslik va semantikani tahlil qilish orqali katta ma'lumotlardagi matn yozuvlarida paydo bo'ladigan naqshlarni o'rganadi va mijozlar o'z postlarida aytmoqchi bo'lgan narsalar kontekstida muhim ob'ektlar va munosabatlarni ajratib oladi. Aslida, bir so'z yoki so'zlar qatoriga e'tibor qaratish o'rniga, NLP jumlalarni maqsad uchun har tomonlama tahlil qiladi. NLP-da qo'llaniladigan eng keng tarqalgan metodologiyalar - bu avtomatik umumlashtirish, noaniqlik, nutqning bir qismini belgilash, munosabatlarni chiqarish va ob'ektni ajratib olish va eng muhimi - tabiiy tilni tushunish va tanib olish. Qanday qilib NLP tuzilmagan katta ma'lumotlardagi ma'lumotlardan yaxshiroq foydalanishga yordam beradi? Har bir sohada - tibbiyot, yuridik, farmatsevtika, sport, ta'lim va hokazo, aytaylik, katta hajmdagi ma'lumotlar har kuni hujjatlar, mijozlar ma'lumotlari, savdo ma'lumotlari va boshqalar ko'rinishida arxivlanadi. Bu ma'lumotlar asosan matndir va shuning uchun NLP bo'ladi. Tahlildan samarali natijalarga erishish uchun juda muhim - bu bashoratli, real vaqtda yoki tarixiy. NLP quyidagi sohalarda yordam berishimumkin.O'zaro ta'sirlar
Biznes razvedkasi
Hissiyot tahlili
. Katta ma'lumotlar shunchaki shov-shuvli so'z va "bo'lishi mumkin bo'lgan" texnologiya o'rniga, endi korxonalar va startaplar uchun strategiyani amalga oshirishning eng muhim talablaridan biri hisoblanadi. Katta maʼlumotlar – doimiy ravishda turli kanallardan mijozning onlayn xarid qilish harakati, ijtimoiy tarmoqdagi faoliyati va savdo nuqtalari maʼlumotlari kabi ichki maʼlumotlar jurnali kabi maʼlumotlar toʻplanadi. Real vaqt rejimida qayd qilinayotgan maʼlumotlar doimo kirib boradi va saqlanadi. bulutda. Yirik korxonalar petabaytdan ortiq ma'lumotlarga ega bo'lishi mumkin. Ma'lumotlar kelib chiqishidan "xuddi shunday" holatida olinganligi sababli, u doimiy ravishda o'sib borishi bilan bir qatorda, asosan tuzilmagan. Ushbu katta ma'lumotlarning formati asosan ijtimoiy tarmoqlarda baham ko'rilgan matn yoki mahsulotlar haqida olingan mijozlarning fikr-mulohazalarini bildiradi. Boshqacha qilib aytadigan bo'lsak, katta ma'lumotlar tabiiy tilda, ya'ni oddiy inson real hayotdagi suhbatlarda foydalanishi mumkin bo'lgan so'zlar qatoridir. Taxminlarga ko'ra, 2020 yilga kelib, har bir Big Data Solution tomonidan taqdim etilgan barcha katta ma'lumotlarni tahlil qilish NLP yordamida amalga oshiriladi, chunki ma'lumotlar hajmi butun dunyo bo'ylab 44 trillion gigabaytdan oshadi, shuning uchun Big Data Analytics uchun NLP ko'lami yanada kengayadi. Ushbu va boshqa lingvistik muammolar yillar davomida mashina tarjimasi uchun katta to'siq bo'lib kelmoqda. Shuni ta'kidlash kerakki, mashina tarjimasi hissiyotlarni tahlil qilish va hujjatlarni tasniflashdan butunlay farq qiladi. Bu qiyin vazifa teglar emas, balki so'z ketma-ketligini bashorat qiladigan modelga muhtoj. Mashinani o'rganish, shuningdek, Deep Learning haqidagi barcha nutq va hayajonni ta'kidlaydi, chunki u ketma-ket ma'lumotlarni tahlil qilishda o'yinni o'zgartirdi. RNN va tarjimaning ilg'or natijalari haqida ko'proq ma'lumotni shu yerda ko'rib chiqishingiz mumkin. Bundan tashqari, yanada samarali ifodalash va qayta so'zlash zarurati mavjud. Aytaylik, sizga avtomatik matnni umumlashtirish modeli kerak va siz matnni toʻliq va asl maʼnosini saqlab qolgan holda umumlashtirishni xohlaysiz. Diqqat mexanizmlari (oxirgi yechimlarda modul sifatida kiritilgan) bu vazifalarni bajarishda qimmatli ekanligini isbotlaydi, chunki u matnlarning faqat ma'lum segmentlarida ma'no izlash orqali matnlarning butun bloklarini tushunishi mumkin Tabiiy tilni qayta ishlashning eng muhim va qimmatli qo'llanilishidan biri bu tarjimalardir. Dunyo bo'ylab tillar bir nechta til oilalaridan kelib chiqqan bo'lsa-da, ular son-sanoqsiz mamlakatlar va madaniyatlarga tarqalib ketgan. Ingliz tili AQSh, Buyuk Britaniya, Osiyo va Yevropada farqlanadi; Ispaniya, Markaziy va Janubiy Amerikada ispan tilining o'z versiyalari mavjud. E’tiboringiz uchun rahmatDownload 0.83 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling