Bajardi: 19. 06-guruh talabasi G. Turdiqulova


Tabiiy tilni qayta ishlash (NLP)


Download 0.83 Mb.
bet4/4
Sana03.02.2023
Hajmi0.83 Mb.
#1151143
1   2   3   4
Bog'liq
ppt big datadan

Tabiiy tilni qayta ishlash (NLP)


Ushbu turdagi ma'lumotlar tarkibini tahlil qilish uchun mashinani o'rganish algoritmining bir shakli bo'lgan Natural Language Processing (NLP) ni talab qiladi. NLP bozor tendentsiyalari - joriy yoki prognozlar haqida foydali tushunchalarni ishlab chiqarish uchun innovatsion usullardan foydalangan holda ma'lumot olish uchun katta ma'lumotlardan foydalanish qobiliyatini ta'minlaydigan ma'lumotlar tahlilidagi navbatdagi katta narsa sifatida qaraladi.
NLP bo'yicha tadqiqotlar bir necha o'n yillardan beri olib borilayotgan bo'lsa-da, bu soha faqat so'nggi 3 yil ichida sezilarli yutuqlarga erishdi. NLP-dan foydalanadigan mashinani o'rganish metodologiyalari hozirda katta ma'lumotlar bo'yicha hamkorlar bo'yicha konsalting kompaniyasi orqali korxonalar bo'ylab keng tarqalgan.
NLP statistika va mashinani o'rganish orqali tilshunoslik va semantikani tahlil qilish orqali katta ma'lumotlardagi matn yozuvlarida paydo bo'ladigan naqshlarni o'rganadi va mijozlar o'z postlarida aytmoqchi bo'lgan narsalar kontekstida muhim ob'ektlar va munosabatlarni ajratib oladi. Aslida, bir so'z yoki so'zlar qatoriga e'tibor qaratish o'rniga, NLP jumlalarni maqsad uchun har tomonlama tahlil qiladi. NLP-da qo'llaniladigan eng keng tarqalgan metodologiyalar - bu avtomatik umumlashtirish, noaniqlik, nutqning bir qismini belgilash, munosabatlarni chiqarish va ob'ektni ajratib olish va eng muhimi - tabiiy tilni tushunish va tanib olish.
Qanday qilib NLP tuzilmagan katta ma'lumotlardagi ma'lumotlardan yaxshiroq foydalanishga yordam beradi?
Har bir sohada - tibbiyot, yuridik, farmatsevtika, sport, ta'lim va hokazo, aytaylik, katta hajmdagi ma'lumotlar har kuni hujjatlar, mijozlar ma'lumotlari, savdo ma'lumotlari va boshqalar ko'rinishida arxivlanadi. Bu ma'lumotlar asosan matndir va shuning uchun NLP bo'ladi. Tahlildan samarali natijalarga erishish uchun juda muhim - bu bashoratli, real vaqtda yoki tarixiy.

NLP quyidagi sohalarda yordam berishimumkin.


O'zaro ta'sirlar
    • iOS-dagi Siri interaktiv sohada NLP ning ajoyib namunasidir. Onlayn banking va chakana chakana o'z-o'ziga xizmat ko'rsatish vositalari ham avtomatik tarjima ilovalari kabi NLP-dan foydalanadi. NLP-dan foydalangan holda o'zaro aloqalarni boshqarish tajribasi an'anaviy mijozlarni qo'llab-quvvatlash qo'ng'iroqlarini sun'iy intellektni joriy etish orqali samarali hal qilish va hal qilish mumkin bo'lgan darajalarga aylandi.

Biznes razvedkasi
    • Muayyan ijtimoiy media yorlig'ini kuzatish tahlilchidan mavzuni qamrab oladigan barcha mumkin bo'lgan "hashtaglar" va kalit so'zlarni kiritishni talab qilishi mumkin. NLP tabiiy tilda kiritilgan so'rovlar bo'yicha qidiruv operatsiyalarini amalga oshirishi mumkin, shu bilan barcha mumkin bo'lgan stsenariylarni qamrab oladi va mavzu haqida qancha odam gaplashayotganini aniqlashda statistik xatolarni kamaytiradi.

Hissiyot tahlili
    • Brendlar endi to'g'ridan-to'g'ri kanallar orqali, ijtimoiy media suhbatlaridan boshlab, mijozlarning rasmiy fikr-mulohazalaridan boshqa ma'lumotlarni to'plashlari mumkin. NLP ma'lum bir mahsulot yoki xizmat bozorning maqsadli segmentlarida
    • - demografik va/yoki geografik segmentlarda mamnuniyat bilan qabul qilinayotganligi to'g'risida yakuniy rasmni yaratishi mumkin.

. Katta ma'lumotlar shunchaki shov-shuvli so'z va "bo'lishi mumkin bo'lgan" texnologiya o'rniga, endi korxonalar va startaplar uchun strategiyani amalga oshirishning eng muhim talablaridan biri hisoblanadi. Katta maʼlumotlar – doimiy ravishda turli kanallardan mijozning onlayn xarid qilish harakati, ijtimoiy tarmoqdagi faoliyati va savdo nuqtalari maʼlumotlari kabi ichki maʼlumotlar jurnali kabi maʼlumotlar toʻplanadi. Real vaqt rejimida qayd qilinayotgan maʼlumotlar doimo kirib boradi va saqlanadi. bulutda. Yirik korxonalar petabaytdan ortiq ma'lumotlarga ega bo'lishi mumkin.
Ma'lumotlar kelib chiqishidan "xuddi shunday" holatida olinganligi sababli, u doimiy ravishda o'sib borishi bilan bir qatorda, asosan tuzilmagan. Ushbu katta ma'lumotlarning formati asosan ijtimoiy tarmoqlarda baham ko'rilgan matn yoki mahsulotlar haqida olingan mijozlarning fikr-mulohazalarini bildiradi. Boshqacha qilib aytadigan bo'lsak, katta ma'lumotlar tabiiy tilda, ya'ni oddiy inson real hayotdagi suhbatlarda foydalanishi mumkin bo'lgan so'zlar qatoridir.
Taxminlarga ko'ra, 2020 yilga kelib, har bir Big Data Solution tomonidan taqdim etilgan barcha katta ma'lumotlarni tahlil qilish NLP yordamida amalga oshiriladi, chunki ma'lumotlar hajmi butun dunyo bo'ylab 44 trillion gigabaytdan oshadi, shuning uchun Big Data Analytics uchun NLP ko'lami yanada kengayadi.
Ushbu va boshqa lingvistik muammolar yillar davomida mashina tarjimasi uchun katta to'siq bo'lib kelmoqda. Shuni ta'kidlash kerakki, mashina tarjimasi hissiyotlarni tahlil qilish va hujjatlarni tasniflashdan butunlay farq qiladi.
Bu qiyin vazifa teglar emas, balki so'z ketma-ketligini bashorat qiladigan modelga muhtoj. Mashinani o'rganish, shuningdek, Deep Learning haqidagi barcha nutq va hayajonni ta'kidlaydi, chunki u ketma-ket ma'lumotlarni tahlil qilishda o'yinni o'zgartirdi.
RNN va tarjimaning ilg'or natijalari haqida ko'proq ma'lumotni shu yerda ko'rib chiqishingiz mumkin.
Bundan tashqari, yanada samarali ifodalash va qayta so'zlash zarurati mavjud. Aytaylik, sizga avtomatik matnni umumlashtirish modeli kerak va siz matnni toʻliq va asl maʼnosini saqlab qolgan holda umumlashtirishni xohlaysiz. Diqqat mexanizmlari (oxirgi yechimlarda modul sifatida kiritilgan) bu vazifalarni bajarishda qimmatli ekanligini isbotlaydi, chunki u matnlarning faqat ma'lum segmentlarida ma'no izlash orqali matnlarning butun bloklarini tushunishi mumkin
Tabiiy tilni qayta ishlashning eng muhim va qimmatli qo'llanilishidan biri bu tarjimalardir. Dunyo bo'ylab tillar bir nechta til oilalaridan kelib chiqqan bo'lsa-da, ular son-sanoqsiz mamlakatlar va madaniyatlarga tarqalib ketgan. Ingliz tili AQSh, Buyuk Britaniya, Osiyo va Yevropada farqlanadi; Ispaniya, Markaziy va Janubiy Amerikada ispan tilining o'z versiyalari mavjud.

E’tiboringiz uchun rahmat


Download 0.83 Mb.

Do'stlaringiz bilan baham:
1   2   3   4




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling