!"#"$%& / '"*%+. Tahlil qiluvchi
Tayanch so'zlar ro'yxatini buklash
Download 255.37 Kb. Pdf ko'rish
|
Internetda ma\'lumot to\'plash usullari. Internetda…
2.7 Tayanch so'zlar ro'yxatini buklash
Kalit so'zlarning to'g'ri to'plami boshlang'ich qiymati hisoblanadi optimal hazil ma `lumot. Masalan, "MARP" kalit so'zi sifatida mashinaning ovozini qo'yib, biz to'liq qisqartma (Moskva Pidpryumnitstva rivojlantirish agentligi) bo'lgan hujjatlar ro'yxatini tuzishimiz mumkin. Agar biz kengroq mavzudagi hujjatlarga murojaat qiladigan bo'lsak, masalan: ishlab chiqarishni rivojlantirish va biz ikkita so'zdan oddiy elektr ta'minotini shakllantirishimiz mumkin bo'lsa, u holda mashina bizga yuz minglab nomlar ro'yxatini ko'radi, ular bo'lmaydi. har qanday kelajakda oson. Kalit so'zlarning optimal to'plamini yig'ish maqsadida tartib xujumdagi qutb kabi Zipf qonunlariga asoslanadi: har qanday matn-dzherelo, masxara qilayotganlarga yaqin, tobto olib. "zrazok" va yo tahlil qiling, so'zning ma'nosini ko'ring. Yak text-dzherela kitob, maqola, Web-sayt bo'lishi mumkin, xoh u hujjat bo'lsin. Matnni tahlil qilish quyidagi tartibda amalga oshiriladi: Matndan ko'rish stop-sliv Ro'yxatga o'ralgan teri so'zini kiritish chastotasini hisoblash, unda so'zlar chastotaning o'zgarishi tartibida joylashgan. Vibir ro'yxatning o'rtasida joylashgan chastotalar diapazoniga va eng ko'p ko'rsatiladigan so'zlar diapazonidan turli matngacha. ABO (OR) mantiqiy operatori bilan bog'langan kalit so'zlarning bunday darajasi bilan to'lib-toshgan holda ovoz mashinasiga quvvatni buklash. Bunday tomoshabin uchun quvvat manbai matnning paydo bo'lishiga imkon beradi, unda so'zlardan birini ko'rishni xohlaydi. Tank uchun hazil natijasida chiqarilgan hujjatlar soni juda ko'p bo'lishi mumkin. Biroq, ro'yxatning birinchi tomonida ko'p sonli ovozli mashinalarda tiqilib qoladigan hujjatlarni (kiritish chastotasini o'zgartirish tartibi hujjatga yoziladi) kotiblari amalda. barcha hujjatlar juda dolzarb bo'lib ko'rinishi mumkin, shuning uchun hujjat tegishli ko'rinadi. Tezaurusning tuzilishi semantik tasvirlar deb ataladigan narsalarni ko'rish uchun ko'proq mos keladi va teri asosiy atamasi uchun nozik so'zlar va shovqinli so'zlar jadvali qo'llaniladi (chunki ular jerelistlarda tovush chiqarishda aybdor emas). , Shunday qilib, atamalarning yagona ierarxik tuzilishini almashtirish uchun biz muhitni kengaytirish va o'zgartirishi mumkin bo'lgan jadvallar to'plamini qabul qilishimiz mumkin. Poshukovyh mashinalari Vidbir Ovozli mashinalarning ishlab chiqarishdan keyingi holati tiklanadi, teri mashinasining samaradorligi o'zgarishiga qadar. Hammasi bo'lib 180 ga yaqin turli xil serverlar mavjud bo'lib, ular ov hududlariga, xabarni bajarish tamoyillariga (shuningdek, kirish ma'lumotlari va ishlatilishi mumkin bo'lgan quvvat manbai xususiyatiga qarab) ishlab chiqilgan. mavjud emasligi formati, standartning sifati haqida umumiy ma'lumot Ovoz serverlarini tanlashning asosiy mezonlari - bu serverning indeks bazasi ro'yxati va elektr ta'minoti darajasidan foydalanish uchun mashinaning o'zini rivojlantirish bosqichlari. Ovozli mashinalarni quvvat bilan ta'minlashni kamaytirish Narx - bu mashaqqatli bosqichning eng katlanadigan bosqichi, oz miqdordagi ma'lumot bilan kiyinish (asosiy shovqinda). Tezaurus asosida tebranish ovozli serverlari uchun quvvat manbai shakllantiriladi, buning uchun ahamiyatsiz ma'lumotlarni aniq ko'rsatish usuli yordamida elektr ta'minotini aniqlashtirish mumkin. Resurslarni ko'rib chiqish, eng so'nggilaridan ta'mirlash, bir qarash va shunchaki hazil qilish mumkin. Tegishli deb hisoblangan resurslardan ma'lumotlar keyingi tahlil qilish uchun tanlanadi. Elektr ta'minotini shakllantirish Elektr ta'minotining formati ham, semantikasi ham sobit bo'lgan ovoz mashinasining mavjudligi va muayyan mavzu sohasida turlicha. Do'konni yuving, shunda hazil maydoni maksimal darajada aniqlashtiriladi va u eshitiladi. Perevaga bitta kengaytmali bo'tqadan bir nechta vuzky quvvat manbalarining g'alabali ta'minotini olish imkoniyatiga ega bo'ladi. Teri asosidagi asosiy tushunuvchi uchun tezaurusdan tashqi quvvat to'plami tayyorlanadi. Elektr ta'minotini sinovdan o'tkazish ham amalga oshirilmoqda - masalan, tezaurusni yangilash va yangilash, shovqin ma'lumotlarini ko'rsatish. Yangi avtomobillarning elektr ta'minotini haqoratli funktsiyalarga muvofiq asosiy ê ga o'tkazing: Mantiqiy algebra operatorlari VA, OR, EMAS: (I) - hujjatlarning ovozi bor, operator tomonidan berilgan shartlar bo'yicha qasos olish; (ABO) - shukaniy matn qasos uchun aybdor Men operator tomonidan berilgan shartlardan birini xohlayman; istalgan atama matnlari uchun operatorga amal qilishingiz mumkin. Tashqi ko'rinish operatorlari - so'zlar orasidagi to'g'ridan- to'g'ri va ko'rinish tartibini yaxlitlash uchun, masalan: - boshqa atama birinchi navbatda ma'lum bo'lganligi uchun aybdor, lekin u so'zlarning kuylash sonini o'zgartirmaydi; BY - atamalar berilgan tartibda amal qiladi; - operator tomonidan belgilangan shartlar, ê xulosalari. Terminlarni ko'paytirish imkoniyati - atamaning oxirini almashtirish uchun "*" belgisini tanlash ro'yxat oldiga kobning (shablon) birinchi qismidan bir xil bo'lgan barcha so'zlarni kiritish imkonini beradi. Oblik morfologiyasi mov - mashina bu atamaning barcha shakllarini, ehtimol, silkinish bo'lganligi sababli, avtomatik ravishda uzatadi. Siz so'zlar, iboralar uchun hazil qilishingiz mumkin. Hujjatning bir elementi bilan hazil almashish (aybdor so'zlar imkon qadar sarlavhada, birinchi xatboshida topilgan). Zbigiv atamalar sonini almashish. Siz grafik tasvirlarni hazil qilishingiz mumkin. Kichik va katta harflarga nisbatan sezgirlik. Oziqlantirish natijasi (posilan ro'yxati) ikki bosqichda qayta ishlanadi. Birinchi bosqichda, aniq ahamiyatsiz dzherel namoyishi amalga oshiriladi, lekin ular ovoz mashinasining murakkabligi yoki "razvedka" quvvat manbai yo'qligi tufayli vibratordan ichishgan. Shu bilan birga, semantik tahlil o'tkaziladi, undan boshlang'ich quvvat manbaini o'zgartirish uchun tezaurusni aniqlashtirish mumkin. Oldinga ishlov berish ma'lum manbalardan teriga oxirgi marta urish va mavjud bo'lgan ma'lumotlarni tahlil qilish yo'li bilan amalga oshiriladi. Download 255.37 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling