!"#"$%& / '"*%+. Tahlil qiluvchi


Tayanch so'zlar ro'yxatini buklash


Download 255.37 Kb.
Pdf ko'rish
bet9/19
Sana07.04.2023
Hajmi255.37 Kb.
#1337123
1   ...   5   6   7   8   9   10   11   12   ...   19
Bog'liq
Internetda ma\'lumot to\'plash usullari. Internetda…

2.7 Tayanch so'zlar ro'yxatini buklash
Kalit so'zlarning to'g'ri to'plami boshlang'ich qiymati
hisoblanadi 
optimal hazil
ma `lumot. Masalan, "MARP"
kalit so'zi sifatida mashinaning ovozini qo'yib, biz to'liq
qisqartma (Moskva Pidpryumnitstva rivojlantirish
agentligi) bo'lgan hujjatlar ro'yxatini tuzishimiz mumkin.
Agar biz kengroq mavzudagi hujjatlarga murojaat
qiladigan bo'lsak, masalan: ishlab chiqarishni rivojlantirish
va biz ikkita so'zdan oddiy elektr ta'minotini
shakllantirishimiz mumkin bo'lsa, u holda mashina bizga
yuz minglab nomlar ro'yxatini ko'radi, ular bo'lmaydi. har
qanday kelajakda oson.
Kalit so'zlarning optimal to'plamini yig'ish maqsadida
tartib xujumdagi qutb kabi Zipf qonunlariga asoslanadi:
har qanday matn-dzherelo, masxara qilayotganlarga yaqin,
tobto olib. "zrazok" va yo tahlil qiling, so'zning ma'nosini
ko'ring. Yak text-dzherela kitob, maqola, Web-sayt bo'lishi
mumkin, xoh u hujjat bo'lsin.
Matnni tahlil qilish quyidagi tartibda amalga oshiriladi:
Matndan ko'rish stop-sliv
Ro'yxatga o'ralgan teri so'zini kiritish chastotasini
hisoblash, unda so'zlar chastotaning o'zgarishi tartibida
joylashgan.
Vibir ro'yxatning o'rtasida joylashgan chastotalar
diapazoniga va eng ko'p ko'rsatiladigan so'zlar
diapazonidan turli matngacha.
ABO (OR) mantiqiy operatori bilan bog'langan kalit
so'zlarning bunday darajasi bilan to'lib-toshgan holda ovoz
mashinasiga quvvatni buklash. Bunday tomoshabin uchun
quvvat manbai matnning paydo bo'lishiga imkon beradi,
unda so'zlardan birini ko'rishni xohlaydi.
Tank uchun hazil natijasida chiqarilgan hujjatlar soni juda
ko'p bo'lishi mumkin. Biroq, ro'yxatning birinchi tomonida
ko'p sonli ovozli mashinalarda tiqilib qoladigan hujjatlarni
(kiritish chastotasini o'zgartirish tartibi hujjatga yoziladi)
kotiblari amalda. barcha hujjatlar juda dolzarb bo'lib
ko'rinishi mumkin, shuning uchun hujjat tegishli ko'rinadi.
Tezaurusning tuzilishi semantik tasvirlar deb ataladigan
narsalarni ko'rish uchun ko'proq mos keladi va teri asosiy
atamasi uchun nozik so'zlar va shovqinli so'zlar jadvali
qo'llaniladi (chunki ular jerelistlarda tovush chiqarishda
aybdor emas). , Shunday qilib, atamalarning yagona
ierarxik tuzilishini almashtirish uchun biz muhitni
kengaytirish va o'zgartirishi mumkin bo'lgan jadvallar
to'plamini qabul qilishimiz mumkin.
Poshukovyh mashinalari Vidbir
Ovozli mashinalarning ishlab chiqarishdan keyingi holati
tiklanadi, teri mashinasining samaradorligi o'zgarishiga
qadar. Hammasi bo'lib 180 ga yaqin turli xil serverlar
mavjud bo'lib, ular ov hududlariga, xabarni bajarish
tamoyillariga (shuningdek, kirish ma'lumotlari va
ishlatilishi mumkin bo'lgan quvvat manbai xususiyatiga
qarab) ishlab chiqilgan. mavjud emasligi formati,
standartning sifati haqida umumiy ma'lumot Ovoz
serverlarini tanlashning asosiy mezonlari - bu serverning
indeks bazasi ro'yxati va elektr ta'minoti darajasidan
foydalanish uchun mashinaning o'zini rivojlantirish
bosqichlari.
Ovozli mashinalarni quvvat bilan ta'minlashni kamaytirish
Narx - bu mashaqqatli bosqichning eng katlanadigan
bosqichi, oz miqdordagi ma'lumot bilan kiyinish (asosiy
shovqinda). Tezaurus asosida tebranish ovozli serverlari
uchun quvvat manbai shakllantiriladi, buning uchun
ahamiyatsiz ma'lumotlarni aniq ko'rsatish usuli yordamida
elektr ta'minotini aniqlashtirish mumkin. Resurslarni ko'rib
chiqish, eng so'nggilaridan ta'mirlash, bir qarash va
shunchaki hazil qilish mumkin. Tegishli deb hisoblangan
resurslardan ma'lumotlar keyingi tahlil qilish uchun
tanlanadi.
Elektr ta'minotini shakllantirish
Elektr ta'minotining formati ham, semantikasi ham sobit
bo'lgan ovoz mashinasining mavjudligi va muayyan
mavzu sohasida turlicha. Do'konni yuving, shunda hazil
maydoni maksimal darajada aniqlashtiriladi va u eshitiladi.
Perevaga bitta kengaytmali bo'tqadan bir nechta vuzky
quvvat manbalarining g'alabali ta'minotini olish
imkoniyatiga ega bo'ladi. Teri asosidagi asosiy
tushunuvchi uchun tezaurusdan tashqi quvvat to'plami
tayyorlanadi. Elektr ta'minotini sinovdan o'tkazish ham
amalga oshirilmoqda - masalan, tezaurusni yangilash va
yangilash, shovqin ma'lumotlarini ko'rsatish.
Yangi avtomobillarning elektr ta'minotini haqoratli
funktsiyalarga muvofiq asosiy ê ga o'tkazing:
Mantiqiy algebra operatorlari VA, OR, EMAS: (I) -
hujjatlarning ovozi bor, operator tomonidan berilgan
shartlar bo'yicha qasos olish; (ABO) - shukaniy matn
qasos uchun aybdor Men operator tomonidan berilgan
shartlardan birini xohlayman; istalgan atama matnlari
uchun operatorga amal qilishingiz mumkin.
Tashqi ko'rinish operatorlari - so'zlar orasidagi to'g'ridan-
to'g'ri va ko'rinish tartibini yaxlitlash uchun, masalan: -
boshqa atama birinchi navbatda ma'lum bo'lganligi uchun
aybdor, lekin u so'zlarning kuylash sonini o'zgartirmaydi;
BY - atamalar berilgan tartibda amal qiladi; - operator
tomonidan belgilangan shartlar, ê xulosalari.
Terminlarni ko'paytirish imkoniyati - atamaning oxirini
almashtirish uchun "*" belgisini tanlash ro'yxat oldiga
kobning (shablon) birinchi qismidan bir xil bo'lgan barcha
so'zlarni kiritish imkonini beradi.
Oblik morfologiyasi mov - mashina bu atamaning barcha
shakllarini, ehtimol, silkinish bo'lganligi sababli,
avtomatik ravishda uzatadi.
Siz so'zlar, iboralar uchun hazil qilishingiz mumkin.
Hujjatning bir elementi bilan hazil almashish (aybdor
so'zlar imkon qadar sarlavhada, birinchi xatboshida
topilgan).
Zbigiv atamalar sonini almashish.
Siz grafik tasvirlarni hazil qilishingiz mumkin.
Kichik va katta harflarga nisbatan sezgirlik.
Oziqlantirish natijasi (posilan ro'yxati) ikki bosqichda
qayta ishlanadi. Birinchi bosqichda, aniq ahamiyatsiz
dzherel namoyishi amalga oshiriladi, lekin ular ovoz
mashinasining murakkabligi yoki "razvedka" quvvat
manbai yo'qligi tufayli vibratordan ichishgan. Shu bilan
birga, semantik tahlil o'tkaziladi, undan boshlang'ich
quvvat manbaini o'zgartirish uchun tezaurusni
aniqlashtirish mumkin. Oldinga ishlov berish ma'lum
manbalardan teriga oxirgi marta urish va mavjud bo'lgan
ma'lumotlarni tahlil qilish yo'li bilan amalga oshiriladi.

Download 255.37 Kb.

Do'stlaringiz bilan baham:
1   ...   5   6   7   8   9   10   11   12   ...   19




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling