2-ma’ruzaga: Qo‘shimcha: axborotni qidirish usullari va samaradorlikni baholash


Download 64.55 Kb.
bet7/11
Sana01.12.2021
Hajmi64.55 Kb.
#178694
1   2   3   4   5   6   7   8   9   10   11
Bog'liq
2-maruza davomi

Semiо́tika, yoki semiolо́giya (grech. σημειωτική < dr.-grech. σημεῖον «belgi, tasvir») — belgilar va belgilash tizimlarining xususiyatlarini o’rganuvchi fan. Bu muloqot jarayonida qo’llaniladigan kommunikativ belgilar tizimi haqidagi fan.

Axborotni qidirish — ma’lumotlar massividan oldindan aniqlangan qidiruv yoki so’rov shartlarini qanoatlantiradigan yozuvlarni aniqlash jarayoni hisoblanadi.

AQ hujjatlardagi ma’lumotlarni qidirish, hujjatning o’zini topish, hujjatlardan meta ma’lumotlarni ajratib olish, mahalliy relyatsion ma’lumotlar bazasi, Internet va intranet tizimlari kabi gipermatnli ma’lumotlar massividan matnlarni, rasmlarni, video va audio ma’lumotlarni qidirishni o’rganuvchi fan hisoblanadi. 

Axborot qidirish, matnli qidirish, hujjatlarni qidirish va ma’lumotlarni qidirish kabi tushunchalar bilan bog’liq bo’lgan ba’zi chalkashliklar mavjud. Shunga qaramay, ushbu fan sohasining har bir yo’nalishi o’z usullari, amaliy tajribalari va ma’lum bir adabiyotlariga ega.

Hozirgi kunda AQ tez rivojlanayotgan fan sohasi bo’lib, uning omaviyligi, ayniqsa Internetda ma’lumotlar hajmining yeksponentsial o’sib borishi bilan bog’liq.

 

1.4. So’rov va so’rov ob’ekti



AQ tizimlari haqida gap ketganda, so’rov va so’rov ob’ekti kabi tushunchalarning e’tibor qaratiladi.

So’rov – bu tizim foydalanuvchisining axborotga bo’lgan ehtiyojini ifodalashning rasmiy usuli. Qidiruv so’rovlar tili axborotga bo’lgan ehtiyojlarni iofdalash uchun ishlatiladi, sintaksisi turli tizimlarda farq qiladi. maxsus so’rovlar tilidan tashqari, zamnaviy qidiruv tizimlari tabiiy tilda so’rovlar kiritish imkonini beradi.



So’rov ob’ekti – bu avtomatlashtirilgan qidiriuv tizimining ma’lumotlar bazasida saqlanadigan axborot ob’ekti hisoblanadi. Eng kkeng tarqalgan so’rov ob’ektlari bu matnli hujjatlar bo’lishiga qaramasdan, fundamental cheklovlar mavjud emas, ya’ni xususiy hollarda rasmlar, video va boshqa mul’timedia ma’umotlarni qidirish mumkin. AQT-da qidirish ob’ektini kiritish jarayoni indeksatsiya deb ataladi. AQT har doim ham ob’ektning aniq nusxasini saqlamaydi, ko’p hollarda uning o’rnini bosuvchi ma’lumotlarni taqdim etadi.

1.5. Axborotni qidirish masalalari

AQ ning asosiy masalasi – foyalanuvchiga uning axborotga bo’lgan ehtiyojlarini qondirishga yordam berishdan iborat. Foydalanuvchi tomonidan axborotga bo’lgan ehtiyojni tavsiflash texnik jihatdan qiyin bo’lganligi sababli, ular foydalanuvchi izlayotgan narsani tavsiflovchi kalit so’zlar to’plamini tashkil etadigan qandaydir so’rov sifatida shakllantiriladi.

Ushbu sohani rivojlantirish bilan boshlangan AQ ning klassik masalasi, ba’zi statik hujjatlar majmuasi doirasida so’rovlarni qanoatlantiruvchi hujjatlarni qidirishdir. Lekin AQ masalasi doimo kengayib bormoqda, hozirgi kunda ular quyidagilardan iborat:

- Modellashtirish masalasi;

- Hujjatlarni klassifikatsiyalash;

- Hujjatlarni filtrlash;

- Hujjatlarni klasterizatsiyasi;

- Qidiruv tizimlari arxitekturasi va foydalanuvchi interfesini loyihalash;

-Axborotlarni ajratib olish, xususiy holda hujjat annotatsiyasi va referatini tayyorlash;

- So’rov tillari va boshq.

Shuningdek, AQ tizimlari tabiiy tillarni qayta ishlashda ba’zi masalalarga duch kelmoqda, jumladan, morfologik tahlil, leksik noaniqlikni hal qilish va boshqalarni o’z ichiga oladi.

 

1.6. Samaradorlikni baholash



AQT tomonidan topilgan hujjatlar so’rovga qanchalik mos kelishini baholashning ko’plab usullari mavjud. Afsuski, so’rovlarning muvofiqlik darajasi, boshqacha aytganda relevantnosti, sub’ektiv tushuncha hisoblanadi, muvofiqlik darajasi esa so’rov bajarilishi natijalarini baholovchi aniq insonga bog’liq.  


Download 64.55 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9   10   11




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling