Matnni kodlash tashabbusi: Uning tarixi, maqsadlari va kelajakdagi rivojlanishi


Download 399.29 Kb.
Pdf ko'rish
bet2/9
Sana18.06.2023
Hajmi399.29 Kb.
#1584430
1   2   3   4   5   6   7   8   9
Bog'liq
teiHistory (1)

umumlashtirilgan belgilash tili (SGML), ISO 8879-1986 (E) ([np]: Xalqaro standartlashtirish tashkiloti,
1986 yil).
3
Machine Translated by Google


1. Standart umumlashtirilgan belgilash tili (SGML) ko'rsatmalarni ishlab chiqish uchun mos
asos ekanligini aniqlash; 2. SGML-dan foydalanish bo'yicha cheklovlar
va tavsiyalarning spetsifikatsiyasi, ular almashinuv ehtiyojlariga eng yaxshi javob beradi,
shuningdek, tadqiqot, ishlab chiqish va qo'llash ehtiyojlarining eng keng doirasiga xizmat
qilish uchun maksimal umumiylik va moslashuvchanlikni ta'minlaydi; 3. matnni kodlash
uchun toifalar va xususiyatlarni tahlil qilish
va aniqlash
ma'lumotlar, ko'p darajadagi tafsilotlar;
1993 yilning kuzida TEI oÿzining Mashinada oÿqiladigan matnlarni kodlash va almashish boÿyicha
yoÿriqnomasining birinchi toÿliq versiyasini chiqardi.4 Ushbu hisobot matn turlarining katta diapazoni uchun
kodlash qoidalari va til texnologiyasidagi tadqiqotlar uchun tegishli xususiyatlarni taqdim etadi. , gumanitar
fanlar va hisoblash tilshunosligi muhim bosqichni ifodalaydi: TEIdan oldin hech qachon konventsiyalarni
kodlash bo'yicha tadqiqot jamoasi o'rtasida konsensusga erishish mumkin bo'lmagan.
4. samarali, moslashuvchan va kengaytiriladigan umumiy matn strukturasi ta'riflari
to'plamining spetsifikatsiyasi;
5. elektron matnlarni fayl ichida hujjatlashtirishning kutubxona katalogi konventsiyalariga
mos keladigan va matnlar tarixini kuzatish uchun ishlatilishi mumkin bo'lgan va shu
tariqa ularning kelib chiqishi va o'zgartirilgan o'zgarishlarni tasdiqlashda yordam
beradigan usulning spetsifikatsiyasi; 6. maxsus turdagi matnlar
yoki matnlar uchun kodlash qoidalarining spetsifikatsiyasi
O'z yo'riqnomalarini ishlab chiqishda TEI tadqiqot hamjamiyatining almashish va turli xil qayta ishlash va
tahlil ehtiyojlari uchun kodlash ehtiyojlarini aniqladi, shu asosda umumiy maqsadli sxema uchun talab
qilinadigan kodlash tamoyillarini belgilab berdi va matnning asosiy turlari va xususiyatlarini aniqladi.
kodlash konventsiyalarini ishlab chiqish kerak edi. Aksariyat hollarda oldindan mavjud bo'lgan kodlash
konventsiyalari mavjud emas edi. Deyarli ko'p hollarda, real va potentsial qayta ishlash va tahliliy ehtiyojlar
nuqtai nazaridan, ma'lum bir matn turi uchun kerakli toifalar va xususiyatlar va ularning munosabatlari
oldindan tahlil qilinmagan. TEI ko'p sonli matn turlari uchun ushbu tahlilni yakunlash kabi muhim intellektual
vazifani rag'batlantirdi va bajardi va unga asoslangan kodlash konventsiyalarini taqdim etdi.
TEI yutuqlariga quyidagilar kiradi:
xususiyatlari: a. belgilar
to'plami b. til korpusi c.
umumiy tilshunoslik d.
lug'atlar e.
terminologik ma'lumotlar
f. og'zaki matnlar
g. gipermedia h.
adabiy nasr i. j
oyat.
drama k.
tarixiy manbalar l. matn tanqidiy
apparati
TEI yo'riqnomasi ushbu ishning natijasidir. Ular matnlarning ko'p sinflarining jismoniy va mantiqiy tuzilishini
tavsiflash uchun kodlash konventsiyalarini, shuningdek, ma'lum bir matn turiga xos bo'lgan yoki
tipografiyada odatiy tarzda ifodalanmaydigan xususiyatlarni taqdim etadi. Ular matnni kodlashning umumiy
muammolarini, jumladan, matn ichidagi va matnlararo oÿzaro bogÿlanish, ixtiyoriy matn segmentlarini
chegaralash, parallel elementlarni tekislash, bir-birining ustiga chiqishini koÿrib chiqadi.
4 Mashinada o'qiladigan matnlarni kodlash va almashish bo'yicha ko'rsatmalar, CM Sperberg-McQueen va
L. Burnard, tahrirlar. (Chikago va Oksfrod, ACH-ACL-ALLC matn kodlash tashabbusi, 1993).
Machine Translated by Google


2.1 Ko'lami va maqsadi
2.1.1. "Matn" so'zining ta'rifi
ierarxiyalar va boshqalar. Bundan tashqari, ular matnlarni akustik va vizual ma'lumotlarga bog'lash
uchun konventsiyalarni taqdim etadi. Shunday qilib, TEI yo'riqnomalari keng foydalanuvchilarning
asosiy ehtiyojlariga javob beradi: gumanitar fanlar, fanlar va ijtimoiy fanlar bo'yicha tadqiqotchilar,
nashriyotlar, kutubxonachilar va umuman hujjatlarni qidirish va saqlash bilan bog'liq bo'lganlar. Ular,
shuningdek, inson tilini tushunish, ishlab chiqarish va tarjima qilish bo'yicha tadqiqotlarni ilgari surish
uchun og'zaki va yozma matnlar va leksikalarning ko'p tilli, ko'p modal korpusini to'playotgan o'sib
borayotgan "til texnologiyasi" jamoasining ko'plab ehtiyojlariga javob beradi.
Vassar konferentsiyasida uchrashgan guruhning tashvishi "gumanitar fanlar uchun mo'ljallangan
matnlar" edi. Ushbu ta'rifga kiritilgan matnlar doirasi to'liq aniq emas edi; Umuman olganda, bunday
matnlar har qanday tilda qadimiy yoki zamonaviy kengaytirilgan tabiiy nutq qismlarini o'z ichiga oladi,
deyish mumkin. Biz ko'pincha yozma shaklda mavjud bo'lgan matnlar haqida o'ylashimiz mumkin,
ammo og'zaki tilning transkriptlari kiritilishi mumkin. Muvofiqliklar, so'zlar ro'yxati, lingvistik tadqiqotlar
natijalari va uzluksiz nutqning o'zaro bog'liqligi va koreferentsiyasiga ega bo'lmagan boshqa narsalar
Vassar konferentsiyasida qabul qilingan matnlilikning yashirin mezonlariga javob berishi aniq emas
edi. Uzluksiz matn bo'laklaridan iborat bo'lmagan, ammo qo'shma havolalari keng bo'lgan lug'atlar
aniq chegarada mavjud bo'lib, oxir-oqibat Vassar guruhi tomonidan "matn" rukniga kiritilgan.
Keyinchalik, biz TEIning maqsadlari va uning umumiy tashkil etilishini chuqurroq muhokama qilamiz.

Download 399.29 Kb.

Do'stlaringiz bilan baham:
1   2   3   4   5   6   7   8   9




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling