Matnni kodlash tashabbusi: Uning tarixi, maqsadlari va kelajakdagi rivojlanishi
Download 399.29 Kb. Pdf ko'rish
|
teiHistory (1)
umumlashtirilgan belgilash tili (SGML), ISO 8879-1986 (E) ([np]: Xalqaro standartlashtirish tashkiloti,
1986 yil). 3 Machine Translated by Google 1. Standart umumlashtirilgan belgilash tili (SGML) ko'rsatmalarni ishlab chiqish uchun mos asos ekanligini aniqlash; 2. SGML-dan foydalanish bo'yicha cheklovlar va tavsiyalarning spetsifikatsiyasi, ular almashinuv ehtiyojlariga eng yaxshi javob beradi, shuningdek, tadqiqot, ishlab chiqish va qo'llash ehtiyojlarining eng keng doirasiga xizmat qilish uchun maksimal umumiylik va moslashuvchanlikni ta'minlaydi; 3. matnni kodlash uchun toifalar va xususiyatlarni tahlil qilish va aniqlash ma'lumotlar, ko'p darajadagi tafsilotlar; 1993 yilning kuzida TEI oÿzining Mashinada oÿqiladigan matnlarni kodlash va almashish boÿyicha yoÿriqnomasining birinchi toÿliq versiyasini chiqardi.4 Ushbu hisobot matn turlarining katta diapazoni uchun kodlash qoidalari va til texnologiyasidagi tadqiqotlar uchun tegishli xususiyatlarni taqdim etadi. , gumanitar fanlar va hisoblash tilshunosligi muhim bosqichni ifodalaydi: TEIdan oldin hech qachon konventsiyalarni kodlash bo'yicha tadqiqot jamoasi o'rtasida konsensusga erishish mumkin bo'lmagan. 4. samarali, moslashuvchan va kengaytiriladigan umumiy matn strukturasi ta'riflari to'plamining spetsifikatsiyasi; 5. elektron matnlarni fayl ichida hujjatlashtirishning kutubxona katalogi konventsiyalariga mos keladigan va matnlar tarixini kuzatish uchun ishlatilishi mumkin bo'lgan va shu tariqa ularning kelib chiqishi va o'zgartirilgan o'zgarishlarni tasdiqlashda yordam beradigan usulning spetsifikatsiyasi; 6. maxsus turdagi matnlar yoki matnlar uchun kodlash qoidalarining spetsifikatsiyasi O'z yo'riqnomalarini ishlab chiqishda TEI tadqiqot hamjamiyatining almashish va turli xil qayta ishlash va tahlil ehtiyojlari uchun kodlash ehtiyojlarini aniqladi, shu asosda umumiy maqsadli sxema uchun talab qilinadigan kodlash tamoyillarini belgilab berdi va matnning asosiy turlari va xususiyatlarini aniqladi. kodlash konventsiyalarini ishlab chiqish kerak edi. Aksariyat hollarda oldindan mavjud bo'lgan kodlash konventsiyalari mavjud emas edi. Deyarli ko'p hollarda, real va potentsial qayta ishlash va tahliliy ehtiyojlar nuqtai nazaridan, ma'lum bir matn turi uchun kerakli toifalar va xususiyatlar va ularning munosabatlari oldindan tahlil qilinmagan. TEI ko'p sonli matn turlari uchun ushbu tahlilni yakunlash kabi muhim intellektual vazifani rag'batlantirdi va bajardi va unga asoslangan kodlash konventsiyalarini taqdim etdi. TEI yutuqlariga quyidagilar kiradi: xususiyatlari: a. belgilar to'plami b. til korpusi c. umumiy tilshunoslik d. lug'atlar e. terminologik ma'lumotlar f. og'zaki matnlar g. gipermedia h. adabiy nasr i. j oyat. drama k. tarixiy manbalar l. matn tanqidiy apparati TEI yo'riqnomasi ushbu ishning natijasidir. Ular matnlarning ko'p sinflarining jismoniy va mantiqiy tuzilishini tavsiflash uchun kodlash konventsiyalarini, shuningdek, ma'lum bir matn turiga xos bo'lgan yoki tipografiyada odatiy tarzda ifodalanmaydigan xususiyatlarni taqdim etadi. Ular matnni kodlashning umumiy muammolarini, jumladan, matn ichidagi va matnlararo oÿzaro bogÿlanish, ixtiyoriy matn segmentlarini chegaralash, parallel elementlarni tekislash, bir-birining ustiga chiqishini koÿrib chiqadi. 4 Mashinada o'qiladigan matnlarni kodlash va almashish bo'yicha ko'rsatmalar, CM Sperberg-McQueen va L. Burnard, tahrirlar. (Chikago va Oksfrod, ACH-ACL-ALLC matn kodlash tashabbusi, 1993). Machine Translated by Google 2.1 Ko'lami va maqsadi 2.1.1. "Matn" so'zining ta'rifi ierarxiyalar va boshqalar. Bundan tashqari, ular matnlarni akustik va vizual ma'lumotlarga bog'lash uchun konventsiyalarni taqdim etadi. Shunday qilib, TEI yo'riqnomalari keng foydalanuvchilarning asosiy ehtiyojlariga javob beradi: gumanitar fanlar, fanlar va ijtimoiy fanlar bo'yicha tadqiqotchilar, nashriyotlar, kutubxonachilar va umuman hujjatlarni qidirish va saqlash bilan bog'liq bo'lganlar. Ular, shuningdek, inson tilini tushunish, ishlab chiqarish va tarjima qilish bo'yicha tadqiqotlarni ilgari surish uchun og'zaki va yozma matnlar va leksikalarning ko'p tilli, ko'p modal korpusini to'playotgan o'sib borayotgan "til texnologiyasi" jamoasining ko'plab ehtiyojlariga javob beradi. Vassar konferentsiyasida uchrashgan guruhning tashvishi "gumanitar fanlar uchun mo'ljallangan matnlar" edi. Ushbu ta'rifga kiritilgan matnlar doirasi to'liq aniq emas edi; Umuman olganda, bunday matnlar har qanday tilda qadimiy yoki zamonaviy kengaytirilgan tabiiy nutq qismlarini o'z ichiga oladi, deyish mumkin. Biz ko'pincha yozma shaklda mavjud bo'lgan matnlar haqida o'ylashimiz mumkin, ammo og'zaki tilning transkriptlari kiritilishi mumkin. Muvofiqliklar, so'zlar ro'yxati, lingvistik tadqiqotlar natijalari va uzluksiz nutqning o'zaro bog'liqligi va koreferentsiyasiga ega bo'lmagan boshqa narsalar Vassar konferentsiyasida qabul qilingan matnlilikning yashirin mezonlariga javob berishi aniq emas edi. Uzluksiz matn bo'laklaridan iborat bo'lmagan, ammo qo'shma havolalari keng bo'lgan lug'atlar aniq chegarada mavjud bo'lib, oxir-oqibat Vassar guruhi tomonidan "matn" rukniga kiritilgan. Keyinchalik, biz TEIning maqsadlari va uning umumiy tashkil etilishini chuqurroq muhokama qilamiz. Download 399.29 Kb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling