Ma'lumot maxfiy speechocean transcription guidelines en 3 20210701


Download 46 Kb.
Sana18.03.2023
Hajmi46 Kb.
#1280584
Bog'liq
ish


MA'LUMOT MAXFIY
Speechocean_transcription_guidelines_en_v2.3_20210701
- 1 -
SpeechOcean transkripsiyasi bo'yicha ko'rsatmalar
Umumiy transkripsiya konventsiyalari
1. Transkripsiyalar foydalanuvchi haqiqatda aytganlarini aks ettirishi kerak.
Bu so'zning rasmiy versiyasi bo'lishi shart emas yoki u grammatik emasmi yoki yo'q.
berilgan tarkib.
Masalan, Men savdo markaziga borishni xohlayman va savdo markaziga borishni xohlayman
Agar ma'ruzachilar "xohlayman" deyishsa, transkripsiya "xohlayman" emas, "xohlayman" bo'ladi.
Agar ma'ruzachi quyidagi namunaviy jumlada "bog'lar" ko'plik shaklini aytsa, uni aniq transkripsiya qiling
"obligatsiyalar" sifatida: to'lov muddati o'n yil bo'lgan obligatsiyalarni toping
2. Case
Transkripsiyalar, agar hujjat hujjatlarida boshqacha ko'rsatilmagan bo'lsa
ma'lumotlar bazasi. Barcha so'zlar va ismlar aralash harflar bilan yozilishi kerak.
To'g'ri ot (masalan, ismlar, manzillar, mamlakatlar, tashkilotlar, oylar va boshqalar) bilan boshlanadi
bosh harf, masalan, Xitoy, Microsoft va boshqalar.
Brend nomlari, tovar belgilari asl formati, shu jumladan, ularning asosiy shakli sifatida transkripsiya qilinadi (masalan,
MySpace, Hotmail dot com)
Gapning birinchi so'zining birinchi harfi bosh harf bilan yozilishi kerak.

3. Raqamlar ketma-ketligi


Raqamlar ketma-ketligi (parvoz raqamlari, vaqtlari, sanalari, samolyot turlari, pul miqdori va boshqalar) bo'ladi.
aytilganlarni aks ettirish uchun yozilgan ("parvoz olti bir uch"; "etti o'ttiz"; "yigirma birinchi avgust";
"etti qirq etti"; "to'rt yuz o'n dollar".)
Agar raqamlarda muqobil lug'at shakllari bo'lsa (masalan, ingliz tilida "nol" yoki "oh" yoki "naught"), to'g'ri
haqiqatda talaffuz qilingan shaklni aks ettiruvchi muqobildan foydalanish kerak.
Uzun raqamlar birga yozilishi yoki qisqartirish uchun qismlar orasiga bo'sh joylar qo'yilishi mumkin
leksika hajmi.
4. Harflar ketma-ketligi
Harf ketma-ketligi imlo so'zlar, pochta indekslari, qisqartmalar va qisqartmalarda uchraydi ("D F W"; "A P"
slash eighty"; "P M"; "C O"; "I B M" va h.k.) Harflar katta harfda, bo'sh joy bilan ajratilishi kerak.
AM va PM vaqtlari (masalan, "besh o'ttiz PM") harflar ketma-ketligiga misol sifatida ko'rib chiqiladi,
ya'ni katta harf va bo'sh joy bilan ajratilgan.
5. Qisqartmalar
Qisqartmalar turli elementlarning bosh harflariga asoslangan atamalarga ishora qiladi va shunday deb talaffuz qilinadi
so'zlar. Ular katta harf bilan yozilgan so'zlar orasida oq bo'shliqlarsiz yozilishi kerak
harflar.
Masalan,
"Men NASAda ishlayman."
"OITS jamiyatga katta ta'sir ko'rsatadi".
6. Qisqartmalar
Transkripsiyada qisqartmalarni kiritmang. Har doim yozilgan shakldan foydalaning (to'liq so'z)
shunday talaffuz qilinganda.
Masalan,
"Bu doktor Smit." = "Bu doktor Smit."
— Iltimos, Smit xonim shu yoʻldan. = "Xonim Smit, shu yo'ldan iltimos."
"Keyin ular Sankt-Polga borishdi." = "Keyin ular Sankt-Polga ketishdi."
7. Tinish belgilari
Grammatika qoidalariga muvofiq tinish belgilaridan foydalaning.
 Oxirgi tinish belgilaridan foydalaning (nuqta, savol belgisi, undov belgisi)
to'liq jumla.
 Apostrof va kabi so‘zning muhim qismi bo‘lgan tinish belgilaridan foydalaning
defis.
 Nutqning uzun qismlarini ajratish uchun verguldan foydalaning. Bu o'quvchini tushunishni osonlashtirish uchun.
 QO'YILING: nuqtali vergul, qo'shtirnoq.
Agar kimdir maxsus belgini gapirsa, belgini mos keladigan so'z bilan almashtiring (pastki
hol). Bu faqat foydalanuvchi belgini gapirganiga amin bo'lganda amalga oshirilishi kerak. The
transkripsiya aytilgan narsani aniq aks ettirishi kerak.

g.
"Rasmlar + Kamera" = "Rasmlar va kamera"


"My email is m-golden@" = "mening email is M dash gold at."
"1 + 1 = 2." = "bir ortiqcha bir ikkiga teng."
8. Tushunmaydigan so'zlar
Tushunib bo'lmaydigan nutq, so'zlar yoki nutqning mutlaqo tushunarsiz bo'lgan qismlari
“**” orqali transkripsiya qilingan. "**" belgisi qo'shni tushunarli so'zlardan bo'shliqlar bilan ajratilgan.
Masalan,
"Musiqani to'xtating." = "Musiqani ** to'xtating."
"Spotify'da ??? o'ynang." = "Spotify'da ** o'ynang."
9. To‘ldiruvchi so‘zlar
Toʻldiruvchi soʻzlar soʻzlovchilar ikkilanishni bildirish yoki a ni nazorat qilish uchun ishlatadigan “soʻzlar”dir
keyin nima deyishni o'ylab suhbat. Har bir tilda toʻldiruvchi soʻzlarning cheklangan toʻplami mavjud
karnaylar foydalanishi mumkin. To'ldiruvchi so'zlarning imlosi qanday ekanligini aks ettirish uchun o'zgartirilmasligi kerak
ma'ruzachi so'zni talaffuz qiladi va har bir to'ldiruvchi so'zdan oldin heshteg (#) qo'yilishi kerak.
Masalan,
"lekin #hm menga yoqadi."
"#hmm, ehtimol siz haqsiz."
"#ah, men tushundim."
10. Bir nechta tillar (kodni almashtirish)
Agar ma'ruzachi tillarni almashtirsa, o'zaro almashish joyiga tegini qo'ying
tillar boshlanadi va
kalit tugashi bilan boshlanadi. Agar tilning tabiati bo'lsa
Annotator tomonidan bir ma'noda tan olingan, "xorijiy" ni ISO639 til kodi bilan almashtiring
(odatda ikki harfli, kichik harfli qisqartma) yangi til. Oldin bo'sh joy bo'lishi kerak
va har bir chet tili tegidan keyin.
Masalan,
"Bilmayman, amigo." = “Bilmayman, amigo.

11. Nutqdan tashqari akustik hodisalar
Nutqsiz akustik hodisalarning beshta toifasi transkripsiya qilinishi kerak. Voqealar faqat bo'ladi
agar ular aniq ajralib tursa, transkripsiya qilinadi. Juda past darajadagi, ya'ni aralashmaydigan hodisalar bo'ladi
e'tiborga olinmagan.
Hodisa sodir bo'lgan joyda, burchakda belgilangan belgilar yordamida transkripsiya qilinadi
qavslar. Bir yoki bir nechta so'z oralig'ida sodir bo'ladigan shovqin hodisalari uchun transkripsiya kerak
shovqinning boshlanishini, u ta'sir qiladigan birinchi so'zdan oldin ko'rsating.
akustik hodisalarning birinchi toifasi ma'ruzachidan va boshqa toifalardan kelib chiqadi
boshqa manbadan kelib chiqadi. Karnaydan chiqadigan tovushlar odatda bir-biriga mos kelmaydi
maqsadli nutq, boshqa manbalardan kelib chiqadigan tovushlar esa, albatta, paydo bo'lishi mumkin
nutq bilan bir vaqtda.
Teglarni aniqlashga misol

Karnay shovqini: turli xil tovushlar va shovqinlar
so'ralgan matnning bir qismi bo'lmagan ma'ruzachi, masalan. lab urish,
yo'tal, xirillash, tomoqni tozalash, tilni chertish, baland ovozda nafas olish, kulish, baland ovozda
xo'rsinmoq. Ushbu marker, shuningdek, ma'ruzachi bo'lgan holatda ham qo'llanilishi kerak
so'zdan oldin yoki keyin mikrofonga zarba beradi. Faqat baland lab
zarbalar va nafaslarni transkripsiya qilish kerak.
Per

Statsionar shovqin: Bu turkumda fon shovqini mavjud
intervalgacha emas va ko'proq yoki kamroq barqaror amplitudaga ega
spektr ma'lum vaqt ichida. Misollar, ovozli shovqin (mexnat partiyasi
shovqin), fon shovqini, sirenalar, shamol, yomg'ir, baland mashina shovqini
tashqarida. Musiqa, agar eshitiladigan bo'lsa, statsionar deb ham belgilangan
mo'ljallangan bo'lmasa ham. Bu belgi kamdan-kam hollarda jimlikda qo'llanilishi kerak
ish stoli muhiti.
yaxshimisiz
qilish

Insoniy bo'lmagan shovqin: Bu turkumda an shovqinlari mavjud
intervalgacha tabiat. Bu shovqinlar odatda a kabi faqat bir marta paydo bo'ladi
eshikni taqillatish, biror narsani tushirish yoki sichqonchani bosish.
uchun hech qanday dalil yo'q
u taklif qiladi
pora oldi

Birlamchi boʻlmagan dinamiklar shovqini sifatida transkripsiya qilindi: Shovqin
boshqa odamning labini urish, yo'tal, tomoq, til kabi
bosing, yuk nafas, kulish, va nutq birlamchi emas
karnaylar hammasi kiritilgan.
u allaqachon bo'lgan
ichki ostiga joylashtirilgan
tergov
Izoh:
va faqat tovushlar atrof-muhitga xos bo'lmagan hollardagina qo'llanilishi kerak. Masalan, mashinada
statsionar fon shovqini va ko'cha shovqinlarini yozish muhiti bilan ta'minlanganidek kutish mumkin.
Bu shovqinlarni transkripsiya qilmaslik kerak. Berilgan fondan faqat aniq va sezilarli og'ishlar bo'lishi kerak
belgilangan. odatda so'zlarning boshlang'ich holatiga qo'yiladi. dan foydalanish afzal EMAS
"Restoran" yoki "ko'cha" muhiti yoki atrofda gaplashayotgan boshqa odamlarni belgilash uchun.
 Agar yoki so'zda boshlansa, belgi ta'sirlangan birinchi so'zdan oldin qo'yiladi. Belgilar edi
har doim atrofdagi so'zlardan bo'shliqlar bilan ajratiladi.
Download 46 Kb.

Do'stlaringiz bilan baham:




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling