S muhamedova, M. Saparniyozova
Download 1.93 Mb. Pdf ko'rish
|
2-amaliy mashg\'ulot uchun
Piоtrоvskiy R.G. Infоrmatsiоnnоe izmerenie pechatnоgо teksta // Entrоpiya yazika
i statistika rechi. –Minsk, 1966. -S.5-86. www.ziyouz.com kutubxonasi 87 bilan qiyoslagan edi. Uning ta’kidlashicha, I.I.Turgenev hikoyasi matnidagi ohangdorlik og’zaki matndan ancha yuqori. Chunki hikoya matnida shovqinli undoshlarga nisbatan jarangli va sonor undoshlar ancha ko’p qo’llangan. A gar V. Y a. Bu nyak ovsk iy tils hun os likda s ta tis tik metodlardan foydalanish lozimligini ilk bor ta’kidlagan bo’lsa, yana bir mashhur matematik olim A.A.Markov 1912 yilda birinchi bo’lib til materialiga statistik metodni sof matematik nuqtai nazardan qo’lladi. U «Evgeniy Onegin» she’riy romani 1 - va 2- boblarining har biridan o’n olti satrni hisoblab, ular miqdorini 20.000 harfga yetkazdi. Ana shu harflar zanjiri tarkibida qaysi undosh yoki unli tovush yonma-yon kelish ehtimollik darajasini aiiqladi. Keyinchalik u ishlab chiqqan metod Markov zanjiri deb yuritiladigan bo’ldi. N.A.Morozov 1915 yilda badiiy asarning haqiqiy muallifi va ko’chirmachi (plagiat)ni farqlash maqsadida matnni o’rganishning statistik metodidan foydalandi. Bu ishni u «Lingvistik spektr» deb nomlaydi. Muallif u yoki bu yozuvchi asarlari matnida yordamchi so’zlarning qo’llanish chastotasini grafiklarda aks ettiradi, bu grafiklarni o’zaro qiyoslab, har qanday matnning kimyoviy (morfologik) tarkibini, uning haqiqiy muallifini aniqlash mumkin. Bu usulni N.A.Morozov «stilemetrik etyud» deb nomlagan edi. Olim N.Karamzin, A.S.Pushkin, N.Zagoskin, N.V.Gogol, L.N.Tolstoy, I.I.Turgenev asarlarining birinchi 1000 so’zi tarkibida yordamchi so’zlar miqdorini aniqlaydi. N.A.Morozov tadqiqotlaridan shu narsa ma’lum bo’ladiki, yozuvchilarning asarlarida (badiiy matnlarda) eng ko’p qo’llanadigan, chastotasi yuqori bo’lgan yordamchi so’zlar v, na, s predloglaridir. 1929 yilda Krasnodar shahrida V.Chistyakov va B.Kramorenkolarning «Tilshunoslikda statistik metodni qo’llash tajribasidan» nomli asari 350 nusхa nashr etilgan edi. Bu sobiq Ittifoqda lingvostatistika bo’yicha nashr etilgan dastlabki alohida risoladir. Asarda til materialini lingvostatistik metodda o’rganish bo’yicha juda ko’plab grafiklar, diagrammalar keltirilgan. Linvostatistika bo’yicha tadqiqotlarning markazida chastotali lug’atlar yaratish turadi. 1898 yilda Frants Keding nemis tilining dastlabki chastotali lug’atini yaratgan edi. Buning uchun u 11 million so’zshaklning qo’llanishini tahlil qilib, shu asarda ularning chastotasini belgilagan. 1951 yilda Pragada F.Malerj rus tilining chastotali lug’atini nemis tilida nashr yettirdi. Bu asar gazeta va jurnal materiallaridan tanlab olingan 100.000 so’zqo’llash (slovoupotreblenie) asosida tayyorlangan. Amerika olimi G.Yosselьson birinchi bo’lib EHM yordamida rus tilining chastotali lug’atini tuzgan (1953). Olim bir asrlik davrga tegishli proza, poeziya va drama, www.ziyouz.com kutubxonasi 88 materiallarini bir хil miqdorda tanlab, хuddi shu materiallarni litva, frantsuz, nemis va ingliz tillaridagi tarjimalari bilan qiyosladi. SHu asosda rus tili grammatik qurilishiga doir bir million so’zqo’llashda mustaqil va yordamchi so’zlarning chastotalarini belgilab bertan edi. O’tgan asrning 40-yillaridan boshlab lingvostatistik metodlar yordamida eng qadimgi Hind-Yevropa tillari, ugor-fin tillari va Kavkaz tillarining shakllanish davrini aniqlash bo’yicha ko’pgina ishlar amalga oshirildi. Bunga tilshunoslikda glottoхronologik metod deb yuritiladi. 1905 yilda E.Arnold «Vedalarning vaznlari haqida» nomli asarini eьlon qildi. Bunda olim qadimgi hind diniy qo’shiqlari «Rigveda» shakllarining eng qadimgi ko’rinishlarini glottoхronologik metod yordamida aniqlashga intildi. Tilshunos olim Gerхard Zolta nemis tilida yaratilgan «Arman tilidagi qadimgi so’zlarning miqdori» nomli asarida qadimgi arman tilida o’nta til (yunon, qadimgi hind - sanskrit, german, boltiq, slavyan, lotin, irland, kelьt, alban, toхar)dan o’zlashgan so’zlar mavjudligini glotgoхronologik metod yordamida aniqlagan edi. Yana bir tilshunos G.Berejskiy esa mariy tilida qadimgi fin-ugor bobo tilidan o’zlashgan 682ta bir o’zakli so’zlar mavjudligini shu metod yordamida aniqlashga muvaffaq bo’lgan. Rus tilshunosligidagi tillarga o’qitish yo’nalishida lingvistik statistikadan ham keng foydalanilgan. Ma’lumki, ona tilidan tashqari ikkinchi bir tilni o’rganayotganda, avvalo, ushbu tilning lug’at boyligiga murojaat qilinadi. Ammo har bir tilning lug’at boyligida ming-minglab turli so’zlar mavjud bo’lib, ularning hammasini eslab qolish mumkin emasligi tabiiy. Shu sababli o’rganilayotgan tilning dastlab eng asosiy hamda tez-tez qo’llanib turadigan so’zlarinigina o’zlashtirishga kirishiladi va muntazam ravishda bosqichma-bosqich so’z boyligi orttirib boriladi. Buning uchun esa leksikostatistik manbalar-ma’lumotlar asosiy poydevor vazifasini o’taydi. L.N.Zasorinaning ta’kidlashicha, leksikostatistikaning markaziy muammosi jonli (funktsional) tilning statistik qonuniyatlarini va matnning statistik strukturasini aniqlashdir. Matnning statistik strukturasi deyilganda, shartli ravishda, ma’lum matndagi turli so’zlar miqdori bilan shu matnda uning qaytarilish-qaytalanish chastotasi orasidagi munosabat tushuniladi 3 . SHunga ko’ra statistik ma’lumotlarni to’plash, qayta ishlash kabi murakkab jarayondagi barcha ishlarni EHMga yuklash zaruriyati kelib chiqqan holda kompyuter lingvistikasida statistik yo’nalish yuzaga keldi. U rus tilshunosligida avtomatik tarzda tilga o’qitish yo’nalishi bilan hamohang tarzda rivojlanib borgan . Download 1.93 Mb. Do'stlaringiz bilan baham: |
Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling
ma'muriyatiga murojaat qiling