Lingvist oxirgi shakl 1-son indd


Corpus of monolingual texts


Download 1.51 Mb.
Pdf ko'rish
bet103/123
Sana02.12.2023
Hajmi1.51 Mb.
#1779748
1   ...   99   100   101   102   103   104   105   106   ...   123
Bog'liq
Lingvist OXIRGI SHAKL 1-son

Corpus of monolingual texts: corpus containing monolin-
gual texts. The corpus of texts in the same language is divided into 
subgroups: corpuses of texts of different genres, corpuses reflect-
ing problems, corpuses with titles, corpuses of studies, illustrative 
corpuses, corpuses of the field, corpuses of authors, corpuses of 
researches, corpuses of journalistic texts, linguodidactic limousine 
bodies).
The corpus of parallel texts can be bilingual (Uzbek-En-
glish, Russian-English) and multilingual (Russian-English-French). 
“The corpus of parallel texts is being created for scientific and practi-
cal purposes (including for the purpose of teaching foreign languag-
es). According to the structure of parallel texts, it consists of texts 
translated from the source language into the target language. For 
example, the English text of “Alie in Wonderland” and its translation 
in German, French, and Russian languages are the basis for creating 
parallel texts” [Baranov, 2001:62].
The role of parallel corpora in the improvement of artificial intelligence
155


With the help of parallel corpus, it is possible to know the vari-
ants of a word, sentence, paragraph, supersyntactic units in different 
languages. Parallel corpus are important databases for today’s era of 
widespread intercultural communication. Through parallel corpus, 
it will be possible to identify universals in different language envi-
ronments and cultures, as well as specific mental characteristics of 
languages, realia and lacunar units. The corpus of parallel texts also 
serves for the development of automatic translation, ensures the 
development of computer lexicography. Using the corpus of parallel 
texts, special concordance programs are developed and it is possible 
to create different specialized dictionaries. The capabilities of artifi-
cial intelligence used in these processes will also expand.
A parallel corpus is a corpus containing sets of original texts 
in L1 and their translated sets of texts in languages L2 ... Ln. In most 
cases, a parallel corpus contains information in only two languag-
es. Closely related to parallel corpus are “comparative corpus (com-
parable corpus)”, which are two or more works that are similar in 
genre, subject, but not identical in content and form consists of texts 
in more than one language. A parallel corpus can be bilingual or mul-
tilingual, i.e. bilingual and multilingual. In other words, they consist 
of texts in two or more languages.
The cost of any case is determined by its size. The larger the 
size, the more material the corpus covers, the wider the possibilities 
of the language. The cost of parallel texts is determined by the size 
as well as the number of languages. For example, Gigaword corpus: 
covers English, Arabic, and Chinese languages and consists of 2 bil-
lion words. Aquis ommunautaire is the world’s largest corpus of par-
allel texts. An important point is that the use of this corpus is free, 
and it contains rare language pairs such as Maltese-Estonian, Slove-
nian-Finnish. Parallel cases can be used for the following purposes:
1) implementation of typical translation methods and cre-
ation of transformation;
2) study the statistics of the automatic translation system;
3) creating monolingual and multilingual dictionaries;
4) study and evaluation of information storage and transmis-
sion programs;
5) automatic verification of the accuracy of the translated 
text;
6) facilitating the translator’s work through the wide range of 
options for equivalent selection [Garabik, 2006:82].
The largest number of parallel corpus is based on the English 

Download 1.51 Mb.

Do'stlaringiz bilan baham:
1   ...   99   100   101   102   103   104   105   106   ...   123




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling