177
ВЕСТНИК ВГУ, СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ, 2018, № 3
Сравнительный анализ методов машинного обучения …
{ |
1.. }
l
O
o l
nO
=
=
– множество операций,
выполняемых над документом,
nO
–
общее
их количество;
( , , )
S
U P O
=
– структура документообо-
рота организации.
Используя данную математическую мо-
дель, мы можем
формализовать информаци-
онные потоки организации, а также описать
внутреннюю структуру документов, которую
представим в виде упорядоченных пар атри-
бутов документа и их значений:
{( , ) ,
1... ,
}
i
ik
ik
i
k
u
a d
nA
=
=
(2)
где
ik
a
– атрибут,
ik
d
–
его значение,
i
nA
– об-
щее количество атрибутов.
Среди всех атрибутов для решения задачи
классификации самую большую роль играет
его содержание – текст.
Do'stlaringiz bilan baham: