Лекции по дисциплине «Информационные технологии»


Download 0.61 Mb.
Pdf ko'rish
bet38/42
Sana10.02.2023
Hajmi0.61 Mb.
#1188316
TuriЛекции
1   ...   34   35   36   37   38   39   40   41   42
Bog'liq
лек1-разблокирован

выравнивания изображения документа. 
Следующей операцией является чистка изображения документа. Многие 
бумажные документы содержит пятна, шероховатости, линии сгиба и другие 
дефекты, которые глаз не замечает. Они переходят в электронный образ до-
кумента и сильно мешают при электронной обработке. Поэтому проводится 
очищение изображения. Кроме того, зачастую документы имеют фон, одно-
цветный или разноцветный (например, на ценных бумагах), который необхо-
димо снять посредством фильтрации и выделения. 
Следующая операция подготавливает документ к распознаванию. Трудно-
сти возникают, когда элементы букв пересекаются с элементами форм, а 
также из-за дефектов бумаги и т.д. Системы распознавания удаляют элемен-
ты форм так, чтобы не пострадал текст. 
Следующая операция – распознавание. Существует огромное число систем 
распознавания, которые можно разделить на два класса: системы оптическо-
го распознавания OCR, которые работают только с полиграфическим тек-
стом, и интеллектуальные системы распознавания ICR, работающие с ру-
кописным текстом. Системы ICR распознают также штрих-коды, специаль-
ные метки.
Для каждого документа, прошедшего систему массового ввода, создается за-
дание. Задания размещаются на сервере баз данных. Часть операций системы 
массового ввода реализуется программно, другая – сервером. Для обеспече-
ния перечисленных операций выделяют сервер приложений, сервер сканиро-
вания и предварительной обработки изображений, сервер обработки изобра-


50
жений и распознавания (OCR-сервер или ICR-сервер). Число серверов может 
быть различным, для их координации используются серверы баз данных. 
После того как документ распознан, он поступает в систему управления до-
кументами, где проводится его индексация. Во многих системах функции 
управления документами и массового ввода совмещены. Примером является 
система Евфрат корпорации Cognitive Technologies
Третья часть электронного документооборота — автоматизация деловых 
процессов (АДП). Она предназначена для моделирования деятельности каж-
дого сотрудника, работающего с электронными документами. Состоит из 
графического редактора, модуля преобразования карт деловых процессов в 
конкретное АДП - приложение, модуля управления деловыми процессами. 

Download 0.61 Mb.

Do'stlaringiz bilan baham:
1   ...   34   35   36   37   38   39   40   41   42




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©fayllar.org 2024
ma'muriyatiga murojaat qiling