После распознания могут появиться лишние точки, тире, двоеточия, потому что документ был шумный и ридер распознал это как символ. Или волосок со скана распознался как слеш /
Например
|
Перед распознанием документа пользоваться ластиком в редактировании изображения в ABBYY FineReader и убирать возможные шумные места, чистить фон при помощи автоматических возможностей ридера («Убрать шум», «Осветлить фон»), не ставить на такие спорные места модули для распознавания текста
В распознанном документе визуально проконтролировать отсутствие таких недочётов и убрать их вручную
|
В документе не добавилось никаких лишних символов и текст предоставлен клиенту в таком же составе, как был прислан им на распознание
|