Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 145]

4.
После контекстной обработки точность
распознавания английских заглавных букв повышается более чем в 10 раз.
Для русских заглавных букв ситуация аналогичная достигается повышение точности распознавания с
99.09% до 99.9%, т.
е.
в 9 раз.
Таким образом, при наличии полноценной контекстной обработки символов распознаваемого текста
число ошибок можно сократить до уровня 0.1% и ниже.
145
[стр. 90]

третьего места.
Это обусловлено тем, что информация о контексте, т.
с.
словарь и языковые модели, могут исправить ошибку распознавания только в том случае, если правильный вариант располагается не очень глубоко.
Например, применительно к английским заглавным буквам точность первого варианта равна всего лишь 98.13%, тогда как по первым трем вариантам она возросла до 99.78%.
После контекстной обработки точность
повышается более чем в 8 раз.
Для русских заглавных букв ситуация аналогичная достигается повышение точности распознавания с
98.57% до 99.75%, т.
е.
в 6 раз.
Таким образом, при наличии полноценной контекстной обработки символов распознаваемого текста
можно сократить число ошибок до уровня 0.25% и ниже.
5 Практическое применение 5.1 Обзор реализованных программных систем Описываемая система распознавания одиночных символов используется в семействе программных средств КтеКеабег, разработанном компанией «АВВУ V».
Это ПО предназначено для автоматического ввода в компьютер текста, таблиц, форм, опросных листов, бланков и других документов, содержащих как печатные, так и рукописные символы.
Основным продуктом для ввода рукописных документов является программный комплекс РтсКсадег Рукопись.
Он продается во всех странах Западной и Восточной Европы, Северной Америки и Австралии.
Ко времени написания диссертационной работы было продано более 550 копий продукта РшеКеадег Рукопись.
Полная линия РтеКеабег включает в себя: РтеКеаёег 4.0 5(апс1агс1 система распознавания печатных документов на 53 языках.
Имеет пакетный режим работы, сохраняет оформление документа, включая таблицы, поддерживает фоновое распознавание, многопроцессорную работу, содержит модуль обучения новым символам.
Система экспортирует результаты напрямую в М$ \Уогс1, М3 Ехсе11, \№огб РегГесЕ \Уогб Рго или сохраняет в форматах КТР, ТХТ, ООС, СЗУ, ХЬЗ, ЭВР, НТМЬ.
РтеКеайег 4.0 РгоГе$§юпа1 система распознавания печатных документов на 53 языках.
Обеспечивает автоматизированный ввод таблиц и форм в базы данных, 90

[Back]