Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 18]

Глава 1.
Анализ проблемы 1.1 Структуризация задачи автоматизированного ввода рукописных документов Как оценить целесообразность разработки и внедрения автоматизированной системы ввода рукописных документов? Очевидно, что если стоимость нового решения в разумной перспективе ниже, чем стоимость существующих решений, то .модернизация какой-либо деятельности имеет смысл.
Применительно к задаче ввода рукописных документов в компьютер
целесообразность нововведения можно сформулировать так: эффективность автоматизированного ввода данных должна быть выше, чем эффективность ручного ввода.
Для понимания того, чем определяется эффективность автоматизированной системы, рассмотрим пример типичной системы ввода рукописных документов.
Технологический процесс ввода
состоит из пяти шагов: 1.
Ввод рукописного документа в компьютер.
Эта операция может быть осуществлена с помощью сканирующего устройства.
За последнее десятилетие быстрое
развитое рынка компьютерных технологий привело к расширению ассортимента производимых и предлагаемых пользователям сканеров, существенному снижению их цен и улучшению их характеристик.
Цены на устройства колеблются от 100 до 50000 долларов
США (при соответствующем разбросе характеристик).
Это позволяет подобрать адекватную модель,
удовлетворяющую всем техническим параметрам и требованиям для выполнения практически любой задачи.
В результате операции сканирования в памяти компьютера формируется растровое изображение листа черно-белое, серое или цветное.
2.
Анализ полученного изображения.
В ходе этой операции поток документов, если он содержит несколько разных типов документов, сортируется, и каждый документ опознается, то есть происходит процедура отнесения документа к определенному типу.
Затем определяется ориентация документа, т.
е.
он располагается привычным для чтения образом, и проводится анализ структуры документа, выделение областей (полей), в которых содержится полезная информация.
18
[стр. 5]

корреспонденции.
По самым скромным оценкам, количество почтовых отправлений измеряется десятками миллиардов за год.
Хотя многие страны частично решают задачу компьютеризации почтовых операций, вводя написание почтового индекса по направляющим линиям или стимулируя отправителей использовать маркировку с помощью штриховых кодов, объем корреспонденции, обрабатываемой вручную, остается очень большим.
Задача распознавания адреса остается одной из актуальнейших практических проблем, и почтовые ведомства многих развитых стран активно финансируют исследования в области распознавания образов, направленные на решение этой задачи [2}.
3.
Распознавание квитанций и чеков в банках.
Во многих странах распространенной практикой является оплата товаров и услуг с помощью чековых книжек и кредитных каргочек [3].При совершении покупки или иного платежа оформляется квитанция ($Нр), в которой указываются сумма, имя клиента, номер карточки и т.
д.
Эти квитанции передаются затем в банки, которые перечисляют по ним деньги со счета покупателя карточки насчет соответствующего предприятия.
Соответственно, возникает задача ввода данных с квитанции в компьютер.
Учитывая, что количество владельцев электронных карточек и чековых книжек во всем мире исчисляется сотнями миллионов, порождается очень большой объект рукописных документов.
Подытоживая вышесказанное, можно заключить, что задача автоматизированного ввода рукописных документов в компьютер является актуальной и решение этой задачи позволит достичь значительного экономического эффекта.
1 Общее описание проблемы Модернизация какой-либо деятельности имеет смысл только в том случае, если стоимость нового решения в разумной перспективе ниже, чем стоимость существующих решений.
Применительно к задаче ввода рукописных документов в компьютер
это обозначает, что эффективность автоматизированного ввода должна быть выше, чем эффективность ручного ввода.
Чтобы понять, чем определяется эффективность автоматизированной системы, рассмотрим пример типичной системы ввода рукописных документов.
Технологический процесс ввода
можно разбить на следующие этапы: 1.
Ввод изображения документа в компьютер.
В результате этой операции в памяти компьютера формируется растровое изображение листа черно-белое, серое или 5

[стр.,6]

цветное.
Эта операция осуществляется с помощью сканирующего устройства (сканера).
За последнее десятилетие быстрое
развитие рынка сканеров привело к расширению их ассортимента, существенному снижению цен и улучшению характеристик.
Цены на устройства колеблются от 100 до 50000 долларов,
при соответствующем разбросе характеристик.
Это позволяет подобрать адекватную модель
практически для любого мыслимого приложения.
2.
Анализ изображения.
Цели этой операции: а) опознать документ, если в одном потоке встречается несколько разных типов документов; б) определить ориентацию документа, т.
е.
расположить его привычным для чтения образом; в) проанализировать структуру документа и выделить области (поля), в которых содержится полезная информация.
3.
Распознавание изображения.
Цель этой операции состоит в извлечении информации из полей документа, т.с.
в преобразовании изображения полей страницы в текстовую или численную форму.
4.
Ручная и автоматизированная проверка результатов распознавания.
Цель этой операции состоит в проверке правильности введенной информации.
Ошибки возникают при заполнении формы из-за ошибок человека, и на этапах анализа и распознавания документа из-за несовершенства алгоритмов распознавания.
Проверка осуществляется как с помощью автоматических средств (контроль вводимой информации на непротиворечивость), так и ручным просмотром распознанных документов.
5.
Сохранение выверенных непротиворечивых результатов распознавания в информационной системе предприятия.
На этом этапе информация передастся из временного хранилища системы ввода в основную базу данных для использования ее участниками процесса обработки информации.
Начиная с этого момента, электронная копия документов становится первичной, а бумага либо уничтожается, либо сдается в архив.
Целесообразность внедрения автоматизированного ввода определяется в первую очередь стоимостью эксплуатации.
Чтобы понять, из чего складывается стоимость эксплуатации, проанализируем по очереди все этапы ввода.
Анализ, распознавание и сохранение результатов распознавания выполняются автоматически, поэтому затрат ручного труда на этих операциях нет.
6

[Back]