Проверяемый текст

Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)

[стр. 165]
Разработанный метод целостного, целенаправленною поэтапного применения классификаторов, существенно превосходит по скорости и надежности существующие распознаватели, при сохранении точности структурного классификатора и выдает результаты в виде, пригодном для использования современными методами контекстной обработки.
Предложенный новый метод построения классификатора базируется на трех фундаментальных принципах принципе целостности, целенаправленности и использования контекста.
Разработан структурный классификатор, который осуществляет сопоставление эталона непосредственно с исходным изображением, а не с заранее просчитанными признаками.
Установлено, что структурная модель описания символа позволяет добиться высокой точности распознавания при практически неограниченной вариабельности символа, что особенно важно для распознавания нестилизованного рукописного текста.
Описан способ улучшения эффективности системы распознавания методом приведения изображения для простого растрового и признаковых классификаторов.
Использование алгоритма приведения для структурного изображения приводит к потере информации о дефектах исходною изображения и поэтому не используется.
Разработана новая признаковая модель распознаваемого объекта, использующая 232 признака, которые вычисляются в отличие от известных подходов не на растровом, а на векторном изображении символа.
Предложенная модель показала улучшенные результаты по сравнению с другими системами признаков.
Установлено, что применение нелинейного преобразования ослабляет влияние шумов при обучении этапонов.
Разработан новый язык структурных описаний эталонов распознаваемых символов, позволяющий описывать символ как набор структурных элементов, связанных пространственно-метрическими отношениями, и обеспечивающий существенное улучшение качества распознавания.
В отличие от классических языков 165

[стр. 38]
изображением, с использованием априорной информации о символе и атрибутов уже выделенных элементов символа.
Это позволяет устойчиво выделять элементы на разорванных и искаженных изображениях.
Структурная модель описания символа позволяет добиться высокой точности распознавания при практически неограниченной вариабельности символа, что особенно важно для распознавания нсстилизованного рукописного текста.
Структурный эталон Структурный эталон описывает символ как набор структурных элементов, находящихся в определенных отношениях между собой.
Используется четыре типа структурных элементов: отрезок, дуга, кольцо, точка.
Набор используемых структурных элементов был выбран экспериментально за основу были взяты простейшие объекты, для которых легко создать алгоритмы поиска, и по мере разработки системы экспериментально проверялась достаточность этого набора элементов для описания рукописных знаков.
В эталоне указываются диапазоны допустимых значений атрибутов каждого элемента.
Например, для отрезка задаются допустимый диапазон углов и максимальное отклонение от прямой линии.
Отношения задаются как нечеткие логические высказывания.
В качестве переменных используются различные атрибуты элементов длины, описывающие рамки, углы, координаты характерных точек элементов.
Большинство отношений сводится к проверке того, что некоторая величина принадлежит диапазону с нечеткими границами.
В результате проверки отношения получается оценка в диапазоне [0..1].
Оценка О обозначает что отношение не выполняется, оценка 1 что отношение выполняется идеально.
Оценки всех отношений перемножаются, что соответствует нечеткой логической операции АЫЭ.
Ниже приведен для примера фрагмент описания символа “Н”, переписанный на упрощенном варианте языка структурных описаний.
Элементы: 1) Отрезок 01 (обязательный).
Отклонения от вертикали от -30° до +45°.
Расположен в левой половине описывающей рамки.
2) Отрезок 02 (обязательный).
Отклонения от вертикали от -30° до +45°.
Расположен в правой половине описывающей рамки.
38

[стр.,97]
изданий, суммарный объем которых эквивалентен двум тысячам страниц машинописного текста в сутки.
Вся эта гигантская работа выполняется с помощью 7 сканирующих и 10 распознающих станций, управляемых системой РтеЯеайег компании АВВУУ.
Заключение В данной работе поднята проблема автоматического ввода рукописных документов в компьютер.
На примере типовой системы было показано, что решающее значение на эффективность процесса ввода оказывает точность распознавания рукописных символов.
В результате была поставлена задача создать классификатор, существенно превосходящий по точности существующие.
Проведенный анализ литературы показал, что наиболее слабым местом современных систем распознавания являются применяемые принципы построения и комбинирования классификаторов, которые не позволяют целенаправленно использовать всю имеющуюся на изображении символа информацию для достижения максимальной точности.
Предварительное извлечение признаков приводит к потере информации, а классификация сосредоточивается на решении задачи выбора лучшего из N классов, которая изначально более сложна, чем задача выбора лучшего из двух классов.
Были предложены новые подходы к построению классификатора, которые базируются на принципах целостности, целенаправленности и использования контекста, и новые методы комбинирования классификаторов, основанные на использовании массовых парных дифференциальных классификаторов.
В результате были разработана и реализована система распознавания символов, которая основывается на многоуровневой комбинации классификаторов: трех полных (растрового, признакового и структурного), и большого количества парных дифференциальных классификаторов.
Для реализации структурного классификатора был разработан новый язык структу рных описаний, который позволяет описывать символ как набор структурных элементов, связанных пространственно-метрическими отношениями.
Были разработаны и реализованы алгоритмы поиска объектов на изображении, удовлетворяющих структурному описанию, и программная система, позволяющая составлять и настраивать структурные описания символов и отображать результаты их сопоставления.
97

[Back]