Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 61]

Автоматическое обучение отсутствует, вместо этого используется интерактивный процесс написания, тестирования и отладки эталона на образцах рукописных символов.
Структурный классификатор Структурный классификатор был разработан в соответствии с принципами целостности, целенаправленности и использования контекста, которые применительно к общей задаче распознавания образов впервые были сформулированы в
[67], и применительно к задаче распознавания рукописных символов описаны в [68, 70,71,72, 73, 74].
В рамках структурного классификатора
модель символа определяется в виде предложенного в данной работе набора структурных элементов и допустимого взаимного их расположения задаваемых с помощью декчаративных метрических отношений.
В качестве переменных в отношениях используются атрибуты и координаты характерных точек элементов, например, концов и экстремумов.
Отношения задаются в форме нечетких логических высказываний.
Структурные элементы на изображении не выделяются заранее.
Вместо этого поиск элементов делается целенаправленно, прямо в процессе сопоставления эталона с
изображением, с использованием априорной информации о символе и атрибутов уже выделенных элементов символа.
Это позволяет устойчиво выделять элементы на разорванных и искаженных изображениях.
Структурная модель описания символа позволяет добиться высокой точности распознавания при практически неограниченной вариабельности символа, что особенно важно для распознавания
нестилизованного рукописного текста.
Сравнительные характеристики используемых классификаторов Экспериментальные комбинации всех четырех описанных выше классификаторов и их рабочие характеристики приведены в таблице 3.1.
61
[стр. 33]

3 Методы решения поставленной задачи 3.1 Содержательная постановка задачи Важный вывод, который следует из анализа предшествующих работ, заключается в том, что никакой из существующих подходов к построению классификатора не является идеальным.
Поэтому для достижения наилучших результатов система распознавания символов должна быть построена как комбинация трех классификаторов: растрового, признакового и структурного.
Растровый классификатор достаточно хорошо изучен и не обладает принципиальными недостатками, препятствующими его использованию.
Исходя из этого можно поставить следующую задачу: Реализовать растровый классификатор, выбрав один из описанных в литературе вариантов, и адаптировать его в соответствии с требованиями решаемой задачи.
Создание признакового классификатора требует решения двух задач выбора системы признаков и выбора решающего правила.
Задача создания решающего правила очень хорошо исследована как с теоретической так и с практической стороны.
Выбор признаков исследован намного хуже, но существует значительное количество экспериментальных работ, описывающих примеры признаков.
С учетом сказанного можно сформулировать следующую задачу: Реализовать признаковый классификатор, выбрав оптимальный набор признаков из описанных в литературе или разработав новые признаки.
В качестве решающего правила выбрать один из описанных в литературе вариантов, адаптировав его в соответствии с требованиями решаемой задачи.
Создание структурного классификатора представляет собой наиболее сложную задачу.
Описанные в литературе структурные классификаторы не отвечают трем фундаментальным принципам построения структурной системы восприятия целостности, целенаправленности и использования контекста, которые применительно к общей задаче распознавания образов впервые были сформулированы в [65], и применительно в задаче распознавания рукописных символов описаны в [66, 67, 68, 69, 70,71].
Согласно принципу целостности, распознаваемый объект рассматривается как целое, состоящее из частей, связанных между собой пространственно-метрическими 33

[стр.,37]

• Растровый классификатор.
Использует 196 бинарных признаков, являющихся точками растрового изображения размера 14 на 14 точек.
Решающее правило основано на функции расстояния.
При обучении производится кластеризация.
• Дифференциальный признаковый классификатор.
Представляет собой набор линейных классификаторов, обучаемых для каждой пары путающихся символов.
Для всех пар используегся один набор из 224 признаков признаковый классификатора плюс два дополнительных признака.
• Структурный классификатор.
Основной классификатор системы, определяющий качество сс работы.
Использует построенные человеком структурные модели символов, которые сопоставляются с распознаваемым изображением.
Обладает очень высокой обобщающей способностью, не нуждается в кластеризации.
Автоматическое обучение отсутствует, вместо этого используется интерактивный процесс написания, тестирования и отладки эталона на образцах рукописных символов.

• Дифференциальный структурный классификатор.
Представляет собой набор линейных классификаторов, обучаемых для каждой пары путающихся классов.
Для каждой пары используется индивидуальный набор признаков, подбираемый человеком.
Структурный классификатор Структурный классификатор был разработан в соответствии с принципами целостности, целенаправленности и использования контекста, которые применительно к общей задаче распознавания образов впервые были сформулированы в
[65], и применительно к задаче распознавания рукописных символов описаны в [66, 67, 68, 69, 70,71].
В рамках структурного классификатора
символ описывается как набор структурных элементов (отрезок, дуга, кольцо, точка), а допустимое взаимное расположение элементов определяется с помощью декларативных метрических отношений.
В качестве переменных в отношениях используются атрибуты и координаты характерных точек элементов, например, концов и экстремумов.
Отношения задаются в форме нечетких логических высказываний.
Структурные элементы на изображении не выделяются заранее.
Вместо этого поиск элементов делается целенаправленно, прямо в процессе сопоставления эталона с
37

[стр.,38]

изображением, с использованием априорной информации о символе и атрибутов уже выделенных элементов символа.
Это позволяет устойчиво выделять элементы на разорванных и искаженных изображениях.
Структурная модель описания символа позволяет добиться высокой точности распознавания при практически неограниченной вариабельности символа, что особенно важно для распознавания
нсстилизованного рукописного текста.
Структурный эталон Структурный эталон описывает символ как набор структурных элементов, находящихся в определенных отношениях между собой.
Используется четыре типа структурных элементов: отрезок, дуга, кольцо, точка.
Набор используемых структурных элементов был выбран экспериментально за основу были взяты простейшие объекты, для которых легко создать алгоритмы поиска, и по мере разработки системы экспериментально проверялась достаточность этого набора элементов для описания рукописных знаков.
В эталоне указываются диапазоны допустимых значений атрибутов каждого элемента.
Например, для отрезка задаются допустимый диапазон углов и максимальное отклонение от прямой линии.
Отношения задаются как нечеткие логические высказывания.
В качестве переменных используются различные атрибуты элементов длины, описывающие рамки, углы, координаты характерных точек элементов.
Большинство отношений сводится к проверке того, что некоторая величина принадлежит диапазону с нечеткими границами.
В результате проверки отношения получается оценка в диапазоне [0..1].
Оценка О обозначает что отношение не выполняется, оценка 1 что отношение выполняется идеально.
Оценки всех отношений перемножаются, что соответствует нечеткой логической операции АЫЭ.
Ниже приведен для примера фрагмент описания символа “Н”, переписанный на упрощенном варианте языка структурных описаний.
Элементы: 1) Отрезок 01 (обязательный).
Отклонения от вертикали от -30° до +45°.
Расположен в левой половине описывающей рамки.
2) Отрезок 02 (обязательный).
Отклонения от вертикали от -30° до +45°.
Расположен в правой половине описывающей рамки.
38

[Back]