Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 111]

объем проделанной работы.
Работа измеряется в количестве исходных отрезков, пройденных выделителями.
Ограничение устанавливается на сопоставление одного эталона.
Максимальное число проходимых отрезков зависит от эталона; этот параметр можно изменять в тексте описания эталона.

Это крайне важно для случаев особо сложных символов, для которых стандартный порог слишком мал.
Ограничение на число пройденных отрезков ослабляется для выделителей, продолжающих локально лучший путь.
Такие выделители имеют возможность пройти какое-то небольшое число
отрезков, даже после исчерпания глобального лимита.
Это правило частично компенсирует
неизбежное ухудшение качества распознавания из-за введения ограничений.
5.5 Методика разработки структурных описаний Разработка структурного описания символов, подлежащих распознаванию, включает в себя выбор структуры символа, формирование текста описания и экспериментальную проверку и отладку.
Описание признается идеальным, если при его использовании: 1.Подтверждаются все символы своего класса и только символы своего класса.
2.
Оценки подтверждения удовлетворяют разработчика; по описанию (в принципе) можно построить все изображения символов своего класса и только изображения символов своего класса.

При описании структурного элемента необходимо: 1.
Задать атрибуты элемента, определяющие его локализацию, ориентацию, прямолинейность или кривизну и пр.,
2.
Задать пространственную привязку характерных точек структурного элемента к рамке или к ранее выделенным элементам,
3.
Задать соотношение размеров структурных элементов,
111
[стр. 79]

за длину неиспользованного векторного изображения и штрафа за несоответствие описывающих рамок исходного изображения и найденного варианта сопоставления.
При расчете длины неиспользованного векторного изображения делается поправка для маленьких отростков из их длины вычитается 2 пиксела для компенсации погрешностей векторизации.
Возможно, после улучшения векторизации эту поправку можно будет откинуть.
Зависимость штрафа от длины остатка представляет из себя монотонно убывающую функцию, форма которой определялась экспериментально (рис.
3.14).
оценка 1/4 3/4 полной диагонали длины изображения Рис.
3.14.
Штраф за остаток черного.
Ограничение на объем проделанной работы Процесс сопоставления структурного эталона с изображением может легко породить комбинаторный взрыв.
Чтобы этого не происходило, имеется ограничение на объем проделанной работы.
Работа измеряется в количестве исходных отрезков, пройденных выделителями.
Ограничение устанавливается на сопоставление одного эталона.
Максимальное число проходимых отрезков зависит от эталона; этот параметр можно изменять в тексте описания эталона,
что крайне необходимо случае отдельных особо сложных символов, для которых стандартный порог слишком мал.
Ограничение на число пройденных отрезков ослабляется для выделителей, продолжающих локально лучший путь.
Такие выделители имеют возможность пройти какое-то небольшое число
79

[стр.,80]

отрезков даже после исчерпания глобального лимита.
Это правило частично компенсирует
ухудшение качества распознавания из-за введения ограничений.
3.10 Структурный дифференциальный классификатор Набор признаков, используемых линейным классификатором, задается индивидуально для каждой пары кластеров.
Существует три стандартных признака, которые по умолчанию включаются в каждую пару: • разность логарифмов структурных оценок первого уровня, • разность весов признакового классификатора, деленная на меньший из двух весов, • разность весов растрового классификатора, деленная на меньший из двух весов.
При необходимости стандартные признаки можно по одному отключать независимо для каждой пары кластеров.
Дополнительные признаки задаются с помощью программы, записываемой человеком на языке структурных описаний.
Основная конструкция этой программы оператор добавления дифференциального признака.
В результате выполнения этой программы формируется массив дополнительных признаков.
Автоматическое обучение Обучение классификатора производится автоматически по выборке изображений из базы, аналогично признаковому дифференциальному классификатору.
В обучении участвуют только те изображения, которые распознаются двумя структурными эталонами.
Знак коэффициентов для стандартных признаков можно предсказать заранее, поэтому о коэффициентах “подозрительного” знака выдается предупреждение.
Для дополнительных признаков принято соглашение, что большие значение свидетельствуют в пользу первого из сравниваемых кластеров, что также дает возможность предсказать для них знак коэффициента линейного классификатора и выдать при необходимости предупреждение.
3.11 Методика разработки структурных описаний Последовательность разработки структурного описания Разработка структурного описания символов, подлежащих распознаванию включает в себя выбор структуры символа, формирование текста описания и 80

[стр.,81]

экспериментальную проверку и отладку.
Описание признается идеальным, если при его использовании: 1.
Подтверждаются все символы своего класса и только символы своего класса.
2.
Оценки подтверждения удовлетворяют разработчика; по описанию (в принципе) можно построить все изображения символов своего класса и только изображения символов своего класса.

Описывая структурный элемент необходимо: • задать атрибуты элемента, определяющие его локализацию, ориентацию, прямолинейность или кривизну и пр.,задать пространственную привязку характерных точек структурного элемента к рамке или к ранее выделенным элементам,задать соотношение размеров структурных элементов, • при необходимости задать пространственные и метрические характеристики особых частей структурного элемента, выделяемых между его характерными точками.
Тестирование описания Искажения при письме и векторизации, а также недостаточная выразительность языка описаний приводят к тому, что построить идеальные описания нельзя.
Цель проверки и отладки описаний максимально возможное приближение к идеалу, поэтому при тестировании описаний символов рекомендуется следующий порядок действий: 1.
Скомпилировать описание.
2.
Распознавать последовательно в отладочном режиме изображения символа из базы до тех пор, пока все “хорошие’' изображения будут получать высокие оценки.
3.
Протестировать распознавание на "своих" изображениях.
Если в списке отказов имеются “хорошие” изображения, добиться путем коррекции описания, чтобы эти изображения подтверждались с высокими оценками.
4.
Убедиться в том, что описание нс подтверждается на других классах, либо подтверждается с низкими оценками.
5.
Повторять шаги 3, 4 до получения приемлемого результата на всех этих шагах.
6.
Проверить описание на контрольной базе.
7.
Разработать сгру кгурное дифференциальное описание для пар символов, получающих инверсные или близкие оценки на отлаживаемом эталоне.
81

[Back]