Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 93]

Структурные описания символа записываются на специализированном языке.
Система обучения компилирует это описание в байт-код.
Процесс сопоставления состоит в интерпретации байт-кода с размножением виртуальных машин в точках ветвления.
В результате формируется дерево перебора.
Символ считается выделенным, если найдены все обязательные элементы, выполнены все отношения и неиспользованная часть
изображения мала по сравнению со всем изображением.
Ниже
приведен процесс поиска буквы «А» на изображении: Рис.
5.1.
Поиск структурных элементов на изображении.
На первом изображении показано исходное векторное изображение.
На остальных изображениях последовательно показаны результаты выделения структурных элементов, входящих в эталон
буквы «А».
5.2 Описание структурных элементов Для структурного эталона используются графемы, которые описываются на языке структурных элементов и связывающих их отношений.
В начале описания эталона может присутствовать секция со списком атрибутов эталона.
Атрибуты эталона записываются подобно атрибутам структурного элемента.
В конце эталона, после ключевого слова
«Результаты», может быть записано несколько выражений, вычисляющих признаки распознанного символа, которые в дальнейшем используются для контекстного анализа.
Например, если по распознанному символу может быть определена базовая линия, то в результатах нужно
записать выражение вычисления вертикальной координаты базовой линии.
Пример эталона первого уровня приводится ниже: 93
[стр. 39]

3) Отрезок 03 (обязательный).
Отклонения от горизонтали от -30° до +30°.
Расположен между отрезками 01 и 02.
Нечеткие отношения: 1) Верхний конец 01 левее верхнего конца 02 на величину "ширина рамки"* (0,7...1) .
Оба конца находятся на одной высоте с точностью до "высота рамки"* (0...0,2) .
2) Длины 01 и 02 равны с точностью до "высота рамки"* (0...0,2) .
3) ...
Отыскание символа на изображении Структурный эталон рассматривается как недетерминированный алгоритм, описывающий процесс поиска символа на изображении.
Например для буквы “Н” этот алгоритм будет иметь следующий вид: !.
Выделить отрезок 01.
2.
Проверить отношения, ссылающиеся на отрезок 01.
3.
В ыдел ить отрезок 02.
4.
Проверить отношения, ссылающиеся на отрезки 01 и 02.
5.
Выделить отрезок 03.
6.
11роверить все оставшиеся отношения.
Недетерминированность возникает из-за того, что для каждого структурного элемента может быть найдено несколько вариантов сопоставления.
В гаком случае необходимо независимо проверить все возможные варианты.
Отношения проверяются сразу же после выделения всех использованных в этом отношении элементов.
Если какоето отношение не выполняется, проверка текущей ветви перебора останавливается.
Это ограничивает перебор на ранних стадиях и позволяет избежать чрезмерного разрастания дерева перебора.
Структурное описания символа записываются на специализированном языке.
Система обучения компилирует это описание в байт-код.
Процесс сопоставления состоит в интерпретации байт-кода с размножением виртуальных машин в точках ветвления.
В результате формируется дерево перебора.
Символ считается выделенным если найдены все обязательные элементы, выполнены все отношения и неиспользованная часть
39

[стр.,40]

изображения мала по сравнению со всем изображением.
Ниже
изображен процесс поиска цифры “5” на разорванном изображении: Рис.
3.1.
Поиск структурных элементов на изображении.
На первом изображении показано исходное векторное изображение.
На остальных изображениях последовательно показаны результаты выделения структурных элементов, входящих в эталон
цифры “5”.
Дуга и первый отрезок выделены через разрыв.
Дифференциальные классификаторы Для различения близких классов используются специализированные дифференциальные классификаторы.
Основная идея заключается в том, что создать очень точный классификатор для двух классов значительно проще, чем создагь классификатор такой же точности для нескольких сотен классов.
Для повышения точности используется два типа дифференциальных классификаторов, работающих на векторных и структурных признаках соответственно.
Оба типа классификаторов построены по одному принципу.
Входными данными является пара конкурирующих классов и изображение; задача парного классификатора выбрать один правильный класс.
Дзя решения этой задачи на этапе обучения системы определяется список пар классов, которые часто пугаются.
Для каждой пары классов строится линейное решающее правило, которое работает на векторе признаков фиксированной длины.
Для обучения используется градиентный поиск, минимизирующий количество ошибок классификации.
Для сравнения гипотез, выданных признаковыми классификаторами, используется одинаковый для всех пар вектор, состоящий из 224 + 2226 признаков.
Первые 224 признака берутся из признакового классификатора, а оставшиеся два признака вычисляются как разность весов конкурирующих гипотез у признакового и у растрового классификаторов.
Сравнение гипотез, подтвержденных структурным уровнем, осуществляется на основе индивидуальных наборов признаков для каждой пары.
Признаки конструируются 40

[стр.,105]

Приложение 1.
Язык структурных описаний Структура описания В структурном эталоне графемы описываются как структурные элементы, из которых составлена графема, и связывающие их отношения.
В начале описания эталона может присутствовать секция со списком атрибутов эталона.
Атрибуты эталона записываются подобно атрибутам структурного элемента.
В конце эталона, после ключевого слова
“Результаты:”, может быть написано несколько выражений, вычисляющих признаки распознанного символа, используемые для контекстного анализа.
Например, если по распознанному символу может быть определена базовая линия, то в результатах нужно
написать выражение вычисления вертикальной координаты базовой линии.
I Гример эталона первого уровня приводится ниже: Атрибуты_эталона: Максимальное_число_пройденных_отрезков=400; Конец_Атрибутов_эталона Отрезок ОЛ Атрибуты: Локализация_в_начале: точка = НРл.начало, расстояние = 0.3 * НР.высота; Направление: идеал = -90, от = -135, до = -45; конец_элемента Дуга Д1 Атрибуты: Локализация_в_середине: точка = НРп.середина, расстояние = 0.3 * НР.высота; Загибается по часовой;

[Back]