Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 25]

различения классов.
Но если среди входных изображений есть такие, которые отличаются только шириной (например, типографские точка и знак подчеркивания), такая нормализация может привести к потере существенной информации.
Нормализация толщины штриха Толщина штриха не является существенным фактором для различения классов человеком, поскольку один символ никак не может превратиться в другой в результате простого увеличения или уменьшения толщины штриха (в разумных пределах).
Учитывая, что классификаторы часто чувствительны к толщине штриха, целесообразно перед распознаванием привести толщину штриха к стандартному значению.
Толщину штриха можно оценить путем расчета средней длины черных участков при пересечении символа горизонтальной или вертикальной прямой в различных местах.
Еще один возможный способ оценки толщины штриха основывается на использовании значений периметра и площади изображения символа.
При этом делается огрубляющее
предположение, что штрих имеет форму вытянутого прямоугольника, ширину которого легко вычислить, зная периметр и площадь.
Нормализация толщины заключается в равномерном расширении или сжатии контура символа на заданную величину.
Если в процессе обработки производится векторизация изображения, то в оценке и корректировке толщины штриха можно использовать векторное изображение.
Нормализация толщины штриха может производиться как с одинаковым коэффициентом для вертикальных и горизонтальных штрихов, так и с разными коэффициентами.
Использование одинакового коэффициента безопаснее с точки зрения внесения неоправданных искажений в изображения символа, но зато использование разных коэффициентов дает возможность сильнее подавить вариабельность символов, поскольку некоторые пишущие инструменты, например перьевая ручка, порождают штрих с толщиной, зависящей от направления движения пера.

25
[стр. 10]

классификатора.
Поэтому задачу выбора алгоритма предобработки нужно решать в контексте используемого классификатора и с учетом требований внешней задачи.
Далее приведен обзор основных приемов предобработки, описанных в литературе.
Нормализация размера Нормализация размера изображения символа с сохранением относительного масштаба по его осям это простейший тип нормализации, который используется в тех случаях, когда при дальнейшей обработке предстоит делать явные или неявные предположения о размере изображения.
Примером таких предположений может служить использование растровых точек нормализованного изображения в качестве признаков [4] или использование настроечных параметров, заданных числом точек, а не в метрических единицах.
Нормализация размера без сохранения относительного масштаба осей, т.
е.
приведение изображения к стандартному размеру (возможно, с белыми полями) уменьшает изменчивость распознаваемого изображения.
Однако применение этого типа нормализации требует особой осторожности, поскольку он действительно может сильно упростить задачу классификации только в том случае, если все используемые классы изображений имеют приблизительно одинаковые размерные характеристики, вследствие чего отношение высоты к ширине не является существенным признаком для различения классов.
По если среди входных изображений есть такие, которые отличаются только шириной (например, типографские точка и знак подчеркивания), такая нормализация может привести к потере существенной информации.
Нормализация толщины штриха Толщина штриха не является существенным фактором для различения классов человеком, поскольку один символ никак не может превратиться в другой в результате простого увеличения или уменьшения толщины штриха (в разумных пределах).
Учитывая, что классификаторы часто чувствительны к толщине штриха, целесообразно перед распознаванием привести толщину' штриха к стандартному значению.
Толщину штриха можно оценить путем расчета средней длины черных участков при пересечении символа горизонтальной или вертикальной прямой в различных местах.
Еще один возможный способ оценки толщины штриха основывается на использовании значений периметра и площади изображения символа.
При этом делается огрубляющее
10

[стр.,11]

предположение, что штрих имеет форму вытянутого прямоугольника, ширину которого легко вычислить, зная периметр и площадь.
Нормализация толщины заключается в равномерном расширении или сжатии контура символа на заданную величину.
Если в процессе обработки производится векторизация изображения, то в оценке и корректировке толщины штриха можно использовать векторное изображение.
Нормализация толщины штриха может производиться как с одинаковым коэффициентом для вертикальных и горизонтальных штрихов, так и с разными коэффициентами.
Использование одинакового коэффициента безопаснее сточки зрения внесения неоправданных искажений в изображения символа, но зато использование разных коэффициентов дает возможность сильнее подавить вариабельность символов, поскольку' некоторые пишущие инструменты, например перьевая ручка, порождают штрих с толщиной, зависящей от направления движения пера.

Нормализация наклона В задачах распознавания рукописных текстов и при распознавании курсивного типографского текста важно избавиться от влияния наклона символов на значения классификационных признаков.
Для этого применяются схемы устранения или нормализации наклона [5].
В отличие от нормализации размера, которую можно применять к каждому символу независимо, исправление наклона символов обычно распространяется на целое слово или на всю строку.
Это связано с тем, что по изображению одного символа сложно или даже невозможно априорно вычислить его наклон.
Поэтому коррекцию наклона лучше делать в большом фрагменте текста, полагаясь на статистическое сглаживание индивидуальных особенностей символов [6].
Для оценки наклона можно вычислить средний наклон длинных вертикальных штрихов.
Такая схема хорошо работает в среднем, но для специфических случаев может давать сбои (например на длинной строке состоящей из одних нулей, у которых нет прямолинейных вертикальных элементов).
Нелинейная нормализация Применительно к ряду задач (в частности, к распознаванию иероглифического письма) были предложены схемы априорной нелинейной нормализации [7].
Обычно такая нормализация задается двумя монотонными непрерывными функциями Рх и Ру, которые отображают исходное изображение в нормализованное так, что точка (х, у) переходит в 11

[Back]