различения классов. Но если среди входных изображений есть такие, которые отличаются только шириной (например, типографские точка и знак подчеркивания), такая нормализация может привести к потере существенной информации. Нормализация толщины штриха Толщина штриха не является существенным фактором для различения классов человеком, поскольку один символ никак не может превратиться в другой в результате простого увеличения или уменьшения толщины штриха (в разумных пределах). Учитывая, что классификаторы часто чувствительны к толщине штриха, целесообразно перед распознаванием привести толщину штриха к стандартному значению. Толщину штриха можно оценить путем расчета средней длины черных участков при пересечении символа горизонтальной или вертикальной прямой в различных местах. Еще один возможный способ оценки толщины штриха основывается на использовании значений периметра и площади изображения символа. При этом делается огрубляющее предположение, что штрих имеет форму вытянутого прямоугольника, ширину которого легко вычислить, зная периметр и площадь. Нормализация толщины заключается в равномерном расширении или сжатии контура символа на заданную величину. Если в процессе обработки производится векторизация изображения, то в оценке и корректировке толщины штриха можно использовать векторное изображение. Нормализация толщины штриха может производиться как с одинаковым коэффициентом для вертикальных и горизонтальных штрихов, так и с разными коэффициентами. Использование одинакового коэффициента безопаснее с точки зрения внесения неоправданных искажений в изображения символа, но зато использование разных коэффициентов дает возможность сильнее подавить вариабельность символов, поскольку некоторые пишущие инструменты, например перьевая ручка, порождают штрих с толщиной, зависящей от направления движения пера. 25 |
классификатора. Поэтому задачу выбора алгоритма предобработки нужно решать в контексте используемого классификатора и с учетом требований внешней задачи. Далее приведен обзор основных приемов предобработки, описанных в литературе. Нормализация размера Нормализация размера изображения символа с сохранением относительного масштаба по его осям это простейший тип нормализации, который используется в тех случаях, когда при дальнейшей обработке предстоит делать явные или неявные предположения о размере изображения. Примером таких предположений может служить использование растровых точек нормализованного изображения в качестве признаков [4] или использование настроечных параметров, заданных числом точек, а не в метрических единицах. Нормализация размера без сохранения относительного масштаба осей, т. е. приведение изображения к стандартному размеру (возможно, с белыми полями) уменьшает изменчивость распознаваемого изображения. Однако применение этого типа нормализации требует особой осторожности, поскольку он действительно может сильно упростить задачу классификации только в том случае, если все используемые классы изображений имеют приблизительно одинаковые размерные характеристики, вследствие чего отношение высоты к ширине не является существенным признаком для различения классов. По если среди входных изображений есть такие, которые отличаются только шириной (например, типографские точка и знак подчеркивания), такая нормализация может привести к потере существенной информации. Нормализация толщины штриха Толщина штриха не является существенным фактором для различения классов человеком, поскольку один символ никак не может превратиться в другой в результате простого увеличения или уменьшения толщины штриха (в разумных пределах). Учитывая, что классификаторы часто чувствительны к толщине штриха, целесообразно перед распознаванием привести толщину' штриха к стандартному значению. Толщину штриха можно оценить путем расчета средней длины черных участков при пересечении символа горизонтальной или вертикальной прямой в различных местах. Еще один возможный способ оценки толщины штриха основывается на использовании значений периметра и площади изображения символа. При этом делается огрубляющее 10 предположение, что штрих имеет форму вытянутого прямоугольника, ширину которого легко вычислить, зная периметр и площадь. Нормализация толщины заключается в равномерном расширении или сжатии контура символа на заданную величину. Если в процессе обработки производится векторизация изображения, то в оценке и корректировке толщины штриха можно использовать векторное изображение. Нормализация толщины штриха может производиться как с одинаковым коэффициентом для вертикальных и горизонтальных штрихов, так и с разными коэффициентами. Использование одинакового коэффициента безопаснее сточки зрения внесения неоправданных искажений в изображения символа, но зато использование разных коэффициентов дает возможность сильнее подавить вариабельность символов, поскольку' некоторые пишущие инструменты, например перьевая ручка, порождают штрих с толщиной, зависящей от направления движения пера. Нормализация наклона В задачах распознавания рукописных текстов и при распознавании курсивного типографского текста важно избавиться от влияния наклона символов на значения классификационных признаков. Для этого применяются схемы устранения или нормализации наклона [5]. В отличие от нормализации размера, которую можно применять к каждому символу независимо, исправление наклона символов обычно распространяется на целое слово или на всю строку. Это связано с тем, что по изображению одного символа сложно или даже невозможно априорно вычислить его наклон. Поэтому коррекцию наклона лучше делать в большом фрагменте текста, полагаясь на статистическое сглаживание индивидуальных особенностей символов [6]. Для оценки наклона можно вычислить средний наклон длинных вертикальных штрихов. Такая схема хорошо работает в среднем, но для специфических случаев может давать сбои (например на длинной строке состоящей из одних нулей, у которых нет прямолинейных вертикальных элементов). Нелинейная нормализация Применительно к ряду задач (в частности, к распознаванию иероглифического письма) были предложены схемы априорной нелинейной нормализации [7]. Обычно такая нормализация задается двумя монотонными непрерывными функциями Рх и Ру, которые отображают исходное изображение в нормализованное так, что точка (х, у) переходит в 11 |