Проверяемый текст

Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)

[стр. 28]
изображение используется на всех этапах распознавания.
При этом обычно применяют комбинированный подход, тогда когда часть операций выполняется на бинарном изображении, а часть на полутоновом [12], и здесь особенно важен правильный выбор набора распознавателей.
2,2 Вычисление признаков Следующая задача, которую необходимо решить для построения классификатора, заключается в том, чтобы от исходного изображения перейти к набору чисел, который будем называть вектором признаков.
Цель перехода от исходного изображения к вектору признаков двоякая.
С одной стороны, признаки это обычно более простой математический объект, который в идеальном случае должен сохранять существенную информацию и отсеять посторонний шум.
С другой стороны, выделение признаков разбивает задачу классификации на две подзадачи вычисление признаков и классификацию по признакам.
Это позволяет использовать все многообразие методов классификации, разработанное в общей теории распознавания [13, 14, 15, 16, 17].
Простой растр Принцип работы простого растрового распознавателя основан на прямом сравнении изображения распознаваемого символа с эталонным изображением, которое получается как усреднение изображения символов обучающей выборки 18, 19].
Степень несходства вычисляется как количество несовпадающих пикселей (с весами, зависящими от величины, дисперсии цвета данного пикселя.
Таким образом, для растрового классификатора признаком является цвет пикселя и у него нет сложной процедуры вычисления признаков.
Для хорошей работы растрового распознавателя необходима сильная предобработка.
Как минимум, необходима нормализация размера, нормализация наклона и нормализация толщины штриха.
Недостатком растрового классификатора является большое число кластеров, требуемых для достижения приемлемой точности, и высокая чувствительность к изменению формы символа.
28

[стр. 13]
большинстве случаев.
Недостатки его проявляются в ситуациях, когда яркость бумажного документа непостоянна или когда значимые символы имеют низкую контрастность.
Следующая по сложности схема предполагает получение от сканера полутонового изображения и перевод его в бинарное средствами компьютера.
Далее работа ведется только с бинарным изображением.
Перенос процедуры бинаризации со сканера в компьютер создаст дополнительные возможности для разработки более эффективных, но и более сложных адаптивных алгоритмов выбора порога бинаризации.
Наиболее перспективным является подход, когда полутоновое изображение используется на всех этапах распознавания.
При этом обычно применяют комбинированный подход, когда часть операций выполняется на бинарном изображении, а часть на полутоновом [10], и здесь особенно важен правильный выбор классификатора.
2.2 Растровый классификатор Принцип работы растрового классификатора основан на прямом сравнении изображения распознаваемого символа с эталонным изображением, которое получается как усредненное изображения символов обучающей выборки [II, 12].
Степень несходства вычисляется как количество несовпадающих пикселов.
Дтя хорошей работы растрового классификатора необходима сильная предобработка.
Как минимум необходима нормализация размера, нормализация наклона и нормализация толщины штриха.
Недостатком растрового классификатора является большое число кластеров, требуемых для достижения приемлемой точности и высокая чувствительность к изменению формы символа.
2.3 Признаковые классификаторы Общую схему работы признаковой системы распознавания можно представить в следующем виде: Рис.
2.1.
Схема работы признаковой системы распознавания.
13

[стр.,14]
Вычисление признаков Первый этап работы признакового классификатора заключается в том, чтобы по изображению вычислить его признаки.
Цель перехода от исходного изображения к вектору признаков двоякая.
С одной стороны, признаки это обычно более простой математический объект, который в идеальном случае должен сохранять существенную информацию и отсеять посторонний шум.
С другой стороны, выделение признаков разбивает задачу классификации на две подзадачи вычисление признаков и классификацию по признакам.
Это позволяет использовать все многообразие методов классификации, разработанных в общей теории распознавания [13, 14, 15, 16, 17].
Тип и число признаков, вычисляемых по исходному изображению, являются важнейшими характеристиками, определяющими качество работы классификатора.
Хотя важность правильного выбора признается всеми исследователями, до сих пор выбор признаков определяется скорее интуицией и опытом исследователя, чем какими-то четкими и обоснованными научными методиками.
«Хорошие» признаки должны обладать следующими свойствами: 1.
Сохранять достаточный объем информации о символе для последующей классификации.
2.
Не зависеть от трансформаций изображения символа, которые не являются существенными для классификации.
Например, толщина штриха или небольшие отличия в наклоне и положении не должны существенно влиять на значения признаков.
3.
Не испытывать резких изменений при плавных изменениях изображения.
4.
Быть по возможности независимыми.
5.
Подчеркивать элементы изображения, существенные для различения классов.
Все перечисленные выше свойства признаков при всей их нестрогости и неформальности являются теми подсознательными направляющими, которыми руководствуется исследователь при формировании набора признаков применительно к конкретной задаче распознавания.
Помимо проблемы «изобретения» признаков существуют не менее важные задачи преобразования готового набора признаков к оптимальному виду.
Это включает в себя нормализацию, устранение зависимости между признаками и отбор наиболее существенных признаков.
14

[Back]