Проверяемый текст

Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)

[стр. 27]
градаций) и даже с цветными (обычно это три цвета ЯОВ по 256 градаций на цвет).
В идеале система распознавания должна работать с полной информацией на всех этапах обработки изображения.
Но, к сожалению, практическая реализация этого подхода сталкивается с существенными трудностями.
Первая наиболее существенная проблема заключается в том, что полутоновые и цветные изображения занимают, соответственно, в 8 и в 24 раза больше оперативной памяти компьютера, чем бинарные.
Во многих ситуациях это приводит к недостижимо высоким требованиям программы к объему доступной оперативной памяти.
Кроме того, большой объем данных прямо влияет на время работы программы.
Это является вторым серьезнейшим аргументом против использования полутоновых и цветных изображений [10].
Вторая проблема заключается в том, что разработанные эффективные методы обработки черно-белых изображений в существенной мере опираются именно на свойство бинарности изображения, как, например, метод выделения по графу связности контура [11].
Подводя итоги, можно вполне определенно утверждать, что в большинстве практических реализаций систем автоматического распознавания текстовой информации в том или ином виде используется бинарное изображение.
Существует несколько возможных схем его получения.
Простейший вариант заключается в том, чтобы осуществить переход к бинарному изображению непосредственно в момент сканирования.
Для этого сканеру необходимо сообщить фиксированный порог яркости, который определяет границу между черным и белым.
Этот подход хорошо работает в большинстве случаев.
Недостатки его проявляются в ситуациях, когда яркость бумажного документа непостоянна или когда значимые символы имеют низкую контрастность.
Следующая по сложности схема предполагает получение от сканера полутонового изображения и перевод его в бинарное средствами компьютера.
Далее работа ведется только с бинарным изображением.
Перенос процедуры бинаризации со сканера на компьютер создает дополнительные возможности для разработки более эффективных, но и более сложных адаптивных алгоритмов выбора порога бинаризации.
Наиболее перспективным является подход, когда полутоновое 27

[стр. 12]
точку (Рх(х), Ру(у».
Функции Рх и Ру выбираются таким образом, чтобы вдоль соответствующей оси получалось равномерное распределение массы или какого-нибудь другого параметра, например числа переходов "черное-белое".
Для алфавитного письма, судя по отсутствию опубликованных работ, использование нелинейной нормализация не получило сколько-нибудь заметного распространения.
Бинаризация При вводе изображения документа в компьютер всегда желательно сохранить максимум информации, присутствующей во входном документе.
Современные устройства ввода изображений способны надежно работать не только с черно-белыми (бинарными) изображениями (2 градации), но и с полутоновыми (обычно 16 или 256 градаций) и даже с цветными (обычно это три цвета КОВ по 256 градаций на цвет).
В идеале система распознавания должна работать с полной информацией на всех этапах обработки изображения.
Но, к сожалению, практическая реализация этого подхода сталкивается с существенными трудностями.
Первая, наиболее существенная проблема заключается в том, что полутоновые и цветные изображения занимают, соответственно, в 8 и в 24 раза больше оперативной памяти компьютера, чем бинарные.
Во многих ситуациях это приводит к недостижимо высоким требованиям программы к объему доступной оперативной памяти.
Кроме того, большой объем данных прямо влияет на время работы программы, что является вторым серьезнейшим аргументом против использования полутоновых и цветных изображений [8].
Вторая проблема заключается в том, что разработанные эффективные методы обработки черно-белых изображений в существенной мере опираются именно на свойство бинарности изображения, как, например, метод выделения по графу связности контура [9].
Подводя итоги, можно вполне определенно утверждать, что в большинстве практических реализаций систем автоматического распознавания текстовой информации в том или ином виде используется бинарное изображение.
Существует несколько возможных схем его получения.
Простейший вариант заключается в том, чтобы осуществить переход к бинарному изображению непосредственно в момент сканирования.
Для этого сканеру необходимо сообщить фиксированный порог яркости, который определяет границу междучерным и белым.
Этот подход хорошо работает в 12

[стр.,13]
большинстве случаев.
Недостатки его проявляются в ситуациях, когда яркость бумажного документа непостоянна или когда значимые символы имеют низкую контрастность.
Следующая по сложности схема предполагает получение от сканера полутонового изображения и перевод его в бинарное средствами компьютера.
Далее работа ведется только с бинарным изображением.
Перенос процедуры бинаризации со сканера в компьютер создаст дополнительные возможности для разработки более эффективных, но и более сложных адаптивных алгоритмов выбора порога бинаризации.
Наиболее перспективным является подход, когда полутоновое изображение используется на всех этапах распознавания.
При этом обычно применяют комбинированный подход, когда часть операций выполняется на бинарном изображении, а часть на полутоновом [10], и здесь особенно важен правильный выбор классификатора.
2.2 Растровый классификатор Принцип работы растрового классификатора основан на прямом сравнении изображения распознаваемого символа с эталонным изображением, которое получается как усредненное изображения символов обучающей выборки [II, 12].
Степень несходства вычисляется как количество несовпадающих пикселов.
Дтя хорошей работы растрового классификатора необходима сильная предобработка.
Как минимум необходима нормализация размера, нормализация наклона и нормализация толщины штриха.
Недостатком растрового классификатора является большое число кластеров, требуемых для достижения приемлемой точности и высокая чувствительность к изменению формы символа.
2.3 Признаковые классификаторы Общую схему работы признаковой системы распознавания можно представить в следующем виде: Рис.
2.1.
Схема работы признаковой системы распознавания.
13

[Back]