Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 163]

Заключение В настоящей диссертационной работе поднята проблема автоматического ввода рукописных документов в компьютер.
На примере
типичной системы технологического ввода данных было показано, что решающее значение на эффективность процесса ввода оказывает точность распознавания одиночных рукописных символов.
В результате была поставлена задача создать
высокоточный «интеллектуальный» классификатор рукописных символов, превосходящий по точности альтернативные способы ввода информации с бумажных носителей, а также малочувствительный к вариабельности символов и к дефектам изображения.
Проведенный анализ литературы показал, что задачу предобработки изображения можно считать относительно хорошо разработанным направлением.
Методы предобработки многообразны и с практической точки зрения позволяют решить подавляющее число возникающих задач.
Важно отметить два момента.
Вопервых, задача предобработки должна
ставиться строго в контексте используемого классификатора.
Не существует оптимального метода предобработки вообще **оптимальность должна определяться по результатам работы классификатора.
Вовторых, предобработка изображения всегда приводит к необратимой потере информации.
Для некоторых классификаторов это допустимо, поскольку число ошибок, вносимых приведением, компенсируется увеличением точности работы классификатора.

Основным вопросом остается задача построения классификатора или системы классификаторов, обеспечивающих минимальное число ошибок распознавания,
а также выбор набора признаков.
В проанализированной литературе задача выбора набора признаков для разных классификаторов освещена в разной степени.
Для растрового распознавателя выбор признаков представляется крайне простой процедурой и поэтому хорошо изучен.
В то время, как для признаковых распознавателей исследователи, при выборе набора признаков, полагаются чаще на собственную интуицию, чем на четко сформулированный алгоритм.
163
[стр. 31]

Для комбинирования классификаторов можно применить Байесовское решающее правило с использованием упрощающего предположения о независимости классификаторов [61].
Исходными данными для принятия решения являются матрицы кросс-ошибок, накапливаемые по обучающей выборке.
Допустим, что существует М классов плюс возможность отказа.
Пусть С матрица размером М х ( М + 1).
Элемент матрицы Су обозначает число изображений класса к отнесенных классификатором к классу] или в отказ.
Если имеется К.
классификаторов, получается К матриц кросс-ошибок.
Условная вероятность того, что изображение х принадлежит классу 1 при условии, что оно было отнесено классификатором к к классу], может быть оценена как Р(хеС.\ек{х) = /)= (2.19) Если изображение* отнесено К классификаторами к классам еь(х) -Д, можно определить вероятность того, что изображение принадлежит классу [: Ъе1(\) = Р(х е С, е\(х) =у/.........ек(х) (2.20) Используя формулы Байеса и предположения о независимости классификатора, ЬеЦ7) можно переписать в виде: Ье!{/) = П*.ДгеС' М*)°А) Х-1 П».1 Р(х 6 С‘ I еК (■*■) = Л ) (2.21) для 1 < 1 < М.
Б качестве наиболее вероятного принимается класс, имеющий максимальную достоверность Ье10).
Соотношением замен/отказов можно управлять, требуя от лучшего класса достоверности ЬеШ) > а, где а порог доверия.
2.6 Выводы Задачу предобработки изображения и задачу комбинирования классификаторов можно считать относительно хорошо разработанными направлениями.
Основным вопросом остается задача построения классификатора или системы классификаторов, обеспечивающих минимальное число ошибок распознавания.

Каждый из трех рассмотренных методов построения классификаторов обладает как достоинствами, так и недостатками.
31

[стр.,32]

Достоинствами растрового классификатора являются проста, хорошая устойчивость к случайным дефектам изображения, высокая целостность восприятия (сравнению подвергается исходное изображение, а не его производные величины), низкий уровень замен.
Его недостатками являются низкая обобщающая способность (как следствие высокой чувствительности к искажениям формы символа), низкая скорость (изза низкой обобщающей способности приходится создавать много кластеров), высокое число отказов (как следствие низкой обобщающей способности).
Достоинствами признакового классификатора являются простота, хорошая обобщающая способность, хорошая устойчивость к изменениям формы символов, низкое число отказов.
Недостатками признакового классификатора являются большое число замен, неустойчивость ко многим типам дефектов изображения.
Следует отметить, что признаковые классификаторы обладают важным принципиальным недостатком этап извлечения признаков приводит к необратимой потере информации.
Особых достоинств у структурных классификагоров в их современном понимании нет.
Недостатками являются сложность, слабая выразительная возможность языка описания символа, бедный и нерасширяемый набор отношений, связывающих элементы, нецеленаправленность процедур анализа и оценки изображения, низкая временная неэффективность.
Методы предобработки многообразны, и с практической точки зрения позволяют решить подавляющее число возникающих задач.
Важно отметить два момента.
Вопервых, задача предобработки должна
ставится строго в контексте используемого классификатора.
Не существует оптимальног о метода предобработки вообще оптимальность должна определяться по результатам работы классификатора.
Во-вторых, предобработка изображения всегда приводит к необратимой потере информации.
Для некоторых классификаторов это допустимо, поскольку число ошибок, вносимых приведением, компенсируется увеличением точности работы классификатора.

Методы комбинирования классификаторов хорошо разработаны для решения классической задачи объединения результатов небольшого числа параллельно работающих классификаторов.
Более сложные схемы объединения (последовательная, последовательно-параллельная) исследованы в значительно меньшей степени.
32

[стр.,97]

изданий, суммарный объем которых эквивалентен двум тысячам страниц машинописного текста в сутки.
Вся эта гигантская работа выполняется с помощью 7 сканирующих и 10 распознающих станций, управляемых системой РтеЯеайег компании АВВУУ.
Заключение В данной работе поднята проблема автоматического ввода рукописных документов в компьютер.
На примере
типовой системы было показано, что решающее значение на эффективность процесса ввода оказывает точность распознавания рукописных символов.
В результате была поставлена задача создать
классификатор, существенно превосходящий по точности существующие.
Проведенный анализ литературы показал, что наиболее слабым местом современных систем распознавания являются применяемые принципы построения и комбинирования классификаторов, которые не позволяют целенаправленно использовать всю имеющуюся на изображении символа информацию для достижения максимальной точности.
Предварительное извлечение признаков приводит к потере информации, а классификация сосредоточивается на решении задачи выбора лучшего из N классов, которая изначально более сложна, чем задача выбора лучшего из двух классов.
Были предложены новые подходы к построению классификатора, которые базируются на принципах целостности, целенаправленности и использования контекста, и новые методы комбинирования классификаторов, основанные на использовании массовых парных дифференциальных классификаторов.
В результате были разработана и реализована система распознавания символов, которая основывается на многоуровневой комбинации классификаторов: трех полных (растрового, признакового и структурного), и большого количества парных дифференциальных классификаторов.
Для реализации структурного классификатора был разработан новый язык структу рных описаний, который позволяет описывать символ как набор структурных элементов, связанных пространственно-метрическими отношениями.
Были разработаны и реализованы алгоритмы поиска объектов на изображении, удовлетворяющих структурному описанию, и программная система, позволяющая составлять и настраивать структурные описания символов и отображать результаты их сопоставления.
97

[Back]