Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 51]

МО = р(х е с(*) = л) • (2.20) Используя формулы Байеса и предположения о независимости классификатора, Ье1(1) можно переписать в виде: для 1 < / < М.
В качестве наиболее вероятного принимается класс, имеющий максимальную достоверность Ъе1(1).
Соотношением замен/отказов можно управлять, требуя от лучшего класса достоверности
Ье1(1)>а, где а порог доверия.
2.6 Выводы Проведенный анализ литературы показал, что: ].
Задачу предобработки изображения можно считать относительно хорошо разработанным направлением.
Методы предобработки многообразны, и с практической точки зрения позволяют решить подавляющее
большинство возникающих задач.
Важно отметить два момента.
Во-первых, задача предобработки должна
ставиться строго в контексте используемого классификатора.
Не существует оптимального метода предобработки вообще оптимальность должна определяться по результатам работы классификатора.
Во-вторых, предобработка изображения всегда приводит к необратимой потере информации.
Для некоторых классификаторов это допустимо, поскольку число ошибок, вносимых
предобработкой, компенсируется увеличением точности работы классификатора.
(2.21) 51
[стр. 31]

Для комбинирования классификаторов можно применить Байесовское решающее правило с использованием упрощающего предположения о независимости классификаторов [61].
Исходными данными для принятия решения являются матрицы кросс-ошибок, накапливаемые по обучающей выборке.
Допустим, что существует М классов плюс возможность отказа.
Пусть С матрица размером М х ( М + 1).
Элемент матрицы Су обозначает число изображений класса к отнесенных классификатором к классу] или в отказ.
Если имеется К.
классификаторов, получается К матриц кросс-ошибок.
Условная вероятность того, что изображение х принадлежит классу 1 при условии, что оно было отнесено классификатором к к классу], может быть оценена как Р(хеС.\ек{х) = /)= (2.19) Если изображение* отнесено К классификаторами к классам еь(х) -Д, можно определить вероятность того, что изображение принадлежит классу [: Ъе1(\) = Р(х е С, е\(х) =у/.........ек(х) (2.20) Используя формулы Байеса и предположения о независимости классификатора, ЬеЦ7) можно переписать в виде: Ье!{/) = П*.ДгеС' М*)°А) Х-1 П».1 Р(х 6 С‘ I еК (■*■) = Л ) (2.21) для 1 < 1 < М.
Б качестве наиболее вероятного принимается класс, имеющий максимальную достоверность Ье10).
Соотношением замен/отказов можно управлять, требуя от лучшего класса достоверности
ЬеШ) > а, где а порог доверия.
2.6 Выводы Задачу предобработки изображения и задачу комбинирования классификаторов можно считать относительно хорошо разработанными направлениями.
Основным вопросом остается задача построения классификатора или системы классификаторов, обеспечивающих минимальное число ошибок распознавания.
Каждый из трех рассмотренных методов построения классификаторов обладает как достоинствами, так и недостатками.
31

[стр.,32]

Достоинствами растрового классификатора являются проста, хорошая устойчивость к случайным дефектам изображения, высокая целостность восприятия (сравнению подвергается исходное изображение, а не его производные величины), низкий уровень замен.
Его недостатками являются низкая обобщающая способность (как следствие высокой чувствительности к искажениям формы символа), низкая скорость (изза низкой обобщающей способности приходится создавать много кластеров), высокое число отказов (как следствие низкой обобщающей способности).
Достоинствами признакового классификатора являются простота, хорошая обобщающая способность, хорошая устойчивость к изменениям формы символов, низкое число отказов.
Недостатками признакового классификатора являются большое число замен, неустойчивость ко многим типам дефектов изображения.
Следует отметить, что признаковые классификаторы обладают важным принципиальным недостатком этап извлечения признаков приводит к необратимой потере информации.
Особых достоинств у структурных классификагоров в их современном понимании нет.
Недостатками являются сложность, слабая выразительная возможность языка описания символа, бедный и нерасширяемый набор отношений, связывающих элементы, нецеленаправленность процедур анализа и оценки изображения, низкая временная неэффективность.
Методы предобработки многообразны, и с практической точки зрения позволяют решить подавляющее
число возникающих задач.
Важно отметить два момента.
Вопервых, задача предобработки должна
ставится строго в контексте используемого классификатора.
Не существует оптимальног о метода предобработки вообще оптимальность должна определяться по результатам работы классификатора.
Во-вторых, предобработка изображения всегда приводит к необратимой потере информации.
Для некоторых классификаторов это допустимо, поскольку число ошибок, вносимых
приведением, компенсируется увеличением точности работы классификатора.
Методы комбинирования классификаторов хорошо разработаны для решения классической задачи объединения результатов небольшого числа параллельно работающих классификаторов.
Более сложные схемы объединения (последовательная, последовательно-параллельная) исследованы в значительно меньшей степени.
32

[Back]