Процесс распознавания с использованием принципа целостности, целенаправленности и использования контекста Рис. 3.2. Использование контекстной информации в целостном, целенаправленном подходе. Исходя из вышеизложенного, можно сформулировать задачи, которые нужно решить для создания структурного классификатора, удовлетворяющего перечисленным выше принципам: • разработать язык структурных описаний, который позволяет описывать символ как набор структурных элементов, связанных пространственнометрическими отношениями; • разработать и реализовать алгоритмы поиска на изображениях объектов, удовлетворяющих структурному описанию; • разработать и реализовать программную систему, позволяющую составлять и настраивать структурные описания символов и визуализировать результаты этого сопоставления. Хорошо известно, что с ростом числа классов сложность классификатора растет, в то время как его точность падает. С этой точки зрения наиболее простым случаем является выбор одного из двух возможных классов. Однако, такой классификатор в общем случае не применим к задаче распознавания символов, т.к. число классов в 57 |
отношениями. Изображение интерпретируется как конкретный объект, только если на нем присутствуют все структурные части этого объекта и эти части находятся в соответствующих отношениях. Сами части получают интерпретацию только в составе предполагаемого целого > гипотезы об объекте. Согласно принципу целенаправленности, распознавание строится как процесс выдвижения и целенаправленной проверки гипотез о целом, в нашем случае о символе, изображенном в данном месте строки. Источниками гипотез являются признаковые классификаторы и контекстная информация. Части изображения анализируется не априорно, а только в рамках выдвинутой гипотезы о целом. Традиционный подход, состоящий в интерпретации того, что наблюдается на изображении, заменяется подходом, состоящим в целенаправленном поиске того, что ожидается на изображении. Использование контекстной информации постулирует, что распознавание объекта должно быть частью интегральной процедуры распознавания более высокого уровня. Процедура распознавания одного символа должна иметь доступ к информации от вышестоящих уровней, например о гипотезе деления слова на символы или об имеющихся контекстных ограничениях. Применительно к распознаванию символов принцип использования контекстной информации можно рассматривать как распространение принципов целостности и целенаправленности на уровень распознавания слов и строк. Чтобы создать структурный классификатор, удовлетворяющий перечисленным выше принципам, необходимо: а) разработать язык структурных описаний, который позволяет описывать символ как набор структурных элементов, связанных пространственнометрическими отношениями; б) разработать и реализовать алгоритмы поиска на изображении объектов, удовлетворяющих структурному описанию; с) разработать и реализовать программную систему, позволяющую составлять и настраивать структурные описания символов и визуализировать результаты их сопоставления. Хорошо известно, что с ростом числа классов сложность классификатора растет, в то время как его точность падает. С этой точки зрения наиболее простым случаем является выбор одного их двух возможных классов. Однако такой классификатор на 34 изданий, суммарный объем которых эквивалентен двум тысячам страниц машинописного текста в сутки. Вся эта гигантская работа выполняется с помощью 7 сканирующих и 10 распознающих станций, управляемых системой РтеЯеайег компании АВВУУ. Заключение В данной работе поднята проблема автоматического ввода рукописных документов в компьютер. На примере типовой системы было показано, что решающее значение на эффективность процесса ввода оказывает точность распознавания рукописных символов. В результате была поставлена задача создать классификатор, существенно превосходящий по точности существующие. Проведенный анализ литературы показал, что наиболее слабым местом современных систем распознавания являются применяемые принципы построения и комбинирования классификаторов, которые не позволяют целенаправленно использовать всю имеющуюся на изображении символа информацию для достижения максимальной точности. Предварительное извлечение признаков приводит к потере информации, а классификация сосредоточивается на решении задачи выбора лучшего из N классов, которая изначально более сложна, чем задача выбора лучшего из двух классов. Были предложены новые подходы к построению классификатора, которые базируются на принципах целостности, целенаправленности и использования контекста, и новые методы комбинирования классификаторов, основанные на использовании массовых парных дифференциальных классификаторов. В результате были разработана и реализована система распознавания символов, которая основывается на многоуровневой комбинации классификаторов: трех полных (растрового, признакового и структурного), и большого количества парных дифференциальных классификаторов. Для реализации структурного классификатора был разработан новый язык структу рных описаний, который позволяет описывать символ как набор структурных элементов, связанных пространственно-метрическими отношениями. Были разработаны и реализованы алгоритмы поиска объектов на изображении, удовлетворяющих структурному описанию, и программная система, позволяющая составлять и настраивать структурные описания символов и отображать результаты их сопоставления. 97 |