Проверяемый текст

Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)

[стр. 57]
Процесс распознавания с использованием принципа целостности, целенаправленности и использования контекста Рис.
3.2.
Использование контекстной информации в целостном, целенаправленном подходе.
Исходя из вышеизложенного, можно сформулировать задачи, которые нужно решить для создания структурного классификатора, удовлетворяющего перечисленным выше принципам: • разработать язык структурных описаний, который позволяет описывать символ как набор структурных элементов, связанных пространственнометрическими отношениями; • разработать и реализовать алгоритмы поиска на изображениях объектов, удовлетворяющих структурному описанию; • разработать и реализовать программную систему, позволяющую составлять и настраивать структурные описания символов и визуализировать результаты этого сопоставления.
Хорошо известно, что с ростом числа классов сложность классификатора растет, в то время как его точность падает.
С этой точки зрения наиболее простым случаем является выбор одного из двух возможных классов.
Однако, такой классификатор в общем случае не применим к задаче распознавания символов, т.к.
число классов в 57

[стр. 34]
отношениями.
Изображение интерпретируется как конкретный объект, только если на нем присутствуют все структурные части этого объекта и эти части находятся в соответствующих отношениях.
Сами части получают интерпретацию только в составе предполагаемого целого > гипотезы об объекте.
Согласно принципу целенаправленности, распознавание строится как процесс выдвижения и целенаправленной проверки гипотез о целом, в нашем случае о символе, изображенном в данном месте строки.
Источниками гипотез являются признаковые классификаторы и контекстная информация.
Части изображения анализируется не априорно, а только в рамках выдвинутой гипотезы о целом.
Традиционный подход, состоящий в интерпретации того, что наблюдается на изображении, заменяется подходом, состоящим в целенаправленном поиске того, что ожидается на изображении.
Использование контекстной информации постулирует, что распознавание объекта должно быть частью интегральной процедуры распознавания более высокого уровня.
Процедура распознавания одного символа должна иметь доступ к информации от вышестоящих уровней, например о гипотезе деления слова на символы или об имеющихся контекстных ограничениях.
Применительно к распознаванию символов принцип использования контекстной информации можно рассматривать как распространение принципов целостности и целенаправленности на уровень распознавания слов и строк.
Чтобы создать структурный классификатор, удовлетворяющий перечисленным выше принципам, необходимо: а) разработать язык структурных описаний, который позволяет описывать символ как набор структурных элементов, связанных пространственнометрическими отношениями; б) разработать и реализовать алгоритмы поиска на изображении объектов, удовлетворяющих структурному описанию; с) разработать и реализовать программную систему, позволяющую составлять и настраивать структурные описания символов и визуализировать результаты их сопоставления.
Хорошо известно, что с ростом числа классов сложность классификатора растет, в то время как его точность падает.
С этой точки зрения наиболее простым случаем является выбор одного их двух возможных классов.
Однако такой классификатор на 34

[стр.,97]
изданий, суммарный объем которых эквивалентен двум тысячам страниц машинописного текста в сутки.
Вся эта гигантская работа выполняется с помощью 7 сканирующих и 10 распознающих станций, управляемых системой РтеЯеайег компании АВВУУ.
Заключение В данной работе поднята проблема автоматического ввода рукописных документов в компьютер.
На примере типовой системы было показано, что решающее значение на эффективность процесса ввода оказывает точность распознавания рукописных символов.
В результате была поставлена задача создать классификатор, существенно превосходящий по точности существующие.
Проведенный анализ литературы показал, что наиболее слабым местом современных систем распознавания являются применяемые принципы построения и комбинирования классификаторов, которые не позволяют целенаправленно использовать всю имеющуюся на изображении символа информацию для достижения максимальной точности.
Предварительное извлечение признаков приводит к потере информации, а классификация сосредоточивается на решении задачи выбора лучшего из N классов, которая изначально более сложна, чем задача выбора лучшего из двух классов.
Были предложены новые подходы к построению классификатора, которые базируются на принципах целостности, целенаправленности и использования контекста, и новые методы комбинирования классификаторов, основанные на использовании массовых парных дифференциальных классификаторов.
В результате были разработана и реализована система распознавания символов, которая основывается на многоуровневой комбинации классификаторов: трех полных (растрового, признакового и структурного), и большого количества парных дифференциальных классификаторов.
Для реализации структурного классификатора был разработан новый язык структу рных описаний, который позволяет описывать символ как набор структурных элементов, связанных пространственно-метрическими отношениями.
Были разработаны и реализованы алгоритмы поиска объектов на изображении, удовлетворяющих структурному описанию, и программная система, позволяющая составлять и настраивать структурные описания символов и отображать результаты их сопоставления.
97

[Back]