распознавания в виде, пригодном для использования в методе целостного, целенаправленного многоуровневого применения классификаторов. Следует заметить, что растровый классификатор хорошо изучен и не обладает принципиальными недостатками, препятствующими его использованию. Исходя из этого, можно сформулировать следующую задачу: реализовать растровый классификатор, выбрав один из описанных в литературе вариантов, и адаптировать его в соответствии с требованиями решаемой задачи. Использование признаковых классификаторов требует решения двух задач выбора системы признаков и выбора решающего правила. Задача создания решающего правила очень хорошо исследована как с теоретической, так и с практической стороны. Выбор признаков исследован намного хуже, но существует значительное количество экспериментальных работ, в которых приведены примеры признаков. С учетом сказанного можно сформулировать следующую задачу: реализовать признаковый классификатор, выбрав оптимальный набор признаков или разработав новые признаки. В качестве решающего правила можно выбрать один из описанных в литературе вариантов, адаптировав его в соответствии с требованиями решаемой задачи. Создание структурного классификатора представляет собой наиболее сложную задачу. Описанные в литературе структурные классификаторы не отвечают трем фундаментальным принципам построения структурной системы восприятия: целостности, целенаправленности и использованию контекста, которые, применительно к общей задаче распознавания образов, впервые были сформулированы в [67], и, применительно к задаче распознавания рукописных символов, описаны в [68,69, 70,71,72, 73,74]. 3.2 Принцип целостности, целенаправленности и использования контекста Принцип целостности заключается в том, что распознаваемый объект рассматривается как целое, состоящее из частей, связанных между собой пространственно-метрическими отношениями. Изображение интерпретируется как конкретный объект, только если на нем присутствуют все структурные части этого 55 |
3 Методы решения поставленной задачи 3.1 Содержательная постановка задачи Важный вывод, который следует из анализа предшествующих работ, заключается в том, что никакой из существующих подходов к построению классификатора не является идеальным. Поэтому для достижения наилучших результатов система распознавания символов должна быть построена как комбинация трех классификаторов: растрового, признакового и структурного. Растровый классификатор достаточно хорошо изучен и не обладает принципиальными недостатками, препятствующими его использованию. Исходя из этого можно поставить следующую задачу: Реализовать растровый классификатор, выбрав один из описанных в литературе вариантов, и адаптировать его в соответствии с требованиями решаемой задачи. Создание признакового классификатора требует решения двух задач выбора системы признаков и выбора решающего правила. Задача создания решающего правила очень хорошо исследована как с теоретической так и с практической стороны. Выбор признаков исследован намного хуже, но существует значительное количество экспериментальных работ, описывающих примеры признаков. С учетом сказанного можно сформулировать следующую задачу: Реализовать признаковый классификатор, выбрав оптимальный набор признаков из описанных в литературе или разработав новые признаки. В качестве решающего правила выбрать один из описанных в литературе вариантов, адаптировав его в соответствии с требованиями решаемой задачи. Создание структурного классификатора представляет собой наиболее сложную задачу. Описанные в литературе структурные классификаторы не отвечают трем фундаментальным принципам построения структурной системы восприятия целостности, целенаправленности и использования контекста, которые применительно к общей задаче распознавания образов впервые были сформулированы в [65], и применительно в задаче распознавания рукописных символов описаны в [66, 67, 68, 69, 70,71]. Согласно принципу целостности, распознаваемый объект рассматривается как целое, состоящее из частей, связанных между собой пространственно-метрическими 33 отношениями. Изображение интерпретируется как конкретный объект, только если на нем присутствуют все структурные части этого объекта и эти части находятся в соответствующих отношениях. Сами части получают интерпретацию только в составе предполагаемого целого > гипотезы об объекте. Согласно принципу целенаправленности, распознавание строится как процесс выдвижения и целенаправленной проверки гипотез о целом, в нашем случае о символе, изображенном в данном месте строки. Источниками гипотез являются признаковые классификаторы и контекстная информация. Части изображения анализируется не априорно, а только в рамках выдвинутой гипотезы о целом. Традиционный подход, состоящий в интерпретации того, что наблюдается на изображении, заменяется подходом, состоящим в целенаправленном поиске того, что ожидается на изображении. Использование контекстной информации постулирует, что распознавание объекта должно быть частью интегральной процедуры распознавания более высокого уровня. Процедура распознавания одного символа должна иметь доступ к информации от вышестоящих уровней, например о гипотезе деления слова на символы или об имеющихся контекстных ограничениях. Применительно к распознаванию символов принцип использования контекстной информации можно рассматривать как распространение принципов целостности и целенаправленности на уровень распознавания слов и строк. Чтобы создать структурный классификатор, удовлетворяющий перечисленным выше принципам, необходимо: а) разработать язык структурных описаний, который позволяет описывать символ как набор структурных элементов, связанных пространственнометрическими отношениями; б) разработать и реализовать алгоритмы поиска на изображении объектов, удовлетворяющих структурному описанию; с) разработать и реализовать программную систему, позволяющую составлять и настраивать структурные описания символов и визуализировать результаты их сопоставления. Хорошо известно, что с ростом числа классов сложность классификатора растет, в то время как его точность падает. С этой точки зрения наиболее простым случаем является выбор одного их двух возможных классов. Однако такой классификатор на 34 • Растровый классификатор. Использует 196 бинарных признаков, являющихся точками растрового изображения размера 14 на 14 точек. Решающее правило основано на функции расстояния. При обучении производится кластеризация. • Дифференциальный признаковый классификатор. Представляет собой набор линейных классификаторов, обучаемых для каждой пары путающихся символов. Для всех пар используегся один набор из 224 признаков признаковый классификатора плюс два дополнительных признака. • Структурный классификатор. Основной классификатор системы, определяющий качество сс работы. Использует построенные человеком структурные модели символов, которые сопоставляются с распознаваемым изображением. Обладает очень высокой обобщающей способностью, не нуждается в кластеризации. Автоматическое обучение отсутствует, вместо этого используется интерактивный процесс написания, тестирования и отладки эталона на образцах рукописных символов. • Дифференциальный структурный классификатор. Представляет собой набор линейных классификаторов, обучаемых для каждой пары путающихся классов. Для каждой пары используется индивидуальный набор признаков, подбираемый человеком. Структурный классификатор Структурный классификатор был разработан в соответствии с принципами целостности, целенаправленности и использования контекста, которые применительно к общей задаче распознавания образов впервые были сформулированы в [65], и применительно к задаче распознавания рукописных символов описаны в [66, 67, 68, 69, 70,71]. В рамках структурного классификатора символ описывается как набор структурных элементов (отрезок, дуга, кольцо, точка), а допустимое взаимное расположение элементов определяется с помощью декларативных метрических отношений. В качестве переменных в отношениях используются атрибуты и координаты характерных точек элементов, например, концов и экстремумов. Отношения задаются в форме нечетких логических высказываний. Структурные элементы на изображении не выделяются заранее. Вместо этого поиск элементов делается целенаправленно, прямо в процессе сопоставления эталона с 37 |