Проверяемый текст

Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)

[стр. 55]
распознавания в виде, пригодном для использования в методе целостного, целенаправленного многоуровневого применения классификаторов.
Следует заметить, что растровый классификатор хорошо изучен и не обладает принципиальными недостатками, препятствующими его использованию.
Исходя из этого, можно сформулировать следующую задачу: реализовать растровый классификатор, выбрав один из описанных в литературе вариантов, и адаптировать его в соответствии с требованиями решаемой задачи.
Использование признаковых классификаторов требует решения двух задач выбора системы признаков и выбора решающего правила.
Задача создания решающего правила очень хорошо исследована как с теоретической, так и с практической стороны.
Выбор признаков исследован намного хуже, но существует значительное количество экспериментальных работ, в которых приведены примеры признаков.
С учетом сказанного можно сформулировать следующую задачу: реализовать признаковый классификатор, выбрав оптимальный набор признаков или разработав новые признаки.
В качестве решающего правила можно выбрать один из описанных в литературе вариантов, адаптировав его в соответствии с требованиями решаемой задачи.
Создание структурного классификатора представляет собой наиболее сложную задачу.
Описанные в литературе структурные классификаторы не отвечают трем фундаментальным принципам построения структурной системы восприятия: целостности, целенаправленности и использованию контекста, которые, применительно к общей задаче распознавания образов, впервые были сформулированы в [67], и, применительно к задаче распознавания рукописных символов, описаны в [68,69, 70,71,72, 73,74].
3.2 Принцип целостности, целенаправленности и использования контекста Принцип целостности заключается в том, что распознаваемый объект рассматривается как целое, состоящее из частей, связанных между собой пространственно-метрическими отношениями.
Изображение интерпретируется как конкретный объект, только если на нем присутствуют все структурные части этого 55

[стр. 33]
3 Методы решения поставленной задачи 3.1 Содержательная постановка задачи Важный вывод, который следует из анализа предшествующих работ, заключается в том, что никакой из существующих подходов к построению классификатора не является идеальным.
Поэтому для достижения наилучших результатов система распознавания символов должна быть построена как комбинация трех классификаторов: растрового, признакового и структурного.
Растровый классификатор достаточно хорошо изучен и не обладает принципиальными недостатками, препятствующими его использованию.
Исходя из этого можно поставить следующую задачу: Реализовать растровый классификатор, выбрав один из описанных в литературе вариантов, и адаптировать его в соответствии с требованиями решаемой задачи.
Создание признакового классификатора требует решения двух задач выбора системы признаков и выбора решающего правила.
Задача создания решающего правила очень хорошо исследована как с теоретической так и с практической стороны.
Выбор признаков исследован намного хуже, но существует значительное количество экспериментальных работ, описывающих примеры признаков.
С учетом сказанного можно сформулировать следующую задачу: Реализовать признаковый классификатор, выбрав оптимальный набор признаков из описанных в литературе или разработав новые признаки.
В качестве решающего правила выбрать один из описанных в литературе вариантов, адаптировав его в соответствии с требованиями решаемой задачи.
Создание структурного классификатора представляет собой наиболее сложную задачу.
Описанные в литературе структурные классификаторы не отвечают трем фундаментальным принципам построения структурной системы восприятия целостности, целенаправленности и использования контекста, которые применительно к общей задаче распознавания образов впервые были сформулированы в [65], и применительно в задаче распознавания рукописных символов описаны в [66, 67, 68, 69, 70,71].
Согласно принципу целостности, распознаваемый объект рассматривается как целое, состоящее из частей, связанных между собой пространственно-метрическими 33

[стр.,34]
отношениями.
Изображение интерпретируется как конкретный объект, только если на нем присутствуют все структурные части этого объекта и эти части находятся в соответствующих отношениях.
Сами части получают интерпретацию только в составе предполагаемого целого > гипотезы об объекте.
Согласно принципу целенаправленности, распознавание строится как процесс выдвижения и целенаправленной проверки гипотез о целом, в нашем случае о символе, изображенном в данном месте строки.
Источниками гипотез являются признаковые классификаторы и контекстная информация.
Части изображения анализируется не априорно, а только в рамках выдвинутой гипотезы о целом.
Традиционный подход, состоящий в интерпретации того, что наблюдается на изображении, заменяется подходом, состоящим в целенаправленном поиске того, что ожидается на изображении.
Использование контекстной информации постулирует, что распознавание объекта должно быть частью интегральной процедуры распознавания более высокого уровня.
Процедура распознавания одного символа должна иметь доступ к информации от вышестоящих уровней, например о гипотезе деления слова на символы или об имеющихся контекстных ограничениях.
Применительно к распознаванию символов принцип использования контекстной информации можно рассматривать как распространение принципов целостности и целенаправленности на уровень распознавания слов и строк.
Чтобы создать структурный классификатор, удовлетворяющий перечисленным выше принципам, необходимо: а) разработать язык структурных описаний, который позволяет описывать символ как набор структурных элементов, связанных пространственнометрическими отношениями; б) разработать и реализовать алгоритмы поиска на изображении объектов, удовлетворяющих структурному описанию; с) разработать и реализовать программную систему, позволяющую составлять и настраивать структурные описания символов и визуализировать результаты их сопоставления.
Хорошо известно, что с ростом числа классов сложность классификатора растет, в то время как его точность падает.
С этой точки зрения наиболее простым случаем является выбор одного их двух возможных классов.
Однако такой классификатор на 34

[стр.,37]
• Растровый классификатор.
Использует 196 бинарных признаков, являющихся точками растрового изображения размера 14 на 14 точек.
Решающее правило основано на функции расстояния.
При обучении производится кластеризация.
• Дифференциальный признаковый классификатор.
Представляет собой набор линейных классификаторов, обучаемых для каждой пары путающихся символов.
Для всех пар используегся один набор из 224 признаков признаковый классификатора плюс два дополнительных признака.
• Структурный классификатор.
Основной классификатор системы, определяющий качество сс работы.
Использует построенные человеком структурные модели символов, которые сопоставляются с распознаваемым изображением.
Обладает очень высокой обобщающей способностью, не нуждается в кластеризации.
Автоматическое обучение отсутствует, вместо этого используется интерактивный процесс написания, тестирования и отладки эталона на образцах рукописных символов.
• Дифференциальный структурный классификатор.
Представляет собой набор линейных классификаторов, обучаемых для каждой пары путающихся классов.
Для каждой пары используется индивидуальный набор признаков, подбираемый человеком.
Структурный классификатор Структурный классификатор был разработан в соответствии с принципами целостности, целенаправленности и использования контекста, которые применительно к общей задаче распознавания образов впервые были сформулированы в [65], и применительно к задаче распознавания рукописных символов описаны в [66, 67, 68, 69, 70,71].
В рамках структурного классификатора символ описывается как набор структурных элементов (отрезок, дуга, кольцо, точка), а допустимое взаимное расположение элементов определяется с помощью декларативных метрических отношений.
В качестве переменных в отношениях используются атрибуты и координаты характерных точек элементов, например, концов и экстремумов.
Отношения задаются в форме нечетких логических высказываний.
Структурные элементы на изображении не выделяются заранее.
Вместо этого поиск элементов делается целенаправленно, прямо в процессе сопоставления эталона с 37

[Back]