Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 63]

Вычисление степени уверенности Для сравнения гипотез разных классификаторов используется вероятность ошибки, вычисляемая как функция от расстояния гипотезы до центра кластера в пространстве признаков классификатора для признаковых классификаторов, и как функция структурной оценки для структурного классификатора.
В обоих случаях используется единая шкала от 0 до 55, которая приблизительно соответствует логарифму вероятности ошибки.
Функция для каждого классификатора измеряется экспериментально по тестовой базе изображений.
В конечном итоге используемая схема комбинирования предпочитает гипотезу того классификатора, который наиболее уверен в своих результатах.
Оценку вероятности ошибки можно также рассматривать как нормализацию функций расстояния к единой шкале.
Алгоритм сортировки дифференциальными классификаторами На вход алгоритма поступает упорядоченный по убыванию уверенности список гипотез.
Задача алгоритма заключается в переупорядочении списка гипотез таким образом, чтобы правильная гипотеза
оказалась на первом месте.
Для сравнения гипотез используются заранее обученные дифференциальные классификаторы.
Алгоритм
работает по принципу пузырьковой сортировки: гипотезы перебираются с конца списка и последовательно «всплывают» путем сравнения с менее вероятными гипотезами.
При перестановке гипотез производится корректировка показателя уверенности.
Этот алгоритм гарантирует, что правильная гипотеза окажется на первом месте
в том и только том случае, если дифференциальное сравнение со всеми вышестоящими гипотезами даст правильный результат, т.
е.
предпочтение будет отдано правильной гипотезе.
3.4 Векторное изображение Согласно представленному методу для вычисления признаков и обеспечения работы структурного классификатора формируется векторная модель изолированного рукописного символа.
Это представление моделирует символ в виде статической траектории движения пишущего инструмента.
Процесс перехода к векторному
63
[стр. 41]

РОССИЙСКАЯ госуд**6 4 Ц6ЯИ0Т ( человеком и записываются как выражения на языке структурных описаний.
В выражениях используются атрибуты выделенных структурных элементов.
Например, для различения цифр 1 и 7 признаком служит угол между двумя отрезками.
Для каждого классификатора подбирается индивидуальный набор признаков.
Структурное описание символа полностью определяет положение и свойства его частей, т.
е.
эффективно размечает символ, позволяя получить координаты всех характерных точек.
Наличие полной информации о структуре символа дает возможность очень просто запрограммировать индивидуальный набор признаков с отличной различающей способностью.
В описываемой системе признаки записываются как выражения на специальном языке, который допускает вычисление широкого спектра характеристик изображения и дает полный доступ к структуре символа.
Использование дифференциальных классификаторов, которые основываются на информации о структуре символа, позволяет добиться очень высокой точности распознавания.
«Массовость» дифференциального классификатора означает, что для максимального повышения точности системы необходимы тысячи парных классификаторов.
Чтобы это стало реальным, в процессе обучения реализуются автоматические процедуры для поиска пар близких классов, обучения и тестирования эталонов.
Для создания эталонов используется полностью интегрированная среда со встроенными средствами тестирования и отладки описаний.
Высокая автоматизация процедур обучения позволяет создать тысячи необходимых дифференциальных классификаторов за приемлемое время.
Векторное изображение Для вычисления признаков и обеспечения работы структурного классификатора формируется векторное представление изображения символа.
Это представление моделирует символ в виде статической траектории движения пишущего инструмента.
Процесс перехода к векторному
изображению называется векторизацией.
Из-за того что реальные пишущие инструменты имеют ненулевую толщину, а на полезное изображение накладывается шум и другие искажения, задача векторизации является неоднозначной.
Векторное изображение представляется неориентированным графом, вершины которого соответствуют изолированным концам и точкам пересечений штрихов.
С 41

[стр.,43]

Классификатор Точность Процент отказов Как работает при сильном изменении формы символа Как работает на разорванных символах Как работает на залитых символах Скорость работы 11ризнаковый + дифференциалы! ый признаковый средняя средний 11ормально плохо плохо высокая Растровый низкая высокий 11лохо хорошо хорошо высокая Структурный + диф<>ерснцнальм ын структурный очень высокая высокий Хорошо хорошо плохо низкая Таблица 3.1.
Сравнительные характеристики используемых классификаторов.
Последовательность работы классификаторов Процесс распознавания инициируется запуском признакового и растрового классификаторов.
Каждый из них выдает ранжированный но степени достоверности список гипотез.
После слияния двух списков на основе численного значения этого показателя, гипотезы из объединенного списка передаются на сортировку дифференциальному признаковому классификатору, в результате чего формируется уточненный список гипотез.
Гипотезы из уточненного списка проверяются по очереди структурным классификатором в порядке убывания показателя степени уверенности.
Если какая-то гипотеза подтверждается с хорошей оценкой, оставшиеся гипотезы могут быть частично или полностью отсечены.
Для подтвержденных гипотез формируется новое значение степени уверенности как максимум у веренности признакового и структурного классификатора.
Все оставшиеся неподтвержденными гипотезы штрафуются.
Объединенный список подтвержденных и неподтвержденных гипотез передается на сортировку дифференциальному структурному уровню, который формирует окончательный результат работы системы.
Вычисление степени уверенности Для сравнения гипотез разных классификаторов используется вероятность ошибки, вычисляемая как функция от расстояния гипотезы до центра кластера в
43

[стр.,44]

пространстве признаков классификатора для признаковых классификаторов, и как функция структурной оценки для структурного классификатора.
В обоих случаях используется единая шкала от 0 до 55, которая приблизительно соответствует логарифму вероятности ошибки.
Функция для каждого классификатора измеряется экспериментально по тестовой базе изображений.
В конечном итоге используемая схема комбинирования предпочитает гипотезу того классификатора, который наиболее уверен в своих результатах.
Оценку вероятности ошибки можно также рассматривать как нормализацию функций расстояния к единой шкале.
Алгоритм сортировки дифференциальными классификаторами На вход алгоритма поступает упорядоченный по убыванию уверенности список гипотез.
Задача алгоритма заключается в переупорядочении списка гипотез таким образом, чтобы правильная гипотеза
по возможности оказалось на первом месте.
Для сравнения гипотез используются заранее обученные дифференциальные классификаторы.
Алгоритм
работав! по принципу пузырьковой сортировки.
Гипотезы перебираются с конца списка и последовательно "всплывают” путем сравнения с менее вероятными гипотезами.
При перестановке гипотез производится корректировка показателя уверенности.
Этот алгоритм гарантирует, что правильная гипотеза окажется на первом месте
тогда и только тогда, когда дифференциальное сравнение со всеми вышестоящими гипотезами дает правильный результат, т.
е.
предпочтение отдается правильной гипотезе.
Базы изображений Признаковый и растровый классификаторы обучаются с использованием заранее подготовленных баз.
которые содержат изображения изолированных символов для каждого класса.
Вазы создаются ручными и полуавтоматическими методами, с .
обязательной ручной проверкой правильности классификации изображений.
Объем баз колеблется от 10 до 100 тысяч изображений на класс.
В совокупности базы для латинского и кириллического алфавита содержат более миллиона изображений одиночных символов.
Система обучения Для обучения и тестирования различных классификаторов создан ряд специализированных программ, которые решают следующие задачи: 44

[Back]