Проверяемый текст

Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)

[стр. 59]
Указанные требования к выходным данным классификатора несколько отличаются от тех, которые выдвигались в первых системах распознавания [75], в которых от классификатора требовалось лишь определить наиболее вероятного кандидата, т.
е.
список выходных данных состоял всего из одной позиции.
При этом никакого ранжирования результатов распознавания по доверительной вероятности не производилось.
Такая постановка задачи годится только для применявшейся ранее линейной схемы распознавания текста, когда текст сначала разделяется на строки, потом строки разделяются на символы, а результат распознавания символа является окончательным результатом работы системы.
Линейная схема обработки подразумевает, что предыдущий этап полностью завершился до начала следующего.
Такой подход обладает одним принципиальным недостатком: решение принимаемое на каждом этапе не учитывает результатов от последующих этапов.
В то время как совершенно очевидно, что если есть несколько возможных вариантов деления слова на символы, то для выбора правильного варианта полезно использовать результаты распознавания символов, исходя из того, что при неверном делении на символы классификатор обычно выдает результат с малой степенью достоверности.
Очень полезными для выбора правильного варианта деления на символы являются также результаты проверки распознанного слова по словарю.
Преимущественная тенденция, используемая при разработке современных схем распознавания, состоит в том, чтобы откладывать окончательное решение выбора варианта на максимально поздний этап.
Это реализуется путем разнообразных схем перебора и обработки с возвратами [76].
Отход от линейной схемы обработки определил выдвижение повышенных требований к классификатору выдавать помимо класса еще и общую оценку степени достоверности полученного результата.
Эта оценка используется, в первую очередь, для принятия решения о выборе линейного деления на символы.
Вторым фактором, определяющим требования к выходным данным классификатора, является словарная обработка.
Если классификатор порождает единственную гипотезу, словарь можно использовать только в режиме ее подтверждения.
Хотя это и дает положительные результаты (например, при выборе 59

[стр. 35]
первый взгляд не применим к задаче распознавания символов, т.к.
число классов в реальных задачах может достигать 100 и более.
Тем не менее можно создать гибридную систему, которая будет объединять обычный классификатор на полное число классов и большое количество парных классификаторов, призванных различать часто путающиеся пары символов.
Практическая реализация этой идеи применительно к распознаванию рукописных символов требует решения следующих задач: а) разработать язык описания парных классификаторов, который позволяет программировать индивидуальные признаки для каждой пары пугающихся символов; б) разработать и реализовать программную систему, позволяющую создавать значительное количество (>1000) специализированных парных классификаторов за приемлемое время; в) разработать и реализовать процедуру комбинирования классификаторов, которая способна объединить несколько полных классификаторов и очень большое количество парных классификаторов.
3.2 Структура системы распознавания Входные и выходные данные системы распознавания Входными данными для системы распознавания одиночного символа является изображение изолированного символа в растровом виде.
Выходные данные модуля распознавания представляют собой совокупность двух компонентов: 1.
Упорядоченного по вероятности списка гипотез о классе, к которому принадлежит входное изображение, с указанием относительной достоверности каждой из них.
2.
Прогноза степени достоверности результата распознавания в целом, т.
е.
оценку абсолютной вероятности того, что входное изображение относится к первому в списке классу, а не является, например, "случайным мусором".
Следует отметить, что требования к выходным данным классификатора отличаются от тех, которые выдвигались в первых системах распознавания [72].
Изначально от классификатора требовалось лишь определить наиболее вероятного кандидата, т.
е.
список состоял всего из одной позиции.
При этом никакого ранжирования результатов распознавания по доверительной вероятности не производилось.
Такая постановка задачи годится только для применявшейся ранее линейной схемы 35

[стр.,36]
распознавания текста, когда текст сначала разделяется на строки, потом строки разделяются на символы, а результат распознавания символа является окончательным результатом работы системы.
Линейная схема обработки подразумевает, что предыдущий этап полностью завершается до начала следующего.
Она обладает одним принципиальным недостатком: решение на каждом этапе принимается в условиях отсутствия информации от последующих этапов.
Тем не менее, если есть несколько возможных вариантов деления слова на символы, то для выбора правильного варианта полезно использовать результаты распознавания символов, так как при неверном делении на символы классификатор обычно выдает результат с малой степенью достоверности.
Также очень полезными для выбора варианта деления на символы являются результаты проверки распознанного слова по словарю.
Преимущественная тенденция, используемая при разработке современных схем распознавания, состоит в том, чтобы откладывать окончательное решение на максимально поздний этап.
Это реааизуется путем разнообразных схем перебора и обработки с возвратами [73].
Отход от линейной схемы обработки определил выдвижение повышенных требований к классификатеру выдавать помимо класса еще и общую оценку степени достоверности полученного результата.
Эта оценка используется, в первую очередь, для принятия решения о выборе линейного деления на символы.
Вторым фактором, определяющим требования к выходным данным классификатора, является словарная обработка.
Если классификатор порождает единственную гипотезу, словарь можно использовать только в режиме ее подтверждения.
Хотя это и дает положительные результаты (например, при выборе линейного деления), гораздо большего эффекта можно достичь, корректируя результаты распознавания по словарю.
А для этого классификатор должен выдавать не одного кандидата, а упорядоченный список кандидатов, желательно с численными оценками вероятности.
Характеристики используемых классификаторов Описываемая система распознавания рукописных символов использует следующие классификаторы: • Признаковый классификатор.
Использует 224 бинарных признака.
Решающее правило основано на функции расстояния.
При обучении производится кластеризация.
36

[Back]