Проверяемый текст

Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)

[стр. 58]
реальных задачах может достигать 100 и более.
Тем не менее, его можно использовать в гибридной системе, которая будет объединять обычный классификатор на полное число классов и большое количество парных классификаторов, призванных различать схожие пары символов.
Практическая реализация этой идеи применительно к распознаванию рукописных символов требует решения следующих задач: • разработать язык описания парных классификаторов, который позволяет программировать индивидуальные признаки для каждой пары схожих символов; • разработать и реализовать метод целенаправленного комбинирования классификаторов, который способен объединить несколько полных и парных классификаторов.
3.3 Метод целостного, целенаправленного многоуровневого применения растрового, признаковых и структурного классификаторов Прежде всего, следует определить первичную модель представления распознаваемых объектов, а также требуемую модель представления результатов классификации.
И если в силу постановки задачи первичная модель представления распознаваемых объектов представляет собой растровую модель изолированного рукописного символа, то модель представления результатов может быть различной.
В данной работе предлагается модель, представляющая собой совокупность двух компонентов: • • Упорядоченного по вероятности списка гипотез о классе, к которому принадлежит входное изображение, с указанием относительной достоверности каждой из них.
• Прогноза степени достоверности результата распознавания в целом, т.
е.
оценку абсолютной вероятности того, что входное изображение относится к первому в списке классу, а не является, например, «случайным мусором».
58

[стр. 35]
первый взгляд не применим к задаче распознавания символов, т.к.
число классов в реальных задачах может достигать 100 и более.
Тем не менее можно создать гибридную систему, которая будет объединять обычный классификатор на полное число классов и большое количество парных классификаторов, призванных различать часто путающиеся пары символов.
Практическая реализация этой идеи применительно к распознаванию рукописных символов требует решения следующих задач: а) разработать язык описания парных классификаторов, который позволяет программировать индивидуальные признаки для каждой пары пугающихся символов; б) разработать и реализовать программную систему, позволяющую создавать значительное количество (>1000) специализированных парных классификаторов за приемлемое время; в) разработать и реализовать процедуру комбинирования классификаторов, которая способна объединить несколько полных классификаторов и очень большое количество парных классификаторов.
3.2 Структура системы распознавания Входные и выходные данные системы распознавания Входными данными для системы распознавания одиночного символа является изображение изолированного символа в растровом виде.
Выходные данные модуля распознавания представляют собой совокупность двух компонентов: 1.
Упорядоченного по вероятности списка гипотез о классе, к которому принадлежит входное изображение, с указанием относительной достоверности каждой из них.
2.
Прогноза степени достоверности результата распознавания в целом, т.
е.
оценку абсолютной вероятности того, что входное изображение относится к первому в списке классу, а не является, например, "случайным мусором".
Следует отметить, что требования к выходным данным классификатора отличаются от тех, которые выдвигались в первых системах распознавания [72].
Изначально от классификатора требовалось лишь определить наиболее вероятного кандидата, т.
е.
список состоял всего из одной позиции.
При этом никакого ранжирования результатов распознавания по доверительной вероятности не производилось.
Такая постановка задачи годится только для применявшейся ранее линейной схемы 35

[Back]