Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 166]

представления знаний он позволяет задавать произвольные отношения между объектами путем программирования функций нечетких оценок и обладает достаточным быстродействием, чтобы использоваться для распознавания символов в реальном времени.
Разработаны новые алгоритмы поиска структурных элементов на изображении, удовлетворяющих структурному описанию и позволяющих за счет целенаправленного поиска выделять их с высокой надежностью даже при наличии дефектов изображения.
Разработана программная система, позволяющая составлять и настраивать структурные описания символов и отображать результаты их сопоставления.
Разработана новая схема решающего правила, которая уточняет результаты основного классификатора с помощью специализированных дифференциальных классификаторов.
Создана основа для дальнейших исследований в области поиска наиболее эффективных средств описания структурных эталонов, развитии методов построения дифференциальных классификаторов, разработки процедур автоматического создания структурных эталонов, формирования репрезентативных баз символов в различных предметных областях.
Как следует из приведенных экспериментальных данных, свойства классификаторов полностью соответствуют ранее приведенным качественным характеристикам.
Особо следует
отмстить повышение точности, даваемое структурным уровнем.
Хотя оно проявляется во всех множествах, участвовавших в измерениях, ярче
всего это явное улучшение проявилось при распознавании цифр, где растровый классификатор имеет точность 96.85%, признаковый на растре -90.60%, признаковый на векторе 97.67%, а добавление структурного классификатора позволяет поднять точность до 99.84%.
Более низкая точность на русском и английском алфавитах объясняется как большим набором символов, участвующих в распознавании, так и наличием патологических «близнецов», т.
е.
пар символов, между которыми нет четкой границы.

166
[стр. 89]

КЁдЬЪ Vа^^ап^ 8 3 дтадез ( 0.002%).
N0 г1дЬЪ уагдапЪ 710 1гпадез ( 0.373%) .
4.4 Сравнение результатов с аналогичными системами В Таблице 4.1 приведены сравнительные данные по точности классификаторов, разработанных двумя ведущими исследовательскими центрами США и Канады.
КхдЬЪ Vа^^ап^: 7 8 ттадез ( 0.004%).
Классификатор Точность распознавания цифр Разработанная автором система 99.6 08С (центр СЕРАЯ, 1)$А) (74] 98.09 СНашсоск (центр СЕРАЯ, Ц$А) [74] 97,97 Комбинация шести классификаторов, включая С5С и СЬатохк (центр СЕРАЯ, Ц5А) (74] 98,43 Ро1упот»а1 (центр СЕЫРАКМ1, Салака) (75] 98.3 Комбинация трех классификаторов, включая Рокпопма! и СопЮиг (центр СЕ^РАЯМ!, Сала<1а) (76] 98,5 Таблица 4.1.
Список наиболее крупных реализованных проектов.
4.5 Анализ результатов Как следует из приведенных экспериментальных данных, свойства классификаторов полностью соответствуют ранее приведенным качественным характеристикам.
Особо следует
отметить повышение точности, даваемое структурным уровнем.
Хотя оно проявляется во всех множествах, участвовавших в измерениях, ярче
всею это явное улучшение проявилось при распознавании цифр, где растровый классификатор имеет точность 96.6%, признаковый 99.0%, а добавление структурного классификатора позволяет поднять точность до 99.
6%.
Ьолее низкая точность на русском и английском алфавитах объясняется как большим набором символов, участвующих в распознавании, так и наличием патологических "близнецов", т.
с.
пар символов, между которыми нет четкой границы.

Например, казалось бы достаточно непохожие буквы "Н" и "И" у разных людей могут выглядеть совершенно одинаково, т.
е.
букву "Н", написанную одним человеком, другой человек с уверенностью может принять за "И".
Важной характеристикой классификатора является точность по первым трем вариантам, т.
е.
процент символов, для которых правильная гипотеза оказалась не ниже 89

[стр.,97]

изданий, суммарный объем которых эквивалентен двум тысячам страниц машинописного текста в сутки.
Вся эта гигантская работа выполняется с помощью 7 сканирующих и 10 распознающих станций, управляемых системой РтеЯеайег компании АВВУУ.
Заключение В данной работе поднята проблема автоматического ввода рукописных документов в компьютер.
На примере типовой системы было показано, что решающее значение на эффективность процесса ввода оказывает точность распознавания рукописных символов.
В результате была поставлена задача создать классификатор, существенно превосходящий по точности существующие.
Проведенный анализ литературы показал, что наиболее слабым местом современных систем распознавания являются применяемые принципы построения и комбинирования классификаторов, которые не позволяют целенаправленно использовать всю имеющуюся на изображении символа информацию для достижения максимальной точности.
Предварительное извлечение признаков приводит к потере информации, а классификация сосредоточивается на решении задачи выбора лучшего из N классов, которая изначально более сложна, чем задача выбора лучшего из двух классов.
Были предложены новые подходы к построению классификатора, которые базируются на принципах целостности, целенаправленности и использования контекста, и новые методы комбинирования классификаторов, основанные на использовании массовых парных дифференциальных классификаторов.
В результате были разработана и реализована система распознавания символов, которая основывается на многоуровневой комбинации классификаторов: трех полных (растрового, признакового и структурного), и большого количества парных дифференциальных классификаторов.
Для реализации структурного классификатора был разработан новый язык структу рных описаний, который позволяет описывать символ как набор структурных элементов, связанных пространственно-метрическими отношениями.
Были разработаны и реализованы алгоритмы поиска объектов на изображении, удовлетворяющих структурному описанию, и программная система, позволяющая составлять и настраивать структурные описания символов и отображать результаты их сопоставления.
97

[стр.,98]

Для создания парных дифференциальных классификаторов были разработаны и реализованы язык описания парных классификаторов, который позволяет программировать индивидуальные признаки для каждой пары путаемых символов, и программная система, позволяющая создавать большое количество парных классификаторов за приемлемое время.
Выла разработана новая схема комбинирования классификаторов, которая уточняет результаты основных классификаторов, использую результаты работы массовых парных дифференциальных классификаторов.
Предложенные подходы к построению классификатора были реализованы в виде программной системы "ИпеК.еас1ег Рукопись" и доведены до уровня промышленного использования.
Разработанный модуль распознавания одного символа вошел в состав полной системы ввода документов, который был внедрен в эксплуатацию в нескольких десятках организаций.
Дальнейшие направления исследований возможны в области поиска наиболее эффективных средств описания структурных эталонов, развитии методов построения дифференциальных классификаторов, разработке процедур автоматического создания структурных эталонов.
Остается актуальной и задача сбора репрезентативных баз символов в различных предметных областях.
Список литературы [1] КакезЬ А§га\\га1, Оа!а Мтт§: Сгоззт§ гНе СЬазт, 1пуИес1 1а1к а* 1Ье 5//? АСЫ81СКОО 1п1'1 Соп/егепсе оп КгижШ^е Отсо\егу апс! Баш Мтт% (КйО-99), $ап Эте^о, СаПГогта, Аи^из! 1999.
[2] У.Соутйага), А.ЗЬекЬаша*, апс! З.Ы.ЗпЬап, 1тегрге1абоп оГЬапсЫ'пПеп асМгезз т 11$ таИ 51геат, Ргос.
о/ЗЫПУРНК, 1993, рр.
197-206.
[3] Т.Рацие* апс! У.ЬесоиПтег, Напс^гИтп^ гесо^пШоп: АррПсаиоп оп Ьапк сКеяиез, Ргос.
о/ 1з1 Ш1.
Соп/.
оп ОоситеШ Апа1у518 апс1 Ресо%пШоп, $1.
Ма1о, Ргапсе, Зерк 1991,749-750.
[4] Т.
РауПсИз, Кесо^пШоп оГрптес! 1ех1 ипдег геаПз^с сопсПсюпз, РаИет Кесо^пШоп Ье(1ег5 14(1993) 317-326.
98

[Back]