Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 82]

ограничен, для соблюдения корректности, в работе с длинными и узкими символами (например, дефисом).
Признаки являются бинарными и определяются типами имеющихся на изображении цепей, типами их концов, наличием экстремумов, положениями концов цепей и экстремумов на изображении, количеством вертикальных и горизонтальных пересечений и суммарной длиной цепей (периметром).
Вели встречаются признаки небинарной природы, то с помощью следующего алгоритма они конвертируются в набор бинарных признаков: диапазон изменения признака разбивается на N интервалов (1............и) и каждому интервалу сопоставляется один бинарный признак.
Значению исходного признака, попадающему в
х-й интервал, соответствует набор бинарных признаков, в котором признаки (1,..., /) имеют значение 1, а остальные (...........//)— значение 0.
Такая схема дает несколько более устойчивые признаки, чем схема, при которой попаданию признака в
/-и интервал соответствует единичное значение /-го бинарного признака и нулевое значение остальных.
Полный набор используемых признаков, вычисляемых по векторному изображению, приведен в следующей таблице: Таблица 4.1.
Признаки, вычисляемые но векторному изображении).
Наличие экстремумов каждого из типов в каждой из полос.
4x6 =24 Наличие концов цепей каждого из типов в каждом из прямоугольников, задаваемых 4x9 =36 пересечением полос.
Наличие цепи заданного типа, начальная и
конечная вершина которой находятся в заданных 9x6x2 = 108 полосах.
Порядок концов целей не учитывается.
То есть, рассматривается
Зх(3+1)/2 = 6 комбинаций положений.
Горизонтальные и вертикальные полосы рассматриваются отдельно.
Число пересечений в вертикальном
л горизонтальном направлениях.
Интервал [0,4] разбит на 2x16 = 32 16 градаций.
Суммарная длина цепей в левой правой, верхней и нижней половинах изображения
8 градаций.
4x8 = 32
[стр. 55]

вертикально ориентированных.
Направление дуги определяется по направлению максимального отклонения от прямой, соединяющей концы.
Всего имеется 9 типов цепей (2 два типа отрезка, 4 типа дуг, 2 типа ломаных и кольцо).
Все признаки бинарные и определяются типами имеющихся на изображении цепей, типами их концов, наличием различных экстремумов, положениями концов цепей и экстремумов на изображении, количеством вертикальных и горизонтальных пересечений и суммарной длиной цепей (периметром).
Признаки небинарной природы конвертируются в набор бинарных признаков с помощью следующего алгоритма: диапазон изменения признака разбивается на N интервалов и каждому интервалу сопоставляется один бинарный признак, значению исходного признака, попадающему в 1-й интервал соответствует набор бинарных признаков, в котором признаки I,...»I имеют значение 1, а остальные — значение 0.
Такая схема дает несколько более устойчивые признаки, чем схема, при которой попаданию признака в
ьй интервап соответствует единичное значение 1-го бинарного признака и нулевое значение остальных.
Положения точек характеризуются попаданием в одну или несколько из 6 полос на изображении: левую, правую и центральную вертикальные и верхнюю, нижнюю и центральную горизонтальные.
Положения вершин также характеризуются попаданием в один из 9 прямоугольников, задаваемых пересечением вертикатьных и горизонтальных полос.
Полосы одного направления перекрываются друг с другом для обеспечения устойчивости признаков.
Суммарная длина (периметр) вычисляется в левой, правой, нижней и верхней половинах изображения.
Полный набор используемых признаков приведен в следующей таблице: Описание признаков Количество признаков Наличие экстремумов каждого из типов в каждой 4x6 = 24 из полос.
Наличие концов цепей каждого из типов в каждом 4x9 = 36 из прямоугольников, задаваемых пересечением полос.
Наличие цепи заданного типа, начальная и
9x6x2 = конечная вершина которой находятся в заданных полосах.
108 55

[стр.,56]

Порядок концов цепей не учитывается.
То есть рассматривается
ЗШ(3+1)/2 6 комбинаций положений.
Горизонтальные и вертикальные полосы рассматриваются отдельно.
Число пересечений в вертикальном
и 2x16 = горизонтальном направлениях.
Интервал [0, 4] разбит на 16 градаций.
32 Суммарная длина цепей в левой, правой, верхней и нижней половинах изображения.
6 градаций.
4x6 = 24 Итого: 224 Таблица 3.2.
Признаки, вычисляемые по векторному изображению.
Вычисление признаков Признаки вычисляются не на исходном векторном изображении, а на специально подготовленном.
Подготовка заключается в более агрессивной коррекции дефектов векторизации и изображения.
При такой коррекции возможна потеря деталей и внесение новых дефектов, поэтому ей нельзя подвергать основное изображение, которое используется при структурном распознавании.
Но на признаковом классификаторе такая коррекция в среднем сказывается положительно, так как повышает стабильность признаков.
Подготовка изображения состоит в проведении следующих операций: • Устранение разрывов путем соединения близко расположенных изолированных концов цепей.
• Коррекция острых углов путем превращения У-образных вершин с коротким отростком в У-образные.
• Дополнительная фильтрация коротких отростков.
• Коррекция Х-образных вершин, распавшихся на две У-образные, соединённые короткой перемычкой.
• Разбиение цепей на части в острых углах.
56

[Back]