Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 72]

До коррекции После коррекции Рис.
3.8.
Коррекция векторного изображения.
3.5 Приведение изображений для классификаторов Для более эффективной работы классификаторов, улучшения кластеризации и сокращения диапазона признаков используется преобразование изображения.
Приведение изображения для простого растрового классификатора В растровом классификаторе изображение символа сначала приводится к стандартной толщине штриха и стандартному размеру, а затем сопоставляется с базой растровых эталонов.
Размер приведенного эталона 14 на 14 точек.
Вычисление толщины штриха производится по средней длине КЬЕ-штриха независимо для
вертикальных и горизонтальных штрихов по следующей формуле: Полупсримстр Р/2 есть сумма числа КЕЕ-штрихов по вертикали и горизонтали.
Решение отыскивается итеративно, начиная с Но= 1, Ь-Р/2-Н,
с последующим увеличением Н на единицу до тех пор, пока Ш не станет больше б1.
За окончательное значение //, принимается то его значение, при котором 1Н меньше всего отличается от ЬН=3, Ь+Н-Р/2 (3.1) 72
[стр. 61]

Отбор значимых признаков для линейною классификатора осуществляется в соответствии с их информативностью.
Показателем качества признака является величина, называемая количеством информации (в шенноновском смысле).
Пусть х и у — вероятности появления некоторого бинарного признака на рассматриваемых кластерах.
Тогда количество информации I, заключенное в этом признаке, равно г _ 1 .
Р(х>у) + р(\ х,\ у) 2 (3.10) р(х, у) = х 1о§2 дг (х + у) 1од2(х + у) + у 1о§2 у Для классификатора отбирается несколько признаков с лучшими значениями количества информации.
Количество признаков определяется заданием суммарного требуемого количества информации.
3.5 Растровый классификатор В растровом классификаторе изображение символа сначала приводится к стандартной толщине штриха и стандартному размеру, а затем сопоставляется с базой растровых эталонов.
Размер приведенного эталона 14 на 14 точек.
Вычисление толщины штриха производится по средней длине КЬЕ-штриха независимо для
вергикальных и горизонтальных штрихов по следующей формуле: I.
Ь*Н = 3, Ь + Н = Р/2 (3.11) Полупсриметр Р/2 есть сумма числа КЬЕ-штрихов по вертикали и горизонтали.
Решение отыскивается итеративно, начиная с Но = 1, Ь
= Р/2 Н, с последующим увеличением Н на единицу до тех пор, пока Н*Ь не станет больше 8.
Значение Н, при котором Ь*Н меньше всего отличается от 5, считается окончательным.
61

[Back]