До коррекции После коррекции Рис. 3.8. Коррекция векторного изображения. 3.5 Приведение изображений для классификаторов Для более эффективной работы классификаторов, улучшения кластеризации и сокращения диапазона признаков используется преобразование изображения. Приведение изображения для простого растрового классификатора В растровом классификаторе изображение символа сначала приводится к стандартной толщине штриха и стандартному размеру, а затем сопоставляется с базой растровых эталонов. Размер приведенного эталона 14 на 14 точек. Вычисление толщины штриха производится по средней длине КЬЕ-штриха независимо для вертикальных и горизонтальных штрихов по следующей формуле: Полупсримстр Р/2 есть сумма числа КЕЕ-штрихов по вертикали и горизонтали. Решение отыскивается итеративно, начиная с Но= 1, Ь-Р/2-Н, с последующим увеличением Н на единицу до тех пор, пока Ш не станет больше б1. За окончательное значение //, принимается то его значение, при котором 1Н меньше всего отличается от ЬН=3, Ь+Н-Р/2 (3.1) 72 |
Отбор значимых признаков для линейною классификатора осуществляется в соответствии с их информативностью. Показателем качества признака является величина, называемая количеством информации (в шенноновском смысле). Пусть х и у — вероятности появления некоторого бинарного признака на рассматриваемых кластерах. Тогда количество информации I, заключенное в этом признаке, равно г _ 1 . Р(х>у) + р(\ х,\ у) 2 (3.10) р(х, у) = х 1о§2 дг (х + у) 1од2(х + у) + у 1о§2 у Для классификатора отбирается несколько признаков с лучшими значениями количества информации. Количество признаков определяется заданием суммарного требуемого количества информации. 3.5 Растровый классификатор В растровом классификаторе изображение символа сначала приводится к стандартной толщине штриха и стандартному размеру, а затем сопоставляется с базой растровых эталонов. Размер приведенного эталона 14 на 14 точек. Вычисление толщины штриха производится по средней длине КЬЕ-штриха независимо для вергикальных и горизонтальных штрихов по следующей формуле: I. Ь*Н = 3, Ь + Н = Р/2 (3.11) Полупсриметр Р/2 есть сумма числа КЬЕ-штрихов по вертикали и горизонтали. Решение отыскивается итеративно, начиная с Но = 1, Ь = Р/2 Н, с последующим увеличением Н на единицу до тех пор, пока Н*Ь не станет больше 8. Значение Н, при котором Ь*Н меньше всего отличается от 5, считается окончательным. 61 |