изображению называется векторизацией. Из-за того, что реальные пишущие инструменты имеют ненулевую толщину, и на полезное изображение накладывается шум и другие искажения, задача векторизации является неоднозначной. Модель и формат хранения Изображение представляется графом, вершины которого соответствуют изолированным концам и точкам пересечений трех или более отрезков. Кроме того, вершинами могут являться точки, разделяющие изображение на части, каждую из которых целесообразнее рассматривать индивидуально (острые углы при вычислении признаков, потенциальные точки порезки в линейном делении и т.п.). Для каждой вершины графа на исходном изображении хранятся ее координаты. Дуги графа представлены списком вершин ломаных линий, состоящих из исходных отрезков, и носят название цепей. Координаты точек цепи записываются в порядке следования. На рисунке внизу серым изображен векторизованный символ, а черными линиями — цепи. Рис. 3.3. Способ хранения векторного изображения. Каждый из концов цепи прикрепляется к вершине. Вершина имеет ссылки на все контактирующие с ней цепи. Для оценки местоположения, длины и структуры цени и всего изображения вычисляются описывающие прямоугольники, со сторонами, параллельными осям координат. 64 |
РОССИЙСКАЯ госуд**6 4 Ц6ЯИ0Т ( человеком и записываются как выражения на языке структурных описаний. В выражениях используются атрибуты выделенных структурных элементов. Например, для различения цифр 1 и 7 признаком служит угол между двумя отрезками. Для каждого классификатора подбирается индивидуальный набор признаков. Структурное описание символа полностью определяет положение и свойства его частей, т. е. эффективно размечает символ, позволяя получить координаты всех характерных точек. Наличие полной информации о структуре символа дает возможность очень просто запрограммировать индивидуальный набор признаков с отличной различающей способностью. В описываемой системе признаки записываются как выражения на специальном языке, который допускает вычисление широкого спектра характеристик изображения и дает полный доступ к структуре символа. Использование дифференциальных классификаторов, которые основываются на информации о структуре символа, позволяет добиться очень высокой точности распознавания. «Массовость» дифференциального классификатора означает, что для максимального повышения точности системы необходимы тысячи парных классификаторов. Чтобы это стало реальным, в процессе обучения реализуются автоматические процедуры для поиска пар близких классов, обучения и тестирования эталонов. Для создания эталонов используется полностью интегрированная среда со встроенными средствами тестирования и отладки описаний. Высокая автоматизация процедур обучения позволяет создать тысячи необходимых дифференциальных классификаторов за приемлемое время. Векторное изображение Для вычисления признаков и обеспечения работы структурного классификатора формируется векторное представление изображения символа. Это представление моделирует символ в виде статической траектории движения пишущего инструмента. Процесс перехода к векторному изображению называется векторизацией. Из-за того что реальные пишущие инструменты имеют ненулевую толщину, а на полезное изображение накладывается шум и другие искажения, задача векторизации является неоднозначной. Векторное изображение представляется неориентированным графом, вершины которого соответствуют изолированным концам и точкам пересечений штрихов. С 41 |