Проверяемый текст
Терещенко Вадим Владиславович. Разработка и реализация новых принципов автоматического распознавания рукописных документов в компьютерных системах обработки данных (Диссертация 2000)
[стр. 88]

(4.8) Процедура повторяется не более некоторого максимального количества раз или пока процесс не сойдется.
Основная идея состоит в том, чтобы двигаться к минимуму в направлении наиболее быстрого убывания функции, которое определяется антиградиентом.
В процессе итераций поддерживается инвариант
= 1.
Шаг изменятся динамически, увеличиваясь при сходимости и уменьшаясь при расходимости.

Функция ](х) в приведенном выше алгоритме описывает размер штрафа в зависимости от имеющегося расстояния от точки до плоскости.
Штрафование производится за отрицательное расстояние
(точка находится с «неправильной» стороны плоскости), что означает неверную классификацию и недостаточно большие положительные расстояния (точка близко к плоскости), что можно интерпретировать как ненадежную классификацию.
Функция штрафов непрерывна и имеет вид: где х расстояние от точки до плоскости, д0 характерное расстояние, которое вычисляется как доля расстояния между (4.9) 88 центрами кластеров.
[стр. 60]

№]"•»=№<;> -и— 1 ’ ЗУ, д/(1> я — у > о (3.8) Ж.
/= Л^О —=^ 1я^'>)) ^ X я-о^» /«1 ^<2> м Процедура повторяегся, пока процесс не сойдется, или не более некоторого максимального количества раз.
В процессе итераций поддерживается инвариант
= 1 Шаг изменятся динамически, увеличиваясь при сходимости и уменьшаясь при расходимости.
Поскольку алгоритм градиентный, важно выбрать начальное положение плоскости недалеко от предполагаемого оптимума, иначе алгоритм может не сойтись или будет сходиться слишком медленно.
Таким приемлемым начальным приближением является плоскость, которая перпендикулярна линии, соединяющей центры кластеров, и пересекает ее в точке, расстояние от которой до центров кластеров одинаково.
Функция Г в приведенном выше алгоритме описывает штраф в зависимости от расстояния от точки до плоскости.
Штрафование производится за отрицательное расстояние
(неправильная классификация) и недостаточно большие положительные (точка близко к плоскости; классификация ненадёжна).
Функция штрафов имеет вид: 1 -*/*0 • рМ лг < О /(*) = 1 -х! х» рЦх> 0 (3.9) Важную роль в этой функции играет выбор параметра д:0, который задает скорость убывания вклада образа в зависимости от расстояния до разделяющей плоскости.
Обычно он выбирается пропорционально расстоянию между кластерами, но иногда настраивается вручную.
Описанный выше алгоритм хорошо работает тогда, когда масштабы всех признаков совпадают.
Если же один или несколько признаков имеют характерный масштаб, существенно превышающий масштаб остальных, происходит перекос классификатора в их сторону, так как только эти признаки будут вносить вклад в расстояние до плоскости.
60

[Back]