Матрица U = \и. {xl)] должна обладать следующими свойствами: (1.7) О<'£JuJ(xi) В случае использования евклидовой метрики этот критерий записывается в виде [189]: тор координат центра j -го кластера в некотором q -мерном нормированном пространстве, изоморфном R q (vl. е R q); с количество кластеров X , (у g{2,...,c}); п количество объектов кластеризации; у = 1,с; / = 1,я. Координаты центра j -го кластера находятся как: где п} мощность j -го кластера (количество объектов, отнесенных к j -му кластеру). Кластеризацию объектов X можно сформулировать как задачу оптимизации: найти матрицу U = [лу(х.)], минимизирующую значение целевой функции (1.9). Оценка качества кластеризации может выполняться с использованием различных показателей качества кластеризации, которые либо максимизируются, либо минимизируются [189]. j -1 х,еХj j=l Xj^Xj 1=1 где U = [uj(x.)] с-разбиение множества объектов X на основе характеристических функций Uj (л;,), определяющих принадлежность объекта кластеру X .; V = (vlv..,vc) —прототипы кластеров; dj( расстояние между объектом х{ и центром кластера vy; vf = век(1.10) |
0 < I > j{xt)< n t j = \,c.(1.13) /= Для оценки качества разбиения используется целевая функция, представляющая критерий разброса. В случае использования Евклидовой метрики этот критерий записывается в виде [116, 202]: ж ,г)= У !,/;=<; V (i.w j=\х^Хj 7=1xteXj 1=1 где U = [iij {xi)]' с-разбиение множества объектов X на основе характеристических функций Uj(x.), определяющих принадлежность объекта xj = {х*,xf ,...,х? ) кластеру X } ; V = ( у , vc) прототипы кластеров; d ■) расстояние между объектом xi и центром кластера v.; vy.=(vy,vj,...,vj) вектор координат центра у-го кластера в некотором # -мерном нормированном пространстве, изоморфном R'! (v lje R " ); с количество кластеров X . (/б{2,...,с});и количество объектов кластеризации; j = \,с ; / = 1,/г. При этом координаты центра / -го кластера находятся как: v ' = 2>,'> ' (1.15) «у veXj где iij мощность у-го кластера (количество объектов, отнесенных к У-му кластеру). Кластеризацию объектов X можно сформулировать как задачу оптимизации: найти матрицу U = [iij (лг(.)], минимизирующую значение целевой функции (1.14). Оценка качества кластеризации может выполняться с использованием различных показателей качества кластеризации, которые либо минимизируются, либо максимизируются [328, 362]. Выбор конкретного показателя качества кластеризации определяется целями выполняемой кластеризации. Так, например, показатель, называемый общий гиперобъем, обеспечивает поиск разбиения с минимальным суммарным гиперобъемом найденных кластеров: 102 |