Проверяемый текст
Демидова, Лилия Анатольевна. Развитие методов теории нечётких множеств и генетических алгоритмов для задач поддержки принятия решений в условиях неопределённости (Диссертация 2009)
[стр. 82]

где с “ количество кластеров; п количество объектов; i/Дх,) ФП объекта xt кластеру X ,; vy вектор координат центра j -го кластера; х, вектор координат / -го объекта; / = 1,л, j = 1 ,с; t = 1,с.
Как видно из приведенных выше формул, одни показатели качества кластеризации основаны на использовании только степеней принадлежности объектов центрам кластеров, другие учитывают и степени принадлежности объектов центрам кластеров, и геометрические свойства как самих объектов кластеризации, так и центров кластеров [146-149, 160, 161].
Следует отметить, что вычисление показателей качества кластеризации, основанных
на использовании ковариационных матриц (например, нечеткого общего гиперобъема FH по формуле (2.13)), требует значительно больших временных затрат, чем вычисление любых других показателей качества кластеризации.
Анализ работ зарубежных авторов, посвященных проблеме выбора показателя качества кластеризации, показал, что для оценки компактности и хорошей отделимости кластеров гиперсферической формы целесообразно использовать индекс Се —Бени по формуле (2.15), являющийся наиболее информативным, так как учитывает как нечеткие степени принадлежности объектов центрам кластеров, так и геометрическое расположение центров кластеров и объектов, что позволяет получить адекватные результаты кластеризации [153, 159, 160, 166, 183, 188, 189].
Как показывает практическое применение индекса Се Бени, при хороших результатах нечеткой кластеризации ХВ < 1 [392].
При этом в качестве искомого количества кластеров
п следует выбрать то, для которого индекс ХВ принимает минимальное значение.
Индекс Се Бени по формуле (2.15) может быть записан в виде: где с количество кластеров; п количество объектов; q количество элементов мониторинга; и,(х() ФП объекта х{ кластеру X j ; v*.
/-я координата центра у-го кластера; х\ l -я координата /-го объекта; / = 1,я, у = 1 ,с; t = l9c.
(2.16) 82
[стр. 259]

взвешенных отклонений координат объектов кластеризации от центров искомых нечетких кластеров по формуле (4.5).
Однако в настоящее время известны различные подходы к оценке качества кластеризации с использованием FCM-алгоритма на основе НМТ1, основанные на применении различных функций, представляющих те или иные показатели качества кластеризации [281, 283, 287, 329, 330, 346, 347].
Одни из них основаны на использовании только степеней принадлежности объектов центрам кластеров, другие учитывают и степени принадлежности объектов центрам кластеров, и геометрические свойства как самих объектов кластеризации, так и центров кластеров.
4.2.1 Показатели качества нечеткой кластеризации Наиболее часто при оценке качества нечеткой кластеризации с использованием FCM-алгоритма на основе НМТ1 используются следующие показатели качества кластеризации.
1.
Показатель разбиения PC [320, 328, 330, 392]: = ->тах, (4.11) // j=I i=i где п количество объектов; с количество кластеров; и (xt) ФП объекта л, кластеру i = j = 1,с.
2.
Энтропия разбиения РЕ [320, 328, 330]: = (.v ,) •logb(uj (л -,) ) > m in, ( 4 .
12 ) n J = \/=1 где n количество объектов; с количество кластеров; h —основание логарифма, иj (х,) ФП объекта л, кластеру X } ; / = 1, п , j = 1,с .
3.
Показатель разбиения HZ [327]: HZ = тах{и (х,))—0,5 j max, (4.13) /=1 V ) где п количество объектов; с количество кластеров; иДд,) ФП объекта xt кластеру X }; / = 1, п , j = \ , с .
259

[стр.,263]

10.
Индекс плотности нечеткого разбиения [328, 329]: (4.34) FH С (4.35) где FH и Sf определяются по формулам (4.29) и (4.33) соответственно.
Следует отметить, что вычисление показателей качества кластеризации, основанных
па использовании ковариационных матриц, требует значительно больших временных затрат, чем вычисление любых других показателей качества кластеризации.
4.2.2 Анализ адекватности результатов нечеткой кластеризации в зависимости от используемого показателя качества кластеризации Показатель разбиения PC по формуле (4.11) обратно пропорционален общему среднему перекрытию между парами нечетких кластеров.
Так, если перекрытие кластеров отсутствует, то PC —1.
Предполагается, что поиск должен обеспечить обоснованную кластеризацию множества объектов [392].
Недостатком данного показателя является отсутствие прямой связи с геометрическими свойствами (расположением) объектов.
Кроме того, показатель разбиения PC монотонно убывает с ростом количества кластеров с.
Отметим, что многие критерии имеют аналогичный недостаток, так как не учитываюг геометрические свойства множества объектов (расположение центров кластеров и расстояния между объектами и центрами кластеров).
Энтропия разбиения РЕ по формуле (4.12) также не учитывает геометрические свойства множества объектов.
При этом оптимальное число кластеров как при вычислении показателя разбиения P C , так и при вычислении энтропии разбиения РЕ равно 2, что не всегда верно [320].
263

[стр.,265]

лежности объектов' центрам кластеров: так ir:геометрическое расположениецентров кластеров и объектов [392].
Однако, как показывает применение этих индексов при решении различных прикладных задач,, индекс отделимости-компактности .SC характеризуется тем, что при определении.оптимального количества кластеров в ряде: случаев имеет место превышение: значения стандартного отклонения: над разницей.средних значений: индексов, что -нежелательно [320]: В это же время индекс Се Бени ХВ характеризуется тем, что,при определении оптимального' количества: кластеров разница средних значений индексов-больше-любого значения стандартного .отклонения [392].
Таким, образом^ показатель разбиения.
PC,.
энтропияразбиения РЕ и показатель разбиения IIZ не могут быть рекомендованы для использования при оценке точности; и адекватности нечеткого разбиения (нечеткойкластеризации)..
Индекс Фукуяма Сугено FS, индекс плотности /iC'S и индекс, отделимости-компактности SC могут давать близкие значения для разного числа кластеров, поэтому они также не могут быть признаны эффективными при оценке наиболее оптимального числа кластеров.
• Исходя из.
выше сказанного,, можно сделать-вывод, что для оценки компактности и хорошей,отделимости:кластеров целёсообразно-использовать индекс:Се Бени по формуле (4.15).’ В основе индекса Се Бени лежит сумма квадратов взвешенных отклонений координат объектов кластеризации-от центров искомых нечетких кластеров по формуле (4.5).
Тем не менее, индекс Сё —Бени.
ХВ является более информативным при оценке компактности и хорошей отделимости кластеров [392].
Как показывает практика, при хороших результатах нечеткой кластеризации, ХВ-< 1.
...
При этом в качестве искомого количества кластеров
с следует выбрать то, для которого индекс ХВ принимает минимальное значение.
265

[Back]