Проверяемый текст
Демидова, Лилия Анатольевна. Развитие методов теории нечётких множеств и генетических алгоритмов для задач поддержки принятия решений в условиях неопределённости (Диссертация 2009)
[стр. 162]

качества каких-либо индексови показателей, использующих в своей записи значение фаззификатора т (как в FCM-алгоритме на основе НМТ1), невозможно ввиду наличия двух фаззификаторов тх и т29 а также из-за того, что само значение фаззификатора существенным образом влияет на значение показателя качества кластеризации (при поиске экстремума).
Также при выборе показателя качества кластеризации на основе ИНМТ2 необходимо отказаться от индексов и показателей, в записи которых присутствуют ФП uJ(xi) (у = 1,...,с, 1 = 1,...,и), поскольку значения ФП зависят от выбора значений фаззификаторов пг} и т2 [31,32].
При оценке качества кластеризации
множества объектов целесообразно
оценивать гиперобъемы полученных кластеров, при этом суммарный гиперобъем кластеров должен быть минимизирован, так как целью FCMалгоритма на основе ИНМТ2 является получение такой максимальной нечеткой области между двумя любыми кластерами (рисунки 3.6 и 3.8), которая бы наилучшим образом аппроксимировала разбиение объектов на кластеры.
Предлагаемые ниже показатели кластеризации обычно используются при оценке качества кластеризации классического (четкого) алгоритма ссредних.
Однако,
как показал анализ, их использование оказалось возможным и в случае оценки качества кластеризации с использованием алгоритмов кластеризации на основе ИНМТ2 [31, 32].
При оценке качества кластеризации для кластеров гиперэллипсоидной формы можно использовать общий гиперобъем Н [31, 32]: —>min, (3.20) /=i где Rj —ковариационная матрица у-го кластера; tij —количество объектов кластеризации, отнесенных к у-му кластеру; у, вектор координат центра у го кластера; xj вектор координат / -го объекта; det(Rj) —определитель кова162
[стр. 351]

.
5.2 Задача выбора/показателя качества кластеризации* Если: при оценке качества: кластеризации с использованием FCMалгоритма на основе.
НМТ1 целесообразно использовать индекс Се Бени, определяемый формулой.
(4;36), то при оценке качества кластеризаций>с использованием.
FGM-алгоритмана основе ЯМФ2'применение в качестве пока-: зателей качества.каких-либо индексов и показателей, использующих в своей записи значение фаззификатора .
т,
оказывается невозможным, во-первых, ввиду .наличия двух фаззификаторовтя, и )п2, а; во-вторых, .из-за того, что самр зтгачение фаззификатора существенным образом влияет иа значение показателя: качества: кластеризации (при.;поиске экстремума):.
Кроме того, при выборе показателя: качества кластеризации следует отказаться-,от индексов; в записи которых присутствуют ФГБ и (д-() ( / = Г,..., с ,.
г1 , „ я); так как.
значения ФГГзависят от выбора; значений ^фаззификаторов щ и,ш2 [76,.
120; 125].
Так.как пелыо FCM-алгоритма-па основе ИНМ.Г2 является;получение такой максимальной нечеткой области между двумя любыми кластерами (рисунки 5.6 и 5.9), которая бы; наилучшим образом аппроксимировала.разбиение объектов на кластеры, то при: оценке качества кластеризации множества объектов целесообразно анализировать, гиперобъемы полученных кластеров, при отом суммарный гиперобъем кластеров долже11<.быть минимизирован.[76].
Для-кластеров; имеющих форму гиперсферы; при оценке качес тва кластеризацииможно использовать показатель качества кластеризации,, осг нованный; например, на минимизации суммы радиусов кластеров [125].
5.2.1 Показатели качества кластеризации 1.
Индекс Дана (Dunn J.C.) D i [316, 327, 330]:, DI =min min t-'j+lsr \ \ min cl(xn xr) JC'^Xj,xrcXt maxi max d{Xl;Xf) .
g = l,e I vJ.„v eA '(.
max, (5.29) 351

[стр.,357]

Поэтому использование индекс Sph может быть рекомендовано для оценки качества кластеризации с использованием FCM-алгоритма на основе ИНМТ2 и ГА для множества объектов, содержащего кластеры гиперсферической формы (или формы, близкой к гиперсферической), так как позволяет существенно уменьшить временные затраты на получение адекватных результатов кластеризации.
Индекс Дана DI не позволяет получить адекватные результаты кластеризации, так как он учитывает только геометрические свойства объектов кластеризации и не предполагает учет расположения центров кластеров относительно объектов, отнесенных к этому кластеру (и поэтому невозможно точно локализовать координаты центров кластеров).
Индекс Девиса —Боулдина D B , индекс плотности CS и индекс V не всегда позволяют получить адекватные результаты кластеризации даже на тестовых примерах.
Это объясняется тем, что индекс Девиса-Боулдина DB и индекс V реализуют учет соответственно суммарного расстояния и квадрата расстояния между объектами, принадлежащими кластеру, и центром этого кластера, а индекс плотности CS обеспечивает учет суммарного расстояния между объектами, принадлежащими кластеру.
Таким образом, при оценке качества кластеризации при реализации FCM-алгоритма на основе ИНМТ2 целесообразно использовать в качестве показателя качества кластеризации общий гиперобъем Я по формуле (5.40) или, в частном случае, индекс Sph по формуле (5.44) для множества объектов, содержащего кластеры гиперсферической формы.
Все перечисленные в пп.
5.2.1 показатели кластеризации обычно используются при оценке качества кластеризации классического (четкого) алгоритма с-средних.
Однако
среди них удалось выявить те, использование которых оказалось возможным и в случае оценки качества кластеризации с использованием FCM-алгоритма на основе ИНМТ2 176, 92, 125].
357

[Back]