3.3 Генетический алгоритм поиска* оптимальной комбинации значений фаззификаторов для FCM-алгоритма на основе интервальных нечетких множеств второго типа Применение метода кластеризации, реализующего использование FCM-алгоритма на основе ИНМТ2 и ГА, обеспечивает получение адекватных результатов кластеризации при значительном сокращении время поиска оптимальной комбинации значений фаззификаторов тх и т 2. Следует отметить, что обычный перебор всевозможных наиболее часто используемых значений фаззификаторов тх и т2 из множества {1,1; 2, 3, 5, 10} зачастую не приносит желаемого результата кластеризации [131]. При решении задачи поиска оптимальной комбинации значений фаззификаторов тх и т2 для FCM-алгоритма на основе ИНМТ2 хромосома может быть задана в виде [31, 32]: s = (mv m2), (3.24) где т1,т2 е(1,ттах]; ттах действительное число, определяющее максимальное значение фаззификатора (в зависимости от решаемой задачи; в большинстве практических задач: ттах <150); т , <т2. При реализации ГА используется одноточечное скрещивание, а мутации подвергается не более одного гена, так как длина хромосомы равна 2. В качестве функции соответствия для ГА может быть использован общий гиперобъем Н по формуле (3.20) для множества объектов, содержащего кластеры гиперэллипсоидной формы или, в частном случае, индекс Sph по формуле (3.22) для множества объектов, содержащего кластеры гиперсферической формы. Пусть в дальнейшем в качестве функции соответствия используется общий гиперобъем Н по формуле (3.20). Выбор хромосом-родителей для выполнения операции скрещивания осуществляется с использованием вероятностного отбора, описанного в главе 165 |
Поэтому использование индекс Sph может быть рекомендовано для оценки качества кластеризации с использованием FCM-алгоритма на основе ИНМТ2 и ГА для множества объектов, содержащего кластеры гиперсферической формы (или формы, близкой к гиперсферической), так как позволяет существенно уменьшить временные затраты на получение адекватных результатов кластеризации. Индекс Дана DI не позволяет получить адекватные результаты кластеризации, так как он учитывает только геометрические свойства объектов кластеризации и не предполагает учет расположения центров кластеров относительно объектов, отнесенных к этому кластеру (и поэтому невозможно точно локализовать координаты центров кластеров). Индекс Девиса —Боулдина D B , индекс плотности CS и индекс V не всегда позволяют получить адекватные результаты кластеризации даже на тестовых примерах. Это объясняется тем, что индекс Девиса-Боулдина DB и индекс V реализуют учет соответственно суммарного расстояния и квадрата расстояния между объектами, принадлежащими кластеру, и центром этого кластера, а индекс плотности CS обеспечивает учет суммарного расстояния между объектами, принадлежащими кластеру. Таким образом, при оценке качества кластеризации при реализации FCM-алгоритма на основе ИНМТ2 целесообразно использовать в качестве показателя качества кластеризации общий гиперобъем Я по формуле (5.40) или, в частном случае, индекс Sph по формуле (5.44) для множества объектов, содержащего кластеры гиперсферической формы. Все перечисленные в пп. 5.2.1 показатели кластеризации обычно используются при оценке качества кластеризации классического (четкого) алгоритма с-средних. Однако среди них удалось выявить те, использование которых оказалось возможным и в случае оценки качества кластеризации с использованием FCM-алгоритма на основе ИНМТ2 176, 92, 125]. 357 5.3 Генетический алгоритм поиска оптимальной комбинации значений фаззифнкаторов для FCM-алгоритма на основе интервальных нечетких множеств второго типа Для получения адекватных результатов кластеризации мож ет быть применен метод кластеризации с использованием FCM -алгоритма па основе ИНМ Т2 и ГА, позволяющий значительно сократи ть время поиска оптимальной комбинации-значений фаззификаторов ///, и т, и обеспечиваю щ ей повышение качества кластеризации, так как обычный перебор всевозможных наиболее часто используемых значений фаззификаторов /и, и т 2 из множества {1,1; 2, 3, 5, 10} не редко не приносит желаемого результата [120]. Для решения задачи поиска оптимальной комбинации значений .фаззификаторов т 1 и т2-хромосома может быть задана в виде [76, 120]: s = (mx,m 2), • (5.46) где /и,,ли2 е (1,т шх]; тшпх некоторое действительное число, определяю щ ее максимальное значение фаззификатора (в зависимости отреш аем ой задачи; в большинстве практических задач: >птах< 150): //;, < ш2. Так как длина хромосомы равна 2', то при реализации ГА используется одноточечное скрещивание, а мутации подвергается не более одного гена. В качестве функции соответствия для ГА может быть использован либо общий гннеробъем 11 по формуле (5.40) или, в частном случае, индекс Sph по формуле (5.44) для множества объектов, содержащ его кластеры гиперсферической формы. В дальнейш ем под функцией соответствия будем понимать общий гиперобъем Н по формуле (5.40). Выбор хромосом-родителей для выполнения операции скрещ ивания осуществляется с использованием вероятностного отбора, описанного в ГЛАВЕ 4, в соответствии с формулой (4.38). При выполнении операции скрещ ивания выбирается вероятность скрещивания Rc и генерируется случайное число N r . Если Rc > N c, то слу358 Диапазон изменения значения фаззифнкатора т может быть определен в виде: (1, и;—], где ттах —некоторое действительное число, определяющее максимальное значение фаззифнкатора. Диапазон, изменения значений «ширины зоны» у-го кластера (у = 1,с ) может быть задан произвольно в виде интервала действительных чисел [77”"",t]jax]j где Т]""" >0-, 77",ЛТ> 0 , rj’”"' наличии, предварительной информации о природе кластеров Диапазоны, изменения значений'«ширины зоны»..[77!"".,77""“ ]f (у = 1,с) могут быть заданы априори. Использование при задании: диапазонов' изменения значений^«ширинызоны» [rjjm (у = 1,с) формул типа (4.47) или (4.48) является нецелесообразным ввиду обычно больших значений фаззифнкатора т .. В качестве функции соответствия д л я Г А в общем случае может использоваться общий гиперобъем. Н-. по формуле: (5140)' а.в,частном случае.-. для множества'объектов, содержащего кластеры гиперсферической формы, —• индекс Sph по-формуле (5.44). В Дальнейшем под функцией соответствия будет пониматься общий гиперобъем Н ' по формуле (5.40), если не оговаривается иначе. . При реализации ГА целесообразно использовать одноточечное скрещивание, а количество мутирующих генов зависит от количества, кластеров с и не должно превышать 10-20% от длины хромосомы. Так, если с —3, то количество мутирующих генов должно быть не больше 1. Выбор хромосом-родителей для выполнения операции скрещивания осуществляется с использованием вероятностного отбора, описанного в ГЛАВЕ 4, в соответствии с формулой (4.38). При выполнении операции скрещивания выбирается вероятность скрещивания Rc и генерируется случайное число jVc. Если Rc > Nc, то случайным образом выбирается точка скрещивания z и выполняется скрещивание. Если в качестве точки скрещивания выбран первый ген, определяющий 370 |