ляции. При этом не следует опасаться преждевременной сходимости популяции, так как быстрая скорость сходимости обеспечивается именно за счёт комбинирования FCM-алгоритма на основе НМТ1 и ГА. Кодирование хромосомы степенями принадлежности объектов центрам кластеров для данного примера оказалось менее эффективным по сравнению с кодированием хромосомы координатами центров кластеров (рисунки 2.17 и 2.18, таблица 2.7), что объясняется значительным превышением количества объектов над количеством элементов мониторинга. 2.9.2 Кластеризация множества объектов при реализации комбинированного метода нечеткой кластеризации с использованием генетического алгоритма с переменной длиной хромосомы Выполним реализацию комбинированного метода нечеткой кластеризации на примере кластеризации десяти объектов жилого фонда на произвольное (заранее неизвестное) количество кластеров с по сокращенному набору элементов оценивания, содержащему 5 элементов мониторинга: 1 «фундаменты», 2 «стены», 3 «междуэтажные перекрытия», 4 —«крыши», 5 «окна» (таблица 2.3). В этом случае следует использовать ГА с хромосомой переменной длины. При этом хромосомы кодируются координатами центров кластеров. При реализации ГА предполагалось, что количество кластеров может варьироваться от 2 до 8. Как показали результаты расчетов, оптимальным количеством кластеров, обеспечивающим получение минимального значения показателя качества кластеризаций индекса Се Бени, оказалось количество кластеров, равное с = 6 . При этом минимальное значение индекса Се —Бени равно 0,004698515225, в то время как при с = 4 минимальное значение индекса Се Бени равно 0,015100303632. Следует отметить, что при реализации ГА с хромосомой переменной длины при различных размерах популяции оптимальное количество кластеров определяется достаточно быстро: обычно требуется не более 2-5 смен поколений ГА. 125 |
Из рисунков видно, что наблюдается быстрая сходимость значений «среднего» и «минимального» здоровья популяции к «максимальному» здоровью (чем меньше значение индекса Се Бени, чем здоровье «максимальнее»). При этом в случае ГЛ без ДПФ.11 номер поколения, в котором значение «максимального» здоровья составляет не меньше 99% от значения «среднего», равен 12, а время расчёта составляет 3,015 с., что всего в 3,860 раз превосходит время расчёта одной генерации классического FCM-алгоритма на основе НМТ1 (таблица 43). В случае ГЛ с ДПФП номер поколения, в котором значение «максимального» здоровья составляет не меньше 99% от значения «среднего», равен 10, а время расчёта составляет 2,960 с., что в 3,79 раз превосходит время расчёта одной генерации классического FCM -алгоритма на основе 1 1МТ1. Таким образом, в случае ГА с ДПФП наблюдается некоторое уменьшение количества поколений, необходимых для получения адекватных результатов кластеризации, несмотря на то, что в нескольких первых поколениях наблюдается больший разброс в значениях «максимального», «среднего» и «минимального» здоровья популяции, что объясняется особенностями формирования популяции «жизнеспособных» хромосом. Следовательно, можно существенно уменьшить время кластеризации, если при формулировании условия завершения расчетов использовать оценки значений «среднего» и «максимального» здоровья популяции. При этом не следует опасаться преждевременной сходимости популяции, так как быстрая скорость сходимости обеспечивается именно за счет комбинирования FCM-алгоритма па основе НМТ1 и ГЛ. Кодирование хромосомы степенями принадлежности объектов центрам кластеров для данного примера оказалось менее эффективным по сравнению с кодированием хромосомы координатами центров кластеров (рисунки 4.15 и 4.16, таблица 4.3), что объясняется значительным превышением количества объектов над количеством критериев. 291 |