Осуществляя выбор базовой методики кластеризации необходимо отметить тот факт, что в общем случае используемое признаковое пространство может не принадлежать к пространствам с вероятностной структурой, что в свою очередь, ограничивает выбор среди методик, не использующих в качестве меры различные варианты вероятностных распределений (смесей распределений). Таким образом, использование для кластеризации непараметрических ядерных оценок плотности вероятности типа Парзсна-Розенблата, представляется нерациональным в силу их адекватности лишь при большом объеме выборки [71]. Следовательно, в числе доступных для использования, остается группа методов, использующих в качестве основы представление объекта в виде точки в «-мерном пространстве, в общем случае произвольной природы, и осуществляющих кластеризацию на основании введенной метрики (расстояния) между объектами. Значительный объем информации по выбору метрик, в т.ч. и для случая нечетких множеств, представлен в работах А.Кофмана [68], И.Д.Манделя [79], С.А.Айвазяна и др. [2], Б.Дюрана и П.Оделла [45], В.Е.Жуковина [48], А.М.Дуброва, В.С.Мхитаряна и Л.И. Трошина 143], АЛОрлова [93], А.В.Андрейчикова и О.Н.Андрейчикоиой [5], Б.Б.Розина [111], И.И.Елисеевой и В.О.Рукавишникова [47] и т.д. Несмотря на значительное число работ по проблематике введения метрик в произвольных пространствах, основным из предлагаемых методов является аксиоматическое введение метрики, исходя из априорных представлений исследователя о специфике исследуемого пространства. Одной из главных проблем, возникающих в процессе метризации произвольного пространства, является адекватность и интерпретируемость полученных результатов в рамках проводимого исследования. Используя введенное в объектном пространстве понятие метрики, становится возможным осуществлять отбор объектов, наиболее близко расположенных в пространстве к «идеальным» объектам, наиболее полно характеризующим данный класс объектов. Использование данного метода осложняется процедурой определения характеристик «идеального» объекта. Также возможно использование метода «сгущений», основанного на |
Осуществляя выбор базовой методики кластеризации .необходимо отметить тот факт, что в общем случае используемое признаковое пространство может не принадлежать к пространствам с вероятностной структурой, что в свою очередь, ограничивает выбор среди методик, не использующих в качестве меры различные шрианты вероятностных распределений (смесей распределений). Таким образом, использование для кластеризации непараметрических ядерных оценок плотности вероятности типа Парзена-Розенблата, представляется нерациональным в силу их адекватности лишь при большом объеме выборки [87]. Следовательно, в числе доступных для использования, остается группа методов, использующих в качестве основы представление объекта в виде точки в и-мерном пространстве, в общем случае произвольной природы, и осуществляющих кластеризацию на основании введенной метрики (расстояния) между объектами. Значительный объем информации по выбору метрик, в т.ч. и для случая нечетких множеств, представлен в работах А.Кофмана [81], И.Д.Манделя [99], С.А.Айвазяна и др. [5], Б.Дюрана и П.Оделла [54], В.Е.Жуковина [59], А.М.Дуброва, В.С.Мхитаряна и Л.И.Трошина [51], А.И.Орлова [124], А.В.Андрейчикова и О.Н.Андрейчиковой [9], Б.Б.Розина [147], И.И.Елисеевой и В.О.Рукавишникова [56] и т.д. Несмотря на значительное число работ по проблематике введения метрик в произвольных пространствах, основным из предлагаемых методов является аксиоматическое введение метрики, исходя из априорных представлений исследователя о специфике исследуемого пространства. Одной из главных проблем, возникающих в процессе метризации произвольного пространства, является адекватность и интерпретируемость полученных результатов в рамках проводимого исследования. Используя введенное в объектном пространстве понятие метрики, становится возможным осуществлять отбор объектов, наиболее близко расположенных в пространстве к «идеальным» объектам, наиболее полно характеризующим данный класс объектов. Использование данного метода осложняется процедурой определения характеристик «идеального» объекта. Также возможно использование метода «сгущений», основанного на последовательном отборе объектов наиболее близких друг к другу. Далее рассматривая целесообразность использова80 |