Проверяемый текст

Демидова, Лилия Анатольевна. Развитие методов теории нечётких множеств и генетических алгоритмов для задач поддержки принятия решений в условиях неопределённости (Диссертация 2009)

[стр. 58]
1.6.3 Кластеризация объектов Кластерный анализ (автоматическая классификация, распознавание образов без учителя, численная таксономия) занимает одно из центральных мест среди методов анализа данных и представляет собой совокупность подходов, методов, алгоритмов, предназначенных для формирования однородных классов в произвольной проблемной области —нахождения некоторого разбиения исследуемой совокупности объектов на подмножества относительно сходных, похожих между собой объектов.
Исходным допущением для выделения таких подмножеств кластеров служит неформальное предположение о том, что объекты, относимые к одному кластеру, должны иметь большее сходство между собой, чем с объектами из других кластеров [76].
Необходимость анализа больших объемов объективной и субъективной информации, связанных с неформализуемыми и плохо формализуемыми задачами различной физической природы, требует развития новых научных направлений, в том числе прикладной статистики и методов анализа данных.
Применение методов прикладной статистики основано на предположении о вероятностной интерпретации анализируемой информации и получении с помощью этих методов закономерностей, имеющих стохастический характер [76].
Кластерный анализ не использует априорных предположений о вероятностной природе исходной информации и применяет только эвристические соображения о характере и особенностях исследуемой совокупности объектов.
Задача кластерного анализа заключается в нахождении некоторого теоретико-множественного разбиения (покрытия) исходного множества объектов на непересекающиеся подмножества кластеры таким образом, чтобы элементы, относимые к одному подмножеству, отличались между собой в значительно меньшей степени, чем элементы из разных подмножеств [76].
58

[стр. 96]
шающие правила их классификации, тем труднее становится анализ этих правил.
Могут существовать различные причины, обусловливающие неоднозначность классификации, например, если объекты сортируются разными экспертами.
Эксперты могут относить сильно различающиеся объекты в один и тот же класс, а объекты со сходными значениями признаков —в разные классы.
Несогласованность, индивидуальных решающих правил может быть, вызвана неоднозначностью понимания экспертами решаемой задачи, ошибками или неточностями, допущенными экспертами при первоначальной .
классификации объектов, субъективным различием решающих правил, используемых разными экспертами, специфичностью знаний экспертов, нстранзитивностыо отдельных экспертных суждений и др.
В итоге могут появиться решающие правила, среди которых будут одинаковые, различающиеся и противоречивые правила.
В этом случае возникает.проблема построения обобщенного правила или небольшой группы правил, которые наилучшим (в; некотором смысле) образом аппроксимируют совокупность этих индивидуальных правил сортировки объектов, включают минимальный набор критериев и относят объекты в заданные классы с допустимой точностью [228].
1.8.4 Кластеризация объектов Кластерный анализ (автоМ;атическая классификация, распознавание образов без учителя, численная таксономия) занимает одно из центральных мест среди методов анализа данных и представляет собой совокупность подходов, методов; алгоритмов, предназначенных для формирования однородных классов в произвольной проблемной области нахождения некоторого разбиения исследуемой совокупности объектов на подмножества относительно сходных, похожих между собой объектов.
Исходным допущением для выделения таких подмножеств кластеров служит неформальное предположением том, что объекты, относимые к одному кластеру, должны иметь большее сходство между собой, чем с объектами из других кластеров [202].
96

[стр.,97]
Необходимость анализа больших объемов объективной и субъективной информации, связанных с неформализуемыми и плохо формализуемыми задачами различной физической природы, требует развития новых научных направлений, в том числе прикладной статистики и-методов анализа данных.
Применение методов прикладной статистики основано на предположении-о вероятностной интерпретации анализируемой информации и получении с помощью этих методов закономерностей, имеющих стохастический характер [136, 202].
Методы анализа данных, в том-числе кластерный анализ, не используют априорных предположений о вероятностной природе исходной информации и применяют только эвристические соображения о характере и особенностях исследуемой совокупности объектов.
В основе этой теории лежит нечетко-возможностная интерпретация неопределенности [219, 220, 288, 348].
Задача кластерного анализа заключается в нахождении некоторого теоретико-множественного-разбиения (покрытия) исходного множества; объектов на непересекающиеся подмножества кластеры таким образом, чтобы элементы, относимые к одному подмножеству, отличались между собой в значительно меньшей степени, чем элементы из разных подмножеств [136].
Нахождение или выявление кластеров в исходном множестве объектов должно-удовлетворять следующим требованиям: каждый кластер должен представлять собой концептуально однородную категорию и содержать похожие объекты с близкими значениями характеристик (значениями признаков, оценок по критериям); совокупность всех кластеров должна быть исчерпывающей, то есть охватывать все объекты исходного множества; кластеры должны быть взаимноисключающими, то есть ни один из объектов исходного множества не должен одновременно принадлежать двум различным кластерам.
Возможность использования различных подходов к формальному определению кластеров послужила поводом для разработки большого числа 97

[Back]