предположений о наличии некоторой структуры в изучаемой совокупности объектов, т.е. поиск существующей структуры; построение новых классификаций для слабоизученных явлений, когда необходимо установоть наличие связей внутри совокупности и попытаться привнести в нее структуру. Вычислительная задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся во множествеЛГ, разбить множество объектов G на т (т целое) кластеров (подмножеств) Qh Q2. ..., QMJ так, чтобы каждый объект Gj принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время, как объекты, принадлежащие разным кластерам, были разнородными. Решением задачи кластерного анализа являются разбиения, удовлетворяющие некоторому критерию оптимальности. Этот критерий может представлять собой некоторый фушщионал, выражающий уровни желательности различных разбиений и группировок, который называют целевой функцией. Налример, в качестве целевой функции может быть взята внутригрупповая сумма квадратов Для решения задачи кластерного анализа необходимо определить понятие сходства и разнородности. Понятно то, что объекты i-ый и у'-ый попадали бы в один кластер, когда расстояние (отдаленность) между точками Х\ и.Xj было бы достаточно маленьким и попадали бы в разные кластеры, когда это расстояние было бы достаточно большим. Таким образом, попадание в один или разные кластеры объектов определяется понятием расстояния между X, н Xj из Ер, где Е р р мерное евклидово пространство. Неотрицательная функция |
предположений о наличии некоторой структуры в изучаемой совокупности объектов, т е. поиск существующей структуры; построение новых классификаций для слабоизученных явлений, когда необходимо установить наличие связей внутри совокупности и попытаться привнести в нее структуру. Вычислительная задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся во множествеX, разбить множество объектов G на т { т целое) кластеров (подмножеств) Q,. Q}, ..., Qn, так, чтобы каждый объект Gj принадлежал одному и только одному' подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время, как объекты, принадлежащие разным кластерам, были разнородными. Решением задачи кластерного анализа являются разбиения, удовлетворяющие некоторому критерию оптимальности. Этот критерий может представлять собой некоторый функционал, выражающий уровни желательности различных разбиений и группировок, который называют целевой функцией. Например, в качестве целевой функции может быть взята внутригрупповая сумма квадратов где Xjпредставляет собой измеренияJ-го объекта. Для решения задачи кластерного анализа необходимо определить понятие сходства и разнородности. Понятно то, что объекты j-ый иу-ый попадали бы в один кластер, когда расстояние (отдаленность) между точками Х .и Xj было бы достаточно маленьким и попадали бы в разные кластеры, когда это расстояние было бы достаточно большим. Таким образом, попадание в один или разные кластеры объектов определяется понятием расстояния между X, и Х} из Ер, где Ер ^-мерное евклидово пространство. Неотрицательная функция d(X,., Xj) называется функцией расстояния (метрикой), если: а) d(X,. Xj) £ 0 , для всех X, иХ, из Ер б) d(X„ Xj) = О, тогда и только тогда, когда Х ,=Х } отклонения: |