Проверяемый текст
Кузнецова, Анна Николаевна; Формирование коммуникативной компетентности как механизм социализации личности в учреждении дополнительного образования детей (Диссертация 2007)
[стр. 210]

качестве целевой функции может быть взята внутригрупповая сумма квадратов /I п 1f п отклонения: W х )2 ^Гх2— I j-1 j*1 r\j .
I где X jпредставляет собой измерения у-го объекта.
Для решения задачи кластерного анализа необходимо определить понятие сходства и разнородности.
Понятно то, что объекты
/-ый и у-ый попадали бы в один кластер, когда расстояние (отдаленность) между точками X, и Xj было бы достаточно маленьким и попадали бы в разные кластеры, когда это расстояние было бы достаточно большим.
Таким образом, попадание в один или разные кластеры объектов определяется понятием расстояния между X\ и Xj из Ер, где Ер р мерное евклидово пространство.
Неотрицательная функция d(Xt , X j) называется функцией расстояния (метрикой), если: а) d(Xi,
Xj) >0, для всех Х{и Xjиз Ер б) (1(ХЬXj) = 0, тогда и только тогда, когда X, = Х} в) d(X„Xj) =d(Xjt XJ г) d(XitXj) Значение dfXj, X'■ )для Xtи Xj называется расстоянием между Xtи Х(и эквивалентно расстоянию между G, и G; соответственно выбранным характеристикам (Fj, F2, F3, ..., Fp).
Наиболее часто употребляется функция Евклидова расстояния: Р , } 2 * Пусть п измерений Xj, Х2 ,..., Хппредставлены в виде матрицы данных размером р х т 210 х1 2 X 2, Х 2 2 ...х2 п *р.
Х Р 2 ■ “*Vly Тогда расстояние между парами векторов d(X,,X) могут быть представлены в виде симметричной матрицы расстояний: d2 (XliXj) =
[стр. 186]

Вычислительная задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся во множестве X, разбить множество объектов G на т (т целое) кластеров (подмножеств) Q i, Q2 , ..., Q„„ так, чтобы каждый объект Gj принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время, как объекты, принадлежащие разным кластерам, были разнородными.
Решением задачи кластерного анализа являются разбиения, удовлетворяющие некоторому критерию оптимальности.
Этот критерий может представлять собой некоторый функционал, выражающий уровни желательности различных разбиений и группировок, который называют целевой функцией.
Например, в качестве целевой функции может быть взята внутригрупповая сумма I ( V квадратов отклонения: W -Зс')г = j-l /.i и (у J где Xj представляет собой измеренияу-го объекта.
Для решения задачи кластерного анализа необходимо определить понятие сходства и разнородности.
Понятно то, что объекты
г-ый и у'-ый попадали бы в один кластер, когда расстояние (отдаленность) между точками Ххи Xj было бы достаточно маленьким и попадали бы в разные кластеры, когда это расстояние было бы достаточно большим.
Таким образом, попадание в один или разные кластеры объектов определяется понятием расстояния между X, и X j из Ер, где Ер р-мерное евклидово пространство.
Неотрицательная функция d(X ,, Xj) называется функцией расстояния (метрикой), если: а) d(X
j, Xj) > 0, для всех X, и Х} из Ер б) d(X„ Xj) = 0, тогда и только тогда, когда X, = Х} в)d(X hX j --d(X j, X ) г) d(X„ Xj) < d(X„ X J d(Xb XJ, где Хр X, a Xkлюбые три вектора из Ер.
Значение d(Xk Xj) для Xtи Х\ называется расстоянием между X; и Л} и эквивалентно расстоянию между G, и Gj соответственно выбранным характеристикам (Fh F2, F3.
....
Fp).
186

[Back]