Тогда расстояние между парами векторов ¿ (X ,, X,) могут быть представлены в виде симметричной матрицы расстояний: г 0 4 ...< с 0 ~ ч А ^п2 . . . о ) Понятием, противоположным расстоянию, является понятие сходства между объектами и Неотрицательная вещественная функция 8 (Х ,; X]) = 8у называется мерой сходства, если : 1)0< 8(Х!, Х^)<1 дляХ ,*Х ; 2) 8(Х , Хд = 1 3)8(Х Ь Х,) = 8(Х ;,Х ,) Пары значений мер сходства можно объединить в матрицу сходства: ( 1 Л'(2 \ ... 5 = *п 1 ... 5 2я Л ) ^п2 ... \ ) Величину Бу называют коэффициентом сходства. Сегодня существует достаточно много методов кластерного анализа. Наиболее распространенным является метод полных связей. Суть данного метода состоит в том, что два объекта, принадлежащих одной и той же группе или кластеру, имеют коэффициент сходства меньший некоторого порогового значения Б. В терминах евклидова расстояния с1это означает, что расстояние между двумя точками (объектами) кластера не должно превышать некоторого порогового значения Ь. Таким образом, И определяет максимально допустимый диаметр подмножества, образующего кластер. Для получения объективных данных в кластерном анализе чрезвычайно важно, чтобы шкалы всех измерений объектов были нормированы на одну величину, например, измерения всех показателей попадали в диапазон от 0 до 10 баллов. С этой целью были введены |
г) d(Xt, Xj> Неотрицательная вещественная функция S(Xt ; X ) = S 4 называется мерой сходства, если: I) OXS(Xi , Х)<1 для X t *X f 2)S(X i t X ) 3)S(X l.X )= S (X j ,X ) Пары значений мер сходства можно объединить в матрицу сходства: Величину называют коэффициентом сходства. Сегодня существует достаточно много методов кластерного анализа. Наиболее распространенным является метод полных связей. Суть данного (F(mF2, Fj, Fp). d:(X,,Xj) ■f J t b x ,) * = =(X\X2^ X „ ) *,2 м етода состоит в том, что два объекта, принадлежащих одной и т ой ж е группе или кластеру, имеют коэффициент сходства меньший некоторого порогового значения 8. В терминах евклидова расстояния d это означает, что расстояние м еж ду двумя точками (объектами) кластера не долж но превышать некоторого порогового значения h. Таким образом, h определяет максимально допустимы й диаметр подмножества, образую щ его кластер. Для получения объективных данных в кластерном анализе чрезвы чайно важно, чтобы шкалы всех измерений объектов были нормированы на одну величину, например, измерения всех показателей попадали в диапазон от 0 д о 10 баллов. С этой целью были введены коэффициенты размерности для каждого из показателей: сформированности мотивации к деятельности (показатель ВО , способности к интеллектуальной деятельности (показатель В 2), готовность к выполнению профессиональной пробы (показатель В*). Коэффициент каждого показателя (Kj) рассчитывался путем деления 10 на максимальный балл. Приведенный балл рассчитывался по формуле: Pt—K}* В;. Данные вычисления проводились в исследовании для каждого респондента, в результате получилась матрица размерностью 192x3, поскольку число показателей 3, а количество учащихся 192 человека. П осле проведения кластерного анализа по описанной выше методике оказалось, что данны е можно разбить на 5 кластеров или групп с 95% уровнем достоверности: * первая группа показатели Bi и В 2 им ею т высокие значения, показатель В3 среднее или высокое значение, показатели Bj и В3 имеют вы сокие значения, показатель &z среднее значение, показатели Bz и В3 имеют вы сокие значения, показатель В] среднее значение; вторая группа показатели Bj и В2 имею т средние значения, показатель В3 высокое значение, показатели В, и В.* имею т средние значения, показатель В 2 вы сокое значение, показатели В 2 и Вз им ею т средние значения, показатель B i высокое значение; третья группа показатели Вд> В2 и В3 имеют только средние значения; |