„ S A и 2 n Величина sa = , где Na = --------, называется средним рассеянием Nd 2 множества I. » — _ т Матрица nxn sx = £(Л^ X)(Xj Х у называется матрицей рассеяния (=1 П множестваX,причем X = Za^/w. /=1 След матрицы Sx называется статистическим рассеянием множества X и и п _ _ обозначается = trSx = ~ ^к)= T < (X i-X )(X i-X ) . Мера st равна /=1 /=1 сумме квадратов расстояний п точек от средних по группе X и представляет собой сумму (внутреннюю по группе) квадратов отклонений. Определение. Определитель SX матрицы Sx называется статистическим рассеянием и обозначается S d = S x. Этот определитель также называется обобщенной дисперсией. Основные усилия в развитии методов кластеризации и классификации были направлены на построение методов, основанных на минимизации внутригрупповых сумм квадратов отклонений. Они могут быть выражены в терминах евклидовых расстояний и называются методами минимальной дисперсии. Метод полных связей (Соренсен) заключается в том, что два объекта, принадлежащих одной и той же группе (кластеру), имеют коэффициент сходства, который меньше некоторого порогового значения s. В этом случае s определяет максимально допустимый диаметр множества, образующего кластер. Метод максимального локального расстояния (МакНотон-Смит) предполагает последовательную процедуру. Каждый объект рассматривается как одноточечный кластер. Объекты группируются по следующему правилу: два кластера объединяются, если максимальное расстояние между точками одного кластера и точками другого минимально. Процедура состоит из п-1 74 |
Чем меньше эта величина, тем ближе друг к другу точки множества. Общая идея, лежащая в основе подхода, использующего понятие близости, состоит в преобразовании пространства описаний D в пространство D*, в котором все точки одного множества расположены близко друг к другу, а точки различных множеств удалены друг от друга на некоторое расстояние. Существует множество эвристических процедур кластерного анализа. Метод полных связей (Соренсен) заключается в том, что два объекта, принадлежащих одной и той же группе (кластеру), имеют коэффициент сходства, который меньше некоторого порогового значения s, В этом случае s определяет максимально допустимый диаметр множества, образующего кластер. Метод максимального локального расстояния (МакНотон-Смит) предполагает последовательную процедуру. Каждый объект рассматривается как одноточечный кластер. Объекты группируются по следующему правилу: два кластера объединяются, если максимальное расстояние между точками одного кластера и точками другого минимально. Процедура состоит из п-1 шагов. Результатом ее выполнения являются разбиения, которые совпадают со всевозможными разбиениями в методе Соренсена для любых пороговых значений. Существует множество методов, однако для конкретной ситуации робастным может быть один, поэтому необходимо иметь возможность включения в гибридную систему любого. 1.7. Методы и модели теории принятия решений 1.7.1. Основные положения теории выбора При решении вопросов управления руководство всегда сталкивается с вопросами принятия решений. При этом формализация проблем, ситуаций и задач необходима для оценки эффективности управленческих решений. Под задачей в канонической форме понимается логическое высказывание вида: "дано V, требуется W" или < V , W>, где V заданные условия, a W цель. 66 |