Евклидовым расстоянием между двумя точками х и у называется величина = (2.10) ы Считается, что объект с описанием X похож на объекты с описаниями, принадлежащими некоторому множеству У=(у0, если мало среднее значение квадрата расстояния между х и точками из Y. 1 " у Точка х близка к множеству Y, если величина df(x,Y) =— ^ ^ ( х , у , ) п у м мала. Чтобы сравнить два множества, надо оценить среднее расстояние между парами точек, взятых по одной из каждого множества. Расстояние d(X,Y) между множествами X и Y определяется величиной = Y.d2(xuyj). (2.11) Для оценки плотности расположения точек внутри множества J И Ж ~1 пх используется мера <%(х,у) =— ------£ I ^ ( х ^ у ,) . п х ( п х М /=1 j = i + 1 Чем меньше эта величина, тем ближе друг к другу точки множества. Общая идея, лежащая в основе подхода, использующего понятие близости, состоит в преобразовании пространства описаний D в пространство D*, в котором все точки одного множества расположены близко друг к другу, а точки различных множеств удалены друг от друга на некоторое расстояние. Пример. Пусть X = {3,4,7,4,3,3,4,4} и W= Y.(xjх ) 2 = "Zxf -(H x j)2 , где (=1 /= 1 i= i X j представляет измерение i-ro объекта. Для приведенного примера W=12. Если множество разбить на три группы: G1 ={3.3.3}, G2={4,4,4,4} и G3={7}, то все внутригрупповые суммы квадратов отклонений будут равны 0: Wi= W2W3=0. 71 |
Чем меньше эта величина, тем ближе друг к другу точки множества. Общая идея, лежащая в основе подхода, использующего понятие близости, состоит в преобразовании пространства описаний D в пространство D*, в котором все точки одного множества расположены близко друг к другу, а точки различных множеств удалены друг от друга на некоторое расстояние. Существует множество эвристических процедур кластерного анализа. Метод полных связей (Соренсен) заключается в том, что два объекта, принадлежащих одной и той же группе (кластеру), имеют коэффициент сходства, который меньше некоторого порогового значения s, В этом случае s определяет максимально допустимый диаметр множества, образующего кластер. Метод максимального локального расстояния (МакНотон-Смит) предполагает последовательную процедуру. Каждый объект рассматривается как одноточечный кластер. Объекты группируются по следующему правилу: два кластера объединяются, если максимальное расстояние между точками одного кластера и точками другого минимально. Процедура состоит из п-1 шагов. Результатом ее выполнения являются разбиения, которые совпадают со всевозможными разбиениями в методе Соренсена для любых пороговых значений. Существует множество методов, однако для конкретной ситуации робастным может быть один, поэтому необходимо иметь возможность включения в гибридную систему любого. 1.7. Методы и модели теории принятия решений 1.7.1. Основные положения теории выбора При решении вопросов управления руководство всегда сталкивается с вопросами принятия решений. При этом формализация проблем, ситуаций и задач необходима для оценки эффективности управленческих решений. Под задачей в канонической форме понимается логическое высказывание вида: "дано V, требуется W" или < V , W>, где V заданные условия, a W цель. 66 |