Кластерный анализ ставит свой задачей объединение похожих объектов в некоторые группы. В основном методы основаны на минимизации внутригрупповых сумм квадратов отклонений. Обычно расстояние d(X,Y) между множествами показателей Х и Y определяется соотношением: d \ ( х ,у ) =— ^ YJd 2(xi, y j ). О-25) « А ы y=i Для оценки плотности расположения точек (филиалов и колонн АТП) внутри множества используется мера: d \ ( х , у ) = 1 Т Y , d 2( x ity j ) . (1.26) пх(пх \ ) м / = ,Ч 1 Чем меньше эта величина, тем ближе друг к другу точки множества. Общая идея, лежащая в основе подхода, использующего понятие близости, состоит в преобразовании пространства описаний D в пространство D*, в котором все точки одного множества расположены близко друг к другу, а точки различных множеств удалены друг от друга на некоторое расстояние. Существует множество эвристических процедур кластерного анализа. Метод полных связей (Соренсен) заключается в том, что два объекта, принадлежащих одной и той же группе (кластеру), имеют коэффициент сходства, который меньше некоторого порогового значения s. В этом случае s определяет максимально допустимый диаметр множества, образующего кластер. Метод максимального локального расстояния (МакНотон-Смит) предполагает последовательную процедуру. Каждый объект рассматривается как одноточечный кластер. Объекты группируются по следующему правилу: два кластера объединяются, если максимальное расстояние между точками одного кластера и точками другого минимально. Процедура состоит из п-1 шагов. Результатом ее выполнения являются разбиения, которые совпадают со всевозможными разбиениями в методе Соренсена для любых пороговых значений. 35 1.3.2. Кластерный анализ |
65 существенных факторов позволяет оценивать на модели выигрыш от принятия решения. Регрессионный анализ ставит свой задачей поиск линейной (или в общем случае нелинейной) зависимости между переменными x}i,...,x]mbи переменной у у В общем случае модель множественной линейной регрессии записывается в следующем виде: где Р, параметры регрессии, которые необходимо оценить и ъ} некоррелированные ошибки. В случае простой регрессии, когда есть одна независимая переменная, имеет место наглядная геометрическая интерпретация аппроксимации анализируемых значений подобранной прямой (кривой). В случае множественной регрессии уже не будет такой наглядной интерпретации прогноза данных как в случае простой регрессии. Геометрический образ регрессии будет гиперплоскостью. Поэтому можно говорить лишь о некоторых проекциях точек и гиперплоскости на некоторое двумерное или трехмерное пространства. Кластерный анализ ставит свой задачей объединение похожих объектов в некоторые группы. В основном методы основаны на минимизации внутригрупповых сумм квадратов отклонений. Обычно расстояние d(X,Y) между множествами показателей X и Y определяется соотношением: Для оценки плотности расположения точек (филиалов и колонн АТП) внутри множества используется мера: т У) = 1 Х « ,Р.+8; ’ (1.40) (1.41) (1.42) Чем меньше эта величина, тем ближе друг к другу точки множества. Общая идея, лежащая в основе подхода, использующего понятие близости, состоит в преобразовании пространства описаний D в пространство D*, в котором все точки одного множества расположены близко друг к другу, а точки различных множеств удалены друг от друга на некоторое расстояние. Существует множество эвристических процедур кластерного анализа. Метод полных связей (Соренсен) заключается в том, что два объекта, принадлежащих одной и той же группе (кластеру), имеют коэффициент сходства, который меньше некоторого порогового значения s, В этом случае s определяет максимально допустимый диаметр множества, образующего кластер. Метод максимального локального расстояния (МакНотон-Смит) предполагает последовательную процедуру. Каждый объект рассматривается как одноточечный кластер. Объекты группируются по следующему правилу: два кластера объединяются, если максимальное расстояние между точками одного кластера и точками другого минимально. Процедура состоит из п-1 шагов. Результатом ее выполнения являются разбиения, которые совпадают со всевозможными разбиениями в методе Соренсена для любых пороговых значений. Существует множество методов, однако для конкретной ситуации робастным может быть один, поэтому необходимо иметь возможность включения в гибридную систему любого. 1.7. Методы и модели теории принятия решений 1.7.1. Основные положения теории выбора При решении вопросов управления руководство всегда сталкивается с вопросами принятия решений. При этом формализация проблем, ситуаций и задач необходима для оценки эффективности управленческих решений. Под задачей в канонической форме понимается логическое высказывание вида: "дано V, требуется W" или < V , W>, где V заданные условия, a W цель. 66 |