кластеризации по двум причинам. Во-первых, энтропия, являясь мерой неопределенности, обладает тем свойством, что ее максимальное значение одновременно представляет собой своеобразную меру близости, обладающую основными свойствами метрики [11,37,38]. Именно благодаря этому свойству энтропию совершенно естественно использовать как интегральный критерий при решении задач кластеризации, проведения сравнения объектов. Тем самым, в условиях неполноты данных снимается проблема обоснования критериев [29, 61]. Во-вторых, полученные формальные представления энтропии позволяют разработать достаточно простые и очень эффективные вычислительные алгоритмы оценки обобщенных характеристик объектов. Таким образом, разработка методов обработки многомерных данных, обеспечивающих учет неопределенности, в интересах поддержки принятия решений в информационных системах сводится к следующему. 1. Разработка модели представления объектов. 2. Обоснование достаточного перечня характеристик (признаков) объектов, позволяющих представить их в виде двумерных массивов (матриц "объект признак") данных. Строками таких матриц служат объекты, а столбцами (признаками) значения их частных характеристик. 3. Разработка метода кластеризации совокупности объектов на основе энтропийного подхода с целью декомпозиции совокупности и ранжирования объектов. 4. Проведение оценки эффективности принятия решения на основе информации по результатам ранжирования объектов. 2.3. Интеграция методов получения обобщенных показателей Метол статистического исследования зависимостей В терминах рассматриваемого методического подхода оцениваемая 59 |
априорную важность (вес) признаков, вследствие чего уже на данном этапе возникают элементы субъективизма в формировании массива исходной информации, а впоследствии появляется опасность ошибочных выводов по результатам расчетов. Ключевую роль в задачах обработки многомерных данных при оценке общего состояния объектов играет предварительная их кластеризация по совокупности характеристик. При ее некорректном проведении возникает реальная опасность неправильной оценки общей картины и учета взаимосвязей видов (типов) объектов, неадекватного представления структуры (иерархии) построения системы объектов, возникновения “узких” мест в информационной системе, как следствие ошибочного представления. Все это может приводить к ошибкам при принятии решения. Обязательным условием кластеризации является наличие соответствующего критерия, с помощью которого осуществляется декомпозиция исходного множества элементов [37]. Как известно, выбор критерия (критериев), с использованием которого осуществляется принятие решения остается одной из сложнейших задач, в силу того, что с помощью частных критериев сложно учесть многоплановую природу сложных объектов. Введение векторных критериев решает эту задачу лишь частично, поскольку возникают дополнительные трудности выбора предпочтения частых критериев, их шкалирования, сведения к безразмерным величинам, решения многокритериальных задач, разработки методов агрегирования (при переходе к решению классической оптимизационной задачи по одному критерию) [11]. При использовании метода максимума энтропии принципиально не возникает формальных и вычислительных сложностей в решении задач кластеризации по двум причинам. Во-первых, энтропия, являясь мерой неопределенности, обладает тем свойством, что ее максимальное значение одновременно представляет собой своеобразную меру близости, обладающую основными свойствами метрики [11,37,38]. Именно благодаря этому свойству энтропию совершенно естественно использовать как интегральный критерий при решении задач кластеризации, проведения сравнения .объектов. Тем самым, в условиях неполноты данных снимается проблема обоснования критериев [29, 61]. Во-вторых, полученные формальные представления энтропии позволяют разработать достаточно простые и очень эффективные вычислительные алгоритмы оценки обобщенных характеристик объектов. Таким образом, разработка методов обработки многомерных данных, обеспечивающих учет неопределенности, в интересах поддержки принятия решений в информационных системах сводится к следующему. 1. Разработка модели представления объектов. 2. Обоснование достаточного перечня характеристик (признаков) объектов, позволяющих представить их в виде двумерных массивов (матриц “объект признак”) данных. Строками таких матриц служат объекты, а столбцами (признаками) значения их частных характеристик. 3. Разработка метода кластеризации совокупности объектов на основе энтропийного подхода с целью декомпозиции совокупности и ранжирования объектов. 4. Проведение оценки эффективности принятия решения на основе информации по результатам ранжирования объектов. 2.3. Анализ существующих методов получения обобщенных показателей. Метод статистического исследования зависимостей В терминах рассматриваемого методического подхода оцениваемая величина скалярный агрегированный показатель (обобщенный показатель) .у с некоторой точностью восстанавливается по значениям частных показателей эффективности X, где Х-{х^}у \%тк . Здесь п число признаков (характеристик) объекта, т число объектов. В базовой модели метода |