Проверяемый текст
Ананьев Николай Сергеевич. Методы и средства анализа данных в системах поддержки принятия решений (Диссертация 2005)
[стр. 59]

кластеризации по двум причинам.
Во-первых, энтропия, являясь мерой неопределенности, обладает тем свойством, что ее максимальное значение одновременно представляет собой своеобразную меру близости, обладающую основными свойствами метрики
[11,37,38].
Именно благодаря этому свойству энтропию совершенно естественно использовать как интегральный критерий при решении задач кластеризации, проведения сравнения объектов.
Тем самым, в условиях неполноты данных снимается проблема обоснования критериев [29, 61].
Во-вторых, полученные формальные представления энтропии позволяют разработать достаточно простые и очень эффективные вычислительные алгоритмы оценки обобщенных характеристик объектов.
Таким образом, разработка методов обработки многомерных данных, обеспечивающих учет неопределенности, в интересах поддержки принятия решений в информационных системах сводится к следующему.
1.
Разработка модели представления объектов.
2.
Обоснование достаточного перечня характеристик (признаков) объектов, позволяющих представить их в виде двумерных массивов (матриц
"объект признак") данных.
Строками таких матриц служат объекты, а столбцами (признаками) значения их частных характеристик.
3.
Разработка метода кластеризации совокупности объектов на основе энтропийного подхода с целью декомпозиции совокупности и ранжирования объектов.
4.
Проведение оценки эффективности принятия решения на основе информации по результатам ранжирования объектов.
2.3.

Интеграция методов получения обобщенных показателей Метол статистического исследования зависимостей В терминах рассматриваемого методического подхода оцениваемая 59
[стр. 55]

априорную важность (вес) признаков, вследствие чего уже на данном этапе возникают элементы субъективизма в формировании массива исходной информации, а впоследствии появляется опасность ошибочных выводов по результатам расчетов.
Ключевую роль в задачах обработки многомерных данных при оценке общего состояния объектов играет предварительная их кластеризация по совокупности характеристик.
При ее некорректном проведении возникает реальная опасность неправильной оценки общей картины и учета взаимосвязей видов (типов) объектов, неадекватного представления структуры (иерархии) построения системы объектов, возникновения “узких” мест в информационной системе, как следствие ошибочного представления.
Все это может приводить к ошибкам при принятии решения.
Обязательным условием кластеризации является наличие соответствующего критерия, с помощью которого осуществляется декомпозиция исходного множества элементов [37].
Как известно, выбор критерия (критериев), с использованием которого осуществляется принятие решения остается одной из сложнейших задач, в силу того, что с помощью частных критериев сложно учесть многоплановую природу сложных объектов.
Введение векторных критериев решает эту задачу лишь частично, поскольку возникают дополнительные трудности выбора предпочтения частых критериев, их шкалирования, сведения к безразмерным величинам, решения многокритериальных задач, разработки методов агрегирования (при переходе к решению классической оптимизационной задачи по одному критерию) [11].
При использовании метода максимума энтропии принципиально не возникает формальных и вычислительных сложностей в решении задач кластеризации по двум причинам.
Во-первых, энтропия, являясь мерой неопределенности, обладает тем свойством, что ее максимальное значение одновременно представляет собой своеобразную меру близости, обладающую основными свойствами метрики


[стр.,56]

[11,37,38].
Именно благодаря этому свойству энтропию совершенно естественно использовать как интегральный критерий при решении задач кластеризации, проведения сравнения .объектов.
Тем самым, в условиях неполноты данных снимается проблема обоснования критериев [29, 61].
Во-вторых, полученные формальные представления энтропии позволяют разработать достаточно простые и очень эффективные вычислительные алгоритмы оценки обобщенных характеристик объектов.
Таким образом, разработка методов обработки многомерных данных, обеспечивающих учет неопределенности, в интересах поддержки принятия решений в информационных системах сводится к следующему.
1.
Разработка модели представления объектов.
2.
Обоснование достаточного перечня характеристик (признаков) объектов, позволяющих представить их в виде двумерных массивов (матриц
“объект признак”) данных.
Строками таких матриц служат объекты, а столбцами (признаками) значения их частных характеристик.
3.
Разработка метода кластеризации совокупности объектов на основе энтропийного подхода с целью декомпозиции совокупности и ранжирования объектов.
4.
Проведение оценки эффективности принятия решения на основе информации по результатам ранжирования объектов.
2.3.

Анализ существующих методов получения обобщенных показателей.
Метод статистического исследования зависимостей В терминах рассматриваемого методического подхода оцениваемая величина скалярный агрегированный показатель (обобщенный показатель) .у с некоторой точностью восстанавливается по значениям частных показателей эффективности X, где Х-{х^}у \%тк .
Здесь п число признаков (характеристик) объекта, т число объектов.
В базовой модели метода

[Back]