Проверяемый текст
Ананьев Николай Сергеевич. Методы и средства анализа данных в системах поддержки принятия решений (Диссертация 2005)
[стр. 58]

существующие методы обработки многомерных данных (факторный, компонентный, кластерный, регрессионный, дискриминантный анализ, анализ соответствия) требуют перехода к безразмерным величинам, что нарушает их исходную структуру.
Фактически выбор типа нормировки однозначно предопределяет
априорную важность (вес) признаков, вследствие чего уже на данном этапе возникают элементы субъективизма в формировании массива исходной информации, а впоследствии появляется опасность ошибочных выводов по результатам расчетов.
Ключевую роль в задачах обработки многомерных данных при оценке общего состояния объектов играет предварительная их кластеризация по совокупности характеристик.
При
ес некорректном проведении возникает реальная опасность неправильной оценки общей картины и учета взаимосвязей видов (типов) объектов, неадекватного представления структуры (иерархии) построения системы объектов, возникновения "узких" мест в информационной системе, как следствие ошибочного представления.
Все это может приводить к ошибкам при принятии решения.
Обязательным условием кластеризации является наличие соответствующего критерия, с помощью которого осуществляется декомпозиция исходного множества элементов [37].
Как известно, выбор критерия (критериев), с использованием которого осуществляется принятие решения остается одной из сложнейших задач, в силу того, что с помощью частных критериев сложно учесть многоплановую природу сложных объектов.
Введение векторных критериев решает эту задачу лишь частично, поскольку возникают дополнительные трудности выбора предпочтения частых критериев, их шкалирования, сведения к безразмерным величинам, решения многокритериальных задач, разработки методов агрегирования (при переходе к решению классической оптимизационной задачи по одному критерию) [11].
При использовании метода максимума энтропии принципиально не возникает формальных и вычислительных сложностей в решении задач
58
[стр. 54]

Достижение указанных преимуществ в наиболее полной мере может быть обеспечено при использовании принципа максимума энтропии [3, 29, 38].
При этом обеспечивается [11,37] (в отличие от распространенных подходов к снятию неопределенности информации принципы Гурвица, Лапласа, Сэвиджа [28,30]): построение содержательные математических моделей для критериев оценки качества объектов именно с информационной точки зрения; агрегирование характеристик объектов для проведения сравнительного анализа и прогнозирования их развития; представление информационных признаков объектов в виде устойчивых агрегатов, позволяющих строить эффективные алгоритмы их распознавания и наглядно визуализировать результаты.
Применение принципа максимума энтропии также позволяет: восстанавливать недостающие (пропущенные) данные при обработке информации путем максимизации энтропии на совокупности известных данных; моделировать с использованием энтропии интеллектуальные процессы принятия решений (на основе ее информационных свойств и устойчивости к неопределенности исходных данных); использовать при построении обобщенных характеристик объектов и прагматических свойств разнородные данные без их предварительной нормировки.
Последнее свойство представляется особенно ценным.
Как правило, исходные данные в информационных системах имеют различную природу и несоизмеримы между собой, например, в БД страховых компаний цена автомобиля, его цвет, наличие гаража и т.п..
В такой ситуации существующие методы обработки многомерных данных (факторный, компонентный, кластерный, регрессионный, дискриминантный анализ, анализ соответствия) требуют перехода к безразмерным величинам, что нарушает их исходную структуру.
Фактически выбор типа нормировки однозначно предопределяет
54

[стр.,55]

априорную важность (вес) признаков, вследствие чего уже на данном этапе возникают элементы субъективизма в формировании массива исходной информации, а впоследствии появляется опасность ошибочных выводов по результатам расчетов.
Ключевую роль в задачах обработки многомерных данных при оценке общего состояния объектов играет предварительная их кластеризация по совокупности характеристик.
При
ее некорректном проведении возникает реальная опасность неправильной оценки общей картины и учета взаимосвязей видов (типов) объектов, неадекватного представления структуры (иерархии) построения системы объектов, возникновения “узких” мест в информационной системе, как следствие ошибочного представления.
Все это может приводить к ошибкам при принятии решения.
Обязательным условием кластеризации является наличие соответствующего критерия, с помощью которого осуществляется декомпозиция исходного множества элементов [37].
Как известно, выбор критерия (критериев), с использованием которого осуществляется принятие решения остается одной из сложнейших задач, в силу того, что с помощью частных критериев сложно учесть многоплановую природу сложных объектов.
Введение векторных критериев решает эту задачу лишь частично, поскольку возникают дополнительные трудности выбора предпочтения частых критериев, их шкалирования, сведения к безразмерным величинам, решения многокритериальных задач, разработки методов агрегирования (при переходе к решению классической оптимизационной задачи по одному критерию) [11].
При использовании метода максимума энтропии принципиально не возникает формальных и вычислительных сложностей в решении задач
кластеризации по двум причинам.
Во-первых, энтропия, являясь мерой неопределенности, обладает тем свойством, что ее максимальное значение одновременно представляет собой своеобразную меру близости, обладающую основными свойствами метрики

[Back]