Проверяемый текст

Ананьев Николай Сергеевич. Методы и средства анализа данных в системах поддержки принятия решений (Диссертация 2005)

[стр. 40]
Дискриминантный анализ Данный метод предполагает, что имеется некоторый набор т.н.
дискриминантных функций, определенных на множестве частных характеристик (признаков), с помощью которых строятся разделяющие поверхности (плоскости) в пространстве этих характеристик (признаков).
Разделяющие поверхности используются для построения решающих правил, используемых в алгоритмах принятия решений и кластеризации [10,12].
Практически используемые решающие правила реализуют байесовскую схему принятия решения о принадлежности элементов исследуемой выборки к одному из фиксированного множества классов (типов, эталонов).
Байесовский подход базируется на предположении, что задача сформулирована в терминах теории вероятностей и известны априорные вероятности появления элементов выборки и условные плотности распределения значений их признаков.
Решение о принадлежности рассматриваемого элемента (объекта) к определенному классу принимается при выполнении условия, обеспечивающего минимум средней вероятности ошибки классификации [10,58].
Методы дискриминантного анализа дают удовлетворительные результаты при соблюдении достаточно жестких условий нормальности распределений объектов внутри классов и равенства ковариационных матриц для каждого класса [7,10].
На практике эти условия, как правило, не выполняются.
Принципиальными недостатками дискриминантного анализа являются: предположение о стохастической природе выборки; необоснованное задание видов законов распределения из-за объективного отсутствия стохастической природы процессов, протекающих в сложных системах; необходимость нормирования разнородных данных.
Дискриминантный анализ при анализе многомерных данных нашел свое 40

[стр. 38]
В задачах распознавания метод оказывается эффективным только для выборок, ковариационная матрица которых мало отличается от диагональной (система с независимыми признаками), что в реальности выполняется редко [6,74].
Дискриминантный анализ Данный метод предполагает, что имеется некоторый набор т.н.
дискриминантных функций, определенных на множестве частных характеристик (признаков), с помощью которых строятся разделяющие поверхности (плоскости) в пространстве этих характеристик (признаков).
Разделяющие поверхности используются для построения решающих правил, используемых в алгоритмах принятия решений и кластеризации [10,12].
Практически используемые решающие правила реализуют байесовскую схему принятия решения о принадлежности элементов исследуемой выборки к одному из фиксированного множества классов (типов, эталонов).
Байесовский подход базируется на предположении, что задача сформулирована в терминах теории вероятностей и известны априорные вероятности появления элементов выборки и условные плотности распределения значений их признаков.
Решение о принадлежности рассматриваемого элемента (объекта) к определенному классу принимается при выполнении условия, обеспечивающего минимум средней вероятности ошибки классификации [10,58].
Методы дискриминантного анализа дают удовлетворительные результаты при соблюдении достаточно жестких условий нормальности распределений объектов внутри классов и равенства ковариационных матриц для каждого класса [7,10].
На практике эти условия, как правило, не выполняются.
Принципиальными недостатками дискриминантного анализа являются: предположение о стохастической природе выборки; необоснованное задание видов законов распределения из-за 38

[стр.,39]
объективного отсутствия стохастической природы процессов, протекающих в сложных системах; необходимость нормирования разнородных данных.
Дискриминантный анализ при анализе многомерных данных нашел свое применение только в задачах распознавания заданных объектов.
Опыт его использования показал, что метод дает хорошие результаты на однородных выборках, подчиняющихся нормальному закону, что существенно ограничивает сферу применения дискриминантного анализа при решении задач обработки разнородной информации.
Кластерный анализ Кластерный анализ предназначен для разбиения множества объектов на заданное (или неизвестное заранее) число классов на основании некоторого математического критерия качества кластеризации.
Критерий качества кластеризации должен отвечать следующим двум требованиям [7]: а) внутри кластеров объекты должны быть тесно связаны между собой (похожими по структуре значений характеристик); б) объекты разных кластеров должны быть непохожими.
Качество кластеризация определяется выбранной мерой близости объектов.
Далее вводится мера близости групп объектов.
Затем формируется критерий качества кластеризации.
Алгоритмы решения задачи кластеризации реализуют методы математической оптимизации.
Методы кластерного анализа используются в задачах распознавания, обработки изображений, обосновании выбора альтернативных вариантов.
Однако его широкое применение ограничивается из-за присущих ему принципиальных недостатков: отсутствие формальных процедур выбора мер близости; отсутствие формальных процедур выбора критерия качества кластеризации; вычислительные сложности, связанные с необходимостью решения

[Back]