Проверяемый текст
Ананьев Николай Сергеевич. Методы и средства анализа данных в системах поддержки принятия решений (Диссертация 2005)
[стр. 41]

применение только в задачах распознавания заданных объектов.
Опыт его использования показал, что метод дает хорошие результаты на однородных выборках, подчиняющихся нормальному закону, что существенно ограничивает сферу применения дискриминантного анализа при решении задач обработки разнородной информации.
Кластерный анализ Кластерный анализ предназначен для разбиения множества объектов на заданное (или неизвестное заранее) число классов на основании некоторого математического критерия качества кластеризации.
Критерий качества кластеризации должен отвечать следующим двум требованиям [7]: а) внутри кластеров о бъекты д олжны быть тесно связаны между собой (похожими по структуре значений характеристик); б) объекты разных кластеров должны быть непохожими.
Качество кластеризация определяется выбранной мерой близости объектов.
Далее вводится мера близости групп объектов.
Затем формируется критерий качества кластеризации.
Алгоритмы решения задачи кластеризации реализуют методы математической оптимизации.
Методы кластерного анализа используются в задачах распознавания, обработки изображений, обосновании выбора альтернативных вариантов.
Однако его широкое применение ограничивается из-за присущих ему принципиальных недостатков: отсутствие формальных процедур выбора мер близости; отсутствие формальных процедур выбора критерия качества кластеризации; вычислительные сложности, связанные с необходимостью решения
нелинейных задач оптимизации большой размерности; необходимость нормирования исходных данных.
Корреляционный анализ Основной целью корреляционного анализа является установление факта и силы связи между характеристиками одного объекта или
41
[стр. 39]

объективного отсутствия стохастической природы процессов, протекающих в сложных системах; необходимость нормирования разнородных данных.
Дискриминантный анализ при анализе многомерных данных нашел свое применение только в задачах распознавания заданных объектов.
Опыт его использования показал, что метод дает хорошие результаты на однородных выборках, подчиняющихся нормальному закону, что существенно ограничивает сферу применения дискриминантного анализа при решении задач обработки разнородной информации.
Кластерный анализ Кластерный анализ предназначен для разбиения множества объектов на заданное (или неизвестное заранее) число классов на основании некоторого математического критерия качества кластеризации.
Критерий качества кластеризации должен отвечать следующим двум требованиям [7]: а) внутри кластеров объекты должны быть тесно связаны между собой (похожими по структуре значений характеристик); б) объекты разных кластеров должны быть непохожими.
Качество кластеризация определяется выбранной мерой близости объектов.
Далее вводится мера близости групп объектов.
Затем формируется критерий качества кластеризации.
Алгоритмы решения задачи кластеризации реализуют методы математической оптимизации.
Методы кластерного анализа используются в задачах распознавания, обработки изображений, обосновании выбора альтернативных вариантов.
Однако его широкое применение ограничивается из-за присущих ему принципиальных недостатков: отсутствие формальных процедур выбора мер близости; отсутствие формальных процедур выбора критерия качества кластеризации; вычислительные сложности, связанные с необходимостью решения


[стр.,40]

нелинейных задач оптимизации большой размерности; необходимость нормирования исходных данных.
Корреляционный анализ Основной целью корреляционного анализа является установление факта и силы связи между характеристиками одного объекта или
характеристиками различных объектов, а также определение структуры связей между характеристиками сложного объекта путем присвоения каждой паре характеристик двоичного признака («связь есть» или «связи нет»).
Знание структуры связей позволяет манипулировать характеристиками объекта в соответствии с целями анализа объединять коррелированные характеристики, строить обобщенные характеристики на базе средних геометрических оценок и т.п.
Для случая многомерных переменных (объектов) х и у, которые «ведут» себя как двумерная нормальная случайная величина, парный коэффициент корреляции, выражающий степень тесноты статистической связи между х и у, имеет вид г{х,у)= Щ.Х Ех){у Еу)} (1.5.2) где Е символ математического ожидания.
Эмпирический (выборочный) аналог парного коэффициента корреляции Л г (ху у ) вычисляется по формуле [7] г(х,у) = Х( Х ' х Х у .
у ) 4-1 (1.5.3) Для измерения степени тесноты статистической связи любой формы используется корреляционное отношение, для вычисления которого необходимо разбить область значений определяющей (предсказывающей) переменной на интервалы группирования.
Ограничением корреляционного 40

[Back]