Проверяемый текст
Ананьев Николай Сергеевич. Методы и средства анализа данных в системах поддержки принятия решений (Диссертация 2005)
[стр. 42]

характеристиками различных объектов, а также определение структуры связей между характеристиками сложного объекта путем присвоения каждой паре характеристик двоичного признака («связь есть» или «связи нет»).
Знание структуры связей позволяет манипулировать характеристиками объекта в соответствии с целями анализа объединять коррелированные характеристики, строить обобщенные характеристики на базе средних геометрических оценок и т.п.
Для случая многомерных переменных (объектов) х и у, которые «ведут» себя как двумерная нормальная случайная величина, парный коэффициент корреляции, выражающий степень тесноты статистической связи между х и у, имеет вид г(,х,у)
Е[(х-Ех)(у-Еу)\ (1.5.2) где Е — символ математического ожидания.
Эмпирический (выборочный) аналог парного коэффициента корреляции
г(х,у) вычисляется по формуле [7] Ё (л -*)0, -у) Р(х, у) = /= (1.5.3) /-] /=1 Для измерения степени тесноты статистической связи любой формы используется корреляционное отношение, для вычисления которого необходимо разбить область значений определяющей (предсказывающей) переменной на интервалы группирования.
Ограничением корреляционного
отношения является его несимметричность.
Для анализа статистических связей между порядковыми переменными, представляемых в виде различных ранжировок, используются методы ранговой корреляции [12].
Методы визуального представления данных Данный класс методов обработки информации разработан для решения разнообразных задач кластеризации, выделения однородностей (таксонов) в
42
[стр. 40]

нелинейных задач оптимизации большой размерности; необходимость нормирования исходных данных.
Корреляционный анализ Основной целью корреляционного анализа является установление факта и силы связи между характеристиками одного объекта или характеристиками различных объектов, а также определение структуры связей между характеристиками сложного объекта путем присвоения каждой паре характеристик двоичного признака («связь есть» или «связи нет»).
Знание структуры связей позволяет манипулировать характеристиками объекта в соответствии с целями анализа объединять коррелированные характеристики, строить обобщенные характеристики на базе средних геометрических оценок и т.п.
Для случая многомерных переменных (объектов) х и у, которые «ведут» себя как двумерная нормальная случайная величина, парный коэффициент корреляции, выражающий степень тесноты статистической связи между х и у, имеет вид г{х,у)=
Щ.Х Ех){у Еу)} (1.5.2) где Е символ математического ожидания.
Эмпирический (выборочный) аналог парного коэффициента корреляции
Л г (ху у ) вычисляется по формуле [7] г(х,у) = Х( Х ' х Х у .
у ) 4-1 (1.5.3) Для измерения степени тесноты статистической связи любой формы используется корреляционное отношение, для вычисления которого необходимо разбить область значений определяющей (предсказывающей) переменной на интервалы группирования.
Ограничением корреляционного
40

[стр.,41]

Р О С С И Й С К А Я I Г°СУЛАрсгЦЕННАЯ СИ^ЛИ ОТЕКА отношения является его несимметричность.
Для анализа статистических связей между порядковыми переменными, представляемых в виде различных ранжировок, используются методы ранговой корреляции [12].
Методы визуального представления данных Данный класс методов обработки информации разработан для решения разнообразных задач кластеризации, выделения однородностей (таксонов) в
выборках, оценки информационного качества совокупности признаков в задачах распознавания объектов [76].
При исследовании вариантов построения сложной системы, необходимого для обоснования решения о направлении ее развития эти методы используются для сравнительной оценки таких вариантов.
Сущность методов визуализации данных заключается в снижении исходной размерности признакового пространства путем агрегирования частных характеристик (признаков).
Формальная реализация методов визуального представления данных основана на применении известных статистических методов многомерного анализа данных [12,58].
Основной недостаток метода зависимость от нормировки данных и выбора способа снижения размерности признакового пространства.
Методы построения обобщенных характеристик ('агрегирование данных) Существует значительное количество методов агрегирования данных, применяемых при оценке эффективности сложных систем, уровня их качества, анализе вариантов их построения и обосновании перспектив развития [49,71].
Их принципиальными недостатками, в той или иной степени являются необходимость нормировки данных, предположение о стохастической природе выборки, необоснованное задание видов законов распределения из-за объективного отсутствия знаний (информации) о стохастической природе процессов, протекающих в таких системах.
В связи с этим области применения имеющихся методов ограничены, а получаемые результаты могут потребовать 41

[Back]