Проверяемый текст

Силкин, Александр Юрьевич; Кластеризация контрагентов как инструмент формализации управленческих решений в области ценообразования (Диссертация 2003)

[стр. 70]
70 сведение частных критериальных показателей к единому интегральному; классификация признаков в виде объектов; нейронные сети.
Одним из наиболее часто используемых методов снижения размерности исследуемого признакового пространства является метод главных компонент [102] исходного признакового пространства.
Суть метода заключается в построении необходимого числа главных компонент, являющихся линейной комбинацией начальных переменных: z « \ X ) = lk * X , (0.2) где !к собственный вектор ковариационной матрицы, соответствующий к -му по величине собственному значению Як этой матрицы; киндекс главной компоненты.
В данном случае, один из существующих критериев информативности количества вычисляемых главных компонент исходного пространства признаков может быть представлен в следующем виде: А* +...
+ А .
< 0 3 > где Лр../l^ собственые числа ковариационной матрицы вектораX , расположенные в порядке убывания; р размерность исходного пространства признаков; р размерность пространтсва главных компонент.
Анализируя с помощью критерия (0.3) изменение доли дисперсий, вносимой первыми р главными компонентами, можно составить представление о количестве компонент необходимых для проведения анализа.
Как отмечает в своей работе П.Благуш [16], к достоинствам данною метода необходимо отнести тот факт, что при его использовании информация, содержащаяся в первоначальном наборе данных, сохраняется в полном объеме без привнесения в процессе расчета дополнительных искажений.
К недостаткам данного метода следует отнести тот факт, что в случае

[стр. 70]
А на основе исключения из числа признаков несущественных; на основе формирования интегральных признаков.
Использование первого подхода связано с необходимостью задания каюголибо порогового критерия для отброса «несущественных» переменных, что соответственно приводит к зависимости от выбора порогового значения соответствующего субъективному представлению исследователя об уровне критерия, и выбора соответствующей меры информативности.
Остановимся на существующих мерах информативности далее.
Л Также в этом случае возможно возникновение двух типов ошибки: включение несущественных переменных и исключение существенных.
Возможность понижения размерности признакового пространства стаговится возможной в силу наличия следующих факторов: наличия дублирования информации, доставляемой сильно взаимосвязанными показателями; малой вариабельностью показателей; возможностью агрегирования показателей.
Рассмотрим более подробно существующие методы снижения размерности: метод главных компонент; сведение частных критериальных показателей к единому интегральному; классификация признаков в виде объектов; нейронные сети.
Одним из наиболее часто используемых методов снижения размерности ис' следуемого признакового пространства является метод построения главных компонент [136] исходного признакового пространства.
Суть метода заключается в построении необходимого числа главных компонент, являющихся линейной комбишцией начальных переменных: А zw (X) =lt *X, (2.2) 70

[стр.,71]
где lkсобственный вектор ковариационной матрицы, соответствующий к -му по величине собственному значениюА* этой матрицы; киндекс главной компоненты.
А В данном случае, один из существующих критериев информативности количества вычисляемых главных компонент исходного пространства признаков мэжет быть представлен в следующем виде: А, + ...+ Л.
■ <2'3> .
где Х,,.Лр -собственые числа ковариационнойматрицы вектора^', расположенные в порядке убывания; р размерность исходного пространства признаков; р —размерность пространтсва главных компонент.
^ Анализируя с помощью критерия (2.3) изменение доли дисперсии, вносимой первыми р главными компонентами, можно составить представление о количестве компонент необходимых для проведения анализа.
Как отмечает в своей работе П.Благуш [22], к достоинствам данного метода необходимо отнести тот факт, что при его использовании информация, содержащаяся в первоначальном наборе датных, сохраняется в полном объеме без привнесения в процессе расчета дополнительных искажений.
К недостаткам данного метода следует отнести тот факт, что в случае проешрования исходного признакового пространства в плоскость>'первых двух главных компонент (двумерное пространство наиболее удобно для целей визуализации информации) геометрические свойства исходной совокупности могут быть отображены с искажениями [136].
Также, необходимо обратить внимание на то, что использование данного ьетода обосновано лишь в том случае, если компоненты исследуемого вектора имеют общую физическую природу и размерность.
В противном случае необходимо предварительно перейти к безразмерным признакам, например с помощью одного из существующих видов нормировки.
В то же время, согласно мнению А.В.Мандель [99] 71

[Back]