Проверяемый текст
Силкин, Александр Юрьевич; Кластеризация контрагентов как инструмент формализации управленческих решений в области ценообразования (Диссертация 2003)
[стр. 70]

70 сведение частных критериальных показателей к единому интегральному; классификация признаков в виде объектов; нейронные сети.
Одним из наиболее часто используемых методов снижения размерности исследуемого признакового пространства является метод
главных компонент [102] исходного признакового пространства.
Суть метода заключается в построении необходимого числа главных компонент, являющихся линейной
комбинацией начальных переменных: z « \ X ) = lk * X , (0.2) где !к собственный вектор ковариационной матрицы, соответствующий к -му по величине собственному значению Як этой матрицы; киндекс главной компоненты.
В данном случае, один из существующих критериев информативности количества вычисляемых главных компонент исходного пространства признаков
может быть представлен в следующем виде: А* +...
+ А .
< 0 3 > где Лр../l^ собственые числа ковариационной матрицы вектораX , расположенные в порядке убывания; р размерность исходного пространства признаков; р размерность пространтсва главных компонент.
Анализируя с помощью критерия
(0.3) изменение доли дисперсий, вносимой первыми р главными компонентами, можно составить представление о количестве компонент необходимых для проведения анализа.
Как отмечает в своей работе П.Благуш
[16], к достоинствам данною метода необходимо отнести тот факт, что при его использовании информация, содержащаяся в первоначальном наборе данных, сохраняется в полном объеме без привнесения в процессе расчета дополнительных искажений.
К недостаткам данного метода следует отнести тот факт, что в случае
[стр. 70]

А на основе исключения из числа признаков несущественных; на основе формирования интегральных признаков.
Использование первого подхода связано с необходимостью задания каюголибо порогового критерия для отброса «несущественных» переменных, что соответственно приводит к зависимости от выбора порогового значения соответствующего субъективному представлению исследователя об уровне критерия, и выбора соответствующей меры информативности.
Остановимся на существующих мерах информативности далее.
Л Также в этом случае возможно возникновение двух типов ошибки: включение несущественных переменных и исключение существенных.
Возможность понижения размерности признакового пространства стаговится возможной в силу наличия следующих факторов: наличия дублирования информации, доставляемой сильно взаимосвязанными показателями; малой вариабельностью показателей; возможностью агрегирования показателей.
Рассмотрим более подробно существующие методы снижения размерности: метод главных компонент; сведение частных критериальных показателей к единому интегральному; классификация признаков в виде объектов; нейронные сети.
Одним из наиболее часто используемых методов снижения размерности ис' следуемого признакового пространства является метод
построения главных компонент [136] исходного признакового пространства.
Суть метода заключается в построении необходимого числа главных компонент, являющихся линейной
комбишцией начальных переменных: А zw (X) =lt *X, (2.2) 70

[стр.,71]

где lkсобственный вектор ковариационной матрицы, соответствующий к -му по величине собственному значениюА* этой матрицы; киндекс главной компоненты.
А В данном случае, один из существующих критериев информативности количества вычисляемых главных компонент исходного пространства признаков мэжет быть представлен в следующем виде: А, + ...+ Л.
■ <2'3> .
где Х,,.Лр -собственые числа ковариационнойматрицы вектора^', расположенные в порядке убывания; р размерность исходного пространства признаков; р —размерность пространтсва главных компонент.
^ Анализируя с помощью критерия
(2.3) изменение доли дисперсии, вносимой первыми р главными компонентами, можно составить представление о количестве компонент необходимых для проведения анализа.
Как отмечает в своей работе П.Благуш
[22], к достоинствам данного метода необходимо отнести тот факт, что при его использовании информация, содержащаяся в первоначальном наборе датных, сохраняется в полном объеме без привнесения в процессе расчета дополнительных искажений.
К недостаткам данного метода следует отнести тот факт, что в случае
проешрования исходного признакового пространства в плоскость>'первых двух главных компонент (двумерное пространство наиболее удобно для целей визуализации информации) геометрические свойства исходной совокупности могут быть отображены с искажениями [136].
Также, необходимо обратить внимание на то, что использование данного ьетода обосновано лишь в том случае, если компоненты исследуемого вектора имеют общую физическую природу и размерность.
В противном случае необходимо предварительно перейти к безразмерным признакам, например с помощью одного из существующих видов нормировки.
В то же время, согласно мнению А.В.Мандель [99] 71

[Back]