70 сведение частных критериальных показателей к единому интегральному; классификация признаков в виде объектов; нейронные сети. Одним из наиболее часто используемых методов снижения размерности исследуемого признакового пространства является метод главных компонент [102] исходного признакового пространства. Суть метода заключается в построении необходимого числа главных компонент, являющихся линейной комбинацией начальных переменных: z « \ X ) = lk * X , (0.2) где !к собственный вектор ковариационной матрицы, соответствующий к -му по величине собственному значению Як этой матрицы; киндекс главной компоненты. В данном случае, один из существующих критериев информативности количества вычисляемых главных компонент исходного пространства признаков может быть представлен в следующем виде: А* +... + А . < 0 3 > где Лр../l^ собственые числа ковариационной матрицы вектораX , расположенные в порядке убывания; р размерность исходного пространства признаков; р размерность пространтсва главных компонент. Анализируя с помощью критерия (0.3) изменение доли дисперсий, вносимой первыми р главными компонентами, можно составить представление о количестве компонент необходимых для проведения анализа. Как отмечает в своей работе П.Благуш [16], к достоинствам данною метода необходимо отнести тот факт, что при его использовании информация, содержащаяся в первоначальном наборе данных, сохраняется в полном объеме без привнесения в процессе расчета дополнительных искажений. К недостаткам данного метода следует отнести тот факт, что в случае |
А на основе исключения из числа признаков несущественных; на основе формирования интегральных признаков. Использование первого подхода связано с необходимостью задания каюголибо порогового критерия для отброса «несущественных» переменных, что соответственно приводит к зависимости от выбора порогового значения соответствующего субъективному представлению исследователя об уровне критерия, и выбора соответствующей меры информативности. Остановимся на существующих мерах информативности далее. Л Также в этом случае возможно возникновение двух типов ошибки: включение несущественных переменных и исключение существенных. Возможность понижения размерности признакового пространства стаговится возможной в силу наличия следующих факторов: наличия дублирования информации, доставляемой сильно взаимосвязанными показателями; малой вариабельностью показателей; возможностью агрегирования показателей. Рассмотрим более подробно существующие методы снижения размерности: метод главных компонент; сведение частных критериальных показателей к единому интегральному; классификация признаков в виде объектов; нейронные сети. Одним из наиболее часто используемых методов снижения размерности ис' следуемого признакового пространства является метод построения главных компонент [136] исходного признакового пространства. Суть метода заключается в построении необходимого числа главных компонент, являющихся линейной комбишцией начальных переменных: А zw (X) =lt *X, (2.2) 70 где lkсобственный вектор ковариационной матрицы, соответствующий к -му по величине собственному значениюА* этой матрицы; киндекс главной компоненты. А В данном случае, один из существующих критериев информативности количества вычисляемых главных компонент исходного пространства признаков мэжет быть представлен в следующем виде: А, + ...+ Л. ■ <2'3> . где Х,,.Лр -собственые числа ковариационнойматрицы вектора^', расположенные в порядке убывания; р размерность исходного пространства признаков; р —размерность пространтсва главных компонент. ^ Анализируя с помощью критерия (2.3) изменение доли дисперсии, вносимой первыми р главными компонентами, можно составить представление о количестве компонент необходимых для проведения анализа. Как отмечает в своей работе П.Благуш [22], к достоинствам данного метода необходимо отнести тот факт, что при его использовании информация, содержащаяся в первоначальном наборе датных, сохраняется в полном объеме без привнесения в процессе расчета дополнительных искажений. К недостаткам данного метода следует отнести тот факт, что в случае проешрования исходного признакового пространства в плоскость>'первых двух главных компонент (двумерное пространство наиболее удобно для целей визуализации информации) геометрические свойства исходной совокупности могут быть отображены с искажениями [136]. Также, необходимо обратить внимание на то, что использование данного ьетода обосновано лишь в том случае, если компоненты исследуемого вектора имеют общую физическую природу и размерность. В противном случае необходимо предварительно перейти к безразмерным признакам, например с помощью одного из существующих видов нормировки. В то же время, согласно мнению А.В.Мандель [99] 71 |