96 Этого добиваются подбором соответствующего значения X . Уравнение (2.4.12) (относительно X) называется характеристическим для матрицы 2 . Известно [2], что при симметричности и неотрицательной определенности матрицы 2 (каковой она и является как всякая ковариационная матрица) это уравнение имеет р вещественных неотрицательных корней Я, >Л2>...^Лр >0, называемых характеристическими (или собственными) значениями матрицы 2 . Учитывая, что varz(1>=var(/,^r)= /1EAT и =Л (последнее соотношение следует из соотношения (2.3.22) после его умножения слева на с учетом !{lj =1), получаем varz(l)(Z) = A. Поэтому для обеспечения максимальной величины дисперсии переменной z (1) нужно выбрать из р собственных значений матрицы 2 наибольшее, т.е. varz(l,(X) = 4 (2.4.13) Подставляем Л, в систему уравнений (2.3.22) и, решая ее относительно определяем компоненты вектора /,. Таким образом, первая главная компонента получается как линейная комбинация z ° \ X ) =llX , где /, собственный вектор матрицы 2 , соответствующий наибольшему собственному числу этой матрицы. Далее аналогично можно показать, что z (K)(X) =lKX , где 1К собственный вектор матрицы 2 , соответствующий к-му по величине собственному значению Як этой матрицы. Таким образом, соотношения для определения всех р главных компонент вектора X могут быть представлены в виде (2.4.4), где Z =(zm,...,zip))1, Х =(х(х),...,х1р))у, а матрица L состоит из строк I/ = j = l,p> являющихся собственными векторами матрицы 2 , соответствующими собственным числам Х}. При этом сама матрица L в соответствии с условиями (2.4.2) является ортогональной, т.е. |
75 Следовательно, задача (2.3.18) может быть записана следующим образом: [ / , £ / , max; 3.20) i V.T=l. Используя функцию Лагранжа W J l -1) и дифференцируя ее покомпонентам вектор-столбца /,т , получаем следующее выражение: (2.3,21) что дает систему для определения ( 2 а/)/,т =о (2.3.22) (здесь 0=(0Д...,0)Т ^-мерный вектор-столбец из нулей). Для того, чтобы существовало ненулевое решение системы (2.3.22) (а оно должно быть ненулевым, так как V,T= i), матрица z x i должна быть вырожденной, т.е. S ~ Я/j 0 (2.3.23) Этого добиваются подбором соответствующего значения л. Уравнение (2.3.23) (относительно я) называется характеристическим для матрицы б. Известно [2], что при симметричности и неотрицательной определенности матрицы Е (каковой она и является как всякая ковариационная матрица) это уравнение имеет р вещественных неотрицательных корней А, > ^2 \ р > 0, называемых характеристическими (или собственными) значениями матрицы 2 . Учитывая, что v a r? (,) =var(/1 Z )= /,E /iT и = ^ (последнее соотношение следует из соотношения (2.3.22) после его умножения слева на с учетом ijl =1), получаем уагг0)(Х )= я. 76 Поэтому для обеспечения максимальной величины дисперсии переменной ?(l) нужно выбрать из р собственных значений матрицы 2 наибольшее, т.е. v a rz (1){JO = Л ( 2 .3 .2 4 ) Подставляем л, в систему уравнений (2.3.22) и, решая ее относительно ..../1р, определяем компоненты вектора Таким образом, первая главная компонента получается как линейная комбинация z m(x) =lx x , где /, собственный вектор матрицы £, соответствующий наибольшему собственному числу этой матрицы. Далее аналогично можно показать, что г ( к\х)= 1кх , где /г собственный вектор матрицы 2 , соответствующий к-м у по величине собственному значению я, этой матрицы. Таким образом, соотношения для определения всех р главных компонент вектора х могут быть представлены в виде (2.3.15), где Z = ( z (,),..„zlp)) \ Л '= (х (1)„..)х0,))т ) а матрица L состоит из строк lj , j =l,p, являющихся собственными векторами матрицы Е, соответствующими собственным числам Лг При этом сама матрица z в соответствии с условиями (2.3.13) является ортогональной, т.е. LLT =LTL = I .3.25) Если от стандартизованных значений исходных признаков перейти к их истинным значениям [31,39], то главные компоненты можно представить системой уравнений (формула 2.2.4). |