/-ой главной компонентой V, (М ...т ) берется [38,88,121] такая центрировано нормированная комбинация признаков, которая: • не коррелированна с / -1 предыдущими главными компонентами; • среди всех возможных комбинаций исходных признаков, которые не коррелированны с / 1 предыдущими главными компонентами, эта комбинация имеет наибольшую дисперсию. Главные компоненты являются математическими функциями измеряемых переменных. Таким образом, компоненты можно непосредственно представлять в виде линейной комбинации переменных и говорить о значении компонент, а не об их оценках. Значения компонент получаются при суммировании значений переменных с весами, пропорциональными компонентным нагрузкам [88, 100]. 'Значение ^ K O M tiO H e u m b ij где Ьц нагрузка на/-ю переменную от й компоненты; Я, соответствующее собственное значение. Деление на собственное значение приводит к тому, что значение компоненты будет иметь единичную дисперсию. Метод главных компонент считается статистическим методом. Но есть другой подход, приводящий к методу главных компонент, но не являющийся статистическим. Этот подход связан с получением наилучшей проекции точек наблюдения в пространстве меньшей размерности. Для решения подобной задачи необходимо знать матрицу вторых моментов. В статистическом подходе, задача заключается в выделении линейных комбинаций случайных величин, имеющих максимально возможную дисперсию. Он опирается на ковариационную или корреляционную матрицу этих случайных величин. У этих двух разных подходов есть общий 78 = 1 ' x j (2.4.4) |
76 В качестве второй главной компоненты Z2 берется [102] такая центрировано— нормированную комбинацию этих признаков, которая: • не коррелированна с первой главной компонентой, • среди всех возможных комбинаций исходных признаков, которые i ой главной компонентой Z, (i=l...m) берется [102] такая центрировано-нормированную комбинацию признаков, которая: • не коррелированна с i 1 предыдущими главными компонентами, • среди всех возможных комбинаций исходных признаков, которые Главные компоненты являются математическими функциями измеряемых переменных. Таким образом, компоненты можно непосредственно представлять в виде линейной комбинации переменных и говорить о значении компонент, а не об их оценках. Значения компонент получаются при суммировании значений переменных с весами, пропорциональными компонентным нагрузкам [104]: не коррелированны с первой главной компонентой, эта комбинация имеет наибольшую дисперсию. не коррелированны с i 1 предыдущими главными компонентами, эта комбинация имеет наибольшую дисперсию. 'Значение j компоненты где bij нагрузка наj ю переменную от i й компоненты; соответствующее собственное значение компоненты. (2.4.5) Деление на собственное значение приводит к тому, что значение компоненты будет иметь единичную дисперсию. 77 Метод главных компонент считается статистическим методом. Но есть другой подход, приводящий к методу главных компонент, но не являющийся статистическим. Этот подход связан с получением наилучшей проекции точек наблюдения в пространстве меньшей размерности. Для решения подобной задачи необходимо знать матрицу вторых моментов. В статистическом подходе, задача заключается в выделении линейных комбинаций случайных величин, имеющих максимально возможную дисперсию.Он опирается на ковариационную или корреляционную матрицу этих случайных величин. У этих двух разных подходов есть общий аспект: использование матрицы вторых моментов как исходной для начала анализа1[23]. Учитывая, что1объекты исследования характеризуются большим, но конечным количеством признаков, влияние которых подвергается воздействию большого количества случайных причин, в качестве моделей в статистическом. плане берутся многомерные распределения, а в алгебраическом многомерное пространство признаков. Анализ главных компонент это метод преобразования данной последовательности-наблюдаемых переменных в другую последовательность переменных [104]. Наиболее простой способ пояснить внутреннюю логику метода сводится к его изучению в двумерном случае. Предположим, что есть две переменные X и Y с совместным нормальным распределением. Совместное нормальное распределение величин, имеющих положительную корреляцию, представлено на рис. 2 .1 а с помощью кривых равных вероятностей. Эти кривые показывают, что благодаря положительной связи между X и Y данные представляют кластер, в котором большие величины X имеют тенденцию соответствовать большим величинам. Y (и наоборот). Таким образом, в большинстве случаев точки попадают в первый и третий квадранты, и реже — во второй и четвертый. Кривые равных вероятностей имеют форму эллипсов, две оси которых изображены пунктирными линиями. |