79 аспект: использование матрицы вторых моментов как исходной для начала анализа [88,100]. Учитывая, что объекты исследования характеризуются большим, но конечным количеством признаков, влияние которых подвергается воздействию большого количества случайных причин, в качестве моделей в статистическом плане берутся многомерные распределения, а в алгебраическом многомерное пространство признаков. Анализ главных компонент — это метод преобразования данной последовательности наблюдаемых переменных в другую последовательность переменных [88,100]. Наиболее простой способ пояснить внутреннюю логику метода сводится к его изучению в двумерном случае. Предположим, что есть две переменные X и У с совместным нормальным распределением. Совместное нормальное распределение величин, имеющих положительную корреляцию, представлено на рис. 2.4.1, а с помощью кривых равных вероятностей. Эти кривые показывают, что благодаря положительной связи между X и У данные представляют кластер, в котором большие величины X имеют тенденцию соответствовать большим величинам У (и наоборот) [100]. Таким образом, в большинстве случаев точки попадают в первый и третий квадранты, и реже во второй и четвертый. Кривые равных вероятностей имеют форму эллипсов, две оси которых изображены пунктирными линиями. Главная ось (Р,) проходит по линии, вдоль которой располагается основная часть данных; вторая ось (Р2) по линии, вдоль которой расположена меньшая часть данных. |
77 Метод главных компонент считается статистическим методом. Но есть другой подход, приводящий к методу главных компонент, но не являющийся статистическим. Этот подход связан с получением наилучшей проекции точек наблюдения в пространстве меньшей размерности. Для решения подобной задачи необходимо знать матрицу вторых моментов. В статистическом подходе, задача заключается в выделении линейных комбинаций случайных величин, имеющих максимально возможную дисперсию.Он опирается на ковариационную или корреляционную матрицу этих случайных величин. У этих двух разных подходов есть общий аспект: использование матрицы вторых моментов как исходной для начала анализа1[23]. Учитывая, что1объекты исследования характеризуются большим, но конечным количеством признаков, влияние которых подвергается воздействию большого количества случайных причин, в качестве моделей в статистическом. плане берутся многомерные распределения, а в алгебраическом многомерное пространство признаков. Анализ главных компонент это метод преобразования данной последовательности-наблюдаемых переменных в другую последовательность переменных [104]. Наиболее простой способ пояснить внутреннюю логику метода сводится к его изучению в двумерном случае. Предположим, что есть две переменные X и Y с совместным нормальным распределением. Совместное нормальное распределение величин, имеющих положительную корреляцию, представлено на рис. 2 .1 а с помощью кривых равных вероятностей. Эти кривые показывают, что благодаря положительной связи между X и Y данные представляют кластер, в котором большие величины X имеют тенденцию соответствовать большим величинам. Y (и наоборот). Таким образом, в большинстве случаев точки попадают в первый и третий квадранты, и реже — во второй и четвертый. Кривые равных вероятностей имеют форму эллипсов, две оси которых изображены пунктирными линиями. |