Если часть значимых факторов являются коррелируемыми между собой, то для построения регрессионной математической модели целесообразно использовать компонентный анализ [2,3,14,15,31,37,38,43,46,74,80,81,100,121]. Суть его состоит в том, что совокупность коррелируемых между собой факторов преобразуется в новые независимые между собой переменные без удаления части коррелируемых факторов. Эти новые переменные называются главными компонентами. Они являются линейными комбинациями коррелируемых между собой факторов [15,31,39,100,121]. Компонентный анализ относится к многомерным методам снижения размерности. Он содержит один метод метод главных компонент. В этом методе линейные комбинации случайных величин определяются характеристическими векторами ковариационной матрицы. Главные компоненты представляют собой ортогональную систему координат, в которой дисперсии компонент характеризуют их статистические свойства. Первой главной компонентой \Л исследуемой системы признаков Х ь Х 2, Х3 , Х 4 ,..., Xj называется [38.88,121] такая центрировано нормированная линейная комбинация этих признаков, которая среди прочих центрировано нормированных линейных комбинаций этих признаков, имеет дисперсию наиболее изменчивую. В качестве второй главной компоненты V2 берется [38.88,121] такая центрировано нормированная комбинация этих признаков, которая: • не коррелированна с первой главной компонентой, • среди всех возможных комбинаций исходных признаков, которые не коррелированны с первой главной компонентой, эта комбинация имеет наибольшую дисперсию. |
75 Оценка значимости коэффициентов модели выполняется с помощью критерия Стыодента [1,15,22,23]. Оценка адекватности полученной многофакторной математической модели исходным данным производится сравнением дисперсионного отношения Фишера (F) с табличным его значением (Ft). Модель считается адекватной, если выполняется следующее неравенство [1,90]: „ • ( п к 1)Л2 „ F = ------------i— > FT (2 4 3^ Аг(1 — R ) Г ’ 1 } где к —число переменных модели; R —коэффициент множественной корреляции; п объем выборки. Коэффициент множественной корреляции, оценивающий полноту отобранных факторов, определяется как: R = щгщ + a 2rYXi + . . . + а КгУХк (2 .4.4) 2.4.2. Краткая характеристика метода главных компонент 1. Общие положения Компонентный анализ относится к многомерным методам снижения размерности. Он содержит один метод метод главных компонент (МГК). В этом методе линейные комбинации случайных величин определяются характеристическими векторами ковариационной матрицы. Главные компоненты представляют собой ортогональную систему координат, в которой дисперсии компонент характеризуют их статистические свойства. Первой главной компонентой Z. исследуемой системы признаков Х ь Х2, Х3 , Х4 Xj называется [102] такая центрировано-нормированная линейная комбинация этих признаков, которая среди прочих центрировано нормированных линейных комбинаций этих признаков, имеет дисперсию наиболее изменчивую. 76 В качестве второй главной компоненты Z2 берется [102] такая центрировано— нормированную комбинацию этих признаков, которая: • не коррелированна с первой главной компонентой, • среди всех возможных комбинаций исходных признаков, которые i ой главной компонентой Z, (i=l...m) берется [102] такая центрировано-нормированную комбинацию признаков, которая: • не коррелированна с i 1 предыдущими главными компонентами, • среди всех возможных комбинаций исходных признаков, которые Главные компоненты являются математическими функциями измеряемых переменных. Таким образом, компоненты можно непосредственно представлять в виде линейной комбинации переменных и говорить о значении компонент, а не об их оценках. Значения компонент получаются при суммировании значений переменных с весами, пропорциональными компонентным нагрузкам [104]: не коррелированны с первой главной компонентой, эта комбинация имеет наибольшую дисперсию. не коррелированны с i 1 предыдущими главными компонентами, эта комбинация имеет наибольшую дисперсию. 'Значение j компоненты где bij нагрузка наj ю переменную от i й компоненты; соответствующее собственное значение компоненты. (2.4.5) Деление на собственное значение приводит к тому, что значение компоненты будет иметь единичную дисперсию. |