сти включения фактора в модель. Поэтому отбор факторов обычно осуществляется в две стадии: на первой подбираются факторы исходя из сущности проблемы; на второй —на основе матрицы показателей корреляции определяют ^-статистики для параметров регрессии. Корреляции между объясняющими переменными исключать из модели дублирующие факторы. Считается, что две переменные явно коллинеарные (находятся между собой в линейной зависимости), если коэффициент интеркорреляции больше или равен 0,7. Если факторы явно коллинеарные, то они дублируют друг друга и один из них рекомендуется исключить из уравнения регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга. Отбор факторов, включаемых в регрессию, является одним из важнейших этапов практического использования методов регрессии. Подходы к отбору факторов на основе показателей корреляции могут быть разными. Они приводят построение уравнения множественной регрессии к разным методикам. В зависимости от того, какая методика построения уравнения регрессии принята, меняется алгоритм ее решения на ЭВМ. Наиболее широкое применение получили следующие методы построения уравнения множественной регрессии: метод исключения; метод включения; шаговый регрессионный анализ. Каждый из этих методов по-своему решает проблему отбора факторов, давая в целом близкие результаты отсев факторов из полного его набора (метод исключения), дополнительное введение факторов (метод включения), исключение ранее введенного фактора (шаговый регрессионный анализ). 50 |
корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми. Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором т факторов, то для нее рассчитывается показатель детерминации Р^, который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии т факторов. Влияние д ругих не учтенны х в модели факторов оценивается, ка к \lF с соответствующей остаточной дисперсией SSr. П ри дополнительном вклю чении в регрессию т + \ факторов коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться; Если же этого не происходит и данные показатели практически мало отличаются д руг от друга, то включаемый в анализ фактор x„h-i не улучш ает модель и практически является лиш ним фактором. Насыщение модели лиш ним и факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической не значимости параметров регрессии по г-критерию Стьюдента. Х отя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качественного теоретико-экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно осущ ествляется в две стадии: на первой подбираются факторы исходя из сущ ности проблемы; на второй на основе матрицы показателей корреляции определяют /-статистики для параметров рефессии. 60 Коэффициенты интеркорреляции, т.е. корреляции между объясняющими переменными, позволяют исключать из модели дублирующ ие факторы. Считается, что две переменные явно коллинеарные (находятся между собой в линейной зависимости), если коэффициент интеркорреляции больше или равен 0,7. Если факторы явно коллинеарные, то они дублирую т д руг друга и один из них рекомендуется исклю чить из уравнения регрессии. Предпочтение при этом отдается не фактору, более тесно связанному с результатом, а тому, которы й при достаточно тесной связи с результатом имеет наименьш ую тесноту связи с другим и факторами. В этом требовании проявляется специфика множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости д руг от друга. Отбор факторов, включаемых в регрессию, является одним из важнейш их этапов практического использования методов регрессии. Подходы к отбору факторов на основе показателей корреляции м огут быть разными. Они приводят построение уравнения множественной регрессии к разным методикам. В зависимости от того, какая методика построения уравнения регрессии принята, меняется алгоритм ее решения на Э ВМ . Наиболее ш ирокое применение получили следующие методы построения уравнения множественной регрессии: метод исклю чения; метод вклю чения; ш аговый регрессионный анализ. Каж ды й из этих методов по-своему решает проблему отбора факторов, давая в целом близкие результаты отсев факторов из полного его набора (метод исклю чения), дополнительное введение факторов (метод вклю чения), исключение ранее введенного фактора (ш аговы й регрессионный анализ). Вал<ной разновидностью множественного линейного регрессионного анализа является дискриминантны й анализ. Д искрим инантны й анализ используется, во-первых, для принятия решения о том, какие переменные различают (дискриминирую т) две или более возникающ ие совокупности (группы ), во-вторых, для решения задачи классиф икации. Например, можно из 61 |