Регрессионный анализ ставит свой задачей поиск линейной (или в общем случае нелинейной) зависимости между переменными X ji,...,xjmb и переменной у у В общем случае модель множественной линейной регрессии записывается в следующем виде: т y j = Z xr V i + zj ’ (L27) г=1 где pj параметры регрессии, которые необходимо оценить и Ej некоррелированные ошибки. В случае простой регрессии, когда есть одна независимая переменная, имеет место наглядная геометрическая интерпретация аппроксимации анализируемых значений подобранной прямой (кривой). В случае множественной регрессии уже не будет такой наглядной интерпретации прогноза данных как в случае простой регрессии. Геометрический образ регрессии будет гиперплоскостью. Поэтому можно говорить лишь о некоторых проекциях точек и гиперплоскости на некоторое двумерное или трехмерное пространства. 3.4. Прогнозирование временных рядов Любой временной ряд может быть разложен на две составляющие детерминированную и случайную: y t=f(t)+£t. О-28) Если бы на изучаемом интервале времени коэффициенты уравнения, описывающего тренд, остались бы неизменными, то для построения модели прогноза вполне оправданным было бы применение метода наименьших квадратов. Однако часто бывает, что в течение анализируемого периода эти коэффициенты меняются во времени. Для коротких временных рядов такие скачки уловить крайне трудно. В подобной ситуации применение метода 36 1.3.3. М ножественная регрессия |
65 существенных факторов позволяет оценивать на модели выигрыш от принятия решения. Регрессионный анализ ставит свой задачей поиск линейной (или в общем случае нелинейной) зависимости между переменными x}i,...,x]mbи переменной у у В общем случае модель множественной линейной регрессии записывается в следующем виде: где Р, параметры регрессии, которые необходимо оценить и ъ} некоррелированные ошибки. В случае простой регрессии, когда есть одна независимая переменная, имеет место наглядная геометрическая интерпретация аппроксимации анализируемых значений подобранной прямой (кривой). В случае множественной регрессии уже не будет такой наглядной интерпретации прогноза данных как в случае простой регрессии. Геометрический образ регрессии будет гиперплоскостью. Поэтому можно говорить лишь о некоторых проекциях точек и гиперплоскости на некоторое двумерное или трехмерное пространства. Кластерный анализ ставит свой задачей объединение похожих объектов в некоторые группы. В основном методы основаны на минимизации внутригрупповых сумм квадратов отклонений. Обычно расстояние d(X,Y) между множествами показателей X и Y определяется соотношением: Для оценки плотности расположения точек (филиалов и колонн АТП) внутри множества используется мера: т У) = 1 Х « ,Р.+8; ’ (1.40) (1.41) (1.42) 196 y=l y=l Соотношения для дисперсий определяют новую структуру или "факторизацию" дисперсий и ковариаций исходных переменных. В результате дисперсия и ковариация представляются в виде функций от а у и дисперсий главных компонент. Этап 2. Полученная система абстрактных факторов по определению является независимой. При реализации стандартных схем прогнозирования, например по методу экспоненциального сглаживания для каждой главной компоненты (абстрактного фактора), у нас нет никакой дополнительной информации кроме предыстории развития главной компоненты. В связи с этим мы не теряем никакой информации. Так, в основном, предполагается, что любой временной ряд может быть разложен на две составляющие детерминированную и случайную yrf(t)+£i. Если бы на изучаемом интервале времени коэффициенты уравнения, описывающего тренд, остались бы неизменными, то для построения модели прогноза вполне оправданным было бы применение метода наименьших квадратов. Однако часто бывает, что в течение анализируемого периода эти коэффициенты меняются во времени. Для коротких временных рядов такие скачки уловить крайне трудно. В подобной ситуации применение метода наименьших квадратов для определения модели прогноза может привести к существенным ошибкам. Метод экспоненциального сглаживания заключается в том, что временной ряд сглаживается с помощью взвешенной скользящей средней, в которой веса подчиняются экспоненциальному закону. Взвешенная скользящая средняя с экспоненциально распределенными весами характеризует значение процесса на конце интервала сглаживания, т.е. является средней характеристикой последних уровней ряда. Именно это свойство используется для прогнозирования. |