272 Пусть результаты моделирования получены при N реализациях, а коэффициент корреляции Л/ N кк=\ хк~Х)(У У) Т,хкУк~НхУ к=\ 41 N N \ 1/2 Кк=\ X х)2У,(Ук~у) JM / N \\к=\ xi ~Nx*II2>*2~му 2 *=i j) 1/2 Очевидно, что данное соотношение требует минимальных затрат машинной памяти на обработку результатов моделирования. Полученный при этом коэффициент корреляции in 1. При сделанных предположениях = 0 свидетельствует о взаимной независимости случайных переменных £ и ij, исследуемых при моделировании. При in 1 имеет место функциональная (т.е. нестохастическая) линейная зависимость вида у Ъо + Ъ]Х причем если in >1, то говорят о положительной корреляции, т.е. большие значения одной случайной величины соответствуют большим значениям другой. Случай 0 < < 1 соответствует либо наличию линейной корреляции с рассеянием, либо наличию нелинейной корреляции результатов моделирования. Регрессионный анализ дает возможность построить модель, наилуч* й а t шим образом соответствующую набору данных, полученных в ходе машинного эксперимента с животноводческой фермой. Под наилучшим соответствием понимается минимизированная функция ошибки, являющаясяй разностью между прогнозируемой моделью и данными эксперимента. Такой функцией ошибки при регрессионном анализе служит сумма квадратов ошибок. Предположим, что модель результатов машинного эксперимента графически может быть представлена в виде прямой линии У <р(х) = bQ+bxxt где у величина, предсказываемая регрессионной моделью. |
7.2. АНАЛИЗ И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ МАШИННОГО МОДЕЛИРОВАНИЯ Возможность фиксации при моделировании системы S на ЭВМ значений переменных (параметров) и их статистическая обработка для получения интересующих экспериментатора характеристик позволяют провести объективный анализ связей между этими величинами. Для решения этой задачи существуют различные методы, зависящие от целей исследования и вида получаемых при моделировании характеристик. Рассмотрим особенности использования методов корреляционного, регрессионного и дисперсионного анализа для результатов моделирования систем [7, 11, 18, 21, 25, 46]. Корреляционный анализ результатов моделирования. С помощью корреляционного анализа исследователь может установить, насколько тесна связь между двумя (или более) случайными величинами, наблюдаемыми и фиксируемыми при моделировании конкретной системы S. Корреляционный анализ результатов моделирования сводится к оценке разброса значений г\ относительно среднего значения у, т. е. к оценке силы корреляционной связи. Существование этих связей и их тесноту можно для схемы корреляционного анализа у=М[г]1£=х] выразить при наличии линейной связи между исследуемыми величинами и нормальности их совместного распределения с помощью коэффициента корреляции гь=м#-м[яьм[г1-мш1>/вщш= =М[£-к]М[т,-11Ж<Гп0д, т. е. второй смешанный центральный момент делится на произведение средних квадратичных отклонений, чтобы иметь безразмерную величину, инвариантную относительно единиц измерения рассматриваемых случайных переменных. Пример 7.1. Пусть результаты моделирования получены при N реализациях, а коэффициент корреляции К 1» L (*к-*)(Ук-5! ) Z хкУк-Nxy • _ >-i t^i Очевидно, что данное соотношение требует минимальных затрат машинной памяти на обработку результатов моделирования. Получаемый при этом коэффициент корреляции г{4<1. При сделанных предположениях »"{, = 0 свидетельствует о взаимной независимости случайных переменных ^ и п. исследуемых при моделировании (рис. 7.1, а). При г{, = 1 имеет место функциональная (т. е. нестохастическая) линейная зависимость вида y=ba + b1x, причем если Г{» > О, то говорят о положительной корреляции, т. е. большие значения одной случайной величины соответствуют большим значениям другой (рис. 7.1, б). Случай 0<Г{,<1 соответствует либо наличию линейной корреляции с рассеянием (рис. 7.1, в), либо наличию нелинейной корреляции результатов моделирования (рис 7 1, г). 248 и оценивает тесноту этой связи. Однако в дополнение к этому желательно располагать моделью зависимости, полученной после обработки результатов моделирования. Регрессионный анализ результатов моделирования. Регрессионный анализ дает возможность построить модель, наилучшим образом соответствующую набору данных, полученных в ходе машинного эксперимента с системой S. Под наилучшим соответствием понимается минимизированная функция ошибки, являющаяся разностью между прогнозируемой моделью и данными эксперимента. Такой функцией ошибки при регрессионном анализе служит сумма квадратов ошибок. Пример 7.2. Рассмотрим особенности регрессионного анализа результатов моделирования при построении линейной регрессионной модели. На рис. 7.2, а показаны точки jf„ у„ ;'=Т7Д полученные в машинном эксперименте с моделью Мы системы S. Делаем предположение, что моа) дель результатов машинного эксперимента графически может быть представлена в виде прямой у=<р{х)=Ь0+Ъ1х, где $ — величина, предсказываемая регрессионной моделью. Требуется получить такие значения коэффициентов Ь0 я Ьи при Рис. 7.2. Построение линейной регрессионной которых сумма квадратов ошибок модели является минимальной. На рисунке ошибка ей /=1, N, для каждой экспериментальной точки определяется как расстояние по вертикали от этой точки до линии регрессии у=q> (x). Обозначим y,=b0+b1Xi, /=1, N Тогда выражение для ошибок будет иметь вид к e,=yi-yi=b0+b1x,-yl, а функция ошибки F0= £ {Ьо+Ьп-уЩ1 . i i Для получения Ь0 и Ьх, при которых функция F0 является минимальной, применяются обычные методы математического анализа. Условием минимума является dFJ3b0=6;dF0ldbL=0. Дифференцируя F0, получаем dFal8b0 = d £ (i0+61x,-^I)J /5i0 = 2 ( M 0 + i 1 £ J C , 5 > , ) 0 , («1 \ i l i l / dFJdb^d £ {Ь0 + Ь1Х1-у,)2 !дЬ1=2Ь0 £ X.+2A, £ xf-2 £ ад=0 Решая систему этих двух линейных алгебраических уравнений, можно получить значения Ь0 и bL В матричном представлении эти уравнения имеют вид 250 |