128 качества управления Ф), характеризующая качество управления на интервале от // до t2 , является суммой количественных оценок <р, качества управления на отдельных шагах, г.е.: ф = (3-65) Необходимо на каждом шаге t выбирать управление х, таким образом, чтобы суммарная количественная оценка Ф за весь горизонт планирования была максимальной: f ф = Z 9,O',-,>х,) +<Ръ{ут)-~> max, (3.66) '-'о *' где у —состояние процесса на последнем шаге. Задача (3.59) (3.66) задача оптимального управления. В принятых обозначениях она формулируется так: найти такие управления х, и фазовую траекторию y=(yIt..., у т), чтобы удовлетворить системе разностных уравнений (3.63), начальным условиям (3.62), ограничениям (3.60), (3.61), (3.63) и получить максимальное на множестве пар {у,, х,}, подчиняющееся условиям (3.64)-(3.65), значение критерия (3.66). Найденные в результате решения задачи (3.59)-(3.66) управление х =(х,...,хт) и траекторию у =(у,...,ут)будем называть оптимальным управлением и оптимальной фазовой траекторией соответственно. Задача (3.59) (3.66) задача дискретной оптимизации, поскольку вектор .т=(зе,...,хг) нужно выбирать из конечного множества, а состояния однозначно определяются выбранными управлениями. Для решения задачи дискретной динамической оптимизации используем одну из схем последовательного анализа вариантов — метод динамического программирования; позволяющий' представить решение задачи дискретного оптимального управления в виде последовательности шагов, на каждом из которых решается более простая по сравнению с исходной задача. Обозначим Ф(‘,у,) оптимальное значение функционала качества управления на интервале от toдо t. Рекуррентные соотношения, связывающие |
У, е Y„ (6.3) 3 'о = /. (6-4) где: Xt — множество допустимых значений вектора управления xt; Yt — множество допустимых значений вектора состояния yt\f скалярная функция, ш описывающая зависимость состояния процесса от предыдущего состояния и выбранного управления;уо начальное состояние процесса. Примем, что на состояние процесса и управление наложены некоторые ограничения, которые символически можно записать в следующем виде: ( У м Л ) ^ 4 (6.5) Будем считать, что каждому этапу процесса можно поставить в соответствие количественную оценку <р„характеризующую качество управления xt при переходе из состояния y t.\ в состояние у,: <Р, =(Ум»-Ч). <=1,2 , Г. (6.6) Также примем, что суммарная количественная оценка (функционал качещ ства управления Ф), характеризующая качество управления на интервале от /1 до /2, является суммой количественных оценок (6.7) i t \ Необходимо на каждом шаге t выбирать управление xt таким образом, чтобы суммарная количественная оценка Ф за весь горизонт планирования была максимальной: г Ф = OVi»х»>+ % (У Т) max, (6.8) /^/0 х< гдеугсостояние процесса на последнем шаге. # . Задача (6.1)-(6.В) задача оптимального управления. В принятых обозначениях она формулируется так: найти такие управления xt и фазовую траекторию у = (yi, ...,ут\ чтобы удовлетворить системе разностных уравнений (6.1), начальным.условиям (6.4), ограничениям (6.2), (6.3), (6.5) и получить макси248 мальное на множестве пар {уг, *,}, подчиняющееся условиям (6.6)-(6.7), значение критерия (6.8). Найденные в результате решения задачи (6.1)-(6.8) управление х = (Зс,,..., хг) и траекторию у = ( у] у т) будем называть оптимальным управлением и оптимальной фазовой траекторией соответственно. Задача (6.1)-(6.8) задача дискретной оптимизации, поскольку вектор х = (5с,,..., хт) нужно выбирать из конечного множества, а состояния однозначно определяются выбранными управлениями. Поскольку состояние процесса у, в периоде t зависит только от состояния у,.\ на предыдущем шаге и от выбранного на этом шаге управления xt , то задача (6.1)-(6.8) является марковской. Рассмотрение только марковских задач не ограничивает общности, поскольку можно показать, что немарковской задаче можно поставить в соответствие марковскую задачу с расширенным множеством состояний [53, 82, 143]. Для решения задачи дискретной динамической оптимизации используем одну из схем последовательного анализа вариантов метод динамического программирования, позволяющий представить решение задачи дискретного оптимального управления в виде последовательности шагов, на каждом из которых решается более простая по сравнению с исходной задача. Обозначим Ф(/,у,) —оптимальное значение функционала качества управления на интервале от Г0 до t. Рекуррентные соотношения, связывающие между собой последовательные оптимальные значения функционала качества Ф(/,у,), записываются на основе принципа оптимальности динамического программирования. В соответствии с этим принципом любой конечный отрезок оптимальной фазовой траектории также представляет собой оптимальную траекторию. Для вывода необходимых рекуррентных соотношений будем рассуждать следующим образом. Пусть найдено оптимальное значение Ф(Г-1,уг.,) функционала качества управления за (Г-1) шагов. Тогда для расчета оптимального значения функционала качества управления за Г шагов нужно оптимизировать одношаговый показатель качества управления г/?„т.е. 249 |