Проверяемый текст
Халиков, Михаил Альфредович; Экономико-математическое моделирование устойчивого развития предприятий машиностроения в условиях рыночной экономики (Диссертация 2004)
[стр. 128]

128 качества управления Ф), характеризующая качество управления на интервале от // до t2 , является суммой количественных оценок <р, качества управления на отдельных шагах, г.е.: ф = (3-65) Необходимо на каждом шаге t выбирать управление х, таким образом, чтобы суммарная количественная оценка Ф за весь горизонт планирования была максимальной: f ф = Z 9,O',-,>х,) +<Ръ{ут)-~> max, (3.66) '-'о *' где у —состояние процесса на последнем шаге.
Задача (3.59) (3.66) задача оптимального управления.
В принятых обозначениях она формулируется так: найти такие управления
х, и фазовую траекторию y=(yIt..., у т), чтобы удовлетворить системе разностных уравнений (3.63), начальным условиям (3.62), ограничениям (3.60), (3.61), (3.63) и получить максимальное на множестве пар {у,, х,}, подчиняющееся условиям (3.64)-(3.65), значение критерия (3.66).
Найденные в результате решения задачи (3.59)-(3.66) управление х =(х,...,хт) и траекторию у =(у,...,ут)будем называть оптимальным управлением и оптимальной фазовой траекторией соответственно.
Задача
(3.59) (3.66) задача дискретной оптимизации, поскольку вектор .т=(зе,...,хг) нужно выбирать из конечного множества, а состояния однозначно определяются выбранными управлениями.
Для решения задачи дискретной динамической оптимизации используем одну из схем последовательного анализа вариантов — метод динамического программирования; позволяющий' представить решение задачи дискретного оптимального управления в виде последовательности шагов, на каждом из которых решается более простая по сравнению с исходной задача.
Обозначим
Ф(‘,у,) оптимальное значение функционала качества управления на интервале от toдо t.
Рекуррентные соотношения, связывающие
[стр. 248]

У, е Y„ (6.3) 3 'о = /.
(6-4) где: Xt — множество допустимых значений вектора управления xt; Yt — множество допустимых значений вектора состояния yt\f скалярная функция, ш описывающая зависимость состояния процесса от предыдущего состояния и выбранного управления;уо начальное состояние процесса.
Примем, что на состояние процесса и управление наложены некоторые ограничения, которые символически можно записать в следующем виде: ( У м Л ) ^ 4 (6.5) Будем считать, что каждому этапу процесса можно поставить в соответствие количественную оценку <р„характеризующую качество управления xt при переходе из состояния y t.\ в состояние у,: <Р, =(Ум»-Ч).
<=1,2 , Г.
(6.6) Также примем, что суммарная количественная оценка (функционал качещ ства управления Ф), характеризующая качество управления на интервале от /1 до /2, является суммой количественных оценок а Ф = 1 > Д y,-vx,).
(6.7) i t \ Необходимо на каждом шаге t выбирать управление xt таким образом, чтобы суммарная количественная оценка Ф за весь горизонт планирования была максимальной: г Ф = OVi»х»>+ % (У Т) max, (6.8) /^/0 х< гдеугсостояние процесса на последнем шаге.
# .
Задача (6.1)-(6.В) задача оптимального управления.
В принятых обозначениях она формулируется так: найти такие управления
xt и фазовую траекторию у = (yi, ...,ут\ чтобы удовлетворить системе разностных уравнений (6.1), начальным.условиям (6.4), ограничениям (6.2), (6.3), (6.5) и получить макси248

[стр.,249]

мальное на множестве пар {уг, *,}, подчиняющееся условиям (6.6)-(6.7), значение критерия (6.8).
Найденные в результате решения задачи (6.1)-(6.8) управление х = (Зс,,..., хг) и траекторию у = ( у] у т) будем называть оптимальным управлением и оптимальной фазовой траекторией соответственно.
Задача
(6.1)-(6.8) задача дискретной оптимизации, поскольку вектор х = (5с,,..., хт) нужно выбирать из конечного множества, а состояния однозначно определяются выбранными управлениями.
Поскольку состояние процесса у, в периоде t зависит только от состояния у,.\ на предыдущем шаге и от выбранного на этом шаге управления xt , то задача (6.1)-(6.8) является марковской.
Рассмотрение только марковских задач не ограничивает общности, поскольку можно показать, что немарковской задаче можно поставить в соответствие марковскую задачу с расширенным множеством состояний [53, 82, 143].
Для решения задачи дискретной динамической оптимизации используем одну из схем последовательного анализа вариантов метод динамического программирования, позволяющий представить решение задачи дискретного оптимального управления в виде последовательности шагов, на каждом из которых решается более простая по сравнению с исходной задача.
Обозначим
Ф(/,у,) —оптимальное значение функционала качества управления на интервале от Г0 до t.
Рекуррентные соотношения, связывающие
между собой последовательные оптимальные значения функционала качества Ф(/,у,), записываются на основе принципа оптимальности динамического программирования.
В соответствии с этим принципом любой конечный отрезок оптимальной фазовой траектории также представляет собой оптимальную траекторию.
Для вывода необходимых рекуррентных соотношений будем рассуждать следующим образом.
Пусть найдено оптимальное значение Ф(Г-1,уг.,) функционала качества управления за (Г-1) шагов.
Тогда для расчета оптимального значения функционала качества управления за Г шагов нужно оптимизировать одношаговый показатель качества управления г/?„т.е.
249

[Back]