129 между собой последовательные оптимальные значения функционала качества <35(г,у,), записываются на основе принципа оптимальности динамического программирования. В соответствии с этим принципом любой конечный отрезок оптимальной фазовой траектории также представляет собой оптимальную траекторию. Для вывода необходимых рекуррентных соотношений будем рассуждать следующим образом. Пусть найдено оптимальное значение Ф(Т1,у,_,)функционала качества управления за (Т-1) шагов. Тогда для расчета оптимального значения функционала качества управления за Т шагов нужно оптимизировать одношаговый показатель качества управления <р,т.е.: Аналогичные рассуждения можно провести для всех предыдущих шагов процесса. Таким образом, учитывая (3.60), приходим к соотношению: где уо—начальное состояние процесса. Соотношение (3.68) и представляет собой уравнение Р. Веллмана. Для переменных системы моделей динамической оптимизации инвестиционных потоков производственного предприятия будем использовать следующие обозначения (часть обозначений использовалась выше): t шаг (период) реализации инвестиционного проекта; Inv(t) планируемый для шага t объем инвестиций; / общее количество наименований выпускаемых изделий; X\'1}(t) наибольший прогнозируемый объем спроса на г'-е изделие; х м (() наименьший технологически допустимый объем выпуска i-го изделия; А (?) —объем выпуска г-го изделия; R(t) стоимостная оценка результата деятельности предприятия; <2>(7\у т) = тах[р, (уг_,,х,)+ Ф{Т 1,у т,)]. (3.67) (3.68) |
мальное на множестве пар {уг, *,}, подчиняющееся условиям (6.6)-(6.7), значение критерия (6.8). Найденные в результате решения задачи (6.1)-(6.8) управление х = (Зс,,..., хг) и траекторию у = ( у] у т) будем называть оптимальным управлением и оптимальной фазовой траекторией соответственно. Задача (6.1)-(6.8) задача дискретной оптимизации, поскольку вектор х = (5с,,..., хт) нужно выбирать из конечного множества, а состояния однозначно определяются выбранными управлениями. Поскольку состояние процесса у, в периоде t зависит только от состояния у,.\ на предыдущем шаге и от выбранного на этом шаге управления xt , то задача (6.1)-(6.8) является марковской. Рассмотрение только марковских задач не ограничивает общности, поскольку можно показать, что немарковской задаче можно поставить в соответствие марковскую задачу с расширенным множеством состояний [53, 82, 143]. Для решения задачи дискретной динамической оптимизации используем одну из схем последовательного анализа вариантов метод динамического программирования, позволяющий представить решение задачи дискретного оптимального управления в виде последовательности шагов, на каждом из которых решается более простая по сравнению с исходной задача. Обозначим Ф(/,у,) —оптимальное значение функционала качества управления на интервале от Г0 до t. Рекуррентные соотношения, связывающие между собой последовательные оптимальные значения функционала качества Ф(/,у,), записываются на основе принципа оптимальности динамического программирования. В соответствии с этим принципом любой конечный отрезок оптимальной фазовой траектории также представляет собой оптимальную траекторию. Для вывода необходимых рекуррентных соотношений будем рассуждать следующим образом. Пусть найдено оптимальное значение Ф(Г-1,уг.,) функционала качества управления за (Г-1) шагов. Тогда для расчета оптимального значения функционала качества управления за Г шагов нужно оптимизировать одношаговый показатель качества управления г/?„т.е. 249 (6.9)Ф(^т)=тах[рДуг_,хг)+Ф(Г-1,>’г-,)].X<«;Xt Аналогичные рассуждения можно провести для всех предыдущих шагов процесса. Таким образом, учитывая (6.2), приходим к соотношению: т &(Т,Ут) max[^0(y0,x, )+ £ $ » ,(У,-1.*,)], (6 .10) X'tx, м где у0начальное состояние процесса. Соотношение (6.10) и представляет собой уравнение Р. Беллмана. Для переменных системы моделей динамической оптимизации инвестиционных потоков машиностроительного предприятия будем использовать следующие обозначения (часть обозначений использовалась выше):. t шаг (период) реализации инвестиционного проекта; / « с о —планируемый для шага t объем инвестиций; / общее количество наименований выпускаемых изделий; X \d)(t) наибольший прогнозируемый объем спроса нач-е изделие; наименьший технологически допустимый объем выпуска /-го изделия; X i (t) -об ъ ем выпуска /-го изделия; R(t) стоимостная оценка результата деятельности предприятия; * A(t) ~ амортизационные отчисления; Iz{t) полные производственные издержки; m валовая прибыль предприятия (выручка за вычетом издержек); н о чистая прибыль; 7(0 ставка налоговых отчислений; М -о б щ ее количество типов ОТО; bm(t) количество единиц ОТО типа m ( m = О ? ); |