Процедура реш ения задачи методом динамического программирования (ДП) Для описания процедуры методом динамического программирования введем некоторые новые обозначения. Поскольку процесс ДГ1 разворачивается с конца, нам придется ввести специальное обозначение для суммы выплат, формирующейся за несколько последних шагов процесса. Пусть РСу сумма выплат по кредиту за последний шаг, Р С ^ \^ — сумма выплат за два последних шага,..., РСд/-»и., сумма выплат за последние (ТУ,..,/) шага, начиная с/-го и заканчивая Л^-м. Процесс оптимизации методом ДГ1 начинается с последнего я-го шага. Пусть в начале п-го шага система находится в состоянии ¿V. Тогда выплата за кредит на последнем шаге будет: Предположим, что значение РСдч нам известно, и найдём условное управление на последнем шаге находится как значение при котором величина РСн достигает минимума: (3.2.6) Согласно (3.2.4) запишем выражение (3.2.6) в виде: (3.2.7) оптимальное управление г/ д г (номер кредитного источника). Это 90 |
171 оптимизируется управление только этого шага. Вместе с тем на каждом шаге управление выбирается с учётом его последствий, так как управление, оптимизирующее целевую функцию только для данного шага, может привести к неоптимальному эффекту всего процесса. Это основное правило динамического программирования, сформулированное Р. Веллманом, называется принципом оптимальности. Использование этого принципа гарантирует, что управление, выбранное на любом шаге, является не локально лучшим, а лучшим с точки зрения процесса в целом. Сформулируем нашу задачу в терминах ДП. Физическая система S, которой мы будем управлять, представляет собой группу кредитных источников с полученными от них средствами. Задание планировать на п этапов даёт естественное членение процесса на п шагов. Ситуацию (состояние системы) перед началом j го шага условимся характеризовать величиной Sj. В состояние Sj система переходит из состояния Sj.1 под воздействием управления uj.\. Зависимость 5;(5}.,гл.) состояния системы на у'-м шаге от состояния на (/-1)-м и управления в нашем случае имеет вид (3.7.5). В качестве критерия оценки затрат на кредитование в результате применённого управления на каждом шаге будем использовать сумму выплат PCj, которую можно рассчитать по формуле: Sj0 4 d j d H ) ^ U = o PC, (3.5.8) ------------365 -,х = 1 1-(d , d , .)---— K J н 365 Для описания процедуры метода динамического программирования введем некоторые новые обозначения. Поскольку процесс ДП разворачивается с конца, нам придется ввести специальное обозначение для суммы выплат, формирующейся за несколько последних шагов процесса. |