Проверяемый текст
Кочиева, Таиса Багратовна. Исследование и разработка моделей базовых систем стимулирования в активных системах (Диссертация 2000)
[стр. 25]

точки, необходимо доопределить (с точки зрения предположений центра о поведении агента) выбор агента.
Если
не оговорено особо, то в ходе последующего изложения будем считать выполненной гипотезу благожелательности (ГБ), которая заключается в следующем: если агент безразличен между выбором нескольких действий (например, действий, на которых достигается глобальный максимум его целевой функции), то он выбирает из этих действий то действие, которое наиболее благоприятно для центра.
Итак, в рамках ГБ агент выбирает из множества (3) наиболее благоприятное для центра действие, следовательно, эффективность системы стимулирования стеМ равна: (4) К (а)= т а Х ФМ уеР{<т) где Ф(у) определяется (2).
Если отказаться от гипотезы благожелательности, то следует вместо эффективности (4) стимулирования использовать гарантированную эффективность к М ) = т ъ х ф (у) уеР(<х) Прямая задача синтеза оптимальной системы стимулирования заключается в выборе допустимой системы стимулирования, имеющей максимальную эффективность: (5) К { с г ) max.
' аеМ или максимальную гарантированную эффективность: К„(сг)-» шах g4 У сеМ Система стимулирования <т’(*), являющаяся решением задачи (5), то есть имеющая максимальную эффективность, называется оптимальной: 25 Обратная задача стимулирования заключается в поиске множества систем стимулирования, реализующих заданное действие.
[стр. 14]

множеством реализуемых действий, зависит от используемой центром системы стимулирования.
Основная идея стимулирования как раз и заключается в том, что, варьируя систему стимулирования, центр может побуждать агента выбирать те или иные действия.
Так как целевая функция центра зависит от действия, выбираемого агентом, то эффективностью системы стимулирования называется (максимальное или минимальное) значение целевой функции центра на множестве действий агента, реализуемых данной системой стимулирования.
Следовательно, задача стимулирования заключается в том, чтобы выбрать оптимальную систему стимулирования, то есть систему стимулирования, имеющую максимальную эффективность.
Приведем формальные определения.
Множество действий агента, доставляющих максимум его целевой функции (и, естественно, зависящее от функции стимулирования), называется множеством решений игры или множеством действий, реализуемых данной системой стимулирования'.
(4) Р(<т) = Arg max {oiy) с(у)}.
yeA Зная, что агент выбирает действия из множества (4), центр должен найти систему стимулирования, которая максимизировала бы его собственную целевую функцию.
Так как множество Р(о) может содержать более одной точки, необходимо доопределить (с точки зрения предположений центра о поведении агента) выбор агента.
Если
выполнена гипотеза благожелательности (ГБ), которую мы будем считать имеющей место, если не оговорено особо, в ходе дальнейшего изложения, то агент выбирает из множества (4) наиболее благоприятное для центра действие.
Альтернативой для центра является расчет на наихудший для него выбор агента из множества решений игры.
Соответственно, различают эффективность системы стимулирования сг еМ: л Гипотеза благожелательности заключается в следующем: если агент безразличен между выбором нескольких действий (например, действий, на которых достигается глобальный максимум его целевой функции), то он выбирает из этих действий то действие, Ч * 44

[стр.,15]

15 (5) К{о) = max Ф(у) уъР(<т) к и ее гарантированную эффективность (6) Kg{а) = min Ф(у), уеР(ст) где Ф(у) определяется либо (2), либо (3) (соответственно, задачи стимулирования первого и второго рода [72]).
Прямая задача синтеза оптимальной системы стимулирования заключается в выборе допустимой системы стимулирования, имеющей максимальную эффективность
(или максимальную гарантированную эффективность): (7) К(сг) max; (8) Kg{d) max.
стеЛ/ Отметим, что решения задач (7) и (8) в общем случае не совпадают (см.
подробности в [46, 72]).
Обратная задача стимулирования заключается в поиске множества систем стимулирования, реализующих заданное действие,
или в более общем случае заданное множество действий А а А.
Например, в рамках предпо* + ложения А.З' при А {у } обратная задача может заключаться в поиске £ множества М(у ) систем стимулирования, реализующих это действие, то есть М(у ) = {а е М \у еР{6)}.
Определив М(у ), центр имеет возможность найти в этом множестве "минимальную" систему стимулирования, то есть реализующую заданное действие с минимальными затратами на стимулирование, или систему стимулирования, обладающую какими-либо другими заданными свойствами, например монотонность, линейность и т.д.
Следует отметить, что введенные выше предположения согласованы в следующем смысле.
Агент всегда может выбрать нулевое действие, не треI бующее от него затрат (предположение А.2') и приносящее нулевой доход центру (предположение А.4).
В то же время, центр имеет возможность ничеI го не платить ему за выбор этого действия (см.
предположение А.З).
которое наиболее благоприятно для центра, то есть действие, доставляющее максимум целевой функции центра [14, 71, 72].

[Back]