Проверяемый текст
Новиков Д.А., Иващенко А.А. Модели и методы организационного управления инновационным развитием фирмы. – М.: КомКнига, 2006
[стр. 78]

78 Оптимальный реализуемый результат деятельности может быть найден из » » I решения следующей стандартной оптимизационной задачи z = arg max [h(x) —С(х)].
(2.2.11) хеВ Утверждение 2.
При п = 1, к >2 и наличии агрегирования в рамках гипотезы благожелательности система стимулирования (2.2.10), (2.2.11) оптимальна.
Таким образом, в настоящем подразделе
получено решение задачи синтеза оптимальной многокритериальной системы стимулирования в одноэлементной ОС как для случая отсутствия агрегирования
информации (утверждение 1), так и для случая агрегирования информации (утверждение 2).
Завершив рассмотрение механизмов стимулирования в одноэлементных ОС, перейдем к описанию механизмов'многокритериального стимулирования в многоэлементных ОС.

2.3.
Стимулирование за индивидуальные результаты Простейшим обобщением базовой одноэлементной модели является многоэлементная ОС с независимыми (невзаимодействующими) агентами.
В этом случае задача стимулирования распадается на набор одноэлементных задач
[8АЛ* Если ввести общие для всех или ряда агентов ограничения на механизм стимулирования, то получается задача стимулирования в ОС со слабо связанными агентами, представляющая собой набор параметрических одноэлементных задач, для которого проблема поиска » оптимальных значении параметров решается стандартными методами условной оптимизации [84], Если агенты взаимосвязаны (в настоящей работе не рассматривается ситуация, когда существуют общие ограничения на множества допустимых состояний, планов, действий и т.д.
агентов
—этот случай подробно описан в [81, 91]), то есть затраты и стимулирование агента зависят, помимо его собственных действий, от действий других агентов, то получается «полноценная»
[стр. 231]

231 Выше мы рассматривали случай отсутствия агрегирования информации.
Теперь предположим, что агрегирование информации имеет место, то есть доход центра h(z) зависит от наблюдаемого им результата деятельности агента z = Q(y) Î B Í Â m , причем m £ k, где Q(×): A ® B – однозначное непрерывное отображение, такое, что U Ay yQ Î )( = B.
Отметим, что при этом предполагается, что оператор агрегирования и функция затрат агента центру известны, а действия не наблюдаются.
Фиксируем произвольный результат деятельности агента z Î B и вычислим, во-первых, множество его действий, приводящих к данному результату: (8) Y(z) = {y Î A Q(y) = z}, и, во-вторых, минимальные затраты агента по достижению данного результата: (9) C(z) = )( min zYyÎ c(y).
Рассмотрим систему стимулирования (10) sK(x, z) = î í ì ¹ = xz xzxC ,0 ,)( , x, z Î B.
Видно, что система стимулирования (10) в рамках гипотезы благожелательности (при прочих равных агент выберет действия, наиболее благоприятные с точки зрения центра) побуждает агента выбрать действия, приводящие к «плановому результату» x Î B, причем затраты центра на стимулирование при этом минимальны.
Оптимальный реализуемый результат деятельности может быть найден из
решения следующей стандартной оптимизационной задачи (11) z* = arg BxÎ max [h(x) – C(x)].
Утверждение 5.2.
При n = 1, k ³ 2 и наличии агрегирования в рамках гипотезы благожелательности система стимулирования (10), (11) оптимальна.
Таким образом, в настоящем подразделе получено решение задачи синтеза оптимальной многокритериальной системы стимулирования в одноэлементной ОС как для случая отсутствия агреги


[стр.,232]

232 рования информации (утверждение 5.1), так и для случая агрегирования информации (утверждение 5.2).
Завершив рассмотрение механизмов стимулирования в одноэлементных ОС, перейдем к описанию механизмов многокритериального стимулирования в многоэлементных ОС.

5.2.2.
Стимулирование за индивидуальные результаты Простейшим обобщением базовой одноэлементной модели является многоэлементная ОС с независимыми (невзаимодействующими) агентами.
В этом случае задача стимулирования распадается на набор одноэлементных задач
[163].
Если ввести общие для всех или ряда агентов ограничения на механизм стимулирования, то получается задача стимулирования в ОС со слабо связанными агентами, представляющая собой набор параметрических одноэлементных задач, для которого проблема поиска оптимальных
значений параметров решается стандартными методами условной оптимизации [163].
Если агенты взаимосвязаны (в настоящей главе не рассматривается ситуация, когда существуют общие ограничения на множества допустимых состояний, планов, действий и т.д.
агентов
– этот случай подробно описан в [170]), то есть затраты и стимулирование агента зависят, помимо его собственных действий, от действий других агентов, то получается «полноценная» многоэлементная модель стимулирования, описываемая в настоящем подразделе.
Предположим пока, что агрегирование информации отсутствует (ситуация, когда агрегирование имеет место, рассматривается в следующем подразделе).
Пусть N = {1, 2, …, n} – множество агентов, yi Î Ai – действие i-го агента, ci(y) – скалярные затраты i-го агента, si(y) – скалярное стимулирование этого агента со стороны центра, i Î N, y = (y1, y2, …, yn) – вектор действий агентов, y Î A = ÕÎNi iA .
Предположим, что центр получает доход H(y) от деятельности агентов.
Обозначим y-i = (y1, y2, …, yi-1, yi+1, …, yn) Î A-i = Õ ¹ij jA – обстановка игры для i-го агента.
Интересы и предпочтения участни

[стр.,236]

236 Утверждение 5.3.
При n ³ 2, k ³ 2 и отсутствии агрегирования, система стимулирования (7), (8) d-оптимальна.
Таким образом, в настоящем подразделе
посредством обобщения результатов, полученных в [171], решена задача синтеза оптимальной многокритериальной системы стимулирования в многоэлементных ОС без агрегирования информации (утверждение 5.3).
Перейдем к описанию случая агрегирования информации.
5.2.3.
Стимулирование за коллективные результаты Пусть в рамках модели, рассмотренной в предыдущем подразделе, имеет место агрегирование информации, то есть результат деятельности z Î B ОС, состоящей из n агентов, является функцией их действий: zi = Qi(y), i Î N.
Интересы и предпочтения участников ОС – центра и агентов – выражены их целевыми функциями.
Целевая функция центра представляет собой разность между его доходом h(z) и суммарным вознаграждением, выплачиваемым агентам, то есть (1) F(s(×), z) = h(z) – åÎNi ii z )(s , где si(zi) – стимулирование i-го агента, s(z) = (s1(z1), s2(z2), …, sn(zn)).
Целевая функция i-го агента представляет собой разность между стимулированием, получаемым им от центра, и затратами ci(y), то есть: (2) fi(si(×), y) = si(zi) – ci(y), i Î N.
Примем следующий порядок функционирования ОС.
Центру и агентам на момент принятия решений о выбираемых стратегиях (соответственно – функциях стимулирования и действиях) известны целевые функции и допустимые множества всех участников ОС, а также функции агрегирования.
Центр, обладая правом первого хода, выбирает функции стимулирования и сообщает их агентам, после чего агенты при известных функциях стимулирования выбирают действия, максимизирующие их целевые функции.
Рассмотрим случай, когда центр наблюдает только результаты деятельности агентов, от которых зависит его доход h(z), но не знает и не может восстановить индивидуальных действий агентов

[Back]