Проверяемый текст
Новиков Д.А., Иващенко А.А. Модели и методы организационного управления инновационным развитием фирмы. – М.: КомКнига, 2006
[стр. 83]

9 83 I I I выми функциями.
Целевая функция центра представляет собой разность между его доходом h(z) и суммарным вознаграждением, выплачиваемым агентам, то есть
ф(с<-).
z) = h(z) УстДг,), (2.4.1) ieN где ofei) стимулирование /-го агента, ф ) = (cr;(z/), cr^zj), crn(zn)).
Целевая функция /-го агента представляет собой разность между стимулированием, получаемым им от центра, и затратами с,(у), то есть: Ж Ф ), У) = Ф д ~ Ф ), i е N.
(2.4.2) Примем следующий порядок функционирования ОС.
Центру и агентам на момент принятия
решений о выбираемых стратегиях (соответственно
функциях стимулирования и действиях) известны целевые функции и допустимые множества всех участников ОС, а также функции агрегирования.
Центр, обладая правом первого хода, выбирает функции стимулирования и сообщает их агентам, после чего агенты при известных функциях стимулирования
выбирают действия, максимизирующие их
целевьуе функции.
Рассмотрим случай, когда центр наблюдает только результаты деятельности
агентов, от которых зависит его доход h(z), но не знает и не может восстановить индивидуальных
действии агентов, то есть, имеет место агрегирование информации центр имеет не всю информацию о векторе у е А действий агентов, а ему известен лишь некоторый их агрегат z е В параметр, характеризующий результаты совместных действий агентов.
Отметим, что в рассмотренной в п.
2.3 задаче стимулирования декомпозиция игры агентов основывалась на возможности центра поощрять агентов за выбор определенного (и наблюдаемого; центром) действия.
Если действия агентов не наблюдаемы, то непосредственное применение идеи декомпозиции невозможно, поэтому при решении задач стимулирования, в которых вознаграждение агентов зависит от агрегированных результатов деятельности, следует использовать подход, описанный для одноэлементной системы в п.
2.2 найти I множество действий, приводящих к заданным результатам деятельности, выде
[стр. 112]

112 ваемой функцией агрегирования) их действий: z = Q(y, a), где a – параметр, отражающий «технологию» деятельности и характеризующий центр.
Интересы и предпочтения участников ОС – центра и агентов – выражены их целевыми функциями.
Целевая функция центра является функционалом F(s, z) и представляет собой разность между его доходом l z, где l может интерпретироваться как рыночная цена, и суммарным вознаграждением u(z, r), выплачиваемым агентам: u(z, r) = å= n i i rz 1 ),(s , где si(z, r) – стимулирование i-го агента, s(z, r) = (s1(z, r), s2(z, r), …, sn(z, r)), то есть (1) F(s(×), z, l, r) = l z – å= n i i rz 1 ),(s .
Целевая функция i-го агента является функционалом fi(si, yi, ri) и представляет собой разность между стимулированием, получаемым им от центра, и затратами ci(yi, ri), то есть: (2) fi(si(×), z, y, r) = si(z, r) – ci(y, ri), i Î N.
Отметим, что индивидуальное вознаграждение i-го агента в общем случае явным или неявным образом зависит от действий и типов всех агентов (случай сильно связанных агентов [171]).
Примем следующий порядок функционирования ОС.
Центру и агентам на момент принятия решений о выбираемых стратегиях (соответственно
функциях стимулирования и действиях) известны целевые функции и допустимые множества всех участников ОС, а также функция агрегирования.
Центр, обладая правом первого хода, выбирает функции стимулирования и сообщает их агентам, после чего агенты при известных функциях стимулирования выбирают действия, максимизирующие их
целевые функции.
Рассмотрим случай, когда центр наблюдает только результат деятельности
ОС, от которого зависит его доход, но не знает и не может восстановить индивидуальных действий агентов, то есть, имеет место агрегирование информации – центр имеет не всю информацию о действиях агентов, а ему известен лишь некоторый их агрегат.


[стр.,233]

233 ков ОС – центра и агентов – выражены их целевыми функциями.
Целевая функция центра F(s, y) представляет собой разность между его доходом H(y) и суммарным вознаграждением u(y), выплачиваемым агентам: u(y) = å= n i i y 1 )(s , где si(y) – стимулирование i-го агента, s(y) = (s1(y), s2(y), …, sn(y)).
Целевая функция i-го агента fi(si, y) – разность между стимулированием, получаемым от центра, и затратами ci(y), то есть: (1) F(s, y) = H(y) – å = n i i y 1 )(s .
(2) fi(si, y) = si(y) – ci(y), i Î N.
Отметим, что и индивидуальное вознаграждение, и индивидуальные затраты i-го агента по выбору действия yi в общем случае зависят от действий всех агентов (случай сильно связанных агентов с несепарабельными затратами).
Примем следующий порядок функционирования ОС.
Центру и агентам на момент принятия
решения о выбираемых стратегиях (соответственнофункциях стимулирования и действиях) известны целевые функции и допустимые множества всех участников ОС.
Центр, обладая правом первого хода, выбирает функции стимулирования и сообщает их агентам, после чего агенты при известных функциях стимулирования
одновременно и независимо выбирают действия, максимизирующие их целевые функции.
Обобщая предложенную в [171] модель, относительно параметров ОС введем следующие предположения: множество Ai допустимых действий i-го агента является компактом в ik  ; функции затрат агентов непрерывны, неотрицательны и $ yLCA i Î Ai, такое, что " y-i Î A-i arg ii Ay Î min ci(yi, y-i) = yLCA i, причем " y-i Î A-i ci(yLCA i, y-i) = 0; функция дохода центра непрерывна по всем переменным и достигает максимума при векторе действий агентов, отличном от yLCA = (yLCA 1, yLCA 2, ..., yLCA n).


[стр.,236]

236 Утверждение 5.3.
При n ³ 2, k ³ 2 и отсутствии агрегирования, система стимулирования (7), (8) d-оптимальна.
Таким образом, в настоящем подразделе посредством обобщения результатов, полученных в [171], решена задача синтеза оптимальной многокритериальной системы стимулирования в многоэлементных ОС без агрегирования информации (утверждение 5.3).
Перейдем к описанию случая агрегирования информации.
5.2.3.
Стимулирование за коллективные результаты Пусть в рамках модели, рассмотренной в предыдущем подразделе, имеет место агрегирование информации, то есть результат деятельности z Î B ОС, состоящей из n агентов, является функцией их действий: zi = Qi(y), i Î N.
Интересы и предпочтения участников ОС – центра и агентов – выражены их целевыми функциями.
Целевая функция центра представляет собой разность между его доходом h(z) и суммарным вознаграждением, выплачиваемым агентам, то есть
(1) F(s(×), z) = h(z) – åÎNi ii z )(s , где si(zi) – стимулирование i-го агента, s(z) = (s1(z1), s2(z2), …, sn(zn)).
Целевая функция i-го агента представляет собой разность между стимулированием, получаемым им от центра, и затратами ci(y), то есть: (2) fi(si(×), y) = si(zi) – ci(y), i Î N.
Примем следующий порядок функционирования ОС.
Центру и агентам на момент принятия решений о выбираемых стратегиях (соответственно
функциях стимулирования и действиях) известны целевые функции и допустимые множества всех участников ОС, а также функции агрегирования.
Центр, обладая правом первого хода, выбирает функции стимулирования и сообщает их агентам, после чего агенты при известных функциях стимулирования выбирают действия, максимизирующие их
целевые функции.
Рассмотрим случай, когда центр наблюдает только результаты деятельности агентов, от которых зависит его доход h(z), но не знает и не может восстановить индивидуальных
действий агентов

[Back]