10.private strategies in games with imperfect public monitoring
DESCRIPTION
10.Private Strategies in Games with Imperfect Public Monitoring. 北木 真. アウトライン. Sequential Equilibrium A Reduced-Form Example Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma. 公的戦略と私的戦略. 行動: E ( Effort ), S ( Shirk ) { y,y } :公的シグナル Public strategies : σ , σ - PowerPoint PPT PresentationTRANSCRIPT
![Page 1: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/1.jpg)
10.Private Strategies in Games with
Imperfect Public Monitoring
北木 真
1
![Page 2: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/2.jpg)
アウトライン Sequential Equilibrium A Reduced-Form Example Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma
2
![Page 3: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/3.jpg)
公的戦略と私的戦略 行動: E ( Effort ), S ( Shirk ) {y,y} :公的シグナル Public strategies : σ , σ
公的シグナルによってのみ定まる
Private strategies : σ シグナル y に続く 2 期の行動は, 1 期の行動に依存
3
-
-- ~^
![Page 4: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/4.jpg)
Sequential Equilibrium 定義
任意の行動 a に対するシグナル y の観測確率 ρ ( y|a )は正であると仮定
任意の自分の履歴 に対して, がに対して最適反応⇒ 戦略プロファイル σ は sequential equilibrium(但し,
)
4
![Page 5: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/5.jpg)
アウトライン Sequential Equilibrium A Reduced-Form Example Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma
5
![Page 6: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/6.jpg)
A Reduced-Form Example 1 期目は左, 2 期目は右のゲームを行う
シグナル y の観測確率 ρ a :行動, y,y :シグナル p=9/10 , q=4/5 , r=1/5 と仮定
2 回のゲームにおける利得: (1-δ)u1+δu2 δ=25/27 と仮定
6
--
-
![Page 7: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/7.jpg)
各戦略の期待利得 Pure Strategies
1 期は EE , 2 期では y のときは RR ,それ以外はPP
左辺の式より期待利得は 1.4815
Public Correlation 1 期は E ,次は y の観測後は R , y の観測後は確率
Φ で R を選択 Φ=0.5 かつ期待利得は 1.5556
7
-
--
![Page 8: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/8.jpg)
各戦略の期待利得 Mixed Public Strategies
1 期は確率 α で E , 2 期は y の観測後は R , y の観測後は確率 Φ で R を選択
より,期待利得は1.5566 ( α = 0.969 ,
Φ=0.567 ) 8
--
![Page 9: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/9.jpg)
各戦略の期待利得 Private Strategies
1 期は確率 α で E を選択 2 期は 1 期で S が選ばれ, y を観測した後は確率 ξ
で R を選択,それ以外の場合は必ず R を選択
より,期待利得は 1.5864 ( α =0.916 , ξ = 0 )
9
-
![Page 10: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/10.jpg)
アウトライン Sequential Equilibrium A Reduced-Form Example Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma
10
![Page 11: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/11.jpg)
Two-Period Examples ただ一つのナッシュ均衡を持つゲーム 右のナッシュ均衡
プレイヤ1: r1 か r2 を等確率 プレイヤ2: c1 か c2 を等確率
公的シグナル Y={y,y} のうち,y が観測される確率 ρ(y|r c ):
11
--
- - ji
![Page 12: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/12.jpg)
PPE と重複しない均衡
12
1 期の各プレイヤーの行動:
2 期のプレイヤ1の行動:
2 期のプレイヤ2の行動:
![Page 13: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/13.jpg)
PPE と重複しない均衡
13
何故, 1 期でプレイヤ1は r3 を選択? r2 を選択すると, 2 期でプレイヤ2は確率 0.1 で
c1 , 0.9 で c2 を選択 プレイヤ1の期待利得は, r3 の選択より減少
均衡戦略が public 1 期の行動は 2 期の行動に影響を与えないため,最
適反応から外れた戦略を取る誘因が発生しない⇒ PPE
一方,プレイヤ2の private strategy は 2 期のゲームにおいて correlated equilibrium を構成 2 期においてナッシュ均衡を構成する必要はない
![Page 14: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/14.jpg)
Correlation による利得
14
右のゲームにおける均衡 Nash : (1,1) Correlation : (3/2,3/2)
各シグナル y1,y2,y3 の観測確率:
![Page 15: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/15.jpg)
Correlation による利得 1 期は 3 つの行動を等確率で 1 つ選択 各プレイヤの 2 期の行動:
r4=r1 , c4=c1 , r0=r3 , c0=c3 とする
2 期の戦略は correlated equilibirum を構成
15
![Page 16: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/16.jpg)
複数のナッシュ均衡があるゲーム
16
プレイヤ1は縦,2は横,3は左か右の表から行動を選択 プレイヤ3にとって R は L を支配
ナッシュ均衡 LRR か RLR を選択:利得( 1,1,12 ) プレイヤー1と2が 1/3 で L を選択:利得
( 1/3,1/3,74/9)
![Page 17: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/17.jpg)
さらに大きな利得を得る シグナル Y={y0,y1,y2,y3} を考える
l : 1 期で L を選択したプレイヤの人数 yl の観測確率は 1-3ε ( ym ( m≠l )の観測確率は
ε ) 各プレイヤの 1 期の行動:
1 期では比較的 LLL が選択される
17
![Page 18: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/18.jpg)
さらに大きな利得を得る
18
各プレイヤの 2 期の行動
ε が十分に小さければ, 2 期はほぼナッシュ均衡となる
![Page 19: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/19.jpg)
さらに大きな利得を得る
19
プレイヤ1と2の2 期の期待利得:
プレイヤ3の 2 期の期待利得 1 期で L を選択:高確率で y3 が観測され,利得は
12 R を選択:高確率で y2 が観測され,利得は 0
ε→0 のとき,利得は (6,6,26.22 )に近づく ナッシュ均衡による利得より大きい
![Page 20: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/20.jpg)
アウトライン Sequential Equilibrium A Reduced-Form Example Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma
20
![Page 21: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/21.jpg)
Public Transitions 右の囚人のジレンマを無限回繰り返す 2 つの公的シグナル y,y のうち, y の観測確率 ρ :
ここでは p>0 , q=0 と仮定 戦略のオートマトン表現
wR :確率 α で E を選択 wP : S を選択 各プレイヤは常に 同じ状態
21
--
-
![Page 22: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/22.jpg)
Public Transitions
22
wR における期待利得 V(wR) E を選択した場合: S を選択した場合: wP における期待利得は 0
wR における行動が無差別⇒ このとき,
各プレイヤが辛抱強い( δ が 1 に近い)とき, α は1 に近づき, V(wR) は 2 に近づく
この場合, PPE によって達成可能な利得 2-(1-p)/pより大きい
![Page 23: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/23.jpg)
q>0 のとき
23
q=0 のときと同じ戦略は均衡ではない プレイヤ1の履歴 Ey , (Ey)k を考える Ey 観測後,プレイヤ2が状態 wR である確率 β0(q)
β0(0)=1 同様にして次の確率 βk(q)を考える:
k→∞ のとき, βk(q) は 0 に近づく プレイヤ1はプレイヤ2がほぼ確実に wP の状態で
あると考え, E の選択をやめる
--
-
![Page 24: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/24.jpg)
Belief-free Equilibrium
24
右の囚人のジレンマにおけるBelief-free equilibrium( 14 章で述べられる)を示す 2 つの公的シグナル y,y のうち,y の観測確率 ρ : -
--
![Page 25: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/25.jpg)
Belief-free Equilibrium
25
戦略のオートマトン表現 wR :確率 αR で Eを選択 WP : S を選択
Vxi(ai) :プレイヤ j の状態が wx で,プレイヤi が ai 選択をした場合のプレイヤ i の利得 VRi(E)=Vri(S)≡VR , VPi(E)=Vpi(S)≡VP
![Page 26: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/26.jpg)
Belief-free Equilibrium VR について:
VP について:
これらの等式を解くことにより,確率 β が求められる
26
![Page 27: 10.Private Strategies in Games with Imperfect Public Monitoring](https://reader035.vdocuments.net/reader035/viewer/2022062722/56813a28550346895da20e2a/html5/thumbnails/27.jpg)
Belief-free Equilibrium
27
β によって,次の等式が導かれる
δ = 1 , αR=1 は等式を満たす p=1/2 , q=1/2-ε , r=ε , b は 2 に近い場合を考
える このとき, 1 に近い δ<1 について, 1 に近い
αR<1 が存在し,それは上の等式を満たす