[invited talk] game theory and radio resource managementoperative game theory and clarify the...

5
社団法人 電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS 信学技報 TECHNICAL REPORT OF IEICE. [招待講演] ゲーム理論と無線リソース制御 山本 高至 京都大学大学院情報学研究科 606-8501 京都市左京区吉田本町 あらまし 無線通信システムにおけるリソース制御や周波数共用といった課題の多くは,干渉という無線特有の相互 作用によって生じる.この相互作用——より正確には複数の意志決定主体間の相互作用——を扱う理論としてゲーム 理論がある.本発表では,非協力ゲーム理論,協力ゲーム理論の基礎を述べるとともに,他の最適化問題との違いを 明確化する.また,ゲーム理論の無線リソース制御への応用について述べる. キーワード ゲーム理論,ナッシュ均衡,無線リソース制御 [Invited Talk] Game Theory and Radio Resource Management Koji YAMAMOTO Graduate School of Informatics, Kyoto University Yoshida-honmachi, Sakyo-ku, Kyoto, 606-8501 Japan Abstract Radio resource management and spectrum sharing techniques in radio communication systems are re- quired to manage interference, which can be treated as a mutual interaction. Such mutual interactions among decision making entities can be discussed using game theory. This talk introduces both non-cooperative and co- operative game theory and clarify the difference between games and other optimization problems. In addition, applications of game theory to radio resource management are discussed. Key words Game theory, Nash equilibrium, radio resource management —1— - 79 - This article is a technical report without peer review, and its polished and/or extended version may be published elsewhere. Copyright ©2012 by IEICE 一般社団法人 電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS 信学技報 IEICE Technical Report RCS2012-14(2012-4)

Upload: others

Post on 12-Oct-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: [Invited Talk] Game Theory and Radio Resource Managementoperative game theory and clarify the difference between games and other optimization problems. In addition, applications of

社団法人 電子情報通信学会THE INSTITUTE OF ELECTRONICS,INFORMATION AND COMMUNICATION ENGINEERS

信学技報TECHNICAL REPORT OF IEICE.

[招待講演] ゲーム理論と無線リソース制御

山本 高至†

† 京都大学大学院情報学研究科 〒 606-8501 京都市左京区吉田本町

あらまし 無線通信システムにおけるリソース制御や周波数共用といった課題の多くは,干渉という無線特有の相互作用によって生じる.この相互作用——より正確には複数の意志決定主体間の相互作用——を扱う理論としてゲーム理論がある.本発表では,非協力ゲーム理論,協力ゲーム理論の基礎を述べるとともに,他の最適化問題との違いを明確化する.また,ゲーム理論の無線リソース制御への応用について述べる.キーワード ゲーム理論,ナッシュ均衡,無線リソース制御

[Invited Talk] Game Theory and Radio Resource Management

Koji YAMAMOTO†

† Graduate School of Informatics, Kyoto University Yoshida-honmachi, Sakyo-ku, Kyoto, 606-8501 Japan

Abstract Radio resource management and spectrum sharing techniques in radio communication systems are re-

quired to manage interference, which can be treated as a mutual interaction. Such mutual interactions among

decision making entities can be discussed using game theory. This talk introduces both non-cooperative and co-

operative game theory and clarify the difference between games and other optimization problems. In addition,

applications of game theory to radio resource management are discussed.

Key words Game theory, Nash equilibrium, radio resource management

— 1 —

- 79 -This article is a technical report without peer review, and its polished and/or extended version may be published elsewhere.

Copyright ©2012 by IEICE

一般社団法人 電子情報通信学会 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS

信学技報 IEICE Technical Report RCS2012-14(2012-4)

Page 2: [Invited Talk] Game Theory and Radio Resource Managementoperative game theory and clarify the difference between games and other optimization problems. In addition, applications of

ゲーム理論

1

主体間の相互作用を扱うことができる理論

「個人合理性」を持つ主体を想定

「ゲーム」とは,ある種の最適化問題

�主体1は自分の目的関数 f1 の値が最大になる選択 x1 をしようとする�目的関数 f1 の値・取るべき選択 x1 は他の主体2の選択結果 x2 に依存�同様に自分の選択結果 x1 が主体2の目的関数 f2 の値にも影響を及ぼす

2

⎧⎨⎩

maxx1

f1(x1, x2)

maxx2

f2(x1, x2)

取り扱いたい問題がこの形になるなら非協力ゲーム理論を使ってその「解」を考えることができる

「戦略形2人ゲーム」:一番シンプルな「非協力ゲーム」

「ゲーム」と他の最適化問題:数学的視点

3

f2

パレートフロンティア片方を上げるにはもう片方を下げざるを得ない

f1

maxx1,x2

f(x1, x2)

maxx1,x2

(f1(x1, x2), f2(x1, x2))多目的最適化問題

単目的最適化問題

複数の,単目的最適化問題の組合せ

⎧⎨⎩

maxx1

f1(x1, x2)

maxx2

f2(x1, x2)

戦略形ゲーム

具体例

4

maxx1,x2

f(x1, x2)

maxx1,x2

(f1(x1, x2), f2(x1, x2))

⎧⎨⎩

maxx1

f1(x1, x2)

maxx2

f2(x1, x2)

多目的最適化問題

単目的最適化問題

戦略形ゲーム

スループットを上げたい

スループットと遅延両方を良くしたい

ユーザ1とユーザ2のスループットを集中制御的に良くしたい

各主体がスループットを上げようとしている

「合理性」

5

maxx1,x2

f(x1, x2)

maxx1,x2

(f1(x1, x2), f2(x1, x2))

⎧⎨⎩

maxx1

f1(x1, x2)

maxx2

f2(x1, x2)

多目的最適化問題

単目的最適化問題

戦略形ゲーム

全体合理性(パレート最適性)

疑問:それは本当に合理的と言えるのか? ↓ 定義です

「個人合理性」 各主体は,利得が最大となる行動を取る

6

fi(x1, x2) > fi(x′1, x

′2),∀i

は    をパレート支配する(x1, x2) (x′1, x

′2)

f2

パレートフロンティア片方を上げるにはもう片方を下げざるを得ない

f1

他の点にパレート支配されない点 || 

パレート最適

- 80 -

Page 3: [Invited Talk] Game Theory and Radio Resource Managementoperative game theory and clarify the difference between games and other optimization problems. In addition, applications of

7

まず,自分の考えている仕組みを単目的・多目的最適化問題 or ゲーム理論の

どの形で定式化すべきか考える

次に,目的関数と変数,その他のパラメータに分ける

(その他,目的関数・変数の制約条件など)

maxx1,x2

f(x1, x2) maxx1,x2

(f1(x1, x2), f2(x1, x2))

⎧⎨⎩

maxx1

f1(x1, x2)

maxx2

f2(x1, x2)

非協力ゲーム理論は役に立つか

�単目的最適化問題の最適解や,多目的最適化問題のパレートフロンティアを求めるために非協力ゲーム理論は使えるか?�そもそも問題が違う

�単目的・多目的最適化問題の最適解を分散的に求めるために非協力ゲーム理論は使えるか?�そもそも問題が違う

�協力すればもっと高くなる場合は,協力するんじゃないの?�拘束力のある「提携」が保証されるのなら協力ゲーム理論が使える�非協力ゲーム理論の枠組みでは議論できない

8

戦略形ゲームの解:ナッシュ均衡(点)

�最適応答�x2 に対する主体1の最適応答 x1* ( x2 の関数)

�ナッシュ均衡�相互に最適応答となる変数の組 (x1*, x2*)

�それ以上自分だけが変数を変更しても,自身の目的関数が向上しない

9

f1(x�1, x2) = max

x1f1(x1, x2)

⎧⎨⎩

f1(x�1, x

�2) = max

x1f1(x1, x

�2)

f2(x�1, x

�2) = max

x2f2(x�

1, x2)

⎧⎨⎩

maxx1

f1(x1, x2)

maxx2

f2(x1, x2)

ゲーム理論における表現

10

最適化理論 ゲーム理論

最適化問題 ゲーム

プレイヤ

変数 x 戦略 s, a

変数の制約条件 戦略空間

目的関数 f 効用関数(利得関数)u

a−i = (a1, . . . , ai−1, ai+1, . . . , aN )(a′

i,a−i) = (a1, . . . , ai−1, a′i, ai+1, . . . , aN )

戦略形ゲームの定義�「戦略形ゲームは,プレイヤ,戦略,効用関数の組で定義される」

�プレイヤ�プレイヤ i の戦略集合�プレイヤ i の効用関数�全プレイヤがこれらの要素全ての情報を持っていると仮定

� これは,次の最適化問題の組み合わせを設定したのと等価

�戦略形N人ゲームのナッシュ均衡点

11

Ai; ai ∈ Ai

ui

{N ,∏

i∈N Ai, {ui}i∈N }

ui(a�i ,a

�−i) = max

ai∈Ai

ui(ai,a�−i), ∀i ∈ N = {1, . . . , N}

⎧⎪⎪⎪⎨⎪⎪⎪⎩

maxa1∈A1

u1(a1, . . . , aN )

...max

aN∈AN

uN (a1, . . . , aN )

N = {1, . . . , N}

12

社会的問題を本当に解決したければプレイヤ,戦略,効用などの構成要素のうち自分の可能な範囲でどれかを変えて

均衡点を動かすしかない

文句を言うだけなのは,問題を解決するという目的に対しては,「合理的」な行動でない

- 81 -

Page 4: [Invited Talk] Game Theory and Radio Resource Managementoperative game theory and clarify the difference between games and other optimization problems. In addition, applications of

無線通信システムにおける「戦略」

�選択に自由度があり,それが他の主体の選択と相互作用する場合には使える

�PHY:送信電力(送信の有無),送信複素信号(送信複素重み),アンテナ指向性

�MAC:チャネル,CWmin�TCP輻輳制御アルゴリズム�接続先基地局,中継局,協力通信での協力相手�使用するサービス(3G or WLAN)

13

システムモデル

14

pi

pj

Gii

Giipi

Gij

Gijpj

∑j �=i

Gijpj + σi2

干渉・雑音電力:

干渉波所望波

リンク容量最大化 ー 分散送信電力制御�プレイヤ:ノード組

�戦略:送信電力

�効用:リンク容量

�最適応答

�効用は自戦略に関して単調増加

�ナッシュ均衡

15

pi ≤ Pi

p�i = Pi

p�i = Pi,∀i

雑音電力

最大電力

pi pj

Gii

Giipi

Gij

Gijpj

ui(pi,p−i) = log2

(1 +

Giipi∑j �=i Gijpj + σi

2

)

∂ui(pi,p−i)∂pi

> 0

i ∈ N = {1, . . . , N}リンクSINR充足 ー 分散送信電力制御

�プレイヤ:ノード組�戦略:送信電力�効用:リンクSINRが目標値 に近い

�最適応答

�Foschiniの分散送信電力制御アルゴリズムと同じ�他リンクの情報なしで,逐次更新でナッシュ均衡に行き着く(実現可能解がある場合)

16

pi

Γi

p�i =

Γi

Gii

⎛⎝∑

j �=i

Gijpj + σi2

⎞⎠ =

Γi

γi(pi,p−i)pi

V. Srivastava, et al., “Using game theory to analyze wireless ad hoc networks,” IEEE Commun. Surveys & Tutorials, vol.7, no.4, pp.46-56, 2005.

ui(pi,p−i) = −(γi(pi,p−i) − Γi)2

γi(pi,p−i) =Giipi∑

j �=i Gijpj + σi2

i ∈ N = {1, . . . , N}

pipj

Gii

Giipi

Gij

Gijpj

分散チャネル選択(固定電力)�プレイヤ:ノード組�戦略:チャネル�効用:被干渉と与干渉の和

17

xi

N. Nie, et al., “Adaptive channel allocation spectrum etiquette for cognitive radio networks,” Mobile Networks and Applications, vol.11, no.6, pp.779-797, Dec. 2006.

ui(xi,x−i) = −∑j �=i

GijPjδxj ,xi−

∑j �=i

GjiPiδxi,xj

i ∈ N = {1, . . . , N}

Gii

Gij

Gji

GiiPi

Pi

Pj

GjiPiδxi,xj

GijPjδxj ,xi

δxi,xj=

{1 xi = xj

0 else

分散チャネル選択(固定電力) 続き�プレイヤ:ノード組�戦略:チャネル�効用:被干渉と与干渉の和

�次の関数 g を定義すると(システム内の干渉の和)

�次の関係が成り立つ(ポテンシャルゲーム)

18

xi

g(xi,x−i) = −12

∑i

∑j �=i

(GijPjδxj ,xi+ GjiPiδxi,xj

)

N. Nie, et al., “Adaptive channel allocation spectrum etiquette for cognitive radio networks,” Mobile Networks and Applications, vol.11, no.6, pp.779-797, Dec. 2006.

ui(xi,x−i) = −∑j �=i

GijPjδxj ,xi−

∑j �=i

GjiPiδxi,xj

ui(x′i,x−i) − ui(xi,x−i) = g(x′

i,x−i) − g(xi,x−i)

i ∈ N = {1, . . . , N}

- 82 -

Page 5: [Invited Talk] Game Theory and Radio Resource Managementoperative game theory and clarify the difference between games and other optimization problems. In addition, applications of

ポテンシャルゲーム�次の関数 g が存在する戦略形ゲームをポテンシャルゲームと呼ぶ

�関数 g をポテンシャル関数と呼ぶ

�1プレイヤが最適応答を逐次的に取ったときの戦略組の変化:

�例えば,プレイヤ i の最適応答により と変わった場合,

�ポテンシャル関数の定義より,

�従って,最適応答の逐次的な選択はポテンシャルを一様に増加させる�戦略空間 が有限であれば,有限回数で収束する�収束点では全プレイヤが最適応答を取っているので,ナッシュ均衡である

19

A =∏

i∈N Ai

ui(a′i,a−i) − ui(ai,a−i) = g(a′

i,a−i) − g(ai,a−i),∀i ∈ N

a(0),a(1),a(2), . . .a(0) → a(1)

ui(a(0)) < ui(a(1))

g(a(0)) < g(a(1))

マルチユーザスケジューリング

20

f2

f1

複数ユーザがいる場合,特性の間にトレードオフそれらを集中制御的にいい感じにしたい

いい感じとは?

功利主義的解 均等解ナッシュ解

∑i∈{1,...,N}

fi(x1, . . . , xN )∏

i∈{1,...,N}fi(x1, . . . , xN ) min

i∈{1,...,N}fi(x1, . . . , xN )

maxx1,...,xN

(f1(x1, . . . , xN ), . . . , fN (x1, . . . , xN ))

maxx1,...,xN

f(x1, . . . , xN )

新たな最適化問題の目的関数 f をどのように設定するか

システムスループット Proportional Fair Scheduling

機会の公平性(対数和の最大化) 結果の公平性和の最大化

マルチレート無線LANで等データサイズパケット

を送ったとき

交渉解�ナッシュ交渉解�効用の増分の積の最大化=効用の増分の対数和の最大化�機会の公平性

�均等交渉解�効用の増分の最小値の最大化�結果の公平性

�功利主義的解�効用の増分の和の最大化

� ...

21

f2

f1

プロポーショナル・フェア・スケジューリング(PFS)�各タイミングにおいて単一のユーザを選択する�瞬時スループットと平均スループットの比が最大のユーザに送信機会�送信機会は公平に訪れる

�全ユーザのスループットの積を最大化することが証明される

22

Weighted Proportional Fair Scheduling

23

R. Agrawal, et al., “Class and channel condition based weighted proportional fair scheduler,” Proc. ITC 2001, pp. 553-565, Sept. 2001.

ψ:重み係数

瞬時スループット

平均スループット

Wi(t + 1) =

⎧⎪⎪⎪⎪⎨⎪⎪⎪⎪⎩

(時刻 に送信を行った場合)t

(1 − ψ)Wi(t) + ψfi(t)

(時刻 に送信しなかった場合)t

(1 − ψ)Wi(t)

時刻 t における値が最大のユーザ i にチャネル割当

(fi(t))a

Wi(t)

a = ∞a = 1

a = 0 結果の公平性

PFS.機会の公平性

和の最大化

24

特性関数形ゲーム 交渉ゲーム

N = {1, . . . , N} N = {1, . . . , N}

c = {c1, . . . , cN}交渉が不成立の場合の利得各プレイヤ単独の利得

v({1}), . . . , v({N})

X = {x = (x1, . . . , xN )}全プレイヤが協力した際に実現される利得ベクトルの集合(実現可能集合)

全プレイヤが提携した際に実現される利得

v : 2N → R

2N = {S : S ⊆ N}プレイヤのあらゆる部分提携の利得

プレイヤ数が3以上の際の部分提携の発生を議論できる

v(N )

要素

N = 2, v({1, 2}) = x1 + x2, v({i}) = ci

なら,問題も,解も同じ(仁,シャープレイ値=ナッシュ交渉解)

協力ゲーム

- 83 -