new algorithmische spieltheorie (adm iii) · 2013. 6. 7. · algorithmische spieltheorie (adm iii)...

1

Algorithmische Spieltheorie (ADM III)

Britta Peis

TU Berlin

SoSe 2013

2

Allgemeines� Vorlesungen: Mittwochs, 10:15 – 11:45, MA 212

Donnerstags, 12:15–13:45, MA 212(teilweise auch Freitags, 10:15–11:45, MA 751)

� Ubungen: integriert, jeden zweiten Donnerstag in der Vorlesungszeit

� Scheinkriterien: Aktive(!) Mitarbeit(Fragen stellen, Hausaufgaben vorfuhren, . . . ),mundliche Prufung oder Klausur am Ende des Semesters

� Studiengange: (laut VL-Verzeichnis) Mathematik, Technomathematikund Wirtschaftsmathematik (BS,MS und D)

� Wunschenswerte Voraussetzungen: ADM I und ADM II

� Medien: Kombination aus Folien und Tafel.

Folien im Anschluß an VL auf www.coga.tu-berlin.de/v-menue/lehre/ss13/vl_algorithmische_spieltheorie/

3

Kapitel 0:Einleitung und Uberblick

3

Was ist Spieltheorie?

Die (mathematische) Spieltheorie . . .

� stellt analytische Werkzeuge bereit, Situationen des taglichen Lebenszu modellieren, in denen mehrere Entscheidungstrager, diesogenannten Spieler, interagieren und gegenseitig den Ausgang desGeschehens beeinflussen.

� findet Anwendungen in der Politik, der Okonomie, derGesellschaftslehre, der Biologie, der Informatik, dem Internet, . . . .

� ist eine interdisziplinare Wissenschaft an der Schnittstelle vonMathematik, Informatik und Wirtschafts-und Sozialwissenschaften.

Wir unterscheiden strategische (nicht-kooperative) und kooperative Spiele.

Spiele wie Schach, Muhle, Doppelkopf, etc. werden nicht (oder nur kaum)Bestandteil der VL sein.

4

Strategische Spiele (kurze Einfuhrung)

Wir starten mit einem kleinen Beispiel, bekannt unter dem Namen ”battleof the sexes (BoS)”: . . . (siehe Tafel).

Das Spiel kann uber die folgende Matrix modelliert werden:

(BoS)F K

F (4, 2) (1, 1)K (0, 0) (2, 4)

5

Definition strategischer SpieleDefinition 0.1.

Ein strategisches Spiel Γ = (N, {Xi}i∈N , {�i}i∈N) besteht aus einerSpielermenge N = {1, . . . , n}, sowie Strategiemengen Xi undPraferenzrelationen �i auf X := X1 × X2 × . . . Xn fur jeden Spieler i ∈ N.

Es wird in davon ausgegangen, dass� die Spieler gleichzeitig jeweils genau eine ihrer Strategien wahlen

(”one-shot simultaneaous move games”),� die Spieler dabei nicht miteinander kommunizieren

(nicht-kooperatives Spiel!),� jeder Spieler vollstandige Information uber die Strategien und

Praferenzen der ubrigen Spieler besitzt,� alle Spieler rational, also vernunftig spielen (sonst sind die Spiele

kaum analysierbar).

Eine Strategiewahl x = (x1, . . . , xn) ∈ X wird auch Profil oder Aktiongenannt.

6

MaxMin-Strategie

In der mathematischen Spieltheorie wird versucht Srategiewahlen/Profilex ∈ X zu identifizieren und zu analysieren, die in gewissem Sinne rationaloder stabil sind.

Betrachten wir z.B. die MaxMin-Strategie, die den garantiertenMindestgewinn maximiert.Die MaxMin-Strategie ist eine typische, undsicher auch vernunftige Wahl fur Spieler, die nicht gerne ein hohes Risikoeingehen.

Was passiert, wenn beide Spieler in unserem Eingangsbeispiel (BoS) ihreMaxMin-Strategie wahlen?

7

GleichgewichtssituationenDas wohl bekannteste Losungskonzept ist das sogenannte ”NashGleichgewicht”,das zwar Nash’s Dissertation (1950) zugeschrieben wird,aber schon auf Cournot (Recherche sur les principes mathematiques de la

theorie de la richesse, Paris 1838) zuruckzufuhren ist.

Definition 0.2.

Eine Strategiewahl x ∈ X wird (reines) Nash Gleichgewicht genannt, wennkeiner der Spieler einen Grund hat, durch Wahl einer anderen Strategiex�i ∈ Xi eine aus seiner Sicht bessere Situation (x−i , x �i ) ∈ X herzustellen.

Dabei ist (x−i , x �i ) = x−i (x �i ) = (x1, . . . , xi−1, x �i , xi+1, . . . , xn).

In einem Nash Gleichgewicht sind somit alle Spieler in gewissen Maßezufrieden, und wir konnen von einer stabilen Situation/Losung sprechen.

Frage: Besitzt (BoS) Nash-Gleichgewichte? Wenn ja, welche?8

Existenz, Berechenbarkeit und Gute von GleichgewichtenTypische Fragestellungen in diesem Zusammenhang:

� Besitzt ein Spiel uberhaupt Nash Gleichgewichte?

� Falls ja, sind sie effizient berechenbar?

� Falls nein, kann ich sie zumindest gut approximieren?

� Wie sozial vertraglich ist ein Nash Gleichgewicht?

Weitere ”klassische” Beispiele strategischer Spiele (siehe Tafel):

i ”Prisoner’s Dilemma”

ii ”Pollution Game”

iii ”Routing Game”

iv ”Matching Pennies”

9

Kooperative Spiele (kurze Einfuhrung)

Wir haben bereits gesehen: die Spieler konnen viel durch Kooperationgewinnen.

Allerdings: wir gehen von eigennutzigen Spielern aus, d.h. dasvordergrundige Ziel eines jeden Spielers ist es, den eigenen Gewinn zumaximieren (bzw. die eigenen Kosten zu minimieren).

Ziel der kooperativen Spieltheorie ist es, unter den Spielern, diegrundsatzlich zur Kooperation bereit sind, die Kooperation herbeizufuhrenund sie zu erhalten.

Zentrale Frage:

Wie sollte der Gesamtgewinn bzw. -verlust auf eine ”faire” und stabile

Weise unter den Spielern aufgeteilt werden?

10

Abstraktes Modell kooperativer Spiele

Definition 0.3.

Ein kooperatives Spiel ist ein Tupel Γ = (N, c) bestehend aus einerSpielermenge N = {1, . . . , n} und einer Kosten- (bzw. Nutzen-, Gewinn-)funktion c : 2N → R.

Die Teilmengen S ⊆ N werden Koalitionen genannt und die Werte c(S)werden als die durch Koalition S verursachten Kosten (Nutzen, Gewinne)interpretiert.

Je nach Situation unterscheiden wir zwischen Kosten- und Nutzenspielen.Strukturell gibt es keine Unterschiede, da sich die Spiele durchMultiplikation mit −1 ineinander uberfuhren lassen.

Beispiel ”Facility Location Game”: . . . (siehe Tafel).

11

Der Core kooperativer SpieleDas Losungskonzept des ”Core” geht auf van Neumann zuruck:

In einer fairen Kostenverteilung x ∈ RN sollte keine Koalition mehr zahlen,als die durch sie verursachten Kosten, d.h. es sollte gelten:

x(S) :=�

i∈S

xi ≤ c(S) ∀S ⊆ N.

Definition 0.4.

Der Core eines kooperativen Spiels Γ = (N, c) ist die Menge aller Vektorenim Polyeder

Core(N, c) := {x ∈ RN| x(N) = c(N) und x(S) ≤ c(S)∀S ⊆ N}.

Werden somit die Kosten (Gewinne, Verluste) entsprechend einerAllokation im Core verteilt, sieht keine Koalition einen Anreiz darin, sichvon der großen Koalition N abzuspalten. Eine derartige Core-Losung warein diesem Sinne stabil.

12

Nachteile des Cores, Ausblick

Nachteile des Core-Konzepts:

� Der Core kann durchaus leer sein (. . . Tafel).

� Einige Core-Losungen sind fairer als andere.

� Selbst wenn der Core nicht leer ist, ist es oftmals sehr aufwendig,einen Core-Vektor zu bestimmen

Wir werden in der Vorlesung Spiele charakterisieren, bei denen der Coregarantiert nicht leer, und Core-Vektoren effizient berechenbar sind.

Zudem werden wir weitere, alternative Losungkonzepte kennenlernen undanalysieren.

−→ starke Zusammenhange zwischen stabilen Losungskonzepten und derlinearen/konvexen Optimierung.

13

Literatur (wird moglicherweise erweitert):

� Noam Nisan, Tim Roughgarden, Eva Tardos, Vijay V. Vazirani (Eds.),Algorithmic Game Theory, Cambridge University Press, 2007. (Onlineverfugbar, siehe WWW)

� Martin J. Osborne and Ariel Rubinstein, A Course in Game Theory,MIT Press, 2001.

� Martin J. Osborne, An Introduction to Game Theory, OxfordUniversity Press, 2004.

� Tim Roughgarden, Selfish Routing and the Price of Anarchy, MITPress, 2005.

� M. R. Garey, D. S. Johnson, Computers and Intractability: A Guide to

the Theory of NP-Completeness, Freeman, 1979.

14

Kapitel 1:Strategische Spiele

16

Gleichgewichte bei Strategischen Spiele

Wir untersuchen in diesem Kapitel die Existenz vonGleichgewichtssituationen bei strategischen Spielen.

Sei N = {1, . . . , n} eine endliche Menge von Spielern. In unserem Modellstrategischer Spiele steht jedem Spieler i ∈ N eine Strategiemenge Xi zurVerfugung. Nachdem jedes i ∈ N ein xi ∈ Xi gewahlt hat, erhalten wir dieGesamtsituation (Profil, Aktion)

x := (x1, . . . , xi , . . . , xn) ∈ X := X1 × . . .× Xi × . . .× Xn.

Profil x ist eine Gleichgewichtssituation (”reines Nash Gleichgewicht”),wenn kein i ∈ N durch Wahl einer anderen Strategie x

�i ∈ Xi eine fur ihn

bessere Situation (x−i , x �i ) ∈ X herstellen kann.

Beispiel: Die Spieler sind Autofahrer, die einen Weg zwischen Start- undZielpunkt wahlen.

17

Nutzenfunktionen

Wir nehmen an, dass jeder Spieler i ∈ N eine Situation x ∈ X mit einer(individuellen) Nutzenfunktion ui : X → R bewertet.

Die dadurch induzierte Praferenzrelation (Pra-Ordnung) ist

x ≺i x� ⇔ ui (x) < ui (x�).

Bemerkung: Ein Praordnung auf X ist eine binare Relation � so, dass furalle x, y, z ∈ X :

(i) x � x (Reflexivitat)

(ii) x � y und y � z impliziert x � z (Transitivitat)

Ubung: Sei |N| = 1 und X = {a, b, c , d}. Geben Sie ein Beispiel einerPraordnung, die nicht von einer Nutzenfunktion induziert werden kann.

18

Spiele in Standartform

Bemerkung: Ein durch Nutzenfunktionen induziertes strategisches SpielΓ = (N, {Xi}i∈N , {ui}i∈N) ist in Standartform (bzw. ist ein Matrixspiel),wenn alle Strategien und Bewertungen explizit angegeben werden.

Standartformen sind vor allem bei 2 Spielern und wenigen Strategien sehrkomfortabel. Oftmals sind Spiele nicht in Standartform reprasentierbar, daviel zu viele Spieler und Strategien involviert sind.

Alternative: Kompakt reprasentierte Spiele (spater).

19

Dominante Strategien

Ein Profil x∗ ∈ X wird dominante Losung genannt, wenn fur jeden Spieleri die Strategiewahl x

∗i stets optimal ist, d.h. unabhangig von der

Strategiewahl der ubrigen Spieler.

Formal ist somit x∗ dominante Losung wenn gilt

ui (x−i , x∗i ) ≥ ui (x) ∀x ∈ X ,∀i ∈ N.

Bemerkung: Eine dominante Losung ist immer auch ein Gleichgewicht.

Welche der bisherigen Beispiele besitzen dominante Losungen?

20

Transitivitat

Wir haben gesehen: Es gibt Praferenzrelationen, die transitiv sind, abernicht mit Nutzenfunktionen modelliert werden konnen. Daruberhinaus gibtes Praferenzrelationen, die nicht einmal transitiv sind.

Das folgende Beispiel geht auf den Marquis de Condorcet (1743–1794)zuruck:

Beispiel von Condorcet: . . . (siehe Tafel).

Wir gehen an dieser Stelle nicht weiter auf diese interessantenModellierungsaspekte ein, sondern gehen vereinfachend davon aus, dassdie Praferenzrelationen der einzelnen Spieler von Nutzenfunktioneninduziert sind.

21

Gleichgewichte und FixpunkteDie Frage nach einem Gleichgewicht kann als Frage nach einem Fixpunkteiner zugeordneten Funktion umformuliert werden.

Notation: Sei wieder X := X1 × . . .× Xn und definiere fur alle i ∈ N,a = (a1, . . . , an) ∈ X und x ∈ Xi :

X−i := X1 × . . .× Xi−1 × Xi+1 × . . .× Xn

a−i := (a1, . . . , ai−1, ai+1, . . . , an) ∈ X−i

a−i (x) := (a1, . . . , ai−1, x , ai+1, . . . , an) ∈ X .

Zu jedem Profil a� ∈ X−i der ubrigen Spieler bezeichne Bi (a�) ⊆ Xi dieMenge der ”besten Antworten” von i ∈ N auf a�, d.h.

Bi (a�) = {x ∈ Xi | ui (a

�(x)) ≥ ui (a�(y)) ∀y ∈ Xi}.

Dann ist ein Gleichgewichtspunkt gerade ein Punkt a∗ ∈ X mit derEigenschaft

a∗i ∈ Bi (a

∗−i ) ∀i ∈ N.

22

Gleichgewichte und Fixpunkte (Forts.)Wir definieren nun die (mengenwertige) Funktion f : X → 2X vermoge

f (a) := B1(a−1)× . . .× Bn(a−n).

Dann ist a∗ ein Gleichgewicht ⇐⇒ a∗ ∈ f (a∗).

Definition 1.1.

Unter einem Fixpunkt einer teilmengenwertigen Funktion f : X → 2X

versteht man ein x∗ ∈ X mit der Eigenschaft x

∗ ∈ f (x∗).

Bemerkung: Der klassische Begriffs eines Fixpunktes einer Funktionf : X → X kann als Spezialfall angesehen werden (siehe Tafel.)

Gleichgewichte/ Fixpunkte sind i.A. nicht garantiert. Wir betrachten nunmathematische Modelle, die die Existenz von Gleichgewichten (bzw.Fixpunkten) garantieren.

23

Satz von Nikaido/Isoda

Sei Γ = (N, {Xi}i∈N , {ui}i∈N) ein durch die Nutzenfunktionen {ui}i∈N

induziertes strategisches Spiel.

Satz 1.

Das strategische Spiel Γ = (N, {Xi}i∈N , {ui}i∈N) besitzt einGleichgewicht, falls gilt

1 Die Menge X ist eine nichtleere kompakte und konvexe Menge in Rm.

2 Die Funktionen ui sind in jeder Komponente stetig und konkav.

Erinnerung: Eine Funktion f : X → R ist konkav, wenn die Funktiong := −f konvex ist, d.h. wenn fur jede Konvexkombinationz = λ1x(1) + . . . + λhx(h) von Punkten x(1), . . . , x(h) ∈ X gilt

f (z) = f (λ1x(1) + . . . + λnx

(h)) ≥ λ1f (x(1)) + . . . + λhf (x(h)).

24

Beweis des Satzes von Nikaido-IsodaZum Beweis des Satzes charakterisieren wir zunachst die Nicht-Existenz

eines Gleichgewichts. Sei dazu

G (a, a�) =n�

i=1

ui (a−i (a�i )) ∀a, a� ∈ X .

Lemma 1.2.Die folgenden Aussagen sind aquivalent:

1 Es existiert kein Gleichgewicht.

2 Zu jedem a ∈ X gibt es ein a� ∈ X mit G (a, a�) > G (a, a).

Beweis: . . . Ubung.

Beobachtung: Ein Gleichgewicht existiert genau dann nicht, wenn dieMengen O(a�) = {a ∈ X | G (a, a�)− G (a, a) > 0} (fur a� ∈ X ) die MengeX uberdecken.

Beweis des Satzes: . . . (siehe Tafel.)25

Hauptsatz uber abgeschlossene konvexe MengenDer Hauptsatz uber abgeschlossene konvexe Mengen kann auch”spieltheoretisch”, mit Hilfe von Satz 1, bewiesen werden:

Satz 2.

Sei C ⊆ Rk eine nichtleere abgeschlossene und konvexe Menge undp ∈ Rk \ C beliebig. Dann existiert ein x∗ ∈ C und ein a∗ ∈ Rk mit derEigenschaft

(a∗)Tx ≤ (a∗)Tx∗ < (a∗)Tp ∀x ∈ C .

Bemerkung: Der ”Satz von der trennenden Hyperebene” bildet dieGrundlage fur zahlreiche Beweise in der Linearen Programmierung, wiez.B. Farkas’ Lemma, Starke Dualitat, . . .

Beweis: . . . (siehe Tafel.)

26

Fixpunktsatz von KakutaniKakutani hat 1941 aus dem Brouwer’schen Fixpunktsatz einenallgemeineren Fixpunktsatz abgeleitet:

Satz 3.Unter den Annahmen

(K1) X ist eine nichtleere, kompakte und konvexe Teilmenge von Rm.

(K2) f : X → 2X ist eine teilmengenwertige Funktion derart, dass

1 die Mengen f (x) nichtleer, kompakt und konvex, und2 die Mengen {(x, y) ∈ R2m | y ∈ f (x)} abgeschlossen sind,

existiert ein Punkt x∗ ∈ X mit der Eigenschaft x∗ ∈ f (x∗).

Beweis: hier ohne Beweis (technisch sehr aufwendig).

Satz 1 folgt als Spezialfall, wenn man wiederf (a) := B1(a−1)× . . .× Bn(a−n) wahlt, und zeigt, dass die im Satz 1geforderten Eigenschaften die Eigenschaften (K1) und (K2) implizieren.

Fixpunktsatze garantieren zwar die Existenz von Gleichgewichten, gebenaber keinerlei Anleitung, wie diese berechnet werden konnen.

27

Randomisierung von Matrixspielen

Erinnerung: Bei Matrixspielen bzw. strategischen Spielen in Standardform

gehen wir davon aus, dass die Strategiemengen inΓ = (N, {Xi}i∈N , {ui}i∈N) endlich sind. Sei nun Xi = {x i

1, . . . , xiim}, i ∈ N.

Achtung: Nichttriviale endliche Menge sind nicht konvex! Folglich findendie Fixpunktesatze von Nikaido-Isoda oder Kakutani hier keineAnwendung.

Randomisierte Matrixspiele: Jeder Spieler wahlt sich eineWahrscheinlichkeitsverteilung πi = (pi

1, . . . , pimi

) auf seiner StrategiemengeXi = {x i

1, . . . , xiim} und zieht dann eine konkrete Strategie, die er

schliesslich spielt, gemass πi .

Spieler i spielt demnach Strategie x ∈ Xi mit W’keit πi (x) = pij , wenn

x = xij .

28

Randomisierte Matrixspiele (Forts.)

Beim Ubergang zur randomisierten Version ersetzt somit jeder Spieler i dieMenge Xi durch die Menge ∆mi := {(p1, . . . , pmi ) | p ≥ 0,

�mij=1 pj = 1}

aller W’keitsverteilungen auf Xi .

Die Simplizes ∆mi sind kompakte und konvexe Menge. Folglich ist auch∆ := ∆m1 × . . .×∆mn ⊆ Rm1+...+mn konvex und kompakt.

Der erwartete Nutzen/Gewinn fur Spieler i ist nun

Ui (π1, . . . ,πn) =

�

x=(x1,...,xn)∈X

ui (x)π1(x1) . . . πn(xn).

Beobachtung: Die Ui sind als Summe von Produkten stetiger Funktionenauf ∆ stetig, und in jeder Komponente linear (und damit konkav).

29

Satz von Nash

Der Satz von Nash ist somit eine Folgerung von Satz 1:

Korollar 1.Das randomisierte Matrixspiel mit den Strategiemenge ∆mi und denNutzenfunktionen Ui besitzt ein Gleichgewicht.

Terminologie: Bei randomisierten Spielen heißen die ursprunglichenStrategiemengen Xi oft reine Strategien. Die W’keitsverteilungenπi ∈ ∆mi sind dann gemischte Strategien.

Reine Strategien x ∈ Xi entsprechen der gemischten Strategie πi mitπi (x) = 1 (und πi (x �) = 0 fur x �= x

� ∈ Xi ).

30

Nullsummen-Spiele

Definition 1.3.

Ein Matrixspiel mit Nutzenfunktionen {ui}i∈N heißt Nullsummenspiel,wenn es eine Zahl u

∗ gibt, so dass fur jedes Profil x ∈ X giltu1(x) + . . . + un(x) = u

∗.

Bemerkung: Die Terminologie erklart sich daraus, dass man oBdA u∗ = 0

annehmen kann. (Ansonsten ersetze ui durch ui := ui −u∗

n und erhalte einim Wesentlichen gleiches Spiel mit u1(x) + . . . + un(x) = 0.)

Im Fall |N| = 2 gilt u2(x) = −u1(x), d.h. der eine Spieler gewinnt, was derandere verliert.

Bemerkung: Bei Zwei-Personen-Nullsummen-Matrixspielen genugt es inder Auszahlungsmatrix nur die Komponente des Zeilenspielers anzugeben.

31

Gleichgewichte bei 2-Personen-Nullsummen-SpielenJahre vor Nash hat von Neumann erkannt:

Satz 4.Randomisierte Nullsummen-Matrixspiele mit zwei Spielern besitzen immer(mindestens) einen Gleichgewichtspunkt.

Wir werden den Satz in einer allgemeineren Form beweisen. Sei dazu Γ ein2-Personen-Nullsummenmatrixspiel mit Strategiemengen X bzw. Y undNutzenfunktionen u1(x , y) = −u2(x , y) fur alle (x , y) ∈ X × Y .

Bemerkung: Die Funktion L : X × Y → R mitu1(x , y) = L(x , y) = −u2(x , y) heißt auch Lagrangefunktion von Γ.

Satz 5.

(x∗, y∗) ist ein Gleichgewicht bzgl. L gdw. fur alle (x , y) ∈ X × Y gilt

maxx∈X

miny∈Y

L(x , y) = L(x∗, y∗) = miny∈Y

maxx∈X

L(x , y).

Beweis: . . . Tafel.32

Optimierungsprobleme als 2-PersonenspieleZahlreiche wichtige Aspekte der mathematischen Optimierung lassen sichauch spieltheoretisch interpretieren:

Wir betrachten das folgende allgemeine Optimierungsproblem

(P) maxx∈Rn

{f (x) | gi (x) ≤ 0 fur i = 1, . . . ,m},

wobei f , g1, . . . , gm : Rn → R.

Die Lagrangefunktion zu (P) ist L(x, y) = f (x)−�m

i=1 yigi (x) fur allex ∈ Rn, y ∈ Rm

+.

Sei Γ das zugeordnete 2-Personen-Nullsummenspiel, bei dem der ersteSpieler durch Wahl einer ”Strategie” x ∈ Rn die Funktion L(x, y)maximieren mochte, und der zweite Spieler L(x, y) durch Wahl vonLagrange-Multiplikatoren y1, . . . , ym ≥ 0 minimieren mochte (und dadurchden ersten Spieler zum Einhalten der Restriktionen gi (x) ≤ 0 zwingen will).

Ubung: Zeigen Sie: Ist (x∗, y∗) Gleichgewicht von Γ, dann ist x∗ eineOptimallosung von (P).

33

MaxMin-Strategien mittels Linearer ProgrammierungWir kehren nun von 2-Personen-Nullsummenmatrixspielen zu allgemeinenMatrixspielen Γ = (N, {Xi}i∈N , {ui}i∈N) zuruck.

Ein Spieler i , der seinen garantierten Mindestnutzen maximieren mochte,also nach der MaxMin-Strategie spielen will, muss das folgendeOptimierungsproblem losen

maxx∈Xi

mina∈X

ui (a−i (x)).

Beobachtung: Unter dem Gesichtspunkt der MaxMin-Strategie spieltSpieler i im Prinzip ein Nullsummenspiel gegen einen zweiten”Superspieler” mit Strategiemenge Y = X−i und LagrangefunktionL(x , y) = ui (x , y).

Satz 6.Die MaxMin-Strategien eines randomisierten Nullsummenmatrixspielskonnen mittels Linearer Programmierung ausgerechnet werden.

Beweis: . . . Tafel. 34

Exkurs: Ineffizienz von Gleichgewichten

Das Gefangenen-Dilemma hat gezeigt: Rationales eigennutziges Verhaltenkann gesamtgesellschaftlich sehr viel schlechter sein als eine Losung, diedurch eine zentrale Authoritat vorgegeben wurde.

Zentrale Frage: ”Um wieviel kann ein GG schlechter sein als ein ”sozialesOptimum”?”

Es gibt verschiedene Zielfunktionen um den sozialen Wert eines Profilsx ∈ X zu messen.

Die popularsten sind die ”utilitarian function”�

i∈N ui (x),und die”egalitarian function” maxi∈N ui (x).

Bemerkung: Das GG im Gefangenen-Dilemma minimiert keine der beidenZielfunktionen. Das Beispiel kann so modifiziert werden, dass die GGbeliebig ineffizient (d.h. schlecht im Vergleich zum sozialen Optimum) sind.

40

Preis der Anarchie/Stabilitat

Definition 1.4.

Der Preis der Anarchie/Stabilitat (kurz: PoA/PoS) ist definiert als dasVerhaltnis des Wertes einer schlechtesten/besten Gleichgewichtslosung zueiner sozial optimalen Losung.

Bemerkung: Der PoA und PoS hangt naturlich stark von der gewahltenZielfunktion ab. Wir betrachten (wenn nicht anders genannt) dieZielfunktion C (x) =

�i∈N ui (x).

Beispiel von Pigou: . . . Tafel.

41

Netzwerkspiele

Mithilfe von Netzwerkspielen (”Routing games”) werden Situationenmodelliert und analysiert, bei denen die Spieler einen gewissen Anteil an”Verkehr” (wie Autos, Bits, Wasserpartikel, etc.) durch ein vorgegebenesNetzwerk schicken. Die Kosten/Verzogerung entlang einer Strecke hangtdabei von der Auslastung/dem Verkehr auf dieser Strecke ab.

Modell:

� Gerichteter Graph G = (V ,E ) (”Einbahnstraßen”),

� Knotenpaare {si , ti} mit Nachfrage di ≥ 0 (”Commodities”),

� Kosten-/Verzogerunsfunktionen ce : R → R auf jeder Kante e ∈ E .

Interpretation: Jeweils di Flusseinheiten sollen von si nach ti geschicktwerden. Die Kosten ce um eine Flusseinheit entlang e zu schicken hangenvom Gesamtfluss auf e ab.

42

Gleichgewichtsmodell von WardropViele gegenwartig untersuchte Modelle zur Verkehrsflussanalyse gehen aufdas Modell von Wardrop (1952) zuruck(kontinuierliches Verkehrsflussmodell /”Nonatomic selfish routing”):

Sei Pi ⊆ {0, 1}E die Menge aller (Inzidenzvektoren) gerichteter(si , ti )-Pfade in G = (V ,E ), und P =

�i Pi .

Definition 1.5.Eine Zuordnung f : P → R+ wird Fluss genannt. Ein Fluss f ist zulassig(im Wardrop-Modell), wenn

�P∈Pi

fP = di fur jede Commodity i .

Ist f ein Fluss, dann ist fe :=�

P∈P:e∈P fP die Verkehrsmenge unter f aufe, und verursacht eine Verzogerung auf e um ce(fe) Zeiteinheiten fur jedeFlusseinheit, die entlang e geschickt wird.

Insgesamt bewirkt der Fluss f eine Verzogerung vonC (f ) =

�e∈E ce(fe)fe Zeiteinheiten.

43

Existenz von Gleichgewichten im Wardrop Modell

Im Modell von Wardrop ist f∗ ein Gleichgewicht (”Nash-Fluss”), wenn f

∗

zulassig ist und unter der induzierten Kostenstructur c∗e := ce(f ∗e ) kein

anderer zulassiger Fluss insgesamt gunstiger ware, d.h. wenn gilt�e∈E c

∗e f

∗e ≤

�e∈E c

∗e fe fur jeden zulassigen Fluss f .

Satz 7.Sind die Kostenfunktion ce stetig und monoton wachsend, dann ist imWardrop-Modell die Existenz eines Gleichgewichts garantiert.

Beweis: . . . Tafel.

Bemerkung: Bei affin linearen Kostenfunktionen ist im Wardrop Modell derPoA hochstens 4

3 . D.h. das Beispiel von Pigou ist schon das Schlimmste!

44

Paradoxon von Braess

Unter der Annahme, dass ein Verkehrsfluss immer zu einem Gleichgewichthin tendiert, hat Braess 1968 folgendes Phanomen entdeckt:

Es kann durchaus sein, dass eine Senkung der Kosten auf einer Straße die

Verkehrsflusskosten insgesamt erhoht!

Paradoxon von Braess: . . . Tafel.

Es ist folglich keinesfalls garantiert, dass der Neu- oder Ausbau einerStraße dem Verkehr insgesamt dient!

45

Diskrete Verkehrsflusse

Im diskreten Verkehrsflussmodell muss jeder Spieler seinen Bedarf di

enlang eines ganzzahligen Flusses von si nach ti schicken.

Die Strategiemengen sind somit Xi = {f i : Pi → Z+ |�

P∈Pif

iP = di} und

damit endlich.

Erinnerung: Im (kontinuierlichen) Wardrop-Modell waren dieStrategiemengen X

ci = {f i : Pi → R+ |

�P∈Pi

fiP = di} konvex und

kompakt.

Bemerkung: Im ”Atomic selfish routing”-Modell muss jeder Spieler i

seinen gesamten Bedarf di entlang eines einzigen Pfades P ∈ Pi schicken.

46

Gleichgewichte im diskreten Verkehrsflussmodell

Definition 1.6.

Ein diskret zulassiger Fluss f∗ ist ein Gleichgewicht (diskreter Nash-Fluss),

wenn fur alle i und alle Paare P, P ∈ Pi mit f∗P > 0 gilt�

e∈P\P ce(f ∗e ) ≤�

e∈P\P ce(f ∗e + 1)

Satz 8.Sind die Kantenfunktionen ce monoton wachsend, dann existiert eindiskreter Nash-Fluss und kann algorithmisch konstruiert werden.


47

Rosenthal’s Auslastungsspiele

Das diskrete Verkehrsflussmodell ist im Fall di = 1 ein Spezialfall einerKlasse von Rosenthal untersuchter n-Personenspiele mit endlichenStrategiemengen (Matrixspielen).

Definition 1.7.

Ein Auslastungsspiel (”Congestion Game”) ist ein Tupel(N,R, {Si}i∈N , {cr}r∈R),bestehend aus einer Spielermenge N, einerendlichen Resourcenmenge R, Strategiemengen Si ⊆ 2|R| fur jedes i ∈ N,und Kostenfunktionen cr : N → R+.

Die Kostenfunktion cr ist von der Auslastung (Anzahl der r benutzendenSpieler) abhangig, und gibt die entstehenden Kosten/Verzogerung aufResource r an.

49

Rosenthal’s Auslastungsspiele (Forts.)

In einem Auslastungsspiel (N,R, {Si}i∈N , {cr}r∈R) wahlt jeder Spieleri ∈ N eine seiner Strategien X

(i) ∈ Si (mit Inzidenzvektor x(i)). Die

Komponente xr von x =�

i∈N x(i) gibt dann die Anzahl der Spieler an,

die Resource r ∈ R in ihrer gewahlten Strategie hat.Die Kosten fur Spieler i ergeben sich als C

(i)(x) :=�

r∈X (i) cr (xr ).

Theorem 1.8.

Rosenthal’s Auslastungsspiele besitzen ein Nash-Gleichgewicht (imublichen Sinne).


Beispiel Maschinenbelegungen: . . . siehe Tafel.

50

Fixpunkte bei diskreten Mengen

Satze vom Kakutani-Typ geben (ausser bei Randomisierung) keine Hilfe,wenn die Strategiemengen X1, . . . ,Xn der Spieler diskret sind.

Wir betrachten eine Menge X und eine (teilmengenwertige) Funktionf : X → 2X und fragen uns, wann die Existenz eines Fixpunkts, d.h. einesx∗ ∈ X mit x

∗ ∈ f (x∗) garantiert ist.

Annahmen:

1 Auf X ist eine Halbordnung P = (X ,≤) gegeben.

2 Bzgl. (X ,≤) ist jede (absteigende) Kette x0 > x1 > . . . endlich.

Typische Beispiele: . . . siehe Tafel.

51

Tarski’s Fixpunktsats

Sind zwei Halbordnungen P = (X ,≤P) und Q = (Y ,≤Q) gegeben, dannerhalt man in naturlicher Weise eine Halbordnung P × Q = (X × Y ,≤)mit (x , y) ≤ (x �, y �) ⇐⇒ x ≤P x

� und y ≤Q y�.

Beobachtung: P × Q besitzt die Eigenschaft (2) gdw. sowohl P als auchQ die Eigenschaft (2) besitzen.

Ein (Ordnungs-)Homomorphismus von P = (X ,≤) ist eine Abbildungh : X → X mit

x ≤ y =⇒ h(x) ≤ h(y).

Theorem 1.9.

Sei P = (X ,≤) eine Halbordnung mit der Eigenschaft (2) und h : X → X

ein Homomorphismus. Genau dann besitzt h einen Fixpunkt, wenn es einx0 ∈ X mit der Eigenschaft h(x0) ≤ x0 gibt.


52

Kooperative Spiele

Bisher (bei strategischen Spielen): Die Spieler spielen gegeneinander,versuchen ihren personlichen Nutzen zu maximieren (bzw. ihre Kosten zuminimieren.)

Jetzt (bei kooperativen Spielen): Die Spieler der Menge N konnenmiteinander kooperieren, um den großtmoglichen gemeinsamen Nutzen zuerzeugen.

Zentrale Frage: Welcher Wert soll dem Einzelspieler als fairer anteiligerGewinn (oder Verlust) zubemessen werden?

Annahmen/Begriffe:

� Wir nehmen N = {1, . . . , n} als endlich an.

� Die Teilmengen S ⊆ N werden Koalitionen genannt.

� Der Wert einer Koalition S ⊆ N wird durch v(S) ∈ R ausgedruckt.

54

Definition kooperativer Spiele

Definition 2.1.

Ein kooperatives Spiel ist ein Tupel Γ = (N, v) mit einer endlichen MengeN und einer Funktion v : 2N → R.

Die Funktion v : 2N → R wird charakteristische Funktion, oder (je nachInterpretation) Nutzen- oder Kostenfunktion des Spiels Γ = (N, v)genannt.

Bemerkung: Wir setzen vorraus, dass v(S) bekannt, oder zumindestexplizit berechenbar ist. Außerdem nehmen wir v(∅) = 0 an.

Beispiele:

1 Owens Produktionsspiel (. . . siehe Tafel)

2 Auktionsspiel (. . . siehe Tafel)

3 Vernetzungsspiel (. . . siehe Tafel)

55

Losungskonzepte

Generell suchen wir nach Allokationen x ∈ RN , die den Spielern i ∈ N

eines kooperativen Spiels Γ = (N, v) einen ”fairen” Wert xi zuweisen.

Was dabei ”fair” heißt, ist nicht von vornherein mathematisch klargegeben, sondern wird erst definiert (auf verschiedene Weisen).

Ein (mathematisch spezifizierter) Allokationsmodus heißt Losungskonzept,oder einfach Losung des Spiels.

56

Ertrags- und KostenspieleMan kann den Wert v(S) einer Koalition S ⊆ N als Ertrag betrachten,den S durch Kooperation erwirtschaften kann, oder aber v(S) konnte dieKosten darstellen, die Koalition S durch Kooperation entstehen.

Bei einem Ertragsspiel Γ = (N, v) kann man im Modell davon ausgehen,dass sich Koalition S in kleinere Gruppen aufteilen wurde, wenn derGesamtwert der Koalition dadurch verbessert wurde. Wir betrachten danndas Spiel (N, v) mitv(S) := max{

�ki=1 v(Si ) | S1, . . . ,Sk paarw. disjunkte TMen von S}.

Wegen ∅ ⊆ S gilt v(S) ≥ 0. Außerdem gelten� S ⊆ T =⇒ v(S) ≤ v(T ) (Monotonie)� S ∩ T = ∅ =⇒ v(S ∪ T ) ≥ v(S) + v(T ) (Superadditivitat)

Analog betrachten wir bei Kostenspielen (N, c)c(S) := min{c(S1) + . . . c(Sk) | Si paarweise disjunkt und S ⊆

�ki=1 Si}.

Dann ist fur c ≥ 0 die Funktion c monoton und es gilt� S ∩ T = ∅ =⇒ c(S ∪ T ) ≤ c(S) + c(T ) (Subadditivitat)

57

Der Core

Das Losungskonzept des Core (engl. Kern) geht auf von Neumann zuruck.

Idee: Bei einer vorgeschlagenen Allokation x ∈ RN vergleicht jedeKoalition S ⊆ N den ihr zugeteilten Wert x(S) :=

�i∈S xi mit ihrem

Ertragswert v(S).

In einer fairen Allokation sollte keine Koalition weniger als den von ihrerwirtschafteten Wert zugewiesen bekommen.

Außerdem sollte insgesamt nicht mehr als v∗ = v(N) verteilt werden.

core(v) := {x ∈ RN| x(N) ≤ v

∗ und x(S) ≥ v(S)∀S ⊆ N}.

Lemma 2.2.

Sei (N, v) ein Ertragsspiel. Dann gilt core(v) = core(v) ∩ RN+.

Beweis: . . . siehe Tafel.

58

Core (Forts.)

Analog definieren wir fur Kostenspiele (N, c) den Core als

core(c) := {x ∈ RN| x(N) ≥ v

∗ und x(S) ≤ c(S)∀S ⊆ N}

Bemerkung: Fur die mathematische Analyse ist es nicht relevant, ob wirden Core eines Ertrags- oder Kostenspiels analysieren. Der Einfachheithalber konzentrieren wir uns hier auf das Modell von Ertragsspielen.

59

Satz von Bondareva

Beobachtung: Der Core eines Spiels ist durch lineare Ungleichungendefiniert (siehe Tafel). Der Core kann durchaus leer sein (Ubung).

Die folgende Anwendung der Dualitat linearer Programme ist in derSpieltheorie als ”Satz von Bondareva” bekannt:

Theorem 2.3.

Fur ein Ertragsspiel Γ = (N, v) ist core(v) = ∅ gdw. ∃y ∈ R2N

+ mit�S⊆N v(S)yS > v

∗ und�

S :i∈S yS = 1 fur alle i ∈ N.


60

Approximativer Core und Auktionen

Im Fall core(v) = ∅ kann man zumindest nach einer Allokation x fragen,die die Idee des Cores moglichst gut verwirklicht.

Genauer gesagt fragen wir nach einer Optimallosung des LPs

(P) min{�

i∈N

xi | x(S) ≥ v(S) fur alle S ⊆ N}.

Beobachtung: Das Problem eine ganzzahlige Losung des zu (P) dualen LPszu bestimmen ist gleich dem Problem des Auktionators im Auktionsspiel,den Gesamtwert v

∗(N) der zu ersteigernden Objekte zu bestimmen.

Ist x∗ eine Optimallosung von (P), so kann x

∗i als ”Marktwert” des

Objekts i ∈ N angesehen werden.


61

Der Core bei Owens ProduktionsspielWir erinnern uns an Owens Produktionsspiel (Tafel). Betrachte fur jedenGrundstoff Gi den Wert bi :=

�p∈N bip der insgesamt verfugbaren

Einheiten an Gi und den Produktionswert v(N), wobei

(P �) v(N) = maxx≥0

{

k�

j=1

cjxj |

k�

j=1

aijxj ≤ bi∀i = 1, . . . ,m}.

Sei nun y∗ = (y∗1 , . . . , y∗m) eine Optimallosung des dualen LPs

(D �) miny≥0

{

m�

i=1

biyi |

m�

i=1

aijyi ≥ cj∀j = 1, . . . , k}.

Nach starkem Dualitatssatz gilt v(N) =�m

i=1 biy∗i .

Theorem 2.4.

Ist y∗ Optimallosung von (D’), dann ist z

∗ ∈ RN mit z∗p =

�mi=1 bipy

∗i im

Core des Produktionsspiels.

Beweis: . . . siehe Tafel.62

Beispiel: ZuordnungsspielWir gehen von zwei disjunkten Mengen M und N aus.

Definition 2.5.

Eine Zuordnung (fraktionales Matching) ist ein Vektor x ∈ RM×N+ so dass

fur alle m ∈ M und n ∈ N gilt�

j∈N xmj ≤ 1 und�

i∈M xin ≤ 1.

Jede Matrix A ∈ RM×N+ mit Koeffizienten aij definiert nun ein kooperatives

Spiel auf der Grundmenge V = M × N mit Wertefunktion

v(S ∪ T ) := max{�

i∈S

�

j∈T

aijxij | x Zuordnung}.

Theorem 2.6.Die Core-Allokationen des Zuordnungsspiels sind genau die optimalenLosungen des LPsminy ,z≥0{

�i∈M yi +

�j∈N zj | yi + zj ≥ aij(i ∈ M, j ∈ N)}.


Marginale Vektoren

Definition 2.7.

Sei S ⊆ N eine Koalition des kooperativen Spiels (N, v). Dann ist derrelative (oder marginale) Wert eines Spielers p ∈ S bzgl. S gegeben durchδp(S) := v(S)− v(S \ {p}).

Sei π = (p1, . . . , pn) eine beliebige, aber feste, Reihenfolge (Permutation)der Menge N. Wir betrachten den zu π gehorenden Marginalvektor x

π mit

xπ(pi ) = v({p1, . . . , pi})− v({p1, . . . , pi−1}) ∀i ∈ N.

Beobachtung: Fur jedes i ∈ N ist xπ({p1, . . . , pi}) = v({p1, . . . , pi}).

Insbesondere ist xπ(N) = v(N).

64

Konvexitat

Der marginale Vektor xπ ist folglich eine Allokation, die v(N) unter den

Spielern aufteilt. Allerdings ist xπ typischerweise nicht im Core von (N, v).

Definition 2.8.

Ein Ertragsspiel (N, v) heißt π-konvex, wenn der zur Permutation πgehorende marginale Vektor x

π in core(v) liegt.

Satz 9.

Ein Ertragsspiel (N, v) ist genau dann π-konvex fur jede Permutation π,wenn v supermodular ist, d.h., wenn v(S ∩ T ) + v(S ∪ T ) ≥ v(S) + v(T )fur alle S ,T ⊆ N.


65

Core-Dualitat

Vollig analog erhalten wir fur Kostenspiele (N, c) mitcore(c) = {x ∈ RN | x(N) ≥ c

∗ und x(S) ≤ c(S)∀S ⊆ N}:

Korollar 2.

Genau dann ist das Kostenspiel (N, c) π-konvex fur jede Permution π vonN, wenn c submodular ist, d.h. wenn c(S ∩T ) + c(S ∪ T ) ≤ c(S) + c(T )fur alle S ,T ⊆ N.

Ubung: Sei (N, v) ein Ertragsspiel mit v(N) = v(N). Zeigen Sie, dass dieFunktion c : 2N → R mit c(S) := v(N)− v(N \ S) ∀S ⊆ N diecharakteristische Funktion eines Kostenspiels (N, c) mit der Eigenschaftcore(c) = core(v) ist. Zeigen Sie außerdem, dass v genau dannsupermodular ist, wenn c submodular ist.

66

Core-Vektoren im Vernetzungsspiel.

Vom rein mathematischen Standpunkt aus macht es also keinenUnterschied, ob wir den Core eines konvexen Spiels als Core eines(supermodularen) Ertragsspiels, oder eines (submodularen) Kostenspielsbetrachten.

Theorem 2.9.

Sei (N, c) ein Vernetzungsspiel. Es existiert mindestens eine Permutationπ, so dass x

π im Core des Spiels liegt.


67

Der Greedy-AlgorithmusWir betrachten eine Gewichtsfunktion w : N → R und ordnen dieElemente in N nach nicht-steigenden Gewichten, d.h. in Reihenfolgeπ = (p1, . . . , pn) so dass w(p1) ≥ w(p2) ≥ . . . ≥ w(pn).

Wir definieren dazu die Mengen Wj = Wπj = {p1, . . . , pj} (j = 1, . . . , n).

Fur vorgegebene Werte v1, . . . , vn ∈ R betrachten wir

(P) min{�

p∈N

w(p)x(p) | x(Wj) ≥ vj∀j = 1, . . . , n}.

Der Greedy-Algorithmus konstruiert eine Losung xπ ∈ RN via

xπ(p1) = v1 und x

π(pi ) = vi − vi−1 (i = 2, . . . , n).

Theorem 2.10.

Der Greedy-Vektor lost das Problem (P) optimal.


Der Core konvexer Spiele

Sei (N, v) ein konvexes (d.h. supermodulares) Ertragsspiel undw : N → R+ eine beliebige Gewichtsfunktion.

Wir wahlen die Reihenfolge π wie im Greedy-Algorithmus nachnicht-wachsenden Gewichten und setzen vj := v(Wj) fur alle j ∈ N.

Der Greedy-Vektor ist identisch mit dem entsprechenden Marginalvektorund liegt folglich im Core von (N, v) (wegen Supermodularitat von v).Andrerseits erfullt jede Core-Allokation x per Definition insbesonderex(Wj) ≥ v(Wj) = vj .

Somit folgt aus Theorem ??, dass xπ auch das Problem

min{wTx | x ∈ core(v)} lost.

69

Algorithmische Charakterisierung konvexer Spiele

Theorem 2.11.

Ein kooperatives Ertragsspiel (N, v) ist genau dann konvex, wenn derGreedy-Algorithmus garantiert bei jeder Gewichtung w : N → R+ dasOptimierungsproblem min{wT

x | x ∈ core(v)} lost.


Theorem 2.12.

Sei (N, v) ein konvexes Ertragsspiel. Dann ist core(v) genau die konvexeHulle aller Marginalvektoren x

π.


70

71

new algorithmische spieltheorie (adm iii) · 2013. 6. 7. · algorithmische spieltheorie (adm iii)...

Documents