spieltheorie sose 09 aktuelldez09 - uni-muenster.de · spieltheorie sosem 2009 1 ströbele...

64
Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik II" Einführungsveranstaltung im Modul "Mikroökonomie II" für Bacherlor-Studierende Themenschwerpunkt 17.04.2009 1 Einführung, Spiele in strategischer oder Normal-Form, dominierte Strategien 24.04.2009 2 Nash-Gleichgewichte in reinen Strategien, gemischte Strategien, Beispiele 08.05.2009 3 multiple Nash-Gleichgewichte, Existenz und Effizienz, Beispiele 15.05.2009 4 Nullsummenspiele, Minimax-Wert und Beispiele 22.05.2009 5 Dynamische (sequentielle) Spiele mit vollständiger Information, Beispiele 29.05.2009 6 Sequentielle Spiele: Teilspielperfektheit und unvollständige Information 05.06.2009 Pfingstferien 12.06.2009 7 Sequentielle Spiele: endlich und unendlich oft wiederholte Spiele 19.06.2009 8 Evolutorische Spieltheorie 26.06.2009 9 Kooperative Spiele I: Verhandlungen und Koalitionen, Machtindizes 03.07.2009 10 Kooperative Spiele II: Stabilität von Koalitionen, Grundlagen unvollständiger Information 10.07.2009 11 Statische Spiele mit unvollständiger Information II: Bayes'sche Gleichgewichte 17.07.2009 12 Dynamische Spiele mit unvollständiger Information I: Bayes GG, Signalspiele 24.07.2009 13 Dynamische Spiele mit unvollständiger Information II: Cheap talk, Vorwärtsinduktion 31.07.2009 14 ENDE Literatur: 1. Gernot Sieg, Spieltheorie, Oldenbourg-Verlag, München, Wien, 2. Auflage, 2005 DIESES BUCH ist die Basisliteratur für die Vorlesung! 2. Martin J. Osborne, Introduction to Game Theory, Oxford University Press, 2003. 3. Muhamet Yildiz, Game Theory Lecture Notes (Internet-Download). 4. David M. Kreps, Mikroökonomische Theorie, MI-Verlag, Harverster Wheatsheaf, 1994 5. Avinash Dixit, Susan Skeath, Games of Strategy, Norton, NYork/London, 2. Aufl. 2004 6. Branislav L. Slantchev, Game Theory, Basic Models, Internet 2005 7. zahlreiche weitere Bücher und Lecture Notes: Fudenberg/Tirole, Güth, Rasmussen, ...

Upload: others

Post on 18-Jun-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 1 Ströbele

Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik II" Einführungsveranstaltung im Modul "Mikroökonomie II" für Bacherlor-Studierende Themenschwerpunkt

17.04.2009 1 Einführung, Spiele in strategischer oder Normal-Form, dominierte Strategien

24.04.2009 2 Nash-Gleichgewichte in reinen Strategien, gemischte Strategien, Beispiele

08.05.2009 3 multiple Nash-Gleichgewichte, Existenz und Effizienz, Beispiele

15.05.2009 4 Nullsummenspiele, Minimax-Wert und Beispiele

22.05.2009 5 Dynamische (sequentielle) Spiele mit vollständiger Information, Beispiele

29.05.2009 6 Sequentielle Spiele: Teilspielperfektheit und unvollständige Information

05.06.2009 Pfingstferien

12.06.2009 7 Sequentielle Spiele: endlich und unendlich oft wiederholte Spiele

19.06.2009 8 Evolutorische Spieltheorie

26.06.2009 9 Kooperative Spiele I: Verhandlungen und Koalitionen, Machtindizes

03.07.2009 10 Kooperative Spiele II: Stabilität von Koalitionen, Grundlagen unvollständiger Information

10.07.2009 11 Statische Spiele mit unvollständiger Information II: Bayes'sche Gleichgewichte

17.07.2009 12 Dynamische Spiele mit unvollständiger Information I: Bayes GG, Signalspiele

24.07.2009 13 Dynamische Spiele mit unvollständiger Information II: Cheap talk, Vorwärtsinduktion

31.07.2009 14 ENDE Literatur:

1. Gernot Sieg, Spieltheorie, Oldenbourg-Verlag, München, Wien, 2. Auflage, 2005 DIESES BUCH ist die Basisliteratur für die Vorlesung!

2. Martin J. Osborne, Introduction to Game Theory, Oxford University Press, 2003. 3. Muhamet Yildiz, Game Theory Lecture Notes (Internet-Download).

4. David M. Kreps, Mikroökonomische Theorie, MI-Verlag, Harverster Wheatsheaf, 1994

5. Avinash Dixit, Susan Skeath, Games of Strategy, Norton, NYork/London, 2. Aufl. 2004

6. Branislav L. Slantchev, Game Theory, Basic Models, Internet 2005

7. zahlreiche weitere Bücher und Lecture Notes: Fudenberg/Tirole, Güth, Rasmussen, ...

Page 2: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 2 Ströbele

0. Definition Spieltheorie a) Spieltheorie ist „dem Wesen nach nichts anderes als eine mathematische Theorie der

Konfliktsituationen.“ (Wentzel)

b) „Game Theory is a misnomer for a Multi-person Decision Theory, analyzing the decision-making process when there are more than one decision-makers where each agent’s payoff possibly depends on the actions taken by other agents.“ (Yildiz)

c) “Strategic thinking is essentially about your interaction with others: someone else is also doing similar thinking at the same time and about the same situation.” (Dixit/Skeath)

d) Spieltheorie ist ein formalisiertes Verfahren zur Analyse der Interaktion innerhalb einer Gruppe rationaler Spieler, die sich strategisch verhalten. = Definition Vorlesung A.Prinz.

Bausteine eines Spiels sind grundsätzlich:

- I Spieler, die Entscheidungen treffen (i.d.R. I ≥ 2, um ein sinnvolles „Spiel“ zu haben)

- Spielregeln (WER zieht wann; WELCHE Entscheidungen – mindestens mehr als eine -sind jeweils möglich?)

- Ergebnisse als Resultate verschiedener Entscheidungen

- Auszahlungen in Geld- oder Nutzeneinheiten oder ähnlichen Bewertungen

- Informationen (WAS wissen die jeweiligen Spieler an welcher Stelle des Spiels, wenn sie eine Entscheidung treffen müssen?)

- Eventuell Zufallseinfluss: Diesen bringt ein I+1-ter (Pseudo-)Spieler = NATUR hervor

Annahme wie üblich in der Mikroökonomie: Die Spieler handeln rational, auch wenn dies tautologisch erscheint. Wichtig ist aber folgender zweiter Punkt, der für die einfachsten Lösungskonzepte schon spannend ist: Jeder einzelne Spieler geht davon aus, dass seine optimale Strategiewahl nicht die Entscheidungen seiner Mitspieler beeinflusst.

Dieses scheinbar einfache Kriterium kann uns noch Kopfzerbrechen bereiten, wenn bspw. ein möglicher Gewinn von 1000 für Spieler 1 (bei einer Chance auf einen Verlust bei einem Irrtum des zweiten Spielers von -5000 als Folge einer zitternden Hand) abzuwägen ist gegenüber einem Gewinn von 999, der bei einem ähnlichen falschen Verhalten von Spieler 2 auf lediglich 500 fallen kann. Also sind schon hierbei schwierige Fragen hinsichtlich der Nutzen- und Risikoeinstellung und ähnliches grundsätzlich denkbar.

Als einfachste Annahme wird somit gerne unterstellt: Alle Spieler durchschauen das Spiel und haben gleiche Informationen. Jeder Spieler maximiert seinen erwarteten Nutzen und geht davon aus, dass seine Entscheidungen nicht die der anderen Spieler beeinflussen.

In einem Spiel, wo die Farbe einer beliebig gezogenen Spielkarte in einem Skatblatt (gut gemischt) zu bestimmen ist, spielt die NATUR ausgehend vom ersten Knoten (Spielbeginn) einen Zug mit 50 % Chance auf Schwarz und 50 % Chance auf Rot. Dieser wird i.d.R. als einfacher Kreis dargestellt.

Je nach den zugrunde liegenden Annahmen über die Anzahl der Spieler, das Ausmaß der jeweils verfügbaren Informationen, die Komplexität der entstehenden Spielbäume etc. lassen sich (auch mathematisch) äußerst anspruchsvolle Spiele definieren.

Page 3: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 3 Ströbele

Deshalb wird im folgenden ausschließlich aus Gründen einer verständlicheren Darstellung Schritt für Schritt von den einfachsten Konzepten zu den etwas komplexeren vorgegangen.

Grundsätzlich unterscheidet man Spiele in „strategischer“ oder auch „Normalform“ einerseits, „Spiele in extensiver Form“ andererseits. Nur letztere erlauben ein explizites Aufzeigen der einzelnen zeitlichen Züge und ihrer (eventuell nacheinander angeordneten) Reihenfolge samt der jeweils für die einzelnen Züge verfügbaren Informationsmengen. Damit sind Spiele in extensiver Form die grundsätzlich allgemeine Darstellungsmöglichkeit, haben aber den Nachteil, dass sie häufig die letztlich doch einfache Grundstruktur nicht so schnell sichtbar machen. Jedes Spiel in extensiver Form kann eindeutig in ein Spiel in Normalform übersetzt werden, während die Umkehrung nicht generell eindeutig möglich ist.

Deshalb beginnen wir (wie fast alle Lehrbücher) mit den Spielen in strategischer oder Normalform.

1. Spiele in strategischer Form (Normalform) 1.1. Beispiele

a) Gefangenendilemma (prisoners’ dilemma)

Zwei Verdächtige werden in getrennten Zellen untergebracht und getrennt verhört. Für ein schweres Verbrechen gibt es eher magere Beweise, so dass ohne Geständnis eines der beiden die Anklage nur für ein mittleres Vergehen ausreicht. Sollten beide das größere Vergehen ge-stehen, werden sie jeweils zu 10 Monaten Gefängnis verurteilt. Nutzt einer die Kronzeugen-regelung und gesteht alleine, bekommt er einen Monat, während sein Mittäter zu 15 Monaten verurteilt würde. Schweigen beide wie ein Grab, kann das Gericht beide nur wegen des geringeren Vergehens zu je 4 Monaten Haft verurteilen.

Beide bewerten die Haftzeiten mit einer Nutzenfunktion, so dass sich folgende Nutzen-bewertungen ergeben:

Spaltenspieler

Schweigen S Gestehen G

Zeilenspieler Schweigen S (3;3) (0;5)

Gestehen G (5;0) (1;1)

Abbildung: Auszahlungsmatrix in Nutzeneinheiten für das Gefangenendilemma

b) Geschlechterkrieg (battle of the sexes)

In der Zeit ohne Handy treffen sich eine junge Frau und ein junger Mann auf dem Münsteraner Wochenmarkt am Samstag gegen 11 Uhr. Sie lernen kurz ihre Vorlieben für Ballett und Fußball kennen und finden sich sehr sympathisch. Dummerweise müssen sie sich kurzfristig trennen und haben weder Telefonnummern ausgetauscht noch eine feste Verabredung für den Abend getroffen.

Beide wissen:

- Jeder würde gerne den Abend gemeinsam mit dem anderen verbringen. Beide potentiell interessanten Veranstaltungen beginnen abends um 19.00 Uhr.

- Karl geht lieber in das Ballett,

- Karla geht lieber zum Fußballspiel.

Dies ergibt folgende Nutzenbewertungen:

Page 4: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 4 Ströbele

Karla

Ballett Fußball

Karl Ballett (2;1) (0;0)

Fußball (0;0) (1;2)

Abbildung: Auszahlungen (in Nutzeneinheiten) für „battle of the sexes“

Hinweis: Versuchen Sie eine Lösung für diese beiden Spiele zu finden. Bedenken Sie dabei, dass die Spieler nicht miteinander kommunizieren können.

Nach diesen beiden einführenden Beispielen beginnen wir mit der folgenden

Definition 1:

Ein Spiel in strategischer Form (Normalform) wird durch die folgenden drei Elemente definiert: a) Menge der Spieler {1, …, I}. b) Menge Si der (reinen) Strategien s1, s2, …, sMi für jeden der Spieler i = 1, …, I. Dabei kann es durchaus sein, dass Spieler 1 zwei Strategien und Spieler 2 drei Strategien

zur Auswahl hat. c) Auszahlungsfunktionen ui(s), die jeweils bei der Strategiekombinationen s = (s1,…, sI) für

den jeweiligen Spieler i zustande kommt (in „Nutzeneinheiten“). Dabei ist sk ε Sk für k = 1, …, I jeweils eine vom Spieler k gewählte Strategie.

Bei I = 2 führt das zu einer Darstellung in einer Matrix mit jeweils einem Vektor an Auszahlungen in den einzelnen Feldern:

Beispiel: I = 2, S1 = {s11, s12, s13} und S2 = {s21, s22}

Spieler 2

s21 s22

s11 [u1(s11,s21); u2(s11,s21)] [u1(s11,s22); u2(s11,s22)]

Spieler 1 s12 [u1(s12,s21); u2(s12,s21)] [u1(s12,s21); u2(s12,s22)]

s13 [u1(s13,s21); u2(s13,s21)] [u1(s13,s21); u2(s13,s22)]

Ein Lösungskonzept ist eine Korrespondenz (mathematisch auch „Relation“ oder ähnliche Bezeichnung für eine nicht eindeutige Abbildung), welche jedem Spiel eine oder mehrere Strategiekombinationen (d.h. i.d.R eine Menge) als Lösung zuordnet. Wenn diese immer eindeutig wären, ergäbe sich eine „Funktion“ – was aber i.d.R. nicht immer möglich ist.

Bedenken Sie die beiden obigen Beispiele Gefangenendilemma und „Battle of the sexes“. Bei ersterem ist eine eindeutige Lösung bestimmbar; beim zweiten hingegen nicht.

Zur sprachlichen Vereinfachung: Wenn man einen Spieler i betrachtet, ist man oft an allen möglichen Strategien seiner(s) Gegenspieler(s) interessiert. In diesem Fall bezeichnet man mit „-i“ die Gesamtheit der Gegenspieler. Als abkürzende Bezeichnung nimmt man dann folgende Konvention:

Wenn mit s-i ein (I-1)-dimensionales Strategietupel von Strategien aller Spieler mit Ausnahme von Spieler i bezeichnet wird und letzterer spielt s*i, dann sei

(s*i, s-i) = (s1, …, si-1, s*i, si+1, …, sI) als abkürzende Schreibweise definiert.

1.2. Dominanz

Page 5: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 5 Ströbele

Wir betrachten ein Spiel mit I=2 Spielern, die jeweils drei Entscheidungen treffen können:

Spieler 1 kann vertikal Oben (O), Mitte (M) und Unten (U) ziehen, Spieler 2 hat die Wahl zwischen Links (L), mittig (m) und Rechts (R).

Die jeweiligen Auszahlungen werden in einer Matrix mit jeweils einem Vektor dargestellt:

Sp 1 / Sp 2 Links Mittig Rechts

Oben (1;1) (0;2) (2;1)

Mitte (2;2) (1;1) (0;0)

Unten (1;0) (0;0) (-1;1)

Dabei bezeichnet ein Klammerausdruck (xsi; ysj) in einem Matrixfeld (i,j) die Auszahlungen für Spieler 1 (bekommt x) bzw. 2 (bekommt y), wenn sie die jeweiligen Strategien si bzw. sj spielen.

Am Beispiel: Spielt Spieler 1 die Strategie „Oben“ und Spieler 2 spielt (gleichzeitig) „Rechts“, dann erhält Spieler 1 eine Auszahlung von 2 und der zweite Spieler eine Auszahlung von 1.

Dieses Beispiel hat eine Besonderheit, die das Lösungsverfahren erleichtert: Spieler 1 fragt sich beim Vergleich von „Mitte“ und „Unten“, warum er jemals „Unten“ spielen sollte:

- Spielt Spieler 2 „links“ gilt bei Mitte 2 > 1 = Unten,

- Spielt Spieler 2 „mittig“ gilt 1 > 0,

- Spielt Spieler 2 „rechts“ gilt 0 > -1.

Für Spieler 1 gibt es also keine denkbare Konstellation, in welcher er „unten“ spielen sollte. Er befindet sich also in einer Situation, wo es immer eine bessere Strategie („Mitte“) gegenüber „unten“ gibt.

Beispiel: Sie bekommen nach Ihrem Uni-Abschluss drei Angebote mit unterschiedlichem Gehalt, unterschiedlicher Attraktivität der Stadt, in der Sie arbeiten sollen und unterschiedlicher Entfernung nach Münster, wo Ihr(e) Freund(in) noch studiert. Wenn ein Angebot A in allen Punkten besser ist als ein anderes B [besseres Gehalt, interessantere Stadt und näher bei Ihrer/m Freund(in)], werden sie offensichtlich Angebot B ausscheiden und nur noch A und ein weiteres Angebot C abwägen, bei dem das Gehalt noch besser ist, aber sie weit weg von Münster ziehen müssen.

Definition (Dominanz von Strategien):

a) Eine reine Strategie si des Spielers i ist strikt dominiert, falls s*i existiert, so dass gilt

ui(s*i, s-i) > ui(si, s-i) für alle s-i ε S-i

b) Eine reine Strategie si des Spielers i ist schwach dominiert, falls s*i existiert, so dass gilt

ui(s*i, s-i) ≥ ui(si, s-i) für alle s-i ε S-i und ui(s*i, s-i) > ui(si, s-i) für ein s-i ε S-i

Bei schwacher Dominanz sind also Gehalt und Attraktivität der Stadt gleich gut, aber die Entfernung nach Münster ist für ein Angebot besser als für das andere.

ACHTUNG: Es gibt zahlreiche Spiele, bei denen es keinerlei Dominanz von Strategien gibt, so dass das folgende Lösungskonzept nur für diesen Spezialfall gilt.

Page 6: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 6 Ströbele

Im obigen Spiel haben wir festgestellt: Für Spieler 1 ist offensichtlich „Mitte“ immer besser als „Unten“. Das heißt, er wird niemals „Unten“ spielen. Wenn wir jetzt die letzte Zeile eliminieren – weil dies Spieler 2 ja auch weiß!, dann reduziert sich das Spiel:

1 / 2 Links mittig Rechts

Oben (1;1) (0;2) (2;1)

Mitte (2;2) (1;1) (0;0)

Abbildung: Reduziertes Spiel nach Elimination der strikt dominierten Strategie „Unten“.

Jetzt stellt aber Spieler 2 fest, dass für ihn die Strategie „rechts“ strikt dominiert wird von „mittig“. Da dieses wiederum beide Spieler wissen, kann die rechte Spalte eliminiert werden, so dass ein noch einfacheres Spiel entsteht:

1 / 2 Links Mittig

Oben (1;1) (0;2)

Mitte (2;2) (1;1)

Abbildung: weiter reduziertes Spiel nach Elimination der Spalte „Rechts“

Da jetzt wiederum Spieler 1 feststellt, dass es für ihn immer besser ist, die Strategie „Mitte“ zu spielen (denn „Oben“ ist jetzt nirgends besser als „Mitte“) und daraufhin Spieler 2 sich für „Links“ entscheidet, enden beide bei einer Auszahlung von (2,2).

Jetzt lassen sich die beiden Spiele Gefangenendilemma und „Battle of Sexes“ betrachten:

Das ursprüngliche Gefangenendilemmaspiel kann nach der Methode der schrittweisen Elimi-nation dominierter Strategien gelöst werden: Spielt S „Schweigen“, ist es für Z am besten „Gestehen“ zu spielen; spielt S „Gestehen“, ist es wiederum für Z am besten „Gestehen“ zu spielen. Damit scheidet „Schweigen“ für Z aus. Im Ergebnis gestehen beide, so dass sie jeweils mit einer mittleren Strafe rechnen müssen. Die aus „Mafia-Sicht“ bessere Strategie „Schweigen“ kommt nicht zum Zuge: Es gibt keine Absprachen, keine absehbare Wiederholung des Spiels und auch keine Androhungen für anderes Verhalten.

Im „Battle of the sexes“ gibt es keine dominante Strategie: HIER hilft das bisher benutzte spezielle Lösungskonzept (sukzessive Eliminierung dominierter Strategien) ohnehin nicht weiter.

AUFGABE 1: Finden Sie nach dieser speziellen obigen Lösungsmethode die Lösung für das folgende Spiel aus SIEG, Seite 8:

Spieler S(palte)

Links Rechts

Oben (2;0) (3;1)

Spieler Z(eile) Mitte (0;3) (1;2)

Unten (4;0) (1,1)

Das Ergebnis lautet nach schrittweiser Eliminierung (strikt) dominierter Strategien: Spieler Z spielt „Oben“ und Spieler S spielt „rechts“.

Page 7: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 7 Ströbele

AUFGABE 2: Erläutern Sie die Lösung im „Tankstellenspiel“ in SIEG, Beispiel 2.3.

AUFGABE 3: Warum bietet man bei einer Versteigerung am besten gemäß der wahren Zahlungsbereitschaft? Vgl. dazu SIEG, Beispiel 2.4.

Definition: Eine Strategie sid heißt (schwach) dominant für Spieler i, wenn alle anderen Strate-

gien des Spielers i von sid schwach dominiert werden. Eine Strategie si

d heißt strikt dominant für Spieler i, wenn alle anderen Strategien des Spielers i von si

d strikt dominiert werden.

Wenn Spieler i rational ist (was wir i.d.R. unterstellen) und er verfügt über eine strikt domi-nante Strategie, wird er keine andere Strategie spielen. Für diesen speziellen Fall ist das Spiel-ergebnis durch ausschließliches Betrachten der dominanten Strategie leichter bestimmbar.

Problematischer wird es hingegen bei nur schwach dominierten Strategien:

Hier lassen sich Beispiele finden, wo etwa die Reihenfolge der Eliminierung von Strategien darüber entscheidet, ob es eine eindeutige Lösung gibt oder nicht.

Dies soll am folgenden Beispiel, das auf Kohlberg und Mertens zurückgeht, verdeutlicht werden.

Spieler 2

L R

U (3 ; 2) (2 ; 2)

Spieler 1 M (1 ; 1) (0 ;0)

D (0 ; 0) (1 ; 1)

Offensichtlich wird für Spieler 1 die Strategie D durch U strikt dominiert; also kann er sie verwerfen. Dann ergibt sich ein einfacheres Spiel, bei dem jetzt für Spieler 2 die Strategie R (schwach) durch L dominiert wird. Verwirft man jetzt auch diese Strategie, dann ist das Nash-Gleichgewicht durch (U ; L) gegeben.

Man beachte allerdings, dass im ursprünglichen Spiel auch M durch U strikt dominiert wird. Verwirft man diese Strategie nun zuerst, verbleibt ein Restspiel, in dem für Spieler 2 jetzt R die Strategie L (schwach) dominiert. Dann landet man schließlich bei (U ; R) als Nash-Gleichgewicht.

Wegen solcher möglicher Probleme neigen die meisten Spieltheoretiker dazu, lediglich schwach dominierte Strategien (ohne Zusatzinformationen über das Spiel) nicht zu verwerfen.

1.3. Nash-Gleichgewichte

1.3.1. Nash-Gleichgewichte in reinen Strategien

Da sich längst nicht alle Spiele nach dem Kriterium der sukzessiven Elimination (strikt) domi-nierter Strategien lösen lassen, wird das nächste sinnvolle Lösungskonzept vorgestellt:

Dabei sucht man jeweils die beste Antwort eines Spielers i auf eine (zunächst beliebig) gewählte Strategie seines(r) Gegenspieler(s) -i. Wenn sich dabei herausstellt, dass es (eine oder mehrere) Strategien s*i gibt, bei denen sich i (bei Wahl der Strategie s*-i durch die übrigen) nicht mehr besser stellen kann et vice versa, dann nennt man dies ein Nash-Gleichgewicht. Kein Spieler kann sich in einem Nash-Gleichgewicht durch einseitiges Abweichen von seiner Strategie s*i (oder s*-i) besser stellen.

Definition (Nash-Gleichgewicht):

Page 8: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 8 Ströbele

Eine Strategiekombination s* heißt Nash-Gleichgewicht, falls für alle Spieler i gilt:

ui(s*i, s*-i) ≥ ui(si, s*-i) für alle si ε Si .

In einem Nash-Gleichgewicht kann sich jeder Spieler i (beliebig ausgewählt) nicht mehr (strikt) verbessern, wenn er eine andere Strategie als s*i wählt (solange die Gegenspieler bei ihrer gewählten Strategie s*-i bleiben.

Offensichtlich sind die bereits oben beschriebenen Gleichgewichte nach der Methode „Eliminierung strikt dominierter Strategien“ sämtlich Nash-Gleichgewichte: Es sind ja gerade die schlechteren Strategien schrittweise ausgeschieden, so dass nur die echt besseren übrig geblieben sind. Wenn dann ein Gleichgewicht gefunden wurde, muss dies die Nash-Bedingung erfüllen. Ein Nash-Gleichgewicht, in dem Spieler i eine strikt dominierte Strategie si wählen würde, wäre offensichtlich ein Widerspruch: Es muss dann ja eine noch bessere Antwort auf s*-i der übrigen Spieler geben.

a) Duopollösung im homogenen Markt

Das berühmteste Beispiel für ein Nash-Gleichgewicht wird bereits in der Duopol-Theorie für homogene Güter behandelt:

Wenn zwei (etwa gleich starke, d.h. in den Kostenparametern nicht extrem unterschiedliche) Unternehmen im Markt existieren, die ein aus der Sicht der Nachfrager homogenes Gut pro-duzieren, liegt ein Duopol (im homogenen Markt) vor. Die Wechselwirkung der beiden Anbie-ter entsteht dadurch, dass sie gemeinsam auf die (Gesamt-)Nachfragefunktion p = a –b⋅(y1 + y2) stoßen. Da im Markt ein homogenes Gut gehandelt wird, kann es (ohne Kapazitäts-beschränkungen) nur einen einheitlichen Preis geben. Jedes der beiden Unternehmen muss in Kenntnis der wechselseitigen Marktbeeinflussung eine Mengenstrategie wählen.

Annahme: Kosten1(y1) = α1 + c1 ⋅ y1 und Kosten2(y2) = α2 + c2 ⋅ y2, d.h. GKi(yi) = ci.

O.B.d.A. nehmen wir an: c1 ≤ c2. Wir suchen die bestmögliche Antwort von Unternehmen U1 auf eine zunächst (irgendwie) gegebene Produktionsmenge y2 von U2. Bei gegebenem y2 ergibt sich der Gewinn von Anbieter 1 zu:

(1.1) G1(y1, y2 ) = p(y1 + y2) ⋅ y1 – K1(y1) = [a – b ⋅ (y1 + y2)] ⋅ y1 – α1 - c1 ⋅ y1

Graphische Lösung: Ein wichtiges Instrument zur Analyse (ähnlich wie Isoquanten oder Indif-ferenzkurve) sind ISO-GEWINN-Kurven. Dazu wird gedanklich eine beliebige Gewinnhöhe G1 festgehalten und der jeweilige Zusammenhang zwischen y1 und y2 ermittelt.

(1.2) y2 = ( )a cb

y Gb y

−− −

+⋅

11

1 1

1

α

Page 9: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 9 Ströbele

T′S′

2y

1y

R1

Q′P′

=

1G =0

1y

a cb S

2y U′

Abbildung 1-1: Iso-Gewinn-Kurven für Unternehmen 1 im Mengen-Diagramm

Der Verlauf dieser ISO-GEWINN-Kurven ist für den Fall c1 = c2 = c und α1 = 0 in der Abbildung 1-1 dargestellt. Für spätere Vergleiche sei dann abgekürzt: S = (a-c) / b .

Je weiter nach „südlich“ die ISO-GEWINN-Kurve liegt, desto größer ist der zugehörige Ge-winn für Unternehmen 1. Wenn also y2 aus der Sicht von U1 gegeben ist, muss es lediglich die am weitesten „südlich“ liegende ISO-GEWINN-Kurve suchen und bestimmt damit die optimale Antwort. Die jeweils graphisch bestimmten (y1,y2)-Kombinationen liegen (in unserem Spe-zialfall) auf einer Geraden. Da sie jeweils die optimale Reaktion von U1 auf ein gegebenes y2 darstellt, nennt man sie die Reaktionsfunktion R1 von U1.

Algebraische Lösung: Das Gewinn-Maximum für U1 bei gegebenem y2 wird durch NULL-Setzen der 1.Ableitung der Gewinn-Funktion (1.1) nach y1 bestimmt. Auch dies liefert die sogenannte Reaktionsfunktion R1 (die hier eine Gerade ist) für U1 im Mengendiagramm:

Zuerst: )( 21 yfy = aus G1 max ! mit =1

1

yG

δδ a – 2 · b · y1 – b · y2 – c1 = 0, was ergibt :

(1.3) 11

2 2 yb

cay ⋅−−

= Reaktionsfunktion R1; sei b

caS 11

−=

Symmetrisch lässt sich natürlich dieselbe Überlegung für den anderen Anbieter U2 anstellen, für den sich die Reaktionsfunktion R2 ergibt:

(1.4) 22 1

12 2

a cy yb−

= − ⋅ Reaktionsfunktion R2; sei bca

S 22

−=

Frage nach Nash-Gleichgewicht: Gibt es eine Lösung, in der beide Anbieter simultan keinen Anreiz mehr haben, ihre Pläne zu korrigieren, weil sie sich beide (bei der unterstellten Verhaltensweise) nicht mehr verbessern können? Offensichtlich liegt dieser Fall im Schnittpunkt der beiden Reaktionsfunktionen vor.

Gleichsetzen von (1.3) und (1.4) ergibt:

(1.5a) 3

23

2 21121

SSb

ccay

−⋅=

⋅⋅−+

= , 3

23

2 12212

SSccay

−⋅=

⋅−+= und

yges = y1 + y2 = 33

2 21212

SSb

ccay

+=

⋅−−⋅

=

Page 10: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 10 Ströbele

(1.5b) p = c1 + 13⋅ (a – c1) + 1

3⋅ (c2 – c1) = 1

3· (a + c1 + c2)

Damit jeweils gilt yi ≥ 0, verlangen wir die Bedingungen: ci ≤ a c j+

2für i,j = 1,2.

Für den Spezialfall eines völlig symmetrischen Duopols (beide Anbieter weisen auch iden-tische Grenzkosten auf c = c1 = c2) ergibt sich bei 2 Anbietern als Nash-Cournot-Lösung:

(1.6a) y1 = y2 = bca

⋅−

3 und yges = y1 + y2 =

bS

bca

⋅⋅

=⋅−⋅

32

3)(2 .

Der Gleichgewichtspreis p* ergibt sich durch Einsetzen in die Nachfragefunktion als:

(1.7) p* = a – b ⋅ yges = c + 13

⋅ (a-c) = 32⋅ c +

31⋅ a

(1.8) Jedes Unternehmen erzielt einen Gewinn in Höhe von (p*-c)· bca

⋅−

3=

2

3⎟⎠⎞

⎜⎝⎛⋅

Sb

b) Nash-Gleichgewichte müssen nicht pareto-optimal sein Anhand des folgenden Spiels werden einige Aspekte von Nash-Gleichgewichten verdeutlicht: Spieler S(palte)

Links Mitte Rechts

Dach (3;1) (2;3) (10;2)

Spieler Z(eile) Obergeschoss (4;5) (3;0) (6;4)

Erdgeschoss (2;2) (5;4) (12;3)

Keller (5;6) (5;5) (9;7)

Zunächst prüfen wir für eine beliebige Zelle, ob sie als Nash-Gleichgewicht in Frage kommt:

- Spielt Z die Strategie O(bergeschoss) und S spielt R, dann erhielte Spieler Z einen Payoff von 6, Spieler R einen Payoff von 4. Es gibt aber einen massiven Grund für beide Spieler, sich nach Verbesserungsmöglichkeiten umzusehen: Die beste Antwort von S auf den Zug O von Z wäre natürlich der Zug L (Payoff für S steigt von 4 auf 5). Umgekehrt ist bei gegebenem Zug R von S die beste Antwort von Z durch E(rdgeschoss) mit einem Payoff von 12 gegeben.

- Analyse der jeweils besten Antworten (Reaktionsfunktion). Ordnet man jetzt den denkbaren Strategien von Z (D, O, E, K) die jeweils besten Antworten von S zu, erhält man: D wird mit M beantwortet; dann ist aber E oder K besser für Z. O wird mit L beantwortet; dann ist aber K besser für Z. E wird mit M beantwortet – hier gibt es für Z keine weitere (echte) Verbesserungsmöglichkeit. K wird mit R beantwortet; dann ist aber E besser für Z.

- Zur Überprüfung kann man dasselbe Verfahren auch für die möglichen Strategien von S anwenden und erhält auch hier, dass lediglich im Falle (E;M) keine weitere Verbesserung mehr erreichbar ist. (E;M) ist hier das eindeutig bestimmte Nash-Gleichgewicht.

- Wie man sieht, realisiert das Nash-Gleichgewicht Payoffs (Nutzen) für die beiden Spieler, die durch das Ergebnis (9;7) bei der Strategie (K;R) für beide gegenüber (5;4) verbessert werden könnten. Dies bedeutet: Das hier erreichte Nash-Gleichgewicht ist nicht Pareto-optimal. Das Pareto-Optimum wird in dem nicht-kooperativen Spiel (ohne Verhandlungen über bindende Verhaltensweisen, die beide verbessern könnten!) verfehlt.

Page 11: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 11 Ströbele

Eigenschaften von Nash-Gleichgewichten: a) Die gewählten Strategien s*i sind jeweils beste Antworten auf s*-i. b) Jeder Spieler bedauert seine Entscheidung (unter den gegebenen Entscheidungen der

anderen) nicht! c) Gleichgewichte, welche nach der Methode strikter Dominanz gefunden wurden, sind Nash-

Gleichgewichte. d) In einem Nash-Gleichgewicht kann es (für jeden Spieler) keine gewählten strikt dominierten

Strategien geben. e) Es kann (sehr viele) Spiele geben, für die kein Nash-Gleichgewicht in reinen Strategien

existiert. Beispiel für (e): Matching-pennies-Spiel 2 Spieler decken je eine Münze (Penny) auf; sie entscheiden simultan, ob sie jeweils Kopf oder Zahl zeigen. Die Payoff-Regeln ergeben sich aus der Tabelle: Spieler S(palte) gewinnt den Penny des anderen, wenn Kopf+Kopf oder Zahl+Zahl fällt, Spieler Z(eile) gewinnt den Penny, wenn Kopf+Zahl oder Zahl+Kopf kommt. Spieler Spalte Kopf Zahl Spieler Zeile Kopf (-1;1) (1;-1) Zahl (1;-1) (-1;1)

Dieses Spiel hat kein Nash-Gleichgewicht in reinen Strategien (selbst überprüfen).

1.3.2. Nash-Gleichgewicht in gemischten Strategien Ein in vielen Situationen nahe liegender Gedanke ist, einen Zufallsprozess einzuschalten, um zu einer Auswahl aus Strategiealternativen zu kommen: Torwart beim Elfmeter, „Battle of sexes“, Stein-Schere-Papier-Spiel, Matching-Pennies etc. a) Definition Dieser Ansatz führt zu so genannten „gemischten Strategien“. Definition gemischte Strategien: Eine gemischte Strategie σi = (σ1, …, σMi) für Spieler i ist eine Wahrscheinlichkeitsverteilung über der Menge der reinen Strategien Si = {s1

i, …, sMii. Σi sei der Raum aller gemischten

Strategien des Spielers i. Daraus ergibt sich die naheliegende Verallgemeinerung für Nash-Gleichgewichte: Definition gemischtes Nash-Gleichgewicht (oder Nash-GG in gemischten Strategien): Eine Kombination σ* = (σ1*, …, σI*) von gemischten Strategien heißt Nash-Gleichgewicht (in gemischten Strategien), wenn für alle Spieler i gilt: ui(σ*i, σ*-i) ≥ ui(σi, σ*-i) für alle σi ε Si .

b) Beispiel 1: Geschlechterkampf

Im “battle of sexes” wird die Lösungsmethode verdeutlicht:

Page 12: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 12 Ströbele

Karla

Ballett Fußball

Karl Ballett (2;1) (0;0)

Fußball (0;0) (1;2)

Jeder der beiden Spieler hat zwei Entscheidungsmöglichkeiten. Er/Sie belegt diese Entschei-dungen mit einem Zufallseinfluss, so dass

- Karl mit Wahrscheinlichkeit p ins Ballett, mit Wahrscheinlichkeit 1-p zum Fußball geht,

- Karla mit Wahrscheinlichkeit q ins Ballett und mit 1-q zum Fußball geht. Der erwartete Nutzen von Karla ergibt sich dann wie folgt:

E[U2(p;q)] = p · q · u2(Ballett; Ballett)

+ p· (1-q) · u2(Fußball; Ballett) + (1-p) · q · u2(Ballett; Fußball) + (1-p) · (1-q) · u2(Fußball; Fußball) = p · q · 1 + p· (1-q) · 0 + (1-p) · q · 0 + (1-p) · (1-q) · 2 = (3 · p – 2) · q + 2 – 2 · p Bezüglich der (von Karla beeinflussbaren) Wahrscheinlichkeit q ergibt sich für größere q

- ein steigender Nutzen für Karla, wenn p > 2/3 → q = 1, - ein konstanter Nutzen für Karla, wenn p = 2/3 → q unbestimmt, - ein fallender Nutzen für Karla, wenn p < 2/3 → q = 0.

Da der Zusammenhang bzgl. q linear ist, ergibt sich jeweils eine Randlösung für ein Nutzenmaximum von Karla: Wähle q = 1 solange p > 2/3 und q = 0, wenn p < 2/3 und q = beliebig, wenn p = 2/3. (= Reaktionsfunktion von Karla auf eine beliebige Entscheidung von Karl für p). Ebenso ergibt sich der Nutzen von Karl (in spiegelbildlicher Rechnung): E[U1(p;q)] = (3 · q – 1) · p + 1 – q. Er wählt p = 1, solange q > 1/3 und p = 0, solange q < 1/3 und p beliebig, wenn q = 1/3. (= Reaktionsfunktion von Karl) Die eingezeichneten Reaktionsfunktionen im (p,q)-Diagramm liefern die möglichen Nash-Gleichgewichte: (0,0) ist eine Lösung, d.h. beide gehen nicht ins Ballett, sondern zum Fußball, (1,1) ist ebenfalls eine Lösung, d.h. beide gehen ins Ballett und schließlich ist die Lösung (1/3; 2/3) ebenfalls ein Gleichgewicht: Jeder benutzt einen Würfel und Karla geht bei Zahlen 1-4 ins Ballett und bei Zahlen 5,6 zum Fußball, Karl umgekehrt.

Page 13: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 13 Ströbele

p

q

1

1

(0 , 0)

(2/3 , 1/3) RKarl

RKarla (1 , 1)

2/3

2/3

1/3

1/3 Die gemischten Gleichgewichte werden also wie folgt ermittelt: Spieler 1 = Karl bestimmt seine bestmögliche Wahrscheinlichkeit p, so dass Karla (Spieler 2) indifferent wird (p = 2/3). Karla bestimmt umgekehrt ihre bestmögliche Wahrscheinlichkeit q, so dass Spieler 1 indifferent ist (q = 1/3). Dies ergibt die Reaktionsfunktionen mit den Nash-Gleichgewichten. c) Beispiel 2: Matching Pennies

Das obige Spiel Matching Pennies

Spieler 2 Spalte E{Payoffs} für Z Kopf Zahl Spieler 1 Zeile p Kopf (-1;1) (1;-1)

1-p Zahl (1;-1) (-1;1) Q 1-q

lässt sich durch gemischte Strategien lösen.

Ergebnis für Spieler 2: p · q - p(1-q) – q(1-p) + (1-p) · (1-q) = 4 · p · q- 2p - 2q +1 = (4· p – 2) · q – 2 · p +1 Dann gilt: p > ½ → q = 1 = KOPF INDIFFERENZ 2: p = ½ → q unbestimmt p < ½ → q = 0 = ZAHL Reaktionsfunktion von Spieler 2. Analog erhält man für Spieler 1 dessen Reaktionsfunktion:

q > ½ → p = 0 = ZAHL INDIFFERENZ 1: q = ½ → p unbestimmt q < ½ → p = 1 = KOPF Reaktionsfunktion von Spieler 1. Die Reaktionsfunktionen und deren drei Nash-Gleichgewichte sind in der folgenden Abbildung dargestellt.

Page 14: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 14 Ströbele

. d) Beispiel 3: (SIEG, S. 18 ff.) Umweltschutzpolitik Das Umwelt-Spiel mit Überwachungskosten (100 €/Auto). q Staat 1-q Überprüfung Keine Überprüfung KfZ-Halter p Mit Umwelttechnik (-500 ; -100) (-500 ; 0) 1-p Ohne Umwelttechnik (-4000 ; 0) (0 ; -8000)

hat in reinen Strategien kein Nash-Gleichgewicht; aber sehr wohl in gemischten.

Dazu berechnet man den erwarteten Payoff des Staates als E{UStaat) = p · q · (-100) + p · (1-q) · 0 + (1-p) · q · 0 + (1-p) · (1-q) · (-8000) = = -8100 · p · q + 8000 · p + 8000 · q -8000 = (8000 – 8100 · p) · q – (1-p) · 8000. Da der Staat über q entscheidet, maximiert er seinen erwarteten Payoff in Abhängigkeit des von den Autohaltern gesetzten p, was wiederum den Prozentsatz der gesetzestreuen KfZ-Halter bestimmt: p = 8000 / 8100 = 0,98765 = 98,8 %. Der erwartete Payoff der Autofahrer beträgt: E{UKfZ} = p · q · (-500) + (1-p) · q · (-4000) + p · (1-q) · (-500) = (4000 · q - 500) · p – 4000 · q . Nach den gleichen Überlegungen wie oben ergibt sich die Klammer zu NULL, wenn ein bestimmter q-Wert gilt (der vom Staat gesetzt wird): q = 500 / 4000 = 0,125 = 12,5 %. Im Optimum kontrolliert also der Staat jeden achten Autofahrer und es halten sich durchschnittlich 98,8 % der Autofahrer an die Umweltauflage. 1.3.3. Multiple Nash-Gleichgewichte Das folgende Markteintrittsspiel (Boeing versus Airbus) hat zwei Nash-Gleichgewichte in reinen Strategien (im Spieltableau fett gedruckt),

- Unternehmen Boeing tritt in den Markt ein und Airbus nicht, - Unternehmen Airbus tritt in den Markt ein und Boeing nicht.

Neues Flugzeugmodell Airbus Markteintritt q Kein Markteintritt 1-q

Boeing Markteintritt p (-5 ; -5) (100 ; 0) Kein Markteintritt 1-p (0 ; 100) (0 ; 0)

Wir prüfen die Frage: Gibt es ein Gleichgewicht in gemischten Strategien? E{UBoeing) = p · q · (-5) + p · (1-q) · 100 + (1-p) · q · 0 + (1-p) · (1-q) · 0 = = -105 · p · q + 100 · p = (100 – 105 · q) · p

Page 15: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 15 Ströbele

Falls der Klammerterm positiv ist (q < 100/105 = 0,9524), ergibt sich wieder wie oben: p = 1. Indifferenz gilt für q = 0,9524 = 0,9524. E{UAirbus) = p · q · (-5) + q · (1-p) · 100 + (1-q) · p · 0 + (1-p) · (1-q) · 0 = = -105 · p · q + 100 · q = (100 – 105 · p) · q.

Analoge Schlüsse wie oben ergeben für q (darüber kann Airbus entscheiden): p = 100/105 = 0,9524 → q beliebig.

Jedes der beiden Unternehmen tritt also im (gemischten) Nash-Gleichgewicht mit 95,24 % Wahrscheinlichkeit in den Markt ein und bleibt mit 4,76 % Wahrscheinlichkeit draußen. Der dabei erwartete Payoff beträgt für jedes Unternehmen 0,9071 · (-105) + 95,24 = 0. Das heißt:

Zusätzlich zu den obigen Nash-Gleichgewichten in reinen Strategien gibt es noch ein weiteres Nash-Gleichgewicht in gemischten Strategien.

Mögliche Lösungen bei multiplen Gleichgewichten:

- Kommunikation (hilft nur bei Koordinationsproblemen: Autofahrer an einer Kreuzung)

- Sich selbst erfüllende Erwartungen (self fulfilling prophecies): Beide Unternehmen gehen von Erfolgsdruck für sich selbst und ihren Konkurrenten aus. Wenn Airbus zuerst mit einem größeren Mittelstreckenflugzeug erfolgreich war, wird Boeing einen leistungsstarken Kurzstreckenflieger entwickeln etc.

- Fokalpunkte: Wo trifft man sich in einer Stadt ? In Hannover gelten „unterm Schwanz“, in Göttingen „Gänselieselbrunnen am alten Rathaus“ als natürliche Fokalpunkte. In Münster ist dies schwieriger, da es neben dem Dom auch die Lambertikirche gibt.

Ergebnisse:

(1) In jedem Spiel mit endlich vielen Spielern und endlich vielen Strategien existiert (mindestens) ein möglicherweise gemischtes Nash-Gleichgewicht.

(2) Falls die Strategiemenge aus unendlich (i.d.R. / eventuell auch überabzählbar unendlich vielen Elementen besteht – wie etwa im Nash-Cournot-Duopol-Spiel – dann sind Anforde-rungen an die mathematischen Eigenschaften des Strategieraums und an die Auszahlungs-funktion erforderlich, um die Existenz eines Nash-Gleichgewichts sicherzustellen.

(3) Nash-Gleichgewichte müssen nicht Pareto-optimal sein, bzw. sind es i.d.R. auch nicht.

(4) Das einfachste Lösungsverfahren besteht in der schrittweisen Eliminierung strikt domi-nierter Strategien (da kein rationaler Spieler diese jemals wählt).

(5) Die allgemeine Methode besteht darin, für jeweils Spieler i die bestmögliche Antwort auf eine (irgendwie) gegebene Strategie s*-i zu bestimmen (entweder durch Abzählen möglicher Antworten oder durch Differentialrechnung). Falls kein Gleichgewicht (oder mehrere) in reinen Strategien existiert, dann müssen gemischte Strategien untersucht werden.

1.4. Nullsummen- und Minimax-Wert

In einem Nullsummenspiel (NSS) erhält Spieler i eine Auszahlung, die der andere Spieler bezahlen muss (ACHTUNG: Hierbei geht es um echte €- oder Gutwerte, nicht um Nutzenein-schätzungen). Die Auszahlungen beider Spieler addieren sich somit stets auf NULL. Die allgemeinere Form ist das Spiel um konstante Beträge (nicht notwendigerweise um NULL)

Beispiel: Der Sachmitteletat in der Fakultät x ist durch externe Vorgaben festgelegt. Ab jetzt geht es darum, durch einen geschickten Verteilungsschlüssel möglichst viel davon in das eigene Fach / das eigene Institut zu lenken. Da es sich hierbei um ein Konstant-Summenspiel handelt,

Page 16: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 16 Ströbele

entstehen daraus natürlich Konflikte. Wer gut in der Forschung ist, legt Wert auf eine hohe Belohnungsquote für Forschungsindikatoren, wer gut in der Lehre ist, möchte Diplomarbeiten und Vorlesungsrankings als Maßstab für die Geldverteilung. Wenn dieses Verteilungsspiel nur einmalig gespielt würde, gäbe es erhebliche Konfliktpotentiale. Da es wiederholt gespielt wird, bestehen bessere Aussichten, dass sich die Beteiligten auf „faire“ Aufteilungsregeln einigen.

Das oben bereits beschriebene Matching-Pennies-Spiel ist ein Nullsummenspiel, ebenso wie das Stein-Schere-Papier-Spiel. Typisch für beide Spiele ist, dass sie nur in gemischten Strategien ein Nash-Gleichgewicht haben. Der Erwartungswert der Auszahlung an jeden Spieler ist dann jeweils NULL.

Der Minimax-Wert ist diejenige Auszahlung, die Spieler i (maximal) erreichen kann, wenn seine Gegenspieler (-i) versuchen, seine Auszahlung zu minimieren und er dies durchschaut. Wenn somit Spieler i seine Strategien aus den Strategieräumen Σi wählt mit Auszahlungen ui:

));(max(min iiii umiiii −ΣΣ−−

= σσεσεσ

WICHTIG:

Bei NSS sind Minimax-Strategien und Nash-Gleichgewichtsstrategien identisch.

Bei Konstantsummenspielen (mit Summe ≠ 0) gilt dies i.d.R. nicht (siehe SIEG, S. 26 f.) Minimax-Strategien zeigen, was ein Spieler als Auszahlung mindestens erhält (im obigen Fa-kultätsspiel bspw. die Mindestsachmittel pro Professor und Mitarbeiter).

Beispiel (aus SIEG):

Spieler S(palte)

Links Rechts

Oben (2 ; 0) (1 ; 1)

Spieler Z(eile) Mitte (1 ; 1) (2 ; 0)

Unten (-1 ; -2) (0 ; -3) Sucht man den jeweils maximal möglichen Payoff, kann „Unten“ nach dem Kriterium der strikten Dominanz ausgeschieden werden. Das Spiel hat dennoch in reinen Strategien kein Nash-Gleichgewicht: Beste Antwort von Spieler Z auf „Links“ von Spieler S ist „Oben“, was aber Spieler S mit „rechts“ beantwortet. Beste Antwort von Z auf „Rechts“ ist Mitte, was aber bei S zu „Links“ führt: keine für jeden konsistente bestmögliche Antwort erreichbar. In gemischten Strategien gilt aber (nach Eliminierung von „Unten“): Es gibt ein gemischtes Nash-Gleichgewicht mit p = ½ für Spieler Z und q = ½ für Spieler S (selbst nachrechnen durch erwartete Payoffs und Indifferenz bei p = q = ½ für jeden Spieler). Die erwarteten Payoffs bei dieser Strategie sind jeweils 1,5 für Spieler Z und 0,5 für Spieler S. Will der Zeilenspieler den Payoff des Spielers Z minimieren, muss er „unten“ spielen: Dann erreicht S den Minimax-Wert mS = -2. Dazu müsste aber Z sich selber schaden, denn er kann ja bei einer gemischten Strategie Mitte-Oben immer mZ = 1,5 erreichen. Hier Minimax zu spielen, ist somit kein Nash-Gleichgewicht.

Page 17: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 17 Ströbele

2. Dynamische Spiele mit vollständiger Information

2.1. Spiele in extensiver Form

2.1.1. Perfekte (vollkommene) Information - Jeder Spieler beobachtet und behält alle vorangegangenen Spielzüge, bevor der nächste Zug

gewählt wird. - Jeder Spieler weiß, wer welchen Spielzug gemacht hat, bevor er seine Entscheidung trifft.

Der zweite Punkt ist deshalb besonders wichtig, weil Spieler i aus Spielzügen von Spieler (-i) eventuell schließen kann, welchen Payoff dieser ansteuert und kann damit seine Strategie darauf abstimmen.

a) Beispiel: Markteintrittsspiel Ein bisher alleine in einem Ort anbietender Monopolist (für regionale Dienstleistungen) wird vom möglichen Markteintritt eines Konkurrenten bedroht. Der Newcomer hat die Wahl zwi-schen Eintritt (Enter) oder Draußen bleiben (Don’t). Wenn der Newcomer den Markteintritt wählt, kann der Altsasse (incumbent) entweder „kämpfen“ oder „anpassen“ wählen. Ausgangslage in einem Markt ist ein bisher allein agierender Monopolist. Die Nachfrage-funktion lautet: p = 20 – ½ · (y1 + y2). Die Grenzkosten seien im relevanten Bereich konstant c = 4. Der Newcomer muss Markteintrittskosten aufbringen, die der Altsasse schon hinter sich hat. Diese Kosten legt er kalkulatorisch auf 10 Jahre um, so dass er jedes Jahr 2 Einheiten fix als Kosten des Markteintritts rechnen muss. Als Monopolist produziert U1 die Menge y1 = 16, der Preis beträgt 12, der Gewinn G1 = 128. Die v.Stackelberg-Lösung bei Marktzutritt ergibt hier (y1;y2) = (16;8) mit p = 8 und den Gewinnen (G1;G2) = (64;32-2) = (64;30).

Sollte der Altsasse versuchen, den Gewinn von U2 auf NULL zu drücken, um damit auf Dauer dessen Markteintritt zu verhindern, müsste er y1 = 28,001 setzen (was bei der bestmöglichen Antwort von U2, nämlich y2 = 1,999 und damit y1 + y2 = 30; p = 5 zu einem negativen Gewinn G2 führt). Bei y1 = 28,001 und p = 6 entsteht ein Gewinn G1 = 56.

D E

anpassenkämpfen

Altsasse

( 56 ; 0 ) ( 64 ; 30 )

Markteintritt

( 128 ; 0 )

Newcomer

Abbildung 2.1: Das Markteintrittsspiel (Basisversion) Die dabei entstehenden Auszahlungen sind beiden Spielern bekannt. Die graphische Darstellung dieses sequentiellen Spiels (Zug um Zug) ist in der Abbildung 2.1. gegeben.

Page 18: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 18 Ströbele

b) Ultimatum-Spiel

Ein anderes dynamisches Spiel ist das Aufteilungsspiel eines gegebenen Betrags (Erbschaft ei-nes Onkels in den USA von 10.000 €), wo Spieler 1 einen Vorschlag machen muss, den Spieler 2 entweder akzeptiert oder ablehnt. Verwirft Spieler 2 den Vorschlag, so erhält keiner der beiden etwas; die Erbschaft fällt einem gemeinnützigen Zweck zu.

Hier ist die zentrale Frage nach der Glaubwürdigkeit von (angekündigten) Drohungen. Wenn etwa Spieler 2 ankündigt, dass er jeden Vorschlag ablehnt, in dem er weniger als 6000 € bekommt, steht Spieler 1 vor der Frage, ob er nicht doch bspw. nur 4000 € für Spieler 2 vorschlägt. Steht dieser nämlich vor der Frage Akzeptieren oder Verwerfen, so verzichtet er auf 4000 €.

Charakteristikum ist die Grundstruktur: Spieler 1 macht einen ersten Zug, Spieler 2 kennt die-sen Zug und muss darauf „optimal“ antworten, wobei er aus seinen Strategien wählen muss. Je nach Entscheidung von Spieler 2 ergeben sich dann die Auszahlungen für beide.

Spiele mit dieser Grundstruktur heißen in Deutschland v.Stackelberg-Spiele, weil sie als erstes in der Duopol-Theorie (z.B. mit einem bereits im Markt befindlichen bisherigen Monopol-Spie-ler und einem Markteintritt eines Newcomers) angewendet wurden.

c) Die Bausteine eines Spiels in extensiver Form

Ein dynamisches Spiel besteht aus den folgenden Elementen:

- Die Menge der Spieler {1, …, I},

- Die Reihenfolge, in der die Spieler jeweils am Zug sind,

- Die Handlungsmöglichkeiten der jeweiligen Spieler bei jedem ihrer Züge,

- Die Auszahlungen am Ende der Züge,

- Die Informationen der jeweiligen Spieler bei jedem ihrer Züge,

- Die Wahrscheinlichkeitsverteilungen von (zufälligen) exogenen Ereignissen.

Die graphische Darstellung eines Spiels in extensiver Form wird durch einen Spielbaum, der aus Knoten und Kanten besteht, gegeben. Jeder Spielbaum beginnt in einem speziellen Knoten (Anfang des Spiels). Jeweils Kanten (die entweder die Aktionen der Spieler/ eines der Spieler oder einen Zufallseinfluss des Pseudo-Spielers „Natur“ darstellen) verbinden Knoten der Stufe i mit Knoten der Stufe i+1. Für jedes Paar von Knoten gibt es einen eindeutigen Pfad, der diese beiden Knoten verbindet. Die Endknoten erlauben keine weiteren Aktionen eines Spielers mehr, sondern stellen die jeweiligen Auszahlungen dar:

- 1. Knoten = Spielbeginn

- Kanten = jeweils mögliche Spielzüge

- Endknoten = Auszahlungen

Am Beispiel des Spiels „matching pennies“ sieht man sehr leicht, dass zunächst gekennzeichnet werden muss, über welche Informationen der Spieler jeweils verfügt, der „am Zug“ ist. Man kann dieses spezielle Spiel mit der Annahme vollkommener Information spielen, was folgender Spielbaum wiedergibt:

Page 19: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 19 Ströbele

Den ersten Zug macht Spieler 1: Er deckt seine Münze dann auf.

Für Spieler 2 ist damit das Spiel einfach: Wenn Spieler 1 K gelegt hat, muss einfach Spieler 2 auch K ziehen, wodurch die Münze an ihn geht. Wenn Spieler 1 Z legt, muss Spieler 2 mit Z antworten; wieder ist die Münze seine. Offensichtlich kein sehr interessantes Spiel. Und Spieler 1 wird wenig Neigung haben, es überhaupt zu beginnen.

Selbst wenn die Spieler zeitlich nacheinander ziehen, so ist es für das Spielergebnis viel wichtiger, dass sie den zuerst gemachten Zug des anderen einfach nicht kennen.

Bei einer Ausschreibung für ein Projekt ist es deshalb sehr wichtig, dass die eingegangenen ver-siegelten Angebote erst nach Ablauf der Bewerbungsfrist und dann praktisch „gleichzeitig“ geöffnet werden.

Für in extensiver Form notierte Spiele ist es deshalb wichtig, die Informationsmengen zu kennzeichnen. Weiß also ein Spieler genau, in welchem Knoten er sich gerade befindet, dann kennt er auch die vorangegangenen Züge (z.B. dass Spieler 1 eine Münze mit „Kopf“ aufgelegt hat). Weiß er dies aber nicht, dann kennt er die vorangegangenen Züge nicht und befindet sich zwar chronologisch später dran, muss aber ebenso uninformiert handeln, wie bei gleichzeitigem Aufdecken. Dies kennzeichnet man durch ein graphisches Verbinden derjenigen Knoten, die den gleichen Informationsstand beschreiben (entweder gepunktete Linie zwischen den betroffenen Knoten oder ovale „Einkreisung“ der Knoten o.ä.). Die Informationsmenge ist die Menge aller Knoten, in denen ein Spieler mit seinem Zug das Spiel fortsetzen kann. Wenn die Informationsmenge nur einen Knoten enthält, weiß der betreffende Spieler, an welchem Knoten er fortsetzen muss.

Damit wird das Gefangenendilemma wie folgt in extensiver Form dargestellt: Spieler 1

gestehen schweigen

Spieler 2

gestehen schweigen gestehen schweigen

( 1 ; 1 ) ( 5 ; 0 ) ( 0 ; 5 ) ( 3 ; 3 )

Abbildung: Gefangenendilemma mit imperfekter Information (---)

Page 20: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 20 Ströbele

Als zweites Problem bei sequentiellen Spielen tritt das Problem der dynamischen Konsistenz auf. Dahinter steckt eine einfache Optimierungsüberlegung: Wenn es eine optimale Fahrstrecke von Münster nach Hamburg gibt (A1 via Osnabrück – Bremen – Hamburg Elbbrücken – City), dann ist nach dem Erreichen eines Zwischenziels (z.B. Kreuz Osnabrück-Lotte) die restliche Strecke wiederum optimal, und es wird jetzt nicht eine Strecke über die A 30 über Hannover gewählt. In der dynamischen Optimierung führt dies zur so genannten Bellmann’schen Gleichung, in der Spieltheorie lautet das Konzept „Teilspielperfektheit“.

Im obigen Markteintrittsspiel ergibt sich das Problem

2.2. Teilspielperfektheit

Der Spieler Altsasse könnte ja zu Beginn des Spieles androhen, in jedem Fall zu kämpfen. Dies würde aber bedeuten, dass er auch dann die Strategie „Kampf“ wählt, wenn der Newcomer doch in den Markt eingetreten ist, was wiederum dem Altsassen einen Payoff von lediglich 56 einbringt, während er bei anpassen immerhin auf 64 käme. Da dies wiederum der Newcomer durchschaut, wird er in den Markt eintreten und sich nicht von der „leeren Drohung“ KÄMPFEN abbringen lassen. Eine „leere Drohung“ besteht somit in einem Teil des Spieles, wo Spieler A fortsetzt; sie liegt dann vor, wenn der Spieler A sich damit selbst schlechter stellt als bei einer alternativen Strategie.

Der Newcomer wird also den Spielbaum betrachten, wenn der Fall des Markteintritts unterstellt wird und lediglich nach der bestmöglichen Strategie für den Altsassen gesucht wird. Und diese lautet im obigen Beispiel „Anpassen“.

Wenn also eine Folge möglicher Züge betrachtet wird, taucht das Problem der so genannten Teilspielperfektheit auf.

Ein Teilspiel beginnt an einem Nicht-Endknoten (d.h. es stehen noch „Züge“ mindestens eines Spielers aus!) und schließt alle Kanten und Knoten ein, die auf diesen Knoten folgen. Ein Teilspiel beginnt grundsätzlich in einem Knoten, der aus einer einelementigen Informations-menge besteht: Der fortsetzende Spieler weiß, wo er beginnt. Die Informationsmengen und Auszahlungen sind dieselben wie im Ursprungsspiel.

Definition: Ein teilspielperfektes Nash-Gleichgewicht in einem Spiel in extensiver Form liegt für ein Nash-Gleichgewicht des Spiels dann vor, wenn die Strategien des Nash-Gleichgewichts auch ein Nash-Gleichgewicht in jedem Teilspiel sind.

Insbesondere ist natürlich ein teilspielperfektes Nash-GG auch ein Nash-GG des Originalspiels (das ja selbst das größte Teilspiel ist).

Im folgenden werden einige Betrachtungen und Beispiele zur Teilspielperfektheit angestellt, die sichtbar machen, warum dieses Kriterium für ökonomische Anwendungen besonders geeignet ist.

Die folgenden zwei Beispiele (a) und (b) entstammen D.M. Kreps, Mikroökonomische Theorie, Abschnitt 12.7.

Spiel (a):

In Abbildung (a) hat Spieler 1 die Wahl zwischen U und D. Spielt es U, so ist der Payoff gegeben durch (2 ; 2). Spieler 2 kommt faktisch nur bei Entscheidung D zum Zuge, kann aber rechts oder links wählen, was die angezeigten Payoffs (0 ; 0) bzw. (3; 1) generiert.

Es gibt hier zwei Nash-Gleichgewichte, nämlich U – r und D – l. Dazu betrachte man die (angekündigte oder unterstellte) Entscheidung von Spieler 2, r zu spielen. Dann ist die bestmögliche Antwort von Spieler 1 durch U gegeben. Spielt hingegen Spieler 1 die Strategie U, so kann es Spieler 2 egal sein (da er ja faktisch nicht zum tatsächlichen Ziehen kommt).

Page 21: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 21 Ströbele

Spielt hingegen Spieler 2 „l“, dann ist die bestmögliche Antwort von Spieler 1 durch D gegeben. Ebenso muss Spieler 2 auf den Zug D mit dem bestmöglichen Zug „l“ antworten. Obwohl also rein technisch U – r ein mögliches Nash-Gleichgewicht des Gesamtspiels ist, hätte man doch gute Gründe, diese Variante nicht zu ernst zu nehmen. Der Zug „l“ mit dem Payoff (3 ; 1) dominiert ja strikt die Entscheidung „r“ mit dem Payoff (0 ; 0). Das Teilspiel, das im Knoten 2 beginnt, hat demnach als einzige sinnvolle Lösung die Entscheidung „l“.

Die Begrenzung auf teilspielperfekte Nash-Gleichgewichte führt also zur Auswahl der Lösung, die man naiv als einzig sinnvolle vermutet hätte, nämlich „D, l“.

Spiel (b):

Hier ist das gleiche Spiel wie in (a) erweitert worden um eine weitere Zugmöglichkeit für Spieler 1. Dieser kann sich je nach Zug „r“ oder „l“ von Spieler 2 jetzt mit R und L noch einmal entscheiden und erzielt damit die in der Abbildung angegebenen Payoffs.

Durch die Entscheidungen U – r – R ist wiederum formal ein Nash-Gleichgewicht gegeben: Wenn Spieler 1 U spielt, kann er für den hypothetischen Fall, dass Spieler 2 „r“ spielt, als bestmöglich Antwort darauf schon festlegen, dass er wiederum R zieht (Payoff 1 > Payoff 0 bei Entscheidung L).

Betrachtet man das Teilspiel, welches im Knoten für Spieler 2 beginnt, so gewinnt man eigene Einsichten. Der Knoten ist der einzige in der Informationsmenge für Spieler 2; die übrigen Bedingungen für ein Teilspiel sind ebenfalls erfüllt. Dieses Teilspiel (das mit der Wahl D durch Spieler 1 erreicht würde) lässt sich in bereits gewohnter Normalform wie folgt aufschreiben. Man beachte, dass :

Page 22: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 22 Ströbele

Spieler 2 Im Teilspiel zuerst am Zug

r l

Spieler 1 (Originalspiel) R (1 ; 1) (3 ; 3)

L (0 ; 1) (2 ; 0)

Abbildung: Das Teilspiel ab Knoten 2 in Spiel (b) in Normalform

Wie man sieht, ist ( r ; R ) kein Nash-Gleichgewicht des Teilspiels: Spielt Spieler 2 nämlich r, so ist R die beste Antwort für Spieler 1. Wenn Spieler 1 R spielt, würde Spieler 2 aber als beste Antwort „l“ wählen. Hingegen ist die beste Antwort auf „l“ wiederum durch R gegeben, so dass (l ; R) ein Nash-Gleichgewicht des Teilspiels ist.

Damit scheidet das formal denkbare Nash-Gleichgewicht U – r – R im Originalspiel nach dem Kriterium der „Teilspielperfektheit“ als „gute Lösung“ aus. Damit erhalten wir als Nash-GG, das auch ein teilspielperfektes Nash-Gleichgewicht ist, für Spiel (b) nur D – l – R.

Spiel (c):

Ein modifiziertes Spiel in extensiver Form ist das folgende Spiel (c):

Spielt Spieler 1 U, so erhält er sicher den Payoff von 2; Spieler 2 erhält dann nichts. Spielt er hingegen D, so kommt Spieler 2 zum Zuge und dann eventuell noch einmal Spieler 1. Nach dem Prinzip der Rückwärtsinduktion löst man jetzt die denkbaren Teilspiele und schreitet (rückwärts) bis zum Startknoten des ursprünglichen Spiels. Für den Knoten 2 ergeben sich für Spieler 2 sichere Payoff in Höhe von 1 bei „r“, aber auch die Aussicht auf einen Payoff von 2, wenn er „l“ spielt und daraufhin Spieler 1 mit L antwortet.

Wiederum in Normalform ergibt sich

Spieler 2 Im Teilspiel zuerst am Zug

r l

Spieler 1 (Originalspiel) R (3 ; 1) (0 ; 0)

L (3 ; 1) (1 ; 2)

Auf „r“ von Spieler 2 ist die Antwort von Spieler 1 indifferent. Spielt jedoch Spieler 1 den Zug R, so muss Spieler 2 r „antworten“ – was aber nicht sicher ist. Spielt Spieler 2 den Zug „l“, so antwortet Spieler 1 mit L; spielt 1 seinerseits „L“, dann ist „l“ die beste Antwort von Spieler 2. Also ist (L ; l) ein Nash-GG des Teilspiels. Betrachtet man wiederum die Nash-Gleichgewichte des Originalspiels, so erhält man als eine Nash-GG-Lösung U – l – L. Diese ist auch die einzige teilspielperfekte Lösung.

Anhand dieser (auf den ersten Blick etwas konstruierten) Beispiele kann man nachvollziehen, warum Teilspielperfektheit ein sehr akzeptables Kriterium für das Hervorheben besonderer Nash-Lösungen darstellt.

Dass dieses Vorgehen auch mathematisch Sinn macht, ergibt sich durch folgenden Satz:

Page 23: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 23 Ströbele

Satz: Jedes endliche Spiel in extensiver Form (dynamisches Spiel) mit vollständiger und perfekter Information hat ein teilspielperfektes Nash-Gleichgewicht, das mit Hilfe von Rückwärtsinduktion (backward induction) gefunden werden kann.

Hinweis: Dieses Verfahren haben wir schon beim Markteintrittsspiel angewendet. Anhand der Reaktionsfunktionen R2 weiß der Altsasse um die bestmögliche Antwort des Newcomers. Er benutzt dann im Teilspiel (Markteintritt ist bereits erfolgt) die beste Antwort des New-comers auf verschiedene eigene y1, um dessen Payoffs und die eigenen zu ermitteln. Dadurch kann der Altsasse die Glaubwürdigkeit seiner Drohung „Kämpfen“ selbst abschätzen. Und er weiß wiederum, dass sein Gegenspieler dies auch kann.

2.3. Endlich wiederholte Spiele

Ein dynamisches Spiel ergibt sich auch durch Wiederholung eines statischen Spiels. Letzteres nennt man das „Basisspiel“ oder „Stufenspiel“ (stage game), weil es die Spielregel für alle (endlich oft) folgenden Wiederholungen darstellt.

Gibt es nur ein eindeutiges Nash-GG für das gesamte Spiel, so lässt sich durch die Methode der Rückwärtsinduktion sehr leicht folgendes Ergebnis zeigen:

Satz: Bei einer endlichen Wiederholung eines statischen Spiels mit einem eindeutigen Nash-Gleichgewicht ergibt sich als eindeutiges teilspielperfektes Gleichgewicht die Wiederholung des Nash-GG des Stufenspiels in jeder Runde.

Beweisskizze anhand des obigen Markteintrittsspiels: Ein Unternehmen beherrscht den Markt für ein Gut A in allen großen Städten als Monopolist (10 Standorte). Es steht vor der Frage, einen Newcomer abzuschrecken, der nacheinander in den zehn Standorten ebenfalls eine Filiale eröffnen möchte. Das statische Spiel sagt: Es lohnt sich nicht, die Abschreckungsstrategie ernsthaft zu prüfen; stattdessen ist „anpassen“ angesagt. Eine Änderung von dieser Empfehlung könnte sich nur ergeben, wenn die Abwehr des Marktzutritts am Standort k Extra-Erträge an den Standorten k+1, k+2, …, 10 bringen würde. Für k = 10 sind derartige Extravorteile einer Kampfstrategie nicht mehr möglich, da der Altsasse ohnehin nur an 10 Standorten vertreten ist. Das heißt: Am 10. Standort gibt es mangels (denkbarer?) Extraerträge einer anderen Strategie nur die Ergebnisse des statischen Spiels = Anpassung. Dann ist in der 9. Runde die Situation wieder so etc. zurück bis zur ersten Runde. Also wird von Anfang an entweder gekämpft oder gar nicht und dies findet man schon im eindeutigen Nash-GG des ursprünglichen statischen Spiels.

a) Das Centipede-Spiel (100-Füßer-Spiel)

Das Centipede-Spiel besteht in einem wiederholten Zugwechsel zwischen Spieler 1 und 2, bis es nach dem 100. Zug beendet ist. Die Regel heißt:

Spieler 1 beginnt und kann entweder D (down) oder A (advance) spielen. Bei D endet das Spiel.

Falls der vorherige Spieler k (k = 1 oder 2) A gespielt hat, kann der nächste andere Spieler wieder D oder A spielen.

Es hat also jeder am Zug die Möglichkeit, das Spiel zu beenden. Der Charme des Spiels liegt in den Payoffs. Der erste Payoff bei Spielende durch Spieler 1 im ersten Zug lautet (1 ; 1). In der nächsten Runde vermindert sich der Payoff des vorherigen Spielers um eine Einheit, der des abbrechenden Spielers erhöht sich um zwei Einheiten. Damit entsteht folgendes Spiel

Löst man dieses Spiel nach der Methode der Rückwärtsinduktion, so sind zwei Besonderheiten zu beachten:

Page 24: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 24 Ströbele

- Das Spiel erfordert 200 Züge, um an die letzte Auszahlung (100; 100) zu kommen. Ist es wahrscheinlich, dass handelnde Menschen derart weit zurückrechnen, um ihre beste Strategie zu finden? (Kreps, Seite 359 ff).

- Wie die Rückwärtsinduktion zeigt, kommt für beide Teilnehmer am Ende ein „mickriges“ Ergebnis heraus, nämlich der Payoff gleich zu Beginn (1 ; 1). Warum sollte nicht einer der Teilnehmer signalisieren, dass er die Entscheidung „A“ probiert, im Vertrauen darauf, dass dann auch der andere mit „A“ fortsetzt? Experimente mit Studierenden haben genau dieses Phänomen erzeugt. Am Ende des Spiels fragt der organisierende Professor, der jedem 100 $ aushändigen musste: „Kannten Sie sich schon vorher oder waren Sie Freunde?“, worauf er die Antwort erhielt: „Nein, aber jetzt sind wir Freunde!“ Das menschliche Hirn belohnt offensichtlich Kooperationsbereitschaft mit einem eigenen „Payoff“. Evolutionstheoretisch ist dies bei einem Spiel, wo man durch geschicktes Kooperieren hinzugewinnen kann (auch wenn die letztendliche Aufteilung des erzielbaren Profits nicht genau 50 : 50 sein muss), vielleicht für die Menschen äußerst erfolgreich gewesen. Wir werden diesen Aspekt bei unendlich oft wiederholten Spielen und bei Tit-for-tat-Strategien erneut betrachten.

Kreps hegt deshalb ernsthafte Zweifel, ob tatsächlich immer die Methode der iterierten Elimination bei starker Dominanz in wiederholten Spielen mit vielen Runden angebracht ist.

(1;1) (0;3)

A A

D

1 2

(98;98) (97;100)

1 2

(98;101)

A1 2

(99;99)

(100;100)

Abbildung: Das Hundertfüßerspiel von Rosenthal

Die einfache Rückwärtsinduktion lautet wie folgt: Spieler 2 muss den letzten Zug machen und entscheidet sich für D (dort ist der Payoff mit 101 größer als bei A mit 100). Dies stellt Spieler 1 in Rechnung, der vorher ziehen muss: Für Spieler 1 ist ebenfalls D besser als A, denn sein Payoff ist jetzt 99 anstelle der absehbaren 98 bei „Weiterspielen“. Schrittweises Fortsetzen dieser Argumente führt schließlich dazu, dass es von Anfang an nur das Gleichgewicht (D ;D) gibt, was den Payoff von (1 ; 1) generiert. Und nur dieses Spiel ist teilspielperfekt.

b) einige Formalien

Wenn at = {at1, at

2, …, atN} die Aktionen der einzelnen Spieler zum Zeitpunkt t sind, dann sei ht

= (a0, a1, …, at-1) die Historie bis zum Zeitpunkt t (t = 1, 2, 3, …); sie stellt also genau die bis dahin gemachten Spielzüge der einzelnen Spieler dar. Die Historie h0 beschreibt den Zustand zum Zeitpunkt des Starts des Spiels.

Wenn jeder Spieler ht beobachtet, dann ist eine reine Strategie für Spieler i gegeben durch eine Folge von si(ht) = ai unter Nutzung aller Informationen bis t-1. Die Strategie ist dann si = (si(h0), si(h1), …, si(hT)), wobei bei endlich oft wiederholten Spielen T fix ist und bei grundsätzlich nicht fixiertem Endzeitpunkt auch T = ∞ sein kann.

Eine häufige Annahme für (auch: unendlich) oft wiederholte Spiele ist, dass alle Spieler die Historie genau kennen. Die Praxis schon manchen Skatspiels – das ja nach endlich vielen Zügen beendet ist – zeigt, dass diese Annahme durchaus heroisch sein kann.

Page 25: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 25 Ströbele

c) Beförderungswettlauf

Ein ähnliches Problem ergibt sich beim Beförderungswettlauf, wo zwei Angestellte in einem Wettbewerb um die bestmögliche Bewertung durch ihren Vorgesetzten stehen. Beide möchten möglichst als „fleißig“ gelten und gehen davon aus, dass die Anwesenheitszeit im Büro ein maßgebliches Zeichen dafür ist.

Früh nach Hause gehen, erzeugt zwar Freizeitgewinn, hat aber den Effekt als eher „faul“ zu gelten. Umgekehrt ist spät gehen vorteilhaft durch die Bewertung als „fleißig“, hat aber den Nachteil, keine Freizeit zu haben. Gehen beide spät oder beide früh, haben sie in der Firmen-bewertung keinen Vorteil gegenüber dem anderen.

Das Spiel wird dreimal gespielt und die Auszahlungen addiert.

q Spieler 2 1-q

Früh gehen Spät gehen

Spieler 1 p Früh gehen 6 ; 6 0 ; 10

1-p Spät gehen 10 ; 0 -5 ; -5

Zunächst betrachten wir das Spiel in einmaliger Ausführung: Spielt Spieler 1 „früh“, kann Spieler 2 mit der Antwort „spät“ eindeutig besser dastehen. Falls also Spieler 2 „spät“ spielt, müsste sich Spieler 1 entweder mit einem Payoff von 0 oder von -5 begnügen. Also ist das Paar (Früh ; Spät) ein Nash-GG in reinen Strategien; ebenso spiegelbildlich (Spät; Früh). Neben diesen zwei Nash-GG in reinen Strategien gibt es auch noch ein Nash-GG in gemischten Strategien, wie man durch folgende Überlegung sieht:

Wenn Spieler 1 mit Wahrscheinlichkeit p „Früh“ spielt, erreicht er (bei analoger Strategie von Spieler 2 mit Wahrscheinlichkeiten q bzw. 1-q) einen erwarteten Payoff von

E{Sp1 (p;q)} = 6 · p · q + (1 – p) · q · 10 + (1 – p) · (1 – q) · (-5)

= (5 – 9 · q) · p + 15 · q - 5

Indifferenz für q = 5/9, d.h. E{Sp1 (p;q)} = 30/9 = 3,333

E{Sp2 (p;q)} = 6 · p · q + (1 – q) · p · 10 + (1 – p) · (1 – q) · (-5)

= (5 – 9 · p) · q + 15 · p - 5

Indifferenz für p = 5/9, d.h. E{Sp2 (p;q)} = 30/9 = 3,333

Wird dieses Spiel dreimal wiederholt. Dann sind die jeweils dreimaligen Wiederholungen der Nash-GG in reinen Strategien auch ein teilspielperfektes Nash-GG des wiederholten Spiels. Allerdings gibt es auch eine andere Lösung: Wenn beide zuerst „früh“ gehen (Payoff für jeden 6) und dann im zweiten und dritten Zug jeweils eines der GG in reinen Strategien (also bspw. Spieler 1 geht am zweiten Tag früh, Spieler 2 spät; aber am dritten Tag geht Spieler 1 spät und Spieler 2 früh), dann entsteht eine neue teilspielperfekte Lösung.

Durch das Wechseln der Strategien in den folgenden Perioden wird eine denkbare Abweichung bspw. des Spielers 1 (der am ersten Tag doch „spät“ spielt) dadurch sanktioniert, dass er als Antwort dann mit zweimal „spät“ des Spielers 2 bestraft wird, was ihn mit einem Payoff von 10 schlechter stellt als bei: früh – spät – früh (Payoff = 16 = 6 + 10 + 0 bei Strategie früh – früh – spät des Spielers 2). Die Drohung der „Strafe“ für Abweichungen ist glaubwürdig, weil sie selbst ein Nash-GG darstellt.

Page 26: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 26 Ströbele

Eine Entscheidung „früh – früh“ stellt für ein einmaliges Spiel kein Nash-GG dar, ist aber im Rahmen eines sequentiellen Spiels als erste Runde möglich, weil in den nachfolgenden Runden noch Drohpotential für „Bestrafung“ für Abweichungen vorhanden ist.

Ergebnisse: a) Wird ein Spiel eine endliche Anzahl von Runden wiederholt und hat dieses Spiel nur

ein eindeutiges Nash-GG, dann ist genau die Wiederholung dieses einen Nash-GG in jeder Runde ein teilspielperfektes Nash-GG des wiederholten Spiels.

b) Weist das Stufenspiel jedoch mehrere Nash-GG auf, dann können in dem Wieder-holungsspiel weitere Gleichgewichte hinzukommen, bei denen in einzelnen Runden Strategien gewählt werden, die im Stufenspiel selbst keine Nash-GG sind.

2.4. Unendlich oft wiederholte Spiele

Ein Spiel, das immer wieder gespielt und in gleicher Form wiederholt wird und dessen Wieder-holungszahl nicht vorher als endlich fixiert ist, heißt Superspiel und jedes der einzelnen Spiele heißt (wie oben) Stufenspiel.

Die Auszahlungen eines Spielers i in einem Superspiel sind gegeben durch {ui(1), ui(2), ui(3), …}, wobei der Index i den Spieler bezeichnet und die Zahl in der Klammer die jeweilige Spielrunde (die bis unendlich gehen können).

a) Abdiskontierung

Daraus resultiert ein erstes mathematisches Problem: Wenn ein Spieler i in jeder Rund den Payoff von konstant 5 erreichen kann (oder jede andere Zahl x ≠ 0), dann ist die Summe der Auszahlungen unendlich groß, wenn nicht abdiskontiert wird. Glücklicherweise sind Ökonomen „Weltmeister“ im Abdiskontieren zukünftiger Nutzen oder €-Beträge, so dass dieses Problem lösbar wird.

Der Barwert der Auszahlungen lautet nämlich mit Abdiskontierung mit dem Abdiskon-tierungsfaktor δ:

z+=

11δ (z = Diskontrate = entweder Zinssatz bei monetären Payments oder subjektive

Zeitpräferenzrate) und (1) )(0

tuU it

ti ⋅∑=

=δ .

Sollte jetzt jedes der ui(t) konstant sein, so konvergiert die geometrische Reihe für Ui bei konstanten oder nur linear wachsenden ui(t) doch, obwohl über einen unendlichen Zeithorizont addiert wird.

Wenn man bspw. in jeder Periode einen konstanten Nutzen von 5 hat und diskontiert diesen mit der Diskontrate z = 0,1 = 10 % ab, dann ergibt sich für δ = 0,909091 das Nutzenintegral

(2) 5556,551,01

5...)1,1

11,1

11(5...51,1

151,1

1522

=−

=+⎟⎠

⎞⎜⎝

⎛++⋅=+⋅⎟⎠

⎞⎜⎝

⎛+⋅+=iU .

Dies ist zwar eine schöne endliche Zahl, aber aussagfähiger ist der (abdiskontierte) Durchschnittsnutzen pro Periode, den man im Beispiel als „5“ erwarten würde. Dieser Wert ergibt sich aus (2) dadurch, dass mit (1 – δ) multipliziert wird.

Maximiert man eine Größe F, dann liegen dieselben Maxima auch bei (1- δ) · F. Also können wir statt (1) auch die folgende Funktion maximieren:

Page 27: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 27 Ströbele

(3) )()1(0

tuU it

ti ⋅∑⋅−=

=δδ , was eine hübschere Interpretation erlaubt.

Unendlich wiederholte Spiele dienen auch zur Analyse der möglichen Strategien, wenn zwar das Spiel grundsätzlich beendet werden kann, aber der Stoppzeitpunkt einem Zufallsprozess folgt. Man kann das δt auch als exp(- λ · t) interpretieren: Dann ist λ der Parameter eines spe-ziellen stochastischen Prozesses (Poisson), der das Spiel beendet (Tod, Blitzschlag, o.ä.).

Die inhaltliche Bedeutung der Abdiskontierung für unendlich wiederholte Spiele1 ist leicht einzusehen: Der Abdiskontierungsfaktor gibt ja an, um wie viel zukünftiger Nutzen geringer gewichtet wird als heutiger. Ist etwa δ = 0,8, dann zählen 100.000 € am 01.07.2020 nur noch soviel wie heute 8.600 €. Damit sind mögliche Nutzengewinne in 2020 nicht besonders wichtig, aber auch negative Effekte wie „Vergeltungsschläge“ in 11 Jahren nicht mehr sehr bedrohlich. Dies hat Konsequenzen für mögliche Gleichgewichte in wiederholten Spielen: Bei sehr starker Abdiskontierung (δ << 1) zählt die Zukunft nicht mehr viel; bei hinreichend schwacher Abdiskontierung (δ ≈ 1 – ε) ist die Zukunft immer noch so wichtig, dass mögliche Gegenreaktionen meines Gegenspielers in den Folgeperioden mich heute durchaus beeindrucken und meine (optimale) Strategie beeinflussen können.

b) unendlich oft wiederholtes Gefangenendilemma

Am Beispiel des Gefangenen-Dilemmas ergeben sich einige in der Literatur besonders berühmte Strategie-Beispiele. Wenn die beiden Gefangenen immer wieder zusammen auf Beutezug gehen, kommen sie immer wieder in die gleiche Situation und da sie nicht ihren Todestag kennen, müssen sie davon ausgehen, dass das Spiel zwar grundsätzlich irgendwann endet, aber nicht zu einem festen Zeitpunkt. Bei jeder Verhaftung können sie entweder Schweigen S (= Kooperation; Englisch: Cooperate) oder Gestehen G (= zum Gegner überlaufen, Verraten; Englisch: Defect) spielen.

Mögliche genannte Strategien können bspw. sein

- Immer Gestehen G (Englisch: All-D) : si (ht) = G für alle t = 0,1,2,3, …

- Immer Schweigen S (All-C) : si (ht) = S für alle t = 0,1,2,3, …

- Naive Hammermethode (Grim Trigger): si (ht) = S für t = 0

= S, falls ajk = S, j ≠ i, k = 0,1, …, t-1

= G sonst

Bei dieser Methode wird der erste Vertrauensbruch (man spielt auf “Kooperation” = S) beinhart mit ständiger anschließender Vergeltungsmethode (Trigger = Pistolenabzugshahn) beantwortet.

- Tit-for-Tat (TFT) oder: Wie Du mir, so ich Dir:

: si (ht) = S für t = 0

= S, falls ajt-1 = S, j ≠ i

= G sonst

Hier wird offensichtlich die aktuelle Verfehlung (Verrat bei der letzten Verhaftung) mit demselben Schachzug bei der nächsten Gelegenheit beantwortet. Allerdings kann mich der zweite Spieler mit einer Rückkehr zur (kooperativen) Strategie S wieder dazu veranlassen, auch

1 Die mathematische, nämlich dass nur dadurch Chancen auf Konvergenz des Nutzenintegrals bestehen, haben

wir ja schon erwähnt.

Page 28: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 28 Ströbele

selbst wieder kooperativ zu spielen. Die harte Antwort erfolgt also nur einmal und kann bei Rückkehr zum Pfade der (Ganoven-)Tugend wieder aufgehoben werden.

- Begrenzte Vergeltung (Limited retaliation) mit Gegenaktion G, G, … insgesamt k-mal und Rückkehr zur Kooperation unabhängig von den Aktionen des zweiten Spielers

Phase A: Spieler i wählt (kooperativ) S und geht in Phase B

Phase B: Wähle weiterhin (kooperativ) S, bis ein Mitspieler j ≠ i G spielt; nur dann wechsele zur Phase C und setze ρ = 0

Phase C: Falls ρ ≤ k, wählt Spieler i die Aktion G und setzt dann ρ auf ρ +1; andernfalls zurück zu Phase A.

Natürlich gibt es eine Vielzahl derartiger plausibler Strategien.

Um auf ein Nash-GG zu prüfen, betrachten wir beispielweise (ALL-D ; ALL-D). Da bei einer Strategie von G durch den Spieler j auch G die beste Strategie für Spieler i ist, liegt offensichtlich ein Nash-GG vor.

In SIEG ist ein Experiment beschrieben, in dem das Gefangenendilemma 200-mal gespielt wurde (wobei die Teilnehmer diese Anzahl der Runden vorher nicht kannten), so dass es wie ein „unendlich oft gespieltes Spiel“ verstanden werden kann (ohne vorher bekannten festen Endzeitpunkt). Spaltenspieler

Schweigen S Gestehen G

Zeilenspieler Schweigen S (3;3) (0;5)

Gestehen G (5;0) (1;1)

Abbildung: Auszahlungsmatrix in Nutzeneinheiten für das Gefangenendilemma

Bei 200 Wiederholungen kann jeder Spieler auf einen maximalen Payoff von 1000 Nutzen-einheiten kommen, nämlich genau dann, wenn er gesteht (G) und der andere jeweils schweigt (S). Jedem vernünftigen Menschen erscheint diese Lösung aber als derart „daneben“, weil ja der schweigende den minimalen Payoff von Null erreicht; schon ein einziges Geständnis brächte ihm eine (positive) Nutzeneinheit von „1“. Wenn die Gefangenen hingegen jeweils die Standardlösung (G ; G) 200-mal produzieren, erreichen sie beide nur jeweils 200 Einheiten, insgesamt also 400. Sollten beide Spieler immer schweigen (S), so können sie jeweils 600 Einheiten Nutzen erreichen. Dies ist natürlich nur bei gegenseitigem Vertrauen denkbar, da ja individuell ein starker Anreiz besteht, davon abzuweichen. Die Gefahr des Ausgebeutetwerdens in einem Spiel ohne glaubwürdige Drohstrategie ist sehr groß.

Als Sieger des Wettbewerbs stellte sich Tit-for-tat heraus, das jeweils 504 Punkte erreichte. Hier sind zwei „freundliche“ Elemente hervorzuheben: Sie beginnt mit dem „Kooperations-signal“ Schweigen (S) und bestraft nur bei Abweichungen des Gegenspielers (G). Allerdings ist die Strafe nicht für den gesamten Rest des Spiels, sondern kehrt nach Sanktion wieder zur Kooperationsbereitschaft zurück.

Dagegen erreicht eine reine Zufallsstrategie mit nur 276 eine miserable Auszahlung.

Page 29: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 29 Ströbele

c) Teilspielperfektheit bei unendlich oft wiederholten Spielen

Dies führt auf den nach den obigen Überlegungen wenig überraschenden

Satz 2.1: Besitzt das Stufenspiel ein Nash-Gleichgewicht, so ist die unendlich oft praktizierte Wiederholung dieser Nash-Strategien ein teilspielperfektes Nash-GG des unendlich oft wieder-holten (Super-)Spiels. Existieren mehrere Nash-GG im Stufenspiel, so ist jede beliebige Folge dieser Nash-GG-Strategien ein teilspielperfektes Nash-GG des unendlich oft wiederholten Spiels.

Beweisskizze: Die Strategien an dem Zeitpunkt t sind unabhängig von der Vergangenheit. Die dann noch erreichbare Auszahlung des Superspiels wird (unter den gegebenen Bedingungen der bestmöglichen Antwort des Gegenspielers) maximiert, wenn in jeder Runde die Auszahlung ui im Stufenspiel maximiert wird, d.h. man spielt eine Nash-GG-Strategie.

Resultat: Die Anzahl der möglichen Nash-GG wird durch den Übergang vom Stufenspiel auf ein unendlich oft wiederholtes (Super-)Spiel nicht verringert, sondern vergrößert. Sollte das Stufenspiel bspw. nur zwei Nash-GG ausfweisen, dann ist jede (mischbare) Folge der individuellen Nash-GG wiederum ein Nash-GG: Davon gibt es unendlich viele.

Betrachten wir die Trigger-Strategie im obigen Gefangenen-Dilemma, d.h. Spieler i schweigt solange, bis Spieler j erstmalig gesteht, geht danach aber dauerhaft auf „gestehen“ über. Solange wir durchgehend „Schweigen“ spielen, erhalten beide:

(a) US = ( 1 – δ ) · Barwert(Payofft) = 3

Annahme: Mein Gegenspieler spielt „Trigger“. Antworte ich ständig auch mit „Trigger“, erhal-ten wir in jeder Runde jeweils die Auszahlung „3“. Weiche ich etwa in Runde 17 davon ab, erhalte ich in Runde 17 erstmalig den Payoff von „5“, danach aber mindestens ab Runde 18 den Payoff von „1“. Sollte ich davon einen Netto-Vorteil haben, so wäre ich gut beraten (wegen der Abdiskontierung!!!) diesen Vorteil möglichst früh mitzunehmen. Also warte ich nicht bis Runde 17, sondern spiele dann lieber gleich von Anfang an „gestehen“ und erhalte den Payoff für „Abweichen“:

(b) UA = ( 1 – δ ) · [ 5 + 11

⋅∑∞

=t

tδ ]

Offensichtlich ist (b) dann nicht größer als (a), wenn gilt:

(c) 5 + 11

⋅∑∞

=t

tδ = 5 – 1 + 10

⋅∑∞

=t

tδ ≤ 3 · ∑∞

=0t

tδ ↔ 4 ≤ 2 · δ−1

1 ↔

δ ≥ ½ . Wir haben oben schon gesehen, dass eine Abdiskontierung mit δ = 0,8 die Zukunft sehr gering gewichtet. Nur dann lohnt sich der Verzicht auf die möglichen Erträge einer „Schweigen“-Strategie. Damit haben wir eine Beweisskizze dafür, dass für den Fall δ ≥ ½ die beiderseitige Trigger-Strategie ein Teilspielperfektes Nash-GG ist: Die Überlegungen gelten für jeden neuen Startpunkt „unterwegs“.

d) Folk Theorems (Allerweltstheoreme, die „jedermann“ einsieht)

Im obigen Beispiel zum Gefangenendilemma zeigte sich die Bedeutung der Abdiskontierungs-rate δ.

Man betrachte noch einmal die überhaupt denkbaren Auszahlungen im Gefangenendilemma: (3 ; 3), (0 ; 5), etc.

Page 30: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 30 Ströbele

Trägt man diese in den R 2+ ein, so erhält man zunächst nur 4 Eckpunkte eines Vierecks. Bedenkt man, dass aber jede gemischte Strategie ja gerade die Auszahlungen „dazwischen“ erreichen kann, dann stellt jede Verbindungsgerade der Eckpunkte eine erreichbare Auszahlung dar, aber auch wiederum jede Verbindungsgerade aus beliebigen Punkten der eingerahmten Menge (Konvex-Kombination). Man bedenke jetzt, dass im einmaligen Stufenspiel das Nash-GG lediglich durch die Auszahlung (1 ; 1) gegeben ist. Da ja aber Trigger-Strategien (bei hinreichend hohem δ !) ein (teilspielperfektes) Gleichgewicht produzieren, das eine deutlich höhere Auszahlung generiert, bestehen also in wiederholten (Super-)Spielen bei hinreichend hoher Gewichtung der Zukunft, d.h. δ nahe genug an Eins (aber natürlich δ < 1) sehr viele mögliche Gleichgewichte.

Insbesondere sind bei gemischten Strategien (Spieler 2 schweigt mit Wahrscheinlichkeit 0,8, gesteht mit Wahrscheinlichkeit 0,2; woraufhin Spieler 1 mit jeweils 0,5 Wahrscheinlichkeit schweigt bzw. gesteht) die Payoffs 1,8 für Spieler 2 und 3,333 für Spieler 1 erreichbar.

Beweis: Nachrechnen.

Da sich hieraus sehr viele neue Kombinationsmöglichkeiten ergeben, lässt sich die Menge der denkbaren Payoffs erheblich vergrößern.

1

1

1 4/5

3 1/32

2

3

3

4

4

5

5

Auszahlung an Spieler 2

Auszahlung an Spieler 1

Abbildung: Durch gemischte Strategien im Gefangenendilemma erreichbare Auszahlungen

Eingezeichnet ist der Vektor der Payoffs bei obiger Mischstrategie.

Mit geeigneten Trigger-Strategien (und Mischungsstrategien) lassen sich im wiederholten Gefangenendilemma Gleichgewichte mit für beide Spieler höheren Payoffs erreichen als im einfachen Nash-Gleichgewicht. Es lässt sich zeigen, dass die Trigger-Strategien ein teilspielperfektes Nash-GG bilden.

Page 31: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 31 Ströbele

Diese Erkenntnis ist eine spezielle Variante des so genannten „Folk-Theorems“ (es weiß „jeder“, aber keiner weiß, wer es zum ersten Mal definitiv bewiesen hat):

Folk-Theorem: Wenn die Spieler die Zukunft hinreichend stark gewichten (d.h. die Abdiskontierungsrate ist nicht „sehr klein“), dann ist jeder erreichbare Auszahlungs-vektor mit höheren Auszahlungen als im Nash-GG des Stufenspiels der Auszahlungs-vektor eines teilspielperfekten Gleichgewichts des unendlich oft wiederholten Spiels.

Die beliebig vielen Sanktionsmöglichkeiten in der Zukunft machen Trigger-Strategien glaubwürdig und wenn die Nutzen in der Zukunft hinreichend viel „zählen“ – also nicht zu stark abdiskontiert werden – auch relevant für heutige Entscheidungen. Ist hingegen die Wahrscheinlichkeit groß, dass das Spiel nach wenigen Runden schon endet (die Abdiskontierung wird als te ⋅−δ geschrieben und stellt damit die Dichtefunktion für „Sterben“ dar) oder ist die Ungeduld (= Abdiskontierungsfaktor ist klein) sehr groß, dann nähert man sich eher den Ergebnissen, die auch bei nur endlich oft wiederholten Spielen entstehen.

Betrachten wir noch einmal das Gefangenendilemma: Falls Spieler 1 sich stumpf dafür entscheidet, immer zu gestehen, kann er in jedem Fall mindestens die Auszahlung „1“ erhalten. Eine derartige (gesicherte) Auszahlung nennt man „individuell rational“, weil sie alleine durch seine eigenen Entscheidungen (als Minimum) gesichert wird.

Falls alle anderen Spieler gegen Spieler i spielen (rein theoretische Annahme), dann kann er sich immer noch den Minimax-Wert (siehe oben!) mi sichern. Schlechter muss er sich nicht stellen lassen und nur eine mindestens gleich hohe Auszahlung wäre individuell rational. Im wiederholten Spiel sind alle bisherigen Züge bekannt: mi ist damit auch eine untere Schranke für alle Auszahlungen in Gleichgewichten des Superspiels. Damit werden die möglichen Payoffs eingeschränkt.

1

1

2

2

3

3

4

4

5

5

Auszahlung an Spieler 2

Auszahlung an Spieler 1

.Abbildung: Individuell rationale Auszahlungen im wiederholten Gefangenendilemmaspiel

Page 32: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 32 Ströbele

Anwendungen derartiger Überlegungen finden sich in Fragen der Glaubwürdigkeit der Wirtschaftspolitik (kann die Zentralbank „bluffen“ und sollte sie es tun?) oder bei der Bewertung von Kooperationen mit Geschäftspartnern etc.: Zeitkonsistenz und Reputation sind wichtige Güter in derartigen Spielen.

Page 33: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 33 Ströbele

Kapitel 3: Evolutorische Spieltheorie 3.1. Problemstellung

Es gibt inzwischen Sichtweisen auf ökonomische Prozesse, die aus Nachbardisziplinen entlehnt wurden:

- In einem Markt mit Unternehmen, die jeweils unterschiedliche Strategien verfolgen, überleben auf längere Sicht nur bestimmte Typen. Analogie: „Survival of the fittest.“

- Überfälle auf Karawanen können derart abschreckend wirken, dass der Handel eingestellt wird. „Kluge Räuber“ nehmen deshalb nur soviel weg, dass die auf die Karawanen ange-wiesenen Händler immer noch einen positiven Gewinn erzielen und deshalb beide Seiten überleben können. Analogie: Populationen von Beute- und Raubfischen.

- Ein Aufsichtsrat kontrolliert seinen Vorstand durch Vergleich der Unternehmensergebnisse mit denen der Konkurrenz oder anderer vergleichbarer Unternehmen. Zu welchen Anreizen und Problemen kann dies führen?

Hier helfen Erkenntnisse aus der Biologie und anderer Disziplinen, die sich mit der Evolution dynamischer Systeme beschäftigen. Umgekehrt beschreiben heute auch Disziplinen wie Bio-logie oder Politikwissenschaft komplexe Mechanismen mit Hilfe spieltheoretischer Konzepte.

Beispiel: Wespenbrutpflege (Sphex Ichneumoneus) siehe SIEG, Kapitel 4-

Strategien der Wespen: Selbst ein Nest bauen oder ein bestehendes Nest besetzen (mit dem höheren Risiko, auf die dort bereits ansässige primäre Wespe zu treffen und kämpfen zu müssen).

Wenn die Payoffs in Form effektiv gelegter Eier mit zugehörigem Nahrungsvorrat durch die folgende Matrix gegeben sind, lassen sich „gute“ und „weniger gute“ Strategien bewerten.

Wespe 2

Graben Eindringen

Wespe 1 Graben 1,13 ; 1,13 0,74 ; 1,43

Eindringen 1,43 ; 0,74 0,28 ; 0,28

Sollte es nur aggressive Wespen geben, die bevorzugen, fremde Bruthöhlen zu erobern, dann müsste die Population sehr bald aussterben. Von 1000 Wespenweibchen eines Sommers blieben nur 560 übrig, so dass die Population (die ja auch aus anderen Gründen eine bestimmte Sterberate hat) nach wenigen Generationen dezimiert wird. Jede einzelne Wespe gehört eindeutig einem Typ an (fleißig selbst graben oder eindringen in fremde Höhlen), d.h. jedes Individuum hat eine reine Strategie.

Welche „gemischte“ Strategie der ganzen Art (d.h. unterschiedliche Anteile aggressiver und fauler Wespen gegenüber eher friedlichen und fleißigen) das beste Überleben der Art sichert, kann man spieltheoretisch untersuchen und mit den Befunden in der Natur vergleichen.

Dabei handeln natürlich Tiere nicht rational, sondern erfolgreiche Tiere, d.h. solche mit guten Auszahlungen, überleben eben häufiger und vererben ihre Fähigkeiten und angeborene Verhal-tenstypen weiter.

Wendet man evolutorische Spieltheorie auf ökonomische Fragen an, so betrachtet man den einzelnen Spieler als Teil einer größeren Population von Konkurrenten. Die Spieler treffen

Page 34: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 34 Ströbele

immer wieder paarweise aufeinander und können à priori die anderen Spieler nicht unterscheiden (ehrlicher Makler, Gauner, …?).

Der Selektionsprozess entsteht (anders als in der Biologie) nicht durch Vererbung, sondern dadurch, dass Strategien mit relativ hohen Auszahlungen bevorzugt weiter verwendet werden und solche mit niedrigen Auszahlungen aufgegeben werden. Dieser gegenüber der Biologie modifizierte Selektionsprozess führt zu einer bestimmten Dynamik der Population: bisher eher benachteiligte Spieler imitieren erfolgreiche Strategien anderer, neue Strategien werden ausprobiert und wieder verworfen etc. Wenn sich die Population nicht mehr verändert, d.h. die Mischung der verwendeten Strategien, dann ist ein Gleichgewicht erreicht.

Beispiel (Handel mit zwei verschiedenen Händlertypen) aus SIEG:

Händler 2

aggressiv vorsichtig

Händler 1 aggressiv 0 ; 0 3 ; 1

vorsichtig 1 ; 3 2 ; 2

Die Auszahlungen an einen aggressiven (vorsichtigen) Händler hängen davon ab, wie viele Händler der jeweiligen Typen insgesamt vorhanden sind. Gibt es nur aggressive Händler, erhalten die aggressiven jeweils NULL. Gibt es hingegen dann einen vorsichtigen, so kann dieser sich immerhin den Payoff „1“ sichern. Gibt es hingegen nur vorsichtige Händler bis auf einen, so erhalten die vorsichtigen Händler beinahe sicher jeweils „2“, der eine aggressive stößt ja immer auf vorsichtige und bekommt den Payoff „3“. Daraus ergeben sich die beiden Geraden in der Abbildung, wobei x = Anteil der aggressiven Händler (0 ≤ x ≤ 1):

Payoff (aggressiv) = 3 – 3 · x

Payoff (vorsichtig) = 2 – x

0,5

1

2

3

Auszahlung

Auszahlung an den aggressiven Händler

Auszahlung an den vorsichtigen Händler

Anteil der aggressiven Händler

Page 35: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 35 Ströbele

Interpretation in einem dynamischen Selektionsspiel: Wenn es anfangs nur aggressive Händler gibt, kann ein einziger mit der Strategie „Vorsichtig“ einen Payoff von 1 erzielen, während die übrigen Händler fast bei Null verharren (da sie ja meistens auf ihresgleichen stoßen). Der Schnittpunkt der beiden Geraden liegt bei x = ½ , was zu einem Payoff von durchschnittlich „1,5“ für jeden führt. Ab hier lohnt sich eine weitere Steigerung des Anteils vorsichtiger Händler für den einzelnen nicht mehr. Am Ende sind genau 50 % aggressiv und 50 % vorsichtig.

Wie in der Biologie unterscheidet man

- monomorphe Populationen, d.h. alle verwenden die gleichen Strategien,

- polymorphe Populationen, d.h. jedes Mitglied verwendet eine spezielle Strategie (aber es gibt mindestens zwei unterschiedliche Strategien).

In einer monomorphen Population (alle Spieler verwenden die gleiche Strategie) beginnt ein evolutorischer Prozess, wenn eine andersartige Strategie eintritt. In einer polymorphen Population kann sich eine Änderung dadurch ergeben, dass sich die Gewichtung der einzelnen Strategien durch einen exogenen Einfluss ändert. Die Populationsdynamik wird dann über den natürlichen Selektionsprozess beschrieben. Im Gleichgewicht ändert sich die Zusammensetzung und/oder Größe der Population nicht mehr.

Im obigen Wespenbeispiel ergibt sich als Selektionsergebnis, indem man wie bei den Händlern die beiden Wespentypen unterscheidet (x = Anteil aggressiver eindringender Wespen):

Payoff (Graben) = 1,13 – 0,39 · x und

Payoff (Eindringen) = 1,43 – 1,15 · x

Schnittpunkt liefert: x = 0,3947.

3.2. Evolutionär stabile Strategien

Im folgenden sei ein allgemeines symmetrisches 2-Personen-Spiel betrachtet (Man beachte: Die obigen Wespen- und Händler-Spiele waren symmetrisch!).

Spieler 2

s21 s22 Spieler 1 s11 a ; a b ; c

s12 c ; b d ; d

Sei die Matrix A gegeben durch ⎥⎦

⎤⎢⎣

⎡=

dcba

A .

Spielt Spieler 1 eine gemischte Strategie (was in der Biologie einem entsprechenden Anteil dieses Typs p1 in der Population entspricht):

pT = ( p1; 1-p1 ) ; Schreibweise: p ist ein Spaltenvektor.

und Spieler 2 spielt:

mT = ( m1; 1-m1 ),

Page 36: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 36 Ströbele

dann ergibt sich die (durchschnittliche) Auszahlung an den Spieler 1 zu:

Payoff (Sp 1) = ( ) ⎥⎦

⎤⎢⎣

⎡−⋅+⋅−⋅+⋅

⋅−)1()1(

111

111;1 mdmc

mbmapp = pT · A · m,

wobei p und m die Spaltenvektoren der Wahrscheinlichkeiten sind (Empfehlung: einmal nachrechnen!) und pT der transponierte = Zeilenvektor zu p ist.

Es wird von folgendem Ablauf ausgegangen:

- Alle Individuen einer Population spielen zu Beginn eine gemischte Strategie mit p (bzw. 1-p), d.h. es gibt eine homogene Gruppe von „Spieler 1 – Typen“.

- Ein Individuum wechselt durch einen exogenen Einfluss (Mutation, Imitation eines anderen Lebewesens, …) zu einer Strategie m. Anfangs ist der „sehr kleine“ Anteil der Mutanten ε und der Anteil der übrigen ist 1 – ε.

- Damit ergeben sich bestimmte Auszahlungen für den Mutanten (Spieler 2):

Mit Wahrscheinlichkeit ε trifft er auf sich selbst und erhält mT · A · m; mit Wahrschein-lichkeit 1 – ε trifft er auf einen zahlreich vorhandenen der alten Sorte (Spieler 1) und erhält mT · A · p:

Die erwartete Auszahlung des Newcomers = Mutanten ergibt sich also zu

uM = ε · (mT · A · m) + (1 – ε ) · (mT · A · p) Für die alteingesessenen Spieler 1 – Typen ergibt sich:

uE = ε · (pT · A · m) + (1 – ε ) · (pT · A · p) - Der Mutant überlebt seine Veränderung auf Dauer nicht, wenn uM < uE (Kriterium für

eine erfolgreiche Mutation ist also ein hinreichend hoher Payoff!).

Definition: Evolutionäre stabile Strategien (ESS):

Eine gemischte Strategie p ist eine ESS (Evolutionär stabile Strategie) des symmetrische Spiels mit der Auszahlungsmatrix A, falls sowohl die Gleichgewichtsbedingung

(GG) mT · A · p ≤ pT · A · p

als auch die folgende Stabilitätsbedingung (ST) für den „Gleichheitsfall“ erfüllt sind:

(ST) Gelten m ≠ p und mT · A · p = pT · A · p, dann mT · A · m < pT · A · m

Kein Mutant mit m kann gegenüber den Etablierten mit p eine höhere Auszahlung als die Etablierten erhalten (Man denke an Homo Sapiens gegenüber dem Neandertaler: Hier hat der in Mitteleuropa etablierte Neandertaler verloren und starb aus).

Falls eine Strategie ESS ist, kann kein Mutant mit einer anderen Strategie in diese Population eindringen. Die Stabilitätsbedingung verlangt, dass ein Mutant, der die Gleichgewichtsbe-dingung (GG) genau mit Gleichheit erfüllt, gegen sich selbst eine geringere Auszahlung erhält als wenn p gegen ihn spielt. Verringerte sich dann der Anteil von p, dann ginge es dem Mutanten schlechter als bei einem hohen Anteil von p. Damit ist die so genannte Fitness des Mutanten in der Population schlechter als die der bereits vorhandenen (die annahmegemäß ESS ist). Er kann sich dann nicht ausbreiten und die anderen verdrängen.

Beispiel (Falke – Taube):

Page 37: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 37 Ströbele

Zwei Tiere stehen in Konkurrenz um eine Ressource im Wert V. Es gibt die (reine) Strategie zu kämpfen (Falke) oder nachgeben (Taube). Stoßen zwei Falken aufeinander, fügen sie sich Verletzungen zu und teilen sich dann die Ressource. Das Spiel hat folgende Auszahlungen:

Falke Taube

Falke ½ · (V – C) ; ½ · (V – C) V ; 0

Taube 0 ; V ½ · V ; ½ · V

Abbildung: Auszahlungen im Falke-Tauben-Spiel

Ist der Wert der Ressource größer als die Verletzungen im möglichen Kampf, d.h. V > C, dann ist die Strategie „Falke“ dominant. Dann ist immer kämpfen eine ESS. Hinweis: Bestimmte Steppentiere haben eine solche Strategie.

Wenn aber C > V (Krasses Beispiel: Ein Gepard darf sich auf keinen Kampf mit hohem Verletzungsrisiko einlassen; mit einer Verletzung ist er nicht mehr schnell genug, um Beute zu machen und verhungert), und die Population bestehe anfangs nur aus Falken, dann hat die eine Taube eine Auszahlung von NULL. Diese ist aber höher als die negative Auszahlung der jeweiligen Falken, da ja V – C < 0!

Taube kann sich also ausbreiten, aber stellt selbst auch in reiner Form keine ESS dar: Ein Falke erhält gegenüber einer Taube mit V eine höhere Auszahlung als die Tauben untereinander mit jeweils ½ · V.

Zahlenbeispiel: V = 1 und C = 3

Dann ist A = ⎥⎥⎦

⎢⎢⎣

⎡−

21011

.

Analog zum obigen Vorgehen erhält man hier ein Nash-Gleichgewicht mit einem Drittel Anteil „Falke“ (p = 1/3) und zwei Dritteln Anteil „Taube“ (1-p = 2/3).

Frage: Ist dieses Nash-GG ESS (evolutionär stabil) ?

Setzt sich also ein Mutant mit einer Strategie mT = (m ; 1-m) mit m ≠ 1/3 in der Population durch oder nicht? Dies erfordert die Überprüfung der Stabilitätsbedingung.

Jeder Mutant erhält beim Eintritt den Payoff:

( ) ⎟⎟⎠

⎞⎜⎜⎝

⎛⋅⎥⎦

⎤⎢⎣

⎡−⋅−

3/23/1

2/1011

1; mm = (- m ; 1/2 + 1/2 · m) · ⎟⎟⎠

⎞⎜⎜⎝

⎛3/23/1

= 31

331

3=++−

mm.

Da die etablierten genau den gleichen Payoff erhalten (Nachrechnen), ist die Gleichgewichtsbedingung für ESS in Gleichheitsform erfüllt. Somit ist die Stabilitätsbedingung als zweites zu testen. Der Mutant setzt sich nicht durch, wenn gilt:

mT · A · m < pT · A · m. Diese Bedingung lässt sich durch geschicktes Nachrechnen als erfüllt zeigen. Damit ist die Mischung p = 1/3 (Falke) und 1-p = 2/3 (Taube) eine ESS.

Satz (SIEG, S. 60): Ist A eine 2 * 2 – Matrix mit a11 < a21 und a12 > a22, dann ist die Strategie des eindeutigen symmetrischen Nash-GG (p,p) eine ESS.

Beweis: siehe SIEG.

Page 38: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 38 Ströbele

Kapitel 4: Kooperative Spiele

4.1. Verhandlungsspiele

Wie in der Vorlesung angekündigt siehe hierfür SIEG S. 76ff.

Page 39: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 39 Ströbele

4.2. Koalitionsspiele

Definition 4.1: Sei G = { 1, …, I } die Menge aller Spieler. Jede nicht-leere und nicht-ein-elementige Teilmenge K ≠ G heißt Koalition (im eigentlichen Sinne). Ein Spieler alleine kann als „Einerkoalition“ bezeichnet werden. Alle Spieler zusammen bilden eine „große Koalition“ (anders als im deutschen politischen Sprachgebrauch!).

Beispiele sind etwa die politische Parteien, Zusammenschlüsse zu einer Handelsunion, Staaten des €-Raums etc.

Wenn die Koalitionsmitglieder untereinander Nutzen (etwa durch Geldtransaktionen oder Wäh-lerstimmen) transferieren können, nennt man diese Konstellation übertragbaren Nutzen. Diese Annahme wird im folgenden getroffen, obwohl sie in der Realität nicht immer durchsetzbar sein kann.

Jede Koalition K kann sich selbst diejenige Auszahlung garantieren, die sie im Zweipersonen-spiel als Minimax-Wert v(K) gegen die Koalition der Gegenspieler G \ K erhalten würde. Wird dieser Minmax-Wert v(K) auf die einzelnen Koalitionsmitglieder aufgeteilt, so entsteht i.d.R. eine Bandbreite denkbarer Auszahlungen an die Koalitionsmitglieder.

Definition 4.2: Die Funktion v(K), die jeder Koalition K den Minmax-Wert des Spieles gegen die Koalition der Gegenspieler G \ K zuordnet, heißt charakteristische Funktion.

Anschaulich beschreibt sie den Nutzen, den die Mitglieder der Koalition (mindestens) zusammen erhalten können, unabhängig von den Anstrengungen der Spieler außerhalb der Koalition. Wenn die Gegenkoalition versucht, die Koalition möglichst schlecht zu stellen, wird v(K) tatsächlich erreicht. Liegt hingegen kein Nullsummenspiel vor, ist dies nicht zwingend gegeben: Bei der Bundestagswahl konkurrieren die Parteien etwa um Wählerstimmen; da die Wähler aber auch die Option haben, überhaupt nicht zu Wahl zu gehen, kann eine zu destruktive Oppositionspolitik dieser letztlich sogar schaden.

Im folgenden sollen Lösungskonzepte betrachtet werden, die bestimmte Kombinationen von Koalitionen und deren Auszahlungsvektoren ausschließen. Bedenkt man die Ergebnisse der Tauschökonomik, dann kann ja jeder Spieler mindestens das Niveau an Nutzen erreichen, das er mit seiner Anfangsausstattung bereits hat. Wenn Tauschen freiwillig stattfindet (wie das Bil-den von Koalitionen auch!), wird es nur Tauschgleichgewichte innerhalb der „Tauschlinse“ mit seinem Partner geben können. Individuell rational ist eine Auszahlung für Spieler i nur dann, wenn sie mindestens so hoch ist, wie diejenige Auszahlung, die er als Einerkoalition v({i}) gegen „den Rest der Welt“ auch erreichen kann.

Definition 4.3: Die Imputationsmenge ist die Menge der Auszahlungsvektoren u, welche die folgenden beiden Eigenschaften hat:

a) individuelle Rationalität: ui ≥ v({i}) für alle 1 ≤ i ≤ I.

b) Effizienz: Es gibt keinen Auszahlungsvektor u* ≠ u mit u*i ≥ ui für alle i und u*j > uj für mindestens ein j ε { 1, …, I }.

Beispiel (SIEG) Demokratische Mehrheitsentscheidung:

Drei Wähler mit jeweils gleichem Stimmrecht stimmen ab. Ein Abstimmungssieg erfordert die absolute Mehrheit. Eine Koalition K mit absoluter Mehrheit erhält die Auszahlung 1.

Eine Koalition K muss also aus 2 oder 3 Mitgliedern bestehen. Deren Mitglieder können dann die Auszahlung von 1 untereinander aufteilen. Die charakteristische Funktion lautet somit:

Page 40: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 40 Ströbele

v(K) = 0, falls K aus einem Mitglied besteht und v(K) = 1, wenn K aus 2 oder 3 Mitgliedern besteht. Wie man sieht, ist eine Koalition mit Gleichverteilung der Auszahlungen (bei 3 Mitgliedern jeweils 1/3) nicht stabil: Da u1 + u2 < 1, können beide ihren Payoff verbessern, wenn sie gemeinsam eine Koalition bilden (ohne Partner 3). Die neue Koalition {1,2} würde also den Auszahlungsvektor (1/3, 1/3, 1/3) aus der großen Koalition verwerfen. Im so genannten Kern werden verwerfbare Auszahlungen ausgeschlossen.

Definition 4.4: Kern

Der Kern besteht aus allen Auszahlungsvektoren, die durch keine Koalition verworfen werden können und die zur Imputationsmenge gehören.

Im Pareto-Optimum wird u nicht durch alle Spieler gemeinsam verworfen (= große Kolaition)

Individuell rational bedeutet, das u nicht durch einen Spieler {i} verworfen wird (= Einer-Koalition.

Im Kern sind somit alle Auszahlungsvektoren, die nicht durch einen oder alle oder eine Koalition im engeren Sinne verworfen werden können. Häufig wird dies als eine WIN-WIN-Situation beschrieben.

In der obigen demokratischen Entscheidung gilt aber: Wegen der maximal verteilbaren Summe von 1 kann es immer eine Zweierkoalition geben, die sich selbst jeweils ½ zugesteht, so dass der dritte nichts mehr erhält. Dieser argumentiert spiegelbildlich, so dass jeder Lösungsvorschlag verworfen wird, bei dem u1 + u2 + u3 < 3/2. Da aber insgesamt nur 1 zu verteilen ist, ist der Kern dieser demokratischen Mehrheitsentscheidung die leere Menge.

Da aber die Menge S = { ( ½ ; ½; 0); (½ ; 0; ½); (0; ½ ; ½) } plausible Koalitionsmöglichkeiten beschreibt:

- Ein Lösungsvorschlag aus S kann durch keine andere Mehrheit verworfen werden,

- Das Maximum für jeden Spieler, nämlich 1/2 , wird für zwei (die die Koalition bilden) erreicht,

- Änderungsvorschläge lassen sich nicht mehr durchsetzen.

Eine solche Menge S ist intern stabil.

Definition 4.5: von-Neumann-Morgenstern-Lösung

Mengen von Lösungsvorschlägen S mit Lösungsvarianten u aus der Imputationsmenge heißen

a) intern stabil ↔ Für alle Lösungsvorschläge u ε S gibt es keine Koalition K und kein u* ε S mit u*i > ui für alle i ε K. (Koalitionsmitglieder können sich nicht besser stellen)

b) extern stabil ↔ F Für alle erreichbaren Lösungsvorschläge u (u nicht Element von S) gibt es ein u* ε S und eine Koalition K mit u*i > ui für alle i ε K (In der Koalition K stellen sich die Mitglieder besser).

Intern und extern stabile Mengen S stellen Verallgemeinerungen des Kerns dar, da der Kern eine Teilmenge von S ist.

4.3. Machtindices

a) Pivot-Spieler

Wie man aus der Politik (Koalitionen zwischen zwei oder drei Parteien) oder aus Hauptver-sammlungen von Aktiengesellschaften (gleiche Abstimmungen verschiedener Aktionärs-gruppen) oder ähnlichen Spielsituationen kennt, kommt es manchmal durchaus auf eine oder wenige kleine Gruppen an, ob eine Koalition stabil bleibt oder nicht.

Page 41: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 41 Ströbele

Das Konzept eines Pivot-Spielers soll diesen Aspekt klarmachen:

- Ein Pivot-Spieler ist derjenige Spieler, der eine Minderheiten-Koalition zu einer Mehr-heitskoalition macht.

- Eine Pivot-Spieler kann der Wert zugeordnet werden, den die Koalotion verliert, wee dieser die Koalition verlässt.

- Wie man leicht sieht, ist dieser Wert die Differenz zwischen der charakteristischen Funktion v(K) und des Wertes der charakteristischen Funktion der Koalition ohne den Spieler i: v(K \ {i}).

Ein Machtindex ist ein Instrument zur Messung von Macht. Die beiden bekanntesten Macht-indizes, die im Folgenden dargestellt werden, messen eine ganz besondere Form von Macht: die sogenannte „Abstimmungsmacht“ (voting power) in politischen oder anderen Gremien. Damit ist das Entscheidungsgewicht einzelner Mitglieder eines Gremiums bei Mehrheits-entscheidungen gemeint.

Eine Entscheidung in einem Gremium ist getroffen, wenn die Befürworter einer Alternative ein Quorum erreichen. Beispiele für ein Quorum sind eine absolute Mehrheit von mehr als 50 Prozent, die qualifizierte Mehrheit von zwei Dritteln, die in vielen Ländern für Verfassungs-änderungen erforderlich ist, oder 10 Prozent für die Durchführung von Volksbegehren. Die unten erläuterten Machtindizes zeigen an, bei welchem Anteil aller möglichen Koalitionen der beteiligten Parteien ein Stimmberechtigter die Entscheidung auf die von ihm gewünschte Alternative lenken kann.

Beispiel: In der Europäischen Wirtschaftsgemeinschaft von 1958 hatten die großen Staaten (Deutschland, Frankreich, Italien) jeweils vier Stimmen, die mittelgroßen Staaten (Belgien, Niederlande) je zwei, und Luxemburg nur eine Stimme. Um einen Beschluss zu fassen, waren zwölf Stimmen notwendig. Für das kleine Luxemburg war dies jedoch fatal: Um bei einer Entscheidung ausschlaggebend zu sein, um einmal das Zünglein an der Waage zu sein, hätte es eine Konstellation geben müssen, bei der die anderen Staaten zusammen elf Stimmen haben und es dann auf Luxemburg ankommt, zuzustimmen oder nicht. Einzig in einer solchen Konstellation hätte Luxemburg Macht gehabt. Es konnte aber eine solche Konstellation nicht geben: Die Stimmen anderer Staaten können nicht zu elf addiert werden; der Machtindex von Luxemburg war daher Null.

b) Machtindizes nach Shapley und Banzhaf

Beim Shapley-Shubik-Index bestimmt sich die Macht eines Mitglieds aus der Anzahl der Anordnungen aller Mitglieder, bei denen das Quorum genau mit diesem Mitglied erreicht wird. Dadurch wird jede Koalition mit dem Faktor (n−1)! · (N–n)! · k gewichtet, wobei n die Anzahl ihrer Mitglieder, k die Anzahl einzelner Mitglieder, die sie scheitern lassen können, und N die Anzahl aller Mitglieder ist.

Die Idee ist wie folgt:

- Alle Spieler werden geordnet aufgeschrieben: Jede mögliche Reihenfolge der Spieler wird als Koalition angesehen.

- Alle Koalitionen sind gleichwahrscheinlich. ACHTUNG: Dies ist natürlich eine gravierende Annahme, wenn man etwa daran denkt, dass CDU/CSU mit den Grünen oder SPD mit der Partei DIE LINKE koalieren sollten, wenn es auch mit anderen Parteien ginge.

- Der Spieler (Partei, Abstimmungsblock, …) welcher der Koalition zur Mehrheit verhilft, ist der Pivot-Spieler. Ihm verdankt die Koalition den entstehenden Auszahlungszuuwachs. Für jede Kombination gibt es nur einen Pivotspieler.

Page 42: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 42 Ströbele

- Im Shapley-Shubik-Index wird die Anzahl der Kombinationen ermittelt, in denen ein Spieler i pivotal ist und diese Anzahl wird durch alle möglichen Kombinationen dividiert.

Beispiel: Drei Mitglieder A, B und C mit einem Stimmgewicht von 50, 49 und 1 treffen Ent-scheidungen mit einem Quorum von 51 Prozent. Man betrachtet alle möglichen Dreier-permutationen und notiert, ab welchem Mitglied das Quorum erreicht ist.

Erst wenn sich zu A das Mitglied B hinzugesellt, ist das Quorum erreicht: B entscheidet. Das Gleiche gilt für C, wenn es sich mit A zusammenschließt, denn auch A und C erreichen das Quorum. Die übrigen Fälle sind analog:

• ABC: B entscheidet (Quorum mit AB erreicht)

• ACB: C entscheidet (Quorum mit AC erreicht)

• BAC: A entscheidet (Quorum mit BA erreicht)

• BCA: A entscheidet (Quorum mit BCA erreicht)

• CAB: A entscheidet (Quorum mit CA erreicht)

• CBA: A entscheidet (Quorum mit CBA erreicht)

Von den sechs möglichen Permutationen entscheidet A vier, B und C entscheiden jeweils eine. Der Shapley-Shubik-Index ist der normalisierte Wert:

• A hat den Machtindex 2/3 ≈ 66,7 Prozent

• B hat den Machtindex 1/6 ≈ 16,7 Prozent

• C hat den Machtindex 1/6 ≈ 16,7 Prozent

Das Mitglied C mit nur einer Stimme hat den gleichen Machtindex wie Mitglied B mit immerhin 49 Stimmen. Erhöht man das Quorum um eine Stimme auf 52, verliert C jegliche Entscheidungsmacht (siehe oben Luxemburg), ebenso bei einem Quorum von 49 Stimmen:

Quorum Machtindex von A (50 Stimmen)

Machtindex von B (49 Stimmen)

Machtindex von C (1 Stimme)

100 1/3 1/3 1/3 52–99 ½ 1/2 0

51 2/3 1/6 1/6 50 2/3 1/6 1/6

2–49 ½ 1/2 0 1 1/3 1/3 1/3

Wenn man dies durchschaut, solange man noch Einfluss auf die Quoren hat, kann man faktisch die Macht der eigenen Gruppe (Land, Partei, …) entscheidend verbessern. Hätte etwa Luxemburg 1958 den Effekt durchschaut, hätte es sich stärker gewehrt.

Beim Banzhaf-Index wird die Macht eines Mitglieds durch Abzählen der siegreichen Koali-tionen, in denen es wesentlich zum Sieg beiträgt, bestimmt. Dadurch wird jede Koalition mit der Anzahl einzelner Mitglieder, die sie scheitern lassen können, gewichtet. So ergibt sich für obiges Beispiel: - A ist entscheidend für die Koalitionen AB, AC und ABC - B ist entscheidend für die Koalition AB - C ist entscheidend für die Koalition AC

Page 43: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 43 Ströbele

Daraus ergibt sich die Banzhaf-Macht als Summe der siegreichen wesentlichen Koalitionen von A, B und C: 3 + 1 + 1 = 5. Der Banzhaf-Index ist dann definiert als die normalisierte Banzhaf-Macht: - A hat den Machtindex 3/5 = 60 Prozent - B hat den Machtindex 1/5 = 20 Prozent - C hat den Machtindex 1/5 = 20 Prozent

Obwohl C nur einen Bruchteil der Stimmen von B besitzt, hat es doch die gleiche Macht.

Quorum Machtindex von A (50 Stimmen)

Machtindex von B (49 Stimmen)

Machtindex von C (1 Stimme)

100 1/3 1/3 1/3 52–99 ½ 1/2 0

51 3/5 1/5 1/5 50 2/3 1/6 1/6

2–49 ½ 1/2 0 1 1/3 1/3 1/3

Beispiel (SIEG):

In der Hauptversammlung einer Aktiengesellschaft sind die Eigentümer mit Stimmrecht proportional zu ihren Aktienanteilen vertreten. Das ehemalige Familienunternehmen besitzt noch 43 % der Aktien, ein Verein von Kleinaktionären vertritt 14 % und die übrigen Aktien werden von drei Gruppen gehalten. Gruppe Anteile in Prozent Tochter (E) 35 Sohn (E) 8 Fonds XXL (F) 30 Fonds XXS (F) 3 Hedgefonds (F) 10 Kleinaktionäre (K) 14 SUMME 100

In der Hauptversammlung gibt es zwei Quoren:

Für normale Entscheidungen reicht die einfache Mehrheit der anwesenden Stimmen; bei wichtigen Frage (Ablösung eines Vorstandsmitglieds; strategische Neuorientierungen, …) ist eine ¾-Mehrheit notwendig.

Betrachten wir zunächst die „einfachen laufenden Geschäfte“, d.h. normale Entscheidungen der Hauptversammlung. Wir unterstellen, das die Gruppe der Erben (E) und die Finanzinvestoren (F) jeweils homogene Interessen haben und gleich abstimmen.

Für die einfachen Entscheidungen reichen 50 % der Stimmen (+ 1) aus. Kombination Erben Finanzinvestoren Kleinaktionäre EFK 0 1 0 EKF 0 0 1 FEK 1 0 0 FKE 0 0 1 KEF 1 0 0

Page 44: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 44 Ströbele

KFE 0 1 0 SUMME 2 2 2 Shapley-Shubik-Index ⅓ ⅓ ⅓ Trotz ihres geringen Gewichts sind die Kleinaktionäre gleich mächtig wie die beiden großen Blöcke E und F. Ihre geringen Stimmenanteile reichen für einfache Mehrheiten aus.

Betrachtet man jetzt hingegen die „großen Entscheidungen“, dann stellt man bei den drei großen Gruppen Enkel (E mit 43 %), Finanzinvestoren (F mit 43 %) und den Kleinaktionären (K mit 14 %) fest, dass es keine Konsteallation gibt, in der die Kleinaktionäre alleine mit einem anderen Spieler zusammen die 75 % - Grenze erreichen können. Kombination Erben Finanzinvestoren Kleinaktionäre EFK 0 1 0 EKF 0 1 0 FEK 1 0 0 FKE 1 0 0 KEF 0 1 0 KFE 1 0 0 SUMME 3 3 0 Shapley-Shubik-Index ½ ½ 0 Für jede der sechs denkbaren Kombinationen gibt es immer genau einen Pivot-Spieler, der die Mehrheit sichert. Der Anteil des jeweiligen Pivot-Spielers durch die Gesamtzahl der Kombinationen ergibt den Shapley-Shubik-Index von ½ für jeden der beiden E und F, aber jeweils NULL für die Kleinaktionäre (was diese ja auch oft genug lauthals beklagen!).

Jetzt führe die Aktiengesellschaft eine Kapitalerhöhung um 20 % durch, wobei die neuen Aktien durch einen strategischen Investor erworben werden. Da jetzt nicht mehr 100 Stimmen zählen, sondern 75 % von 120, sind jetzt 90 Stimmen für die strategische Entscheidungen nötig. Es gibt jetzt vier Gruppen in der Abstimmung:

Koalitionsgruppe Anteile in Aktien (in Prozent)

Erben 43 35,8

Finanzinvestoren 43 35,8

Kleinaktionäre 14 11,7

Strategischer Investor 20 16,7

SUMMEN: 120 100

Die Kapitalerhöhung führt dazu, dass die beiden bisherigen Partner in Koalitionen zusammen nicht mehr auf die Abstimmungsmehrheit von 75 % kommen können. Dadurch ergeben sich neue erforderliche Partnerschaften und Mehrheiten.

Durch die Kapitalerhöhung ist die Macht der Kleinaktionäre (vorher = NULL) gestiegen, ein Ergebnis, das man intuitiv nicht erwartet hätte. Dies liegt spiegelbildlich daran, dass sich dadurch die Macht der Erben und der Finanzinvestoren vermindert hat. Diese Eigenschaft des

Page 45: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 45 Ströbele

Shapley-Shubik-Index, dass ein Spieler bei der Hinzunahme weiterer Spieler seine Macht vergrößern kann, wird als Paradox neuer Mitglieder bezeichnet.

Wenn etwa ein Spieler (hier: ein Aktionär) seine Anteile (Stimmen) an zwei neue andere Spieler abgibt, ist keineswegs gesagt, das die neuen Spieler zusammen die gleiche, eine größere oder eine kleiner Macht haben als der einzelne Spieler vorher: Paradox der Größe.

HINWEIS: Anstelle des Shapley-Shubik-Index wird oft auch der Shapley-Wert in Analysen verwendet: Dieser ist nicht auf EINS normiert wie der Index, sondern gibt jeweils den Wert eines pivotalen Spielers an bzw. spiegelbildlich den Wert, den die betrachtete Koalition bei seinem Austritt gerade verliert.

Shapley-Wert i = ( )

)]}{()([!

)(!1

}...,,1{

iKvKvI

KIK

IKKi

−−⋅∑−⋅−

⊆ε

4.4. Wahl- und Abstimmungsverfahren (nach Dixit/Skeath)

Es gibt eine Vielzahl von Wahl- und Abstimmungsverfahren. Damit werden beispielsweise bestimmt:

• der Präsident von Frankreich (zweistufiges Wahlverfahren),

• der Sieger der 1. Bundesliga im Fußball (erste Stufe nach Punkten: 2 für Sieg, 1 für Unentschieden; bei Gleichheit: 2. Stufe nach Tordifferenz)

• Die Mitglieder eines Parlaments:

o GB: Mehrheitswahlrecht pro Wahlkreis

o Deutschland: gemischtes System mit i.d.R. ausschlaggebender Bedeutung der Stimmenanteile der Zweitstimmen

• Der Sieger eines Tanzturniers (Standard oder Latin) nach Majorität der Plätze in den einzelnen Tänzen (Platzziffer des Tanzes)

o Sieger = derjenige mit der niedrigsten Platzziffer.

o Bei Gleichheit: Majorität der gewonnenen Tänze.

Allgemeine Verfahren:

a) Binär = Wahl zwischen 2 Alternativen

• Majoritätsregel bestimmt Sieger

• Ketten von paarweisen Abstimmungen

Spezialfälle:

• Condorcet-Methode (Französischer Marquis de Condorcet 18. Jh.): Ein Kandidat, der in einer paarweisen Abstimmungsserie die meisten übrigen Kandidaten besiegt, gewinnt.

• Amendment-Prozedur im US-amerikanischen Congress: Gesetzesvorlage A erfährt „Änderungsvorschläge A1, A2,…, An.

b) Plurative Methoden:

Page 46: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 46 Ströbele

• 1. Runde der französischen Präsidentschaftswahlen bestimmt die zwei Kandidaten für die „Stichrunde“.

• Borda-Abstimmung (Jeder Kandidat bekommt eine bestimmte Punktzahl: Formel-1-Rennen, Grand Prix d’Eurovison)

c) Gemischte Methoden:

• Majoritätswahl mit 2 Stufen:

Erreicht Kandidat im Wahlgang 1 die absolute Mehrheit der Stimmen – ok. Falls nicht: Stichwahl zwischen den beiden besten.

Skurrile Ergebnisse durch strategisches Wählen möglich; 2002: Chirac vs. Le Pen.

• rundenweises Ausscheiden der am wenigsten präferierten Optionen. Letzte Runde = binär: Mehrheit entscheidet.

• Proportionalwahlen (2. –Stimmen für den deutschen Bundestag)

Jedes Abstimmungsverfahren verschafft Spielräume für strategisches Verhalten. Daraus entstehen einige bekannte Paradoxien.

Das Condorcet – Paradoxon

Aus individuellen Präferenzen soll durch ein Abstimmungsverfahren eine „soziale Präferenz“ entstehen Ergebnis eines Beschlusses, z.B. eines Gemeinderates

Präferenzen:

Rat 1: A > B > C

Rat 2: B > C > A

Rat 3: C > A > B

A = Klotzen mit Geld (einige Schwerpunkte)

B = Nichts machen (Status Quo)

C = Kleckern mit Geld (Gießkanne)

Obwohl die einzelnen Präferenzen wohlgeordnet sind, entsteht durch die spezielle Reihenfolge bei den 3 Ratsmitgliedern das Problem zyklischer Präferenzen des Gremiums:

Abstimmung (a): A gegen B A gewinnt

Abstimmung (b): A gegen C C gewinnt

Abstimmung (c): C gegen B B gewinnt

Abstimmung (d): B gegen A A gewinnt

Das Agenda-Paradoxon (Tagesordnung)

Wer die Abstimmungsreihenfolge festlegt, kann das Ergebnis bestimmen.

1. Abstimmung: Wollen wir den Status Quo beibehalten?

B gegen den Rest: Rat 2 wird von Rat 1 und 3 überstimmt

verbleiben A und C

Page 47: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 47 Ströbele

2. Abstimmung: A gegen C C = C*!

d.h.: wer C erreichen will, muss die erste Abstimmung gegen B durchführen!

Nicht die Abstimmungen entscheiden, sondern derjenige, der die Reihenfolge festlegt.

Lobbying nicht um die Ratsmitglieder, sondern um den Vorsitz ist entscheidend.

Das Umkehr-Paradoxon

Vier Sportler stehen zur Ehrung „Sportler des Jahres“ an. Sieben Sportjournalisten sollen abstimmen. Die Mehrheiten verteilen sich wie folgt:

Präferenz 1: A > B > C > D (2 Journalisten)

Präferenz 2: D > A > B > C (3 Journalisten)

Präferenz 3: B > C > D > A (2 Journalisten)

Jeder vergibt Punkte 1-4:

Sportler Punkte

A 8+ 9+2 = 19

B 6+6+8 = 20

C 4+3+6 = 13

D 2+12+4 = 18

70

Nach der Abstimmung (die ja als Sieger B hervorgebracht hat) wird B als gedopt überführt und von der Fernsehsendung gestrichen.

A wird der neue Sieger!? oder neue Abstimmung (mit Punkten 1-3)

Sportler Punkte

A 6+ 6+2 = 14

C 4+3+6 = 13

D 2+9+4 = 15

42

Da die Präferenzen unverändert sind, hat die Zahl der Kandidaten entschieden.

Arrows Unmöglichkeitstheorem zeigt, dass es kein allgemein „faires“ Wahlverfahren gibt, das gleichzeitig 6 „vernünftige“ Axiome erfüllt:

Page 48: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 48 Ströbele

1.) Alle Alternativen müssen bewertet werden (Vollständigkeit)

2.) Transitivität A > B und B > C A > C

3.) Wenn A > B für alle Abstimmungsberechtigten, dann A > B Gremium.

4.) kein Einfluss außer Präferenzen der Abstimmungsberechtigten

5.) keine Diktatur kein Einzelner darf die Abstimmung majorisieren können

6.) Unabhängigkeit von irrelevanten Alternativen (wenn Kandidat X ausscheidet, bleiben die Rankings der Übrigen unverändert)

Alle realen (scheinbar fairen und akzeptablen) Wahlverfahren eröffnen (zumindest in bestimmten Situationen) die Möglichkeiten strategischen Verhaltens der Wähler:

• USA-Wahlen 2000 Al Gore – Bush – Nader

• Zweitstimmenkampagne der FDP Überhangmandate CDU/CSU

Page 49: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 49 Ströbele

5. Statische Spiele mit unvollständiger Information

5.1. Informationsannahmen und Beispiele

In der Spieltheorie unterscheidet man zwischen

a) unvollkommener Information (imperfect information): Ein Spieler weiß nicht genau, welchen Zug andere Spieler vor ihm gemacht haben,

b) unvollständige Information (incomplete information): Ein Spieler kennt nicht alle für das Spiel relevanten Eigenschaften anderer Spieler.

Harsany hat 1966/67 das Spiel mit unvollständiger Information (b) durch einen geeigneten „Trick“ in ein Spiel mit unvollkommener Information überführt.

Ein Spiel mit unvollständiger (incomplete) Information wird in ein Spiel mit unvollkommener (imperfect) Information überführt, indem an geeigneter Stelle ein weiterer Spieler („die Natur“) eingeführt wird, die per stochastischem Zug über den Typ des Gegenspielers entscheidet.

Beispiel 1: Ein Unternehmen kann einen Arbeiter anstellen, der entweder hoch qualifiziert ist oder weniger gut qualifiziert. Der Arbeiter kennt seinen eigenen Typ, nicht aber das Unter-nehmen. Dies ist ein Spiel mit unvollständiger Information für das Unternehmen. Modellieren lässt sich diese Situation etwa wie folgt:

Die Natur wählt durch einen Zufallsprozess (hier: mit zwei möglichen Zuständen „tüchtig“ mit Wahrscheinlichkeit p oder „schwach“ mit (1-p) für Spieler 2; mit Wahrscheinlichkeit 1 „normal“ für Spieler 1) den Typen jedes Spielers aus, so dass verschiedene (hier: zwei) Teil-Spielbäume entstehen. Jeder Spieler erfährt dann, welcher Typ er ist; der jeweils andere weiß dies nicht.

Wenn p > ½, dann ist ein Nash-GG gegeben durch die Lösung: Das Unternehmen entscheidet sich für „Einstellen“ und der Arbeiter arbeitet gut, wenn er tüchtig ist, und schlecht, wenn er lasch ist. Ein anderes Nash-GG ist gegeben durch „nicht einstellen“ und „schlecht arbeiten“ unabhängig vom Typ, den die Natur gezogen hat.

Beispiel 2: (SIEG)

Ein Spieler 1 ist bisher Monopolist auf einem Markt, der eine neue Fabrik (wegen Verschie-bung der Nachfragefunktion nach außen) zu hohen Kosten von 3 oder niedrigen Kosten von 0 bauen kann. Spieler 2 überlegt den Marktzutritt, kennt aber nicht die Produktionskosten der neuen Fabrik. Damit ergeben sich zwei denkbare Auszahlungsmatrizen.

Eintritt Kein Eintritt Eintritt Kein Eintritt

Bau 0 ; -1 2 ; 0 Bau 3 ; -1 5 ; 0

kein Bau 2 ; 1 3 ; 0 kein Bau 2 ; 1 3 ; 0

Hohe Kosten p niedrige Kosten 1-p

Spieler 2 hat in jedem Fall nur dann Aussichten auf einen positiven Payoff, wenn Spieler 1 nicht baut. Für Spieler 1 ist es andererseits nur lohnend zu bauen, wenn seine Kosten niedrig sind: Bei hohen Kosten dominiert „kein Bau“ die Strategie „Bau“. Spieler 2 kennt aber die Kosten von Spieler 1 nicht und nimmt an, dass dieser mit Wahrscheinlichkeit p hohe Kosten hat. Dementsprechend erhält er bei seinem Markteintritt die Auszahlung 1 mit Wahrscheinlich-

Page 50: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 50 Ströbele

keit p (Spieler 1 baut dann nicht) und mit 1-p die Auszahlung -1, weil Spieler 1 ja bei niedrigen Kosten baut. Insgesamt erhält er als erwarteten Payoff: u2(Eintritt) = 2 · p – 1.

Dieser Payoff ist positiv genau dann, wenn p > ½ .

Spieler 1 hat hier eine dominante Strategie, nämlich nur im Falle niedriger Kosten zu bauen, so dass Spieler 2 dies vorausschauen kann.

Im Allgemeinen ist dieses Problem nicht so einfach zu lösen, wenn keine dominante Strategie existiert. Dazu betrachten wir folgende Modifikation für den Fall niedriger Kosten:

Eintritt Kein Eintritt Eintritt Kein Eintritt

Bau 0 ; -1 2 ; 0 Bau 1,5 ; -1 3,5 ; 0

kein Bau 2 ; 1 3 ; 0 kein Bau 2 ; 1 3 ; 0

Hohe Kosten p niedrige Kosten 1-p

Jetzt ist für Spieler 1 bei niedrigen Kosten die Strategie „Bauen“ nicht mehr dominant, so dass eine echte Interdependenz entsteht.

Dank des „Tricks“ von Harsany überführen wir das Spiel in einen Spielbaum, in welchem die Natur per Zufallsgenerator über hohe oder niedrige Kosten für Spieler 1 entscheidet. Jetzt erhält man ein Spiel mit unvollkommener Information, wofür wir bereits Methoden haben.

Die wichtige Annahme ist, dass zunächst (also zu Beginn des Spiels!) beide Spieler die gleiche Einschätzung über die Wahrscheinlichkeit p für „hohe Kosten“ haben (Annahme des so genannten common knowledge!) Andernfalls gibt es sehr viele verschiedene Lösungen, die sich letztlich auf unterschiedliche subjektive Einschätzungen der beiden Spieler zurückführen ließen.

Definition: Ein Bayes-Gleichgewicht ist das Nash-Gleichgewicht des Spiels mit unvoll-kommener Information.

Im Spielbaum erfährt Spieler 1, ob er hohe oder niedrige Kosten hat; Spieler 2 weiß dies nicht, sondern muss immer noch von p bzw. 1-p ausgehen.

Die Entscheidung im Falle hoher Kosten ist für U1 eindeutig „nicht bauen“, woraufhin Spieler 2 seinen Markteintritt vornähme falls er einen positiven Erwartungswert seiner Payoffs hätte.

Falls die Kosten niedrig sind (was Spieler 2 ja nicht weiß), tritt Spieler U1 mit Wahrschein-lichkeit x in den Markt ein. Spieler 2 entscheidet sich mit Wahrscheinlichkeit y für Markteintritt und erhält im Erwartungswert u2 = p · y · 1 + (1-p) · [ x · y · (-1) + (1-x) · y · 1 ] = y · [ p + (1-p) · ( 1- 2 · x) ] Das Vorzeichen des Klammerterms entscheidet darüber ob der Payoff für y > 0 positiv ist oder nicht:

)1(210

pxmKlammerter

−⋅<⇔>

Falls der Klammerterm positiv ist, ist natürlich y größtmöglich zu wählen: y = 1. Falls der Klammerterm negativ ist, ist natürlich y minimal zu wählen: y = 0.

Indifferenz gilt, falls der Klammerterm gerade NULL ist, d.h. x = 1/[ 2 · (1-p) ].

Page 51: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 51 Ströbele

Spieler 1 baut ja nur bei niedrigen Kosten mit Wahrscheinlichkeit x und bekommt dafür u1 = x · [ 1,5 · y + 3,5 · (1-y) ] + (1-x) · [ 2 · y + 3 · (1 – y) ] = x · ( ½ - y ) + 3 – y Wieder entscheidet das Vorzeichen der Klammer im rechten Term, welches x das beste ist: Falls y < ½, ist x größtmöglich zu wählen: x = 1. Falls y > ½, ist x minimal zu wählen: x = 0. Indifferenz gilt für y = ½ .

Ein Bayes’sches Gleichgewicht erhält man, wenn bei niedrigen Kosten x die beste Antwort auf y ist und bei gegebenem p die Strategie y die beste Antwort auf die naheliegende Strategie des Spielers 1 ist, bei hohen Kosten (sicher) nicht und bei niedrigen Kosten mit Wahrscheinlichkeit x zu bauen.

Ein spezielles Gleichgewicht ist durch (x, y) = (0, 1) gegeben: Hier tritt U2 immer in den Markt ein – was U1 mit Nicht-Bauen beantworten muss. Umgekehrt tritt U2 immer in den Markt ein, falls U1 nicht baut.

Falls p ≤ ½ , ist (x, y) = (1, 0) ein Gleichgewicht. Die Plausibilität ist klar: Sind hohe Kosten nicht sehr wahrscheinlich (d.h. p niedrig), dann wird Spieler 1 lieber „bauen“ wählen und damit den potentiellen Konkurrenten vom Markteintritt abwehren.

Beispiel 3: Bereitstellung eines öffentlichen Gutes (siehe SIEG, Seite 93 ff.) = ÜBUNG

5.2. Bayes’sches Gleichgewicht

Die Grundidee in der Theorie des Bayes’schen Gleichgewicht besteht darin, aus den Wahr-scheinlichkeitsannahmen über die verschiedenen Möglichkeiten, auf verschiedene „Typen“ von Spielern zu treffen, neue bedingte Wahrscheinlichkeiten auszurechnen und dadurch „bessere Strategien“ zu bekommen.

Es gebe verschiedene Typen von Spieler i (nach dem Zug der Natur kennt nur er selbst seinen Typ wie etwa sehr fleißig und tüchtig, mittelprächtig, faul und Drückeberger), d.h. dies sind für ihn private Informationen.

- Ti = Menge aller möglichen Typen ti von Spieler i.

- Wahrscheinlichkeitsverteilung der Typen p(t1, …, tI) über alle Spieler.

- Der realisierte Typ ti ist nur dem Spieler i selbst bekannt, den anderen nicht.

- Die Typen der Gegenspieler von Spieler i sind t -i = ( t1, …, ti-1, ti+1, …, tI ).

- Die bedingte Wahrscheinlichkeit p (t-i|ti) ist die Wahrscheinlichkeitsverteilung für die Typen t-i aus der Sicht der Spielers i, wenn er seinen Typ kennt und die anderen einschätzen will (unter dieser Zusatzinformation, die nur ihm zugängig ist).

- Jeder Typ tritt mit einer positiven Wahrscheinlichkeit auf (ansonsten wird er aus der Liste der Typen gestrichen).

Definition 5.2:

- Seien gegeben die Strategienräume Si eines statischen Bayes’schen Spiels mit I Spielern, die Typenräume Ti und die Erwartungen der Spieler pi über ihre Gegenspieler. Der Spieler i kennt als einziger seinen Typ (private Information), was seine Auszahlungsfunktion ein-grenzt. Die bedingte Wahrscheinlichkeit pi (t-i | ti) beschreibt, dass der Spieler i die Typen seiner Gegenspieler nicht kennt, sondern nur eine Wahrscheinlichkeitsvorstellung darüber hat.

Page 52: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 52 Ströbele

- Die Berechnung der bedingten Wahrscheinlichkeiten für die Typen der Gegenspieler, so-bald Spieler i seinen eigenen Typ kennt, erfolgt nach der Bayes-Formel für bedingte Wahr-scheinlichkeiten (Randverteilung; siehe Statistik und Ökonometrie):

pi (t-i | ti) = ∑

=

−−−

−−

ii Ttii

ii

i

ii

ttpttp

tpttp

ε),(

),()(

),(

Beispiel 4: SIEG

Der FC Preußen sucht Verstärkung für seine Fußballmannschaft. Aus Spielbeobachtungen und Videoaufnahmen weiß der Trainer, dass ein Spieler A mit 40 % Wahrscheinlichkeit eine Ver-stärkung und mit 60 % Wahrscheinlichkeit keine ist. Aus langjähriger Erfahrung (auch anderer Trainerkollegen) weiß er, dass in einem Probetraining 70 % der guten Spieler erfolgreich beste-hen (nur 30 % gute werden irrtümlich falsch als schwach eingeschätzt) und dass ein schlechter Spieler nur in 10 % irrtümlich als „gut“ eingeschätzt wird und in 90 % zu Recht als schwach erkannt wird.

Daraus ergibt sich (ohne das Probetraining durchgeführt zu haben) folgende Gesamtverteilung:

Probetraining Spieler stark Spieler schwach SUMME

Erfolgreich 0,28 0,06 0,34

nicht erfolgreich 0,12 0,54 0,66

SUMME 0,40 0,60

Erläuterung am Beispiel des ersten oberen Feldes: Mit 40 % Wahrscheinlichkeit zieht man aus dem Spielertopf einen guten Spieler. Dieser besteht mit 70 % Wahrscheinlichkeit das Probe-training, so dass für dieses kombinierte Ereignis die Wahrscheinlichkeit 28 % beträgt.

Um jetzt nach einem Probetraining, in welchem ja der Trainer zusätzliche Informationen be-kommen hat, die Aussichten abzuschätzen, tatsächlich eine richtige Entscheidung zu treffen, ermittelt man die bedingte Wahrscheinlichkeit nach der Bayes’schen Regel:

p (stark | erfolgreich) = ),herfolgreic(),herfolgreic(

),herfolgreic(schwachpstarkp

starkp+

= 8235,006,028,0

28,0=

+.

Die Wahrscheinlichkeit, dass ein Spieler stark ist und das Probetraining erfolgreich abschließt, wird geteilt durch die Chancen, dass irgendein Spieler (egal welchen Typs) das Probetraining erfolgreich schafft. Und hier hilft die hohe Wahrscheinlichkeit, dass die „Nieten“ recht gut er-kannt werden können, so dass das Probetraining dem Trainer tatsächlich weiter hilft. Anstelle mit 40 % Wahrscheinlichkeit stellt er jetzt mit 82,35% fest, dass er einen guten Spieler be-kommt. Diese verbesserte Sicherheit ist aus ökonomischer Sicht abzuwägen gegen die Kosten für das Probetraining.

Fazit: In einem Bayes’schen Spiel passen die Spieler in jedem Zug ihre Wahrscheinlichkeits-verteilungen mit Hilfe der Bayes-Regel an und verarbeiten so jeweils optimal die neu verfüg-baren Informationen.

Formalisiert ergeben sich die folgenden Definitionen und Spielabläufe:

Page 53: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 53 Ströbele

Definition 5.3: (Strategien)

Eine Strategie in einem Bayes’schen Spiel bestimmt die Aktionen für alle denkbaren Typen eines Spielers.

Definition 5.4: (Bayes’sches Gleichgewicht)

s* ist ein Bayes’sches Gleichgewicht, wenn für jeden Spieler i und jeden möglichen Typ ti die Strategie si*(ti) eine Lösung der folgenden Maximierungsaufgabe ist

∑−− iiii TtSs εε

max pi (t-i | ti ) · ui ( s*1(t1), …, s*i-1(t i-1), si, s*i-1(t i+1),, …, s*I(tI) )

d.h. die übliche Nash-Gleichgewichtsbetrachtung erfolgt hier mit den erwarteten Nutzenwerten unter den bestmöglichen bedingten Wahrscheinlichkeiten.

Das Ablaufschema zur Bestimmung des Bayes-Gleichgewichts ist dann wie folgt:

- Die Natur bestimmt die Typen der Spieler t1, …, tI.

- Nur der jeweilige Spieler i kennt seinen Typ ti.

- Jeder Spieler wählt (gleichzeitig mit den anderen) eine Aktion aus den ihm möglichen aus.

- Die Spieler erhalten die entstehenden Auszahlungen (abhängig von den gezogenen Typen und gewählten Aktionen).

Beispiel 5: Duopol bei unvollständiger Information

Im bisherigen Duopolspiel wurde unterstellt, dass die beiden Unternehmen im Markt die jewei-ligen Grenzkosten des anderen genau kennen. Jetzt gehen wir davon aus, dass jedes Unter-nehmen Ui nur seine eigenen Grenzkosten kennt („Typ“ i), die entweder „hoch“ oder „niedrig“ sein können. Da U2 etwas günstigere Standorte hat, besteht für dieses Unternehmen eine etwas höhere Wahrscheinlichkeit (55 %), dass es die niedrigen Kosten erzielt. Außerdem gilt, dass beide mit ziemlich hohen Wahrscheinlichkeiten jeweils gemeinsam hohe bzw. niedrige Kosten aufweisen.

Die Verteilung (die beiden bekannt ist), ist in der folgenden Tabelle wiedergegeben:

Unternehmen 2

Hohe Kosten Niedrige Kosten SUMME

Unternehmen 1 Hohe Kosten 0,40 0,1 0,5

Niedrige Kosten 0,05 0,45 0,5

SUMME 0,45 0,55

Die Marktnachfragefunktion sei durch Preis = 2 – q1 – q2

gegeben, wobei alle Größen > 0 sein müssen.

Damit ergeben sich die jeweiligen Auszahlungen zu:

G1 = q1 · (2 – q1 – q2 – c1) und G2 = q2 · (2 – q1 – q2 – c2)

Page 54: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 54 Ströbele

Es bestehen also lediglich „Typenunterschiede“ bezüglich der denkbaren Grenzkosten. Jeder der beiden Ui erfährt zu Beginn des Spiels von der „Natur“ wie seine Grenzkosten sind, d.h. ob er hohe oder niedrige Grenzkosten hat.

Die Angebotsmengen von U1 seien xN bzw. xH bei niedrigen bzw. hohen Grenzkosten.

Die Angebotsmengen von U2 seien yN bzw. yH bei niedrigen bzw. hohen Grenzkosten.

Schritt 1: Herleitung der Reaktionsfunktionen von U1

Unter Nutzung der Bayes’schen Regel kann U1 die folgenden bedingten Wahrscheinlichkeiten ausrechnen. Dabei wird immer festgestellt, wie wahrscheinlich c2 = H oder N ist, wenn U1 seine Grenzkosten kennte:

p (c2 = H | c1 = H ) = 0,40 / (0,40 + 0,10) = 0,8 p (c2 = N | c1 = H ) = 0,10 / (0,40 + 0,10) = 0,2 p (c2 = H | c1 = N ) = 0,05 / (0,05 + 0,45) = 0,1

p (c2 = N | c1 = N ) = 0,45 / (0,05 + 0,45) = 0,9. Falls also einer der beiden Fälle „c1 hoch oder niedrig“ gegeben ist, hat U1 das folgende Maxi-mierungsproblem zu lösen:

Max [ 2 – cH – xH – 0,8 · yH – 0,2 · yN ] · xH

mit dem Ergebnis Reaktionsfunktion R1H: NHH

H yycx ⋅−⋅−−

= 1,04,02

2 bzw.

Max [ 2 – cN – xH – 0,1 · yH – 0,9 · yN ] · xN

mit dem Ergebnis Reaktionsfunktion R1N: NHN

N yycx ⋅−⋅−−

= 45,005,02

2 .

Schritt 2: Herleitung der Reaktionsfunktionen von U2

Unter Nutzung der Bayes’schen Regel kann auch U2 die folgenden bedingten Wahrscheinlich-keiten ausrechnen:

p (c1 = H | c2 = H ) = 0,40 / (0,40 + 0,05) = 8/9 p (c1 = N | c2 = H ) = 0,05 / (0,40 + 0,05) = 1/9 p (c1 = H | c2 = N ) = 0,10 / (0,10 + 0,45) = 2/11

p (c1 = N | c2 = N ) = 0,45 / (0,10 + 0,45) = 9/11. Falls also einer der beiden Fälle „c2 hoch oder niedrig“ gegeben ist, hat U2 das folgende Maxi-mierungsproblem zu lösen:

Max [ 2 – cH – yH –8/9 · xH – 1/9 · xN ] · yH

mit dem Ergebnis Reaktionsfunktion R2H: NHH

H xxcy ⋅−⋅−−

=181

94

22

bzw.

Max [ 2 – cN – yH – 1/11 · xH – 9/11 · xN ] · yN

mit dem Ergebnis Reaktionsfunktion R2N: NHN

N xxcy ⋅−⋅−−

=229

111

22

.

Page 55: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 55 Ströbele

Schritt 3: Bestimmung des Bayes-Gleichgewichts

Mit den insgesamt 4 Reaktionsfunktionen liegen 4 lineare Gleichungen in den vier Unbe-kannten xH, xN, yH, yN vor. Mit den gewohnten Methoden (Einsetzen oder Gleichungen multiplizieren und addieren/subtrahieren) oder mit der Auflösung der Matrixgleichung

⎟⎟⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜⎜⎜

=

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⋅=

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜

22

22

22

22

10229

111

01181

94

45,005,0101,04,001

N

H

N

H

N

H

N

H

N

H

N

H

c

c

c

c

yyxx

A

yyxx

erhält man nach Invertierung der Matrix A die Lösung für die 4 Unbekannten:

A-1 =

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−−

−−

247,1086,0515,0152,0106,0228,1111,0555,0566,0100,0237,10,096

0,167-0,500-0,0961,237

, was bspw. für xH ergibt:

xH = ⅔ - [ (1,237 – 0,5) · ½ · cH + (0,096 – 0,167) · ½ · cN ]

Für die Zahlenwerte cH = 1,5 und cN = 0,5 erhält man dann als Ergebnis:

xH = 0,1312 xN = 0,5021 yH = 0,1638 yN = 0,5327

Aus der gegenseitigen Nicht-Informiertheit resultiert also eine Modifikation der oligo-polistischen Interdependenz gegenüber dem Basismodell aus „Markt- und Preistheorie“.

Plausibilität: Wenn beide Unternehmen bspw. sicher und auch voneinander gegenseitig wis-sen, dass sie niedrige Grenzkosten haben, ergibt sich die Gleichgewichtslösung zu xNs = 0,50 und yNs = 0,50. Dass im obigen Modell davon abgewichen wird, liegt daran, dass jeder nur von sich selbst weiß, dass er den Fall „N“ hat, aber für sein Gegenüber mit einer kleinen Wahrscheinlichkeit auch damit rechnet, dass dieser hohe Grenzkosten aufweist: Dann ist eine höhere Produktionsmenge gleichgewichtig. Diese ist für U2 sogar größer als für U1, weil U2 bei eigenen niedrigen Grenzkosten mit einer etwas höheren Wahrscheinlichkeit für seinen Mitwett-bewerber auf hohe GK rechnet als umgekehrt. Im Falle hoher Grenzkosten korrigieren beide Unternehmen ihre ansonsten gleichen Werte xHs = yHs = 0,16667 nach unten, weil ja die kleine Chance besteht, dass der jeweils andere niedrige GK hat.

HINWEIS: Die Bayes-Strategien sind reine Strategien in dem Sinne, dass die Spieler nach dem unterstellten Zug der Natur selbst nicht mehr gemischte Strategien wählen. Der Zufallseinfluss liegt formal vor dem Beginn des Spiels der übrigen Spieler und diese stellen den Zufallseinfluss angemessen in Rechnung.

Aber es lässt sich zumindest für „kleine“ Zufallsschwankungen ein schönes Ergebnis zeigen, das Harsany 1973 bewiesen hat:

Page 56: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 56 Ströbele

Unterliegen die Auszahlungen der Spieler „kleinen“ Zufallsschwankungen, die von den Spie-lern selbst nicht beobachtet werden können, so entspricht

- das Bayes’sche Gleichgewicht in reinen Strategien des Spiels unvollständiger Infor-mation dem

- Gleichgewicht des ursprünglichen Spiels in gemischten Strategien.

Beispiel (SIEG) Grab the dollar

Auf einem Duopolmarkt steht wegen wachsender Nachfrage eine Investition an. Investieren beide, so machen beide einen Verlust; investiert nur einer, so erzielt er einen Gewinn. Investieren beide nicht, gilt ein Ergebnis von NULL für beide Unternehmen.

Unternehmen 2

Investieren Nicht investieren

Unternehmen 1 Investieren -1 ; -1 1 ; 0

Nicht investieren 0 ; 1 0 ; 0

Hier gibt es ein gemischtes Nash-Gleichgewicht mit jeweils p = q = ½ für jeden Spieler.

Modifizieren wir das Spiel geringfügig um einen „Typ“ ti eines jeden der beiden Spieler. Die Variable „Typ“ sei gleichverteilt auf einem Intervall [ -ε , ε ]. Wenn die Natur gezogen hat, kennt jedes Unternehmen seinen eigenen Typ, aber nicht den des anderen (d.h. jeder hat für sich eine private Information über seinen eigenen Typ). Offensichtlich verändert ti die Payoffs und zwar günstiger, wenn ti > 0 und ungünstiger, wenn ti < 0.

Bayes’sches Gleichgewicht: Der Spieler i investiert genau dann, wenn ti ≥ 0 und investiert nicht, wenn ti < 0. Beweis für Spieler 1:

Aus Symmetriegründen (Gleichverteilung) erwartet Spieler 1, dass Spieler 2 auch diese Strategie verwendet. Dann wird wegen der Gleichverteilung Spieler 2 mit Wahrscheinlichkeit ½ investieren, wenn t2 ≥ 0 und ebenfalls mit Wahrscheinlichkeit ½ nicht investieren. Spieler 1 wird deswegen investieren, wenn ½ · (1+t1) + ½ · (-1) = ½ · t1 ≥ 0. Damit ist (½; ½) ein Bayes-Gleichgewicht in reinen Strategien in einem Spiel mit unvollständiger Information.

Page 57: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 57 Ströbele

6. Dynamische Spiele mit unvollständiger Information

6.1. Informationsmengen und teilspielperfekte Gleichgewichte

Bisherige Annahme: Perfekte Information hieß bisher, dass jeder Spieler genau weiß, wer welchen Zug wann gemacht hat, wenn der jeweilige Spieler Gelegenheit hat, einen Aktion zu wählen.

Imperfekte (unvollkommene) Information: Ein Spieler weiß nicht genau, wer welchen Zug gemacht hat, wenn er die Gelegenheit hat, eine Aktion zu wählen.

Eine Informationsmenge für einen Spieler ist eine Sammlung von Knoten, die folgende Bedingungen erfüllen:

- Der Spieler ist an jedem Knoten in der Informationsmenge am Zug,

- Wenn das Spiel einen Knoten der Informationsmenge erreicht, weiß der Spieler am Zug nicht, in welchem Knoten der Informationsmenge er sich befindet.

Alle Knoten einer Informationsmenge gehören jeweils genau einem Spieler.

Der Spieler hat in jedem Knoten der Informationsmenge dieselbe Menge an Aktionen zur Auswahl.

Offensichtlich ist ein dynamisches (sequentielles) Spiel, in dem jede Informationsmenge genau einen Knoten enthält, ein Spiel mit perfekter Information.

Ein dynamisches (sequentielles) Spiel, in dem es Informationsmengen gibt, die mehr als einen Knoten enthalten, heißt Spiel mit imperfekter (unvollkommener) Information.

Teilspielperfektheit:

- Ein Nash-Gleichgewicht in einem dynamischen Spiel ist teilspielperfekt, wenn die Strategien des Nash-GG in jedem Teilspiel selbst ein Nash-GG sind oder Bestandteil eines solchen sind.

- Ein Teilspiel in einem Spielbaum

o beginnt in einer Informationsmenge Ik mit einem einzigen Element (d.h. es besteht keine Unsicherheit darüber, wo im Spiel der Spieler sich befindet)

o schließt alle Knoten und Kanten ein, die dem „Startpunkt“ Ik (der ein-elementigen Informationsmenge) folgen und

o durchtrennt keine Informationsmenge (d.h. teilt sie in zwei disjunkte Teilmengen), d.h. wenn der Knoten einer Informationsmenge zu einem Teilspiel gehört, dann auch alle Knoten der Informationsmenge zu diesem Teilspiel.

Da wir bereits die dynamischen Spiele mit perfekter Information und zugehörige Lösungs-methoden kennengelernt haben (Rückwärtsinduktion samt ihren Problemen), werden im folgenden die Modifikationen betrachtet, die durch unvollkommene Information entstehen.

6.2. Perfekte Bayes-Gleichgewichte

Ein Student überlegt, ob er als Jungunternehmer in Stadt XY einen Imbiss eröffnen soll und damit in den Markt für Schnellrestaurants eintritt. Er kann entweder ein Lokal mit Sitzplätzen und Tischen eröffnen (H) oder einen Imbisswagen aufstellen, vor dem die Gäste an Stehtischen

Page 58: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 58 Ströbele

ihre Mahlzeit einnehmen (L). Bisher gibt es in XY eine Filiale von McMON, die dem Jung-unternehmer einen Preiskampf androht, wenn er es wagen sollte, in den Markt einzutreten.

Der Spielbaum ist wie in der Abbildung 6.1. dargestellt:

In Normalform (also ohne explizite Sichtbarmachung der sequentiellen Grundstruktur) ergibt sich das folgende Spiel:

McMON

Kampf Teilung

Newcomer Kein Eintritt 0 ; 100 0 ; 100

Eintritt mit L -5 ; -10 10 ; 20

Eintritt mit H -20 ; -10 20 ; 20

Im statischen Normalformspiel gibt es zwei Nash-Gleichgewichte, nämlich

- (Kein Eintritt ; Kampf) und

- (Eintritt mit H ; Teilung)

Eine nähere Betrachtung der sequentiellen Spiels zeigt jetzt aber folgendes Problem auf: Da der Jungunternehmer zum Zeitpunkt seiner Entscheidung noch nicht wissen kann, ob sich der Gegenüber McMON zum „Kampf“ entscheiden wird, gibt es in der Informationsmenge {A, B} eine Aktion „Kampf“, die aber hier nicht mehr zum Zuge kommt. Sollte der bisherige Marktbeherrscher McMON in der Informationsmenge {A, B}mit Wahrscheinlichkeit p davon ausgehen im Konten A und mit Wahrscheinlichkeit 1-p im Knoten B zu sein, dann wird „Teilung“ die einzige Aktion sein, die er wählt.

Es sind also zusätzliche plausible Annahmen über das Spiel angebracht, um zu einem Ausscheiden von wenig glaubhaften Lösungen zu kommen.

Dies geschieht mit den folgenden Annahmen für ein Perfektes Bayes-Gleichgewicht:

- Vorstellungen (beliefs): Der jeweilige Spieler am Zug hat eine Vorstellung über die Wahr-scheinlichkeiten, mit denen er sich an den zur Informationsmenge gehörenden Knoten befindet.

Page 59: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 59 Ströbele

- Fortlaufende Rationalität (sequentail rationality): Jeder Spieler wählt in jeder Informa-tionsmenge nur diejenigen Aktionen aus, die zusammen mit seinen Vorstellungen und den nachfolgenden Strategien seiner Gegenspieler zu einer bestmöglichen Auszahlung führen.

- In allen Informationsmengen innerhalb des Gleichgewichtspfades (d.h. denjenigen Knoten, welche mit positiver Wahrscheinlichkeit erreicht werden) werden die Vorstellungen mittels der Bayes-Regel und der Gleichgewichtsstrategien gebildet.

Strategien und Vorstellungen, welche die obigen Annahmen erfüllen, bilden ein perfektes Bayes’sches Gleichgewicht. Nicht nur die Strategien, sondern auch die Vorstellungen müssen gleichgewichtig sein. Damit lassen sich wenig plausible Gleichgewichte besser ausschließen.

6.3. Ungewissheit und Information: Signalspiele, Screening und leeres Gerede

Wie bisher auch, unterstellen wir im Folgenden, dass die Spieler unterschiedliche Infor-mationen haben. Aus dieser Konstellation asymmetrischer Information ergeben sich denkbare Vorgehensweisen für die beteiligten Spieler:

Der besser informierte Spieler hat zwei Möglichkeiten:

- Verberge die wahre Information (schwacher Fußballspieler mit hoher Verletzungsgefahr) oder versuche sie, geschickt zu verschleiern.

- Offenbare die wahre Information (Detektiv legt seine Pistole vor Gesprächen mit einem Verdächtigen auf den Boden und signalisiert damit friedliche Absichten, Bewerber für einen Arbeitsplatz spricht offen über seine Qualifikation)

Der schlechter informierte Spieler kann seinerseits zwei Möglichkeiten nutzen:

- Versuche Zusatzinformationen zu gewinnen (Probetraining beim Fußball, Versicherung verlangt Offenbarung bisheriger Schadensverläufe, …)

- Bleibe uninformiert, aber versuche glaubwürdig zu machen, dass es dir egal ist, was passiert.

Je nachdem, welcher Spieler den ersten Zug machen kann, unterscheidet man in der Theorie der Signalspiele nach zwei Varianten:

- Der informierte Spieler macht den ersten Zug: Signaling.

- Der uninformierte Spieler macht den ersten Zug: Screening.

6.3.1. Screening

An einer Universität gibt es „harte“ Vorlesungen und Schwerpunkte und eher „einfachere“. Unternehmen XY hat aus der Vergangenheit gelernt, dass Absolventen mit einem hohen Anteil harter Fächer etwas belastbarer und vielfältiger einsetzbar sind als Absolventen mit einem hohen Anteil der einfacheren Fächer.

Es sucht zwei verschiedene Typen A und B von Angestellten als Nachwuchskräfte und bietet als Gehälter 50.000 € pro Jahr für Typ A (hoch belastbar, flexibel) und 33.333 € pro Jahr für Typ B (guter Arbeiter).

Wenn Studenten sich für bestimmte „harte“ Fächer entscheiden, nehmen die A-Studenten einen Verzicht in Form von Parties, Sport und Biertrinken auf sich, den sie mit 2.000 € Jahresgehalt ansetzen. Für die (weniger talentierten) B-Studenten beträgt dieser Verzichtswert schon 3.000 € p.a.

Page 60: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 60 Ströbele

Das Unternehmen sucht eine Zahl n an „harten“ Kursen, oberhalb der die Bewerber 50.000 € geboten bekommen und unterhalb der lediglich 33.333 € bezahlt werden sollen. Die Hoffnung ist, damit die Typen der Bewerber zu trennen:

Die B-Studenten entscheiden sich nur dann gegen harte Fächer, wenn gilt:

33333 > 50000 – 3000 · n, d.h. n > 5,56

Die A-Studenten wählen die harten Fächer dann, wenn gilt:

50000 – 2000 · n > 33333, d.h. n < 8,33.

Damit ist die Entscheidung für das Unternehmen klar:

Wer n „harte“ Kurse belegt hat mit n = 6, 7 oder 8, wird als A-Angestellter genommen;

Wer n „harte“ Kurse belegt hat mit n ≤ 5, wird als B-Angestellter genommen. Diese Unterscheidungsmöglichkeit der beiden Typen liegt natürlich daran, dass die Kosten für das Absolvieren eines „harten“ Kurses für die beiden Arten von Studenten unterschiedlich hoch sind: Für die engagierteren (und eventuell begabteren) Studenten ist es leichter, die Kurse (ohne viele zusätzliche Arbeitsstunden!) zu bestehen. Dadurch kann das Unternehmen eine Anreiz-Struktur entwickeln, bei der sich die Typen

a) trennen (separation of types) und zudem b) ihre zugehörige Gruppe selbst zutreffend auswählen (self-selection).

Wenn das Unternehmen 100 Angestellte sucht, davon 25 % A und 75 % B, gibt es jährlich genau 3,75 Mill. € aus = 25 · 50000 + 75 · 33333 €.

Allerdings müssen hier die A-Typen Kosten tragen: Ihr Nutzenverlust bei n = 6 beträgt 12000 € Jahreseinkommen. Diesen Nutzenverlust müssten sie hinnehmen, weil es auch B-Typen gibt, von denen die sich abheben wollen. Ihr Nettoeinkommen betrüge dann lediglich 38.000 €.

Wenn es nämlich etwa 75 % B-Typen gibt und 25 % A-Typen und die Unternehmen könnten nicht separieren, dann würde das Unternehmen alle gleich behandeln müssen, da es ja die einzelnen Typen noch nicht kennen kann, und jeden mit 37.500 € einstellen. Alle werden wie aus einer „Badewanne“ gezogen und als gleich eingeschätzt (Pooling of all types). Für die A-Typen wäre es aber wenig interessant, gleich behandelt zu werden. Mit Trennung ist ihr Netto-Einkommen höher.

HINWEIS: Rechnen Sie dieses Beispiel selbst durch, wenn es 40 % A-Typen und 60 % B-Typen gibt und auch 40 A (bzw. 60 B) eingestellt werden sollen.

6.3.2 Signaling

Das berühmteste Signaling-Spiel ist das Bier-Quiche-Spiel: Ein Mensch A im Wilden Westen trifft auf einen Raufbold im Hotel, der sich bevorzugt zivilisierte Menschen vornimmt. A hat die Information, dass sich der Raufbold ungern mit starken Cowboys anlegt, weil er dort selbst verdroschen wird. Cowboys beginnen ihren Tag i.d.R. mit einem deftigen Frühstück, zu dem sie gerne ein Bier trinken. Normale Leute von der Ostküste (also aus Sicht der Western-Leute „Weicheier“) bevorzugen das Quiche-Frühstück.

Damit stellt sich die Frage: Soll A auf den Nutzen des Frühstücks mit Quiche, das er bevor-zugen würde, verzichten, weil dann die Wahrscheinlichkeit für eine für ihn unangenehme Rau-ferei stark steigt oder soll er ein Bierfrühstück zu sich nehmen und damit signalisieren, dass er dem Raufbold gewachsen sein kann?

Page 61: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 61 Ströbele

Er würde im zweiten Fall (fälschlicherweise, d.h. als Bluff) signalisieren, dass er ein kämpferischer Typ ist und hätte damit den Raufbold abgeschreckt, solange dieser davon über-zeugt ist. Andererseits kann der Raufbold auch davon ausgehen, dass mit einer gewissen Wahr-scheinlichkeit das Signal „kämpferisch“ (nämlich Bier zum Frühstück) falsch ist.

Variante eines Ausbildungsspiels

Im obigen Ausbildungsspiel (Screening durch das Unternehmen) waren die Verhältnisse noch überschaubar. Im folgenden Spiel, das auch als Ausbildungsspiel interpretiert werden kann, ist folgende Struktur gegeben:

L R

L R

[p] [q]

[1-p] [1-q]

t1

t2

Spieler 2 Spieler 2Natur

o

u

o

u

o

u

o

u

0 , 1

2 , 3

2 , 3

5 , 1

1 , 0

0 , 3

4 , 1

1 , 4

2 / 3

1 / 3

Abbildung 6.2: Signalspiel (Ausbildungsspiel)

Mit Wahrscheinlichkeit ⅔ ist ein Bewerber um einen bestimmten Job vom Typ 1, mit Wahr-scheinlichkeit ⅓ vom Typ 2 (des bessere Computer-Freak). Der erste Spieler (der seinen Typ weiß) sendet ein Signal aus: L (guter Anzug, Diplom) oder R (Jeans, EDV-Bescheinigung). Spieler 2 weiß deshalb noch nicht, welcher Typ der Sender ist (siehe die durch gepunktete Linien verbundenen Knoten auf den Seiten L und R) und muss jetzt entscheiden, welchen Zug er macht: o oder u.

In reinen Strategien wählt Spieler 1 immer eine bestimmte Aktion. Bspw. könnte Typ 1 immer R und Typ 2 immer L wählen. (Hinweis: Diese Eigenschaft machte sich das Unternehmen im obigen Screening-Spiel zunutze: Es wusste dank seines Anreizschemas, das es als erstes bekannt gab, wie die Studenten darauf antworten würden). Ebenso würde Spieler 2 immer auf R mit eindeutigem o oder u antworten, nämlich „u“. Im Allgemeinen muss jedoch Spieler 2 auch Wahrscheinlichkeiten p (und 1-p) bzw. q (und 1-q) abschätzen, mit denen er sich in den vier denkbaren Knoten befindet.

Sollten in einem Gleichgewicht mit reinen Strategien beide Typen (Spieler 1) immer dasselbe Signal senden, dann kann der Empfänger (Spieler 2) die Typen nicht unterscheiden. Dies würde bedeuten, beide Bewerber um einen Job würden sich als exzellent qualifiziert darstellen, wobei der Bluffer darauf setzt, dass seine fehlenden Qualitäten nicht erkannt werden können. Analog zur obigen Situation spräche man von einem Pooling-Gleichgewicht.

In einem Trennungsgleichgewicht (separating equlibrium) ließen sich hingegen die Typen unterscheiden.

Page 62: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 62 Ströbele

Überlegung 1: Untersuchung von Pooling-Gleichgewichten in reinen Strategien

In einem Pooling-Gleichgewicht in L spielen beide Spieler L. Daraufhin legt der Spieler 2 gemäß Bayes’scher Regel p = ⅔ fest. Seine erwarteten Payoffs für (u,o) sind ⅔ · (3;1) bzw. ⅓ · (1;3) = (2,33 ; 1,33). Somit wählt der Spieler 2 immer u, was dem Typ 1 des Senders einen Payoff von 2 und dem Typ 2 des Senders eine Auszahlung von 5 einbringt.

Hingegen ist es kein Pooling-Gleichgewicht, generell R zu spielen. Spieler 2 spielt mit q = ⅔ wiederum „unten“ (u), so dass der Typ 2 (mit ⅓ Wahrscheinlichkeit der bessere Bewerber) lediglich die Auszahlung 1 erhält, was aber schlechter ist als bei Entscheidung L. Also ist R kein Pooling-Gleichgewicht.

Überlegung 2: Untersuchung von Trennungs-Gleichgewichten.

Damit ergäbe sich als eine denkbare Strategie Trennungs-Gleichgewicht (L, R), d.h. wenn Spieler 1 vom Typ 1 ist, spielt er L und falls Spieler 1 vom Typ 2 ist, er spielt R. Damit sind die Typen getrennt. Jetzt kann Spieler 2 die Wahrscheinlichkeiten zu p = 1 und q = 0 bestimmen und wählt (u, u) als Strategie mit dem Payoff 1 für den Spieler 1, der vom Typ 2 ist. Diesen Payoff hätte letzterer aber mit dem Signal L verbessern können. Also: kein Gleichgewicht!

Prüfen Trennungs-Gleichgewicht (R, L): D.h. der Spieler vom Typ 1 spielt immer R, der vom Typ 2 immer L. Spieler 2 berechnet jetzt seine bestmöglichen Payoffs mit p = 0 und mit q = 1, so dass er (o, u) antwortet. Daraufhin ergibt sich als Weg für Typ 1: R – u mit Payoff von 0 für Spieler 1 vom Typ 1 und als Weg für Typ 2: L – o mit Payoff von 2 für Spieler 1 vom Typ 2. Da Spieler 2 auf L mit „o“ antwortet, ist der Payoff für Spieler 1 vom Typ 1 nicht zu verbessern. Würde Spieler 1 vom Typ 2 statt L jetzt lieber R signalisieren, so weiß er, dass darauf Spieler 2 mit u reagiert, was lediglich einen Payoff von 1 bedeutet, also keine Verbesserung. → Dieses Trennungs-Gleichgewicht ist das einzige Nash-Gleichgewicht.

6.3.3. Cheap talk (leeres Gerede)

In bestimmten Situationen kann der Sender (Spieler 1 mit privater Information) einen Zug machen, in welchem er dem Gegenspieler etwas mitteilen will. Dieser Zug hat aber keine Auswirkung auf seine bzw. des Gegenspielers Auszahlung. Der Zug hat also insbesondere keine direkte Konsequenz für den Spieler 1; man nennt ihn deshalb leeres oder unnützes Gerede (cheap talk).

Beispiel Stellenbesetzung (SIEG): Ein Unternehmen kann zwei Stellen besetzen:

- Im Archiv ist es ruhig; dafür ist die Stelle schlechter bezahlt.

- In der Reklamation ist es oft hektisch; dafür ist die Stelle besser bezahlt.

Der Bewerber kann entweder sagen „belastbar“ (also gut bezahlte Stelle mit Stress in R), „stressanfällig“ (also besser geeignet für das Archiv A oder einfach „bla-bla“.

I :Bewerber sagt: „Ich bin belastbar.“ II: Bewerber sagt: „bin stressanfällig.“

Stellen- Angebot Stellen- Angebot

Reklamation Archiv Reklamation Archiv

belastbar 1 ; 2 0 ; 0 belastbar 1 ; 2 0 ; 0

anfällig 0 ; 0 1 ; 2 anfällig 0 ; 0 1 ; 2

Page 63: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 63 Ströbele

In beiden Fällen stellt das Unternehmen den Bewerber gemäß seiner (wahrheitsgemäßen) Aussage ein: Der Bewerber I hat dann zwar mehr Stress, wird aber auf den richtigen Arbeits-platz gesetzt; ebenso Bewerber II.

Wenn jeder „blabla“ sagt, entscheidet das Unternehmen per Zufall und setzt mit jeweils 50 % Wahrscheinlichkeit den Bewerber auf den richtigen und 50 % Wahrscheinlichkeit auf den falschen Posten. Da hierdurch aber der erwartete Payoff auch der Bewerber sinkt, haben sie keinen Anreiz, die blabla-Strategie anzuwenden. In dieser Situation hätten beide Anreiz, die Wahrheit zu sagen. Der Empfänger wird also dem leeren Gerede nicht glauben.

Eine Modifikation zeigt aber die Möglichkeit, dass der Empfänger vom Sender nicht die zutreffende Information erhält:

Stellen- Angebot

Reklamation Archiv

Belastbar 1 ; 2 0 ; 0

Anfällig 1 ; 0 ½ ; 2

Hier hat der anfällige Bewerber einen Anreiz, seine eigentliche Unfähigkeit für die Abteilung R zu verschleiern und wird immer als „belastbar“ auftreten (um die bessere Bezahlung zu bekommen; den Schaden hat ja nur das Unternehmen), dann nützen nur aufwändigere Signale und schwierigere Überprüfung der Bewerber (Probezeiten, Tests, Training, …).

6.3.4. Vorwärtsinduktion

Im folgenden Spiel enthält die Art des ersten Zuges von Spieler 1 ein Signal an Spieler 2, der erst im dritten Zug selbst eine Aktion durchführt.

Weiter

Schluss

Oben

Unten

Oben

Unten

Oben

Unten

1

1

23 , 1

0 , 0

0 , 0

1 , 3

2 , 2

Abbildung 6. : Vorwärtsinduktion

Spielt Spieler 1 im ersten Zug „Schluss“ erhalten beide Spieler eine Auszahlung von (2 ; 2). Setzt er jedoch das Spiel fort und zieht (wobei Spieler 2 nicht weiß, ob er „oben“ oder „unten“

Page 64: Spieltheorie SoSe 09 aktuellDez09 - uni-muenster.de · Spieltheorie SoSem 2009 1 Ströbele Spieltheorie SoSem 2009 Ströbele Vorlesung für BA-Studierende im Modul "Mikroökonomik

Spieltheorie SoSem 2009 64 Ströbele

gezogen hat), dann weiß Spieler 2 bereits, dass das Spiel begonnen hat und er im dritten Zug „dran“ ist. Durch den vorgeschalteten ersten Zug weiß er jetzt, dass Spieler 1 darauf setzt, einen Payoff von 3 zu erreichen – sonst hätte er ja gleich „Schluss“ gespielt.

Hinweis: Beachten Sie die formale Ähnlichkeit mit dem „Erbonkelspiel“. Hier ist das Spiel, die 40.000 $ Erbschaft durch den Neffen aufteilen zu lassen und die Nichte muss zustimmen, andernfalls fällt das Erbe an die Kirche, in einem Punkt modifiziert: Die Nichte bekommt die Macht zur Entscheidung nur für alle Vorschläge ≠ (50:50)-Teilung.