teoria dei giochi teoria che analizza in modo formale linterazione strategica di soggetti razionali...
TRANSCRIPT
Teoria dei giochiTeoria che analizza in modo formale l’interazione strategica di soggetti razionali che agiscono in modo strategico
Situazione strategica
Dieci persone si recano insieme al ristorante
a) Si paga alla romana semplice problema di scelta (Max U s.t. VdB)
Ciascuno è in grado di controllare autonomamente il risultato delle sue scelte
b) Si paga dividendo il conto per 10 problema strategico
Non riesco a controllare la mia spesa
Il risultato delle mie azioni dipende anche dalle scelte degli altri
Gioco
insieme astratto di regole
che vincolano il comportamento dei giocatori
definiscono i risultati sulla base delle azioni che essi intraprendono
Il gioco è le regole
In un gioco vi sono tre elementi caratteristici
1)I giocatori (A,B,C…)
2)Le strategie a loro disposizione Per ogni giocatore le regole stabiliscono un insieme di strategie (SA,SB,SC….)Le mosse che le regole rendono possibili (si Si)
3) I Payoffs associati agli esiti finali del giocoi (sA,sB,sC….)
Rappresentazione di un gioco
• Forma normale: matrice delle vincite
• Forma estesa: albero del gioco
Forma Normale• Uso di matrice a doppia entrata
• Le righe rappresentano le mosse che può compiere il giocatore di riga
• Le colonne rappresentano le mosse che può compiere il giocatore di colonna
• In ogni cella sono rappresentate le vincite che i due giocatori (di riga e di colonna) ottengono attuando le mosse raffigurate nelle corrispondenti righe e colonne
Esempio
Giocatori
B
A
Sinistra Destra
Alto 1 , 2 0 , 1
Basso 2 , 1 1, 0
Strategie B
Strategie A
Uno dei 4 esiti del gioco
Payoff A Payoff B
Forma estesa
• Albero del gioco: descrive le regole e i possibili premi di un gioco
• Nodo: punto decisionale dov’è indicata l’identità del giocatore cui spetta la mossa
• Rami: rappresentano le scelte fatte nei nodi
A
BB
Dx
NonSxDx Dx
Sx
Sx
2 , 3 1 , 2 2 , 0 0 , 1
Forma estesaRami Nodi
Uno dei 4 esiti del gioco
Payoff A Payoff B
Ipotesi sul comportamento dei giocatori
Razionalità
- Sono interessati a massimizzare il payoff materiale individuale
- Sono “calcolatori” perfetti
- Tutti conoscono la razionalità degli altri e si aspettano che gli altri si comportino in modo razionale
Classificazione dei giochi
Cooperativi i giocatori possono assumere
degli impegni che hanno valore VINCOLANTE
NON Cooperativi i giocatori NON possono
assumere degli impegni che hanno valore VINCOLANTE
Informazione completa
Informazione incompleta
Tutte le informazioni del gioco sono note a tutti i
giocatori
NON tutte le informazioni del gioco sono note a tutti i
giocatori
Classificazione dei giochiGiochi a somma
zero il guadagno di un giocatore
CORRISPONDE sempre alla perdita di un altro giocatore
Giochi NON a somma
zero La somma delle vincite (o delle perdite) dei giocatori NON È
COSTANTE
Giochi statici
Giochi one-shot
I giocatori fanno le loro mosse SIMULTANEAMENTE
Vengono giocati UNA SOLA volta
Giochi dinamiciI giocatori fanno le loro mosse SEQUENZIALMENTE
Vengono giocati PIÙ VOLTE fra gli stessi giocatori
Giochi ripetuti
Soluzione dei giochi
Equilibrio per un gioco: situazione in cui nessun giocatore desidera modificare il suo comportamento unilateralmente dato il comportamento degli altri giocatori
Equilibrio di Nash
L’equilibrio di Nash si definisce strategicamente stabile o autovincolante perché nessun giocatore, singolarmente preso, desidera deviare dalla propria strategia di equilibrio ferme restando le strategie adottate dagli altri giocatori
Un insieme di strategie, una per ogni giocatore, tale che la strategia di ogni giocatore sia la migliore per lui, quando anche gli altri giocatori giochino la loro strategia di equilibrio
Equilibrio di Nash
Diremo che un vettore n dimensionale (n è il numero dei giocatori)
)s.....,s,s(s *n
*2
*1
* È un equilibrio di Nash se e solo
se )s,..,s,...s,s()s,..,s,...s,s( *ni
*2
*1i
*n
*i
*2
*1i
E questo sia vero per ogni i (per ogni giocatore) e per ogni
ii*ii Ss e ss
Payoff che ottiene il giocatore i-esimo quando sceglie di
deviare dalla strategia di Nash giocando una strategia diversa
e tutti gli altri continuino a giocare la strategia di Nash
Payoff che ottiene il giocatore i-esimo quando egli gioca la strategia di Nash e quando
tutti gli altri giocano la strategia di Nash
B
b1 b2 b3
a1 0,3 2,2 1,3
A a2 2,1 3,2 2,3
a3 5,1 1,4 1,0
Equilibrio di NashLa strategia (a2,b3) è un equilibrio di Nash perché né A né B hanno l’incentivo a cambiare strategia data la scelta dell’altro giocatore
Se A cambiasse otterrebbe 1 giocando a1 e 1 giocando a3
Se B cambiasse otterrebbe 1 giocando b1 e 2 giocando b2
B
b1 b2 b3
a1 0,3 2,2 1,3
A a2 2,1 3,2 2,3
a3 5,1 1,4 1,0
Equilibrio di NashLa strategia (a2,b3) è un equilibrio di Nash perché né A né B hanno l’incentivo a cambiare strategia data la scelta dell’altro giocatore
L’equilibrio non produce né per A né per B necessariamente il payoff più alto
A preferirebbe il 5 di (a3,b1)
ma allora A si sposterebbe in a2
infine B si sposterebbe in b3
da qui NON ci si muove più
ma (a3,b1) non è un equilibrio perché B cambierebbe la sua scelta in b2
Equilibrio di Nash
)s,..,s,...s,s()s,..,s,...s,s( *ni
*2
*1i
*n
*i
*2
*1i
Il giocatore i-esimo, cosi come tutti gli altri, non può ottenere un payoff superiore giocando una strategia diversa se gli altri continuano a giocare la strategia
di Nash
Nessun giocatore ha l’incentivo a cambiare le sue scelte se gli altri non lo
fanno
Equilibrio di Nash)s,..,s,...s,s()s,..,s,...s,s( *
ni*2
*1i
*n
*i
*2
*1i
*is
ii*ni
*2
*1i
sSs s.t. )s,..,s,...s,s(Max
i
è la soluzione del problema
*is Può essere vista come la ottima risposta del
giocatore i-esimo alle mosse degli altri giocatori
Possiamo definire una risposta ottima per ogni strategia degli altri giocatori costruendo una funzione di risposta
ottimaBRF funzione di risposta ottima
L’equilibrio di Nash sarà caratterizzato dal fatto che per tutti i giocatori è una risposta ottima alle scelte degli altri
Come si trova l’equilibrio di Nash
strategia che risulta migliore (garantisce più alti payoffs) per un giocatore indipendentemente dalle strategie adottate dagli altri giocatori
Strategia DOMINANTE
Strategia DOMINATA
strategia che risulta inferiore (garantisce più bassi payoffs) per un giocatore indipendentemente dalle strategie adottate dagli altri giocatori
Se esiste una strategia dominante un giocatore razionale giocherà QUELLA
Se esiste una strategia dominata un giocatore razionale non la giocherà MAI
B
B1 b2 B3
a1 0,3 2,2 1,3
A a2 2,1 3,2 2,3
a3 5,1 1,4 1,0
Esempio: prendiamo i due giochi che seguono
B
B1 b2 B3
a1 1,3 2,4 1,3
A a2 2,1 3,2 1,1
a3 5,1 4,4 2,0
Strategia Dominata
Strategia Dominante
B
B1 b2 B3
a1 0,3 2,2 1,3
A a2 2,1 3,2 2,3
a3 5,1 1,4 1,0
Eq. di Nash.
Come si trova l’equilibrio di Nash
Eliminazione iterata delle strategie dominate
Vengono eliminate via le strategie dominate finche non si ottiene l’equilibrio
di Nash
ESEMPIO
Equilibrio di Nash verifica
1)b,a(2)b,a( 31A32A
1)b,a(2)b,a( 33A32A
1)b,a(3)b,a( 12B32B
2)b,a(3)b,a( 22B32B
Strategia di Nash Possibile mossa alternativa
B
B1 b2 B3
a1 0,3 4,2 1,3
A a2 2,1 3,2 2,3
a3 5,1 1,4 1,0
Problema non sempre è possibile trovare la soluzione di Nash utilizzando tale procedura
Consideriamo lo stesso gioco di prima con la sola
differenza rappresentata dal payoff del giocatore A nella
in (a1,b2)
Ora non ci sono né strategie dominate né strategie dominantiPer trovare la soluzione occorre utilizzare la funzione
di risposta ottima (BRF)
risposta ottima La migliore strategia che un giocatore può effettuare DATA la strategia scelta dagli ALTRI
GIOCATORI Funzione di
risposta ottima L’insieme delle risposte ottime di un giocatore
B
b1 b2 b3
a1 0,3 4,2 1,3
A a2 2,1 3,2 2,3
a3 5,1 1,4 1,0
Trovare l’ E.d.N. utilizzando la BRF
Se il giocatore B sceglie b1 la migliore risposta di A è a3Se il giocatore B sceglie b2 la migliore risposta di A è
a1Se il giocatore B sceglie b3 la migliore risposta di A è a2
Se il giocatore A sceglie a3 la migliore risposta di B è b2
Se il giocatore A sceglie a1 la migliore risposta di B è b1 o b3Se il giocatore A sceglie a2 la migliore risposta di B è b3
E.d.N deve essere la coppia di
strategie che è la risposta ottima di
entrambi i giocatori
Limiti della definizione di equilibrio di Nash
Gioco del calcio di rigore
e cerchiamo l’equilibrio con il metodo della risposta ottima
E’ evidente che non esiste un equilibrio di Nash per questo gioco
P
dx cx sx
dx 0,2 2,0 2,0
A cx 2,0 0,2 2,0
sx 2,0 2,0 0,2
Strategie miste: strategie che definiscono combinazioni probabilistiche di tutte le possibile strategie pure del giocoIl giocatore non sceglie direttamente una mossa (ad esempio, sx) ma la probabilità con la quale adotterà ciascuna mossa
Valore atteso strategia mista: media ponderata dei premi che il giocatore si aspetta di ricevere, ove i pesi sono le probabilità. del verificarsi di tali vincite
L’equilibrio di Nash può non esistere in strategie pure
Tuttavia se allarghiamo la definizione di strategie per considerare le strategie miste
Si può dimostrare che se consideriamo le strategie miste esiste sempre un equilibrio di Nash
Limiti della definizione di equilibrio di Nash
Lei
Opera Stadio
LuiOpera 1 , 2 0 , 0
Stadio 0 , 0 2 , 1
Consideriamo questo gioco classico
La guerra dei sessi
Esiste una molteplicità
(due) di equilibri di
Nash
Quale selezionare ?
Limiti della definizione di equilibrio di NashMolteplicità equilibri di Nash
S
P F
DP -2, -2 2 , 0
F 0 , 2 0 , 0
Nino
c b
Lucac 3 , 3 0 , 0
b 0 , 0 1 , 1
Prendiamo due altri esempi di gioco
Gioco dell’incrocioDue auto (S e B) arrivano
contemporaneamente all’incrocio
Possono Fermarsi o Passare
Gioco dell “appuntamento”
Due amici (Nino e Luca) devono andare al cinema ma si non si
sono accordati su dove incontrarsi
Davanti al cinema o al bar del Paese
Qual è la differenza fra questi due giochi?
Abbiamo visto che l’individuo ordina i panieri alternativi secondo le sue preferenze e scegli il paniere che massimizza
il suo benessere dati i vincoli cui è soggetto
Come possiamo confrontare allocazioni che coinvolgano più di un soggetto
Problema L’utilità non è misurabileNon possiamo semplicemente sommare la soddisfazione individuale
Criterio Paretiano (da W. Pareto)
Esiste un punto di vista sociale per valutare le allocazioni? Ci sono o no criteri che ci
consentano di direse l’allocazione A è superiore all’allocazione B,
oppure se è vero il contrario?Allocazione = distribuzione di beni, benessere o quant’altro fra più soggetti
Criterio Paretiano
Il “criterio di Pareto ” afferma quanto segue:
Criterio Paretiano
Un’allocazione A è superiore a un’altra allocazione B,
se almeno un soggetto preferisce A a B e nessuno preferisce B ad A (e viceversa).
Un’allocazione A è superiore a un’altra allocazione B, se in A tutti stanno altrettanto
bene che in B e almeno uno sta meglio in A che in B
oppure
Non tutte le allocazioni sono Pareto Ordinabili
A = (10, 3, 7)
B = (10, 2, 7)
C = (9, 5, 16)
Un'allocazione è efficiente (ottima) nel senso di Pareto
se non ne esiste un'altra che sia migliore sulla base del principio di Pareto;
cioè, se non è possibile migliorare il benessere di qualcuno senza peggiorare quello di qualcun altro
Criterio Paretiano (da W. Pareto)
Molteplicità equilibri di Nash
Nel caso del gioco dell’incrocio (e nella guerra dei
sessi) gli equilibri di Nash non sono Pareto Ordinabili
Nel caso del gioco dell’appuntamento gli equilibri di Nash sono Pareto Ordinabili
2,0 e 0,2
1, 1 e 3, 3
Nel caso giochi ripetuti ed equilibri Pareto ordinabili allora vi sarà un endogeno coordinamento verso la soluzione Pareto Superiore
Gioco in cui un numero fisso di giocatori effettua ripetutamente lo stesso gioco l’uno contro l’altro
I giocatori scelgono le loro mosse sulla base delle azioni compiute dalle rivali nei periodi precedenti
Le strategie ed i comportamenti sono più complessi ma anche più realistici che nei giochi uniperiodali
Folk Theorem
Gioco
Ripetuto
In caso la questo ripetizione del gioco può far scomparire la molteplicità
La differenza è importante quando si considerano giochi ripetuti
Molteplicità equilibri di Nash: giochi sequenziali
Auto A
Auto B Auto B
F P
F FP P
0 , 0 0 , 2 2 , 0 -2 , -2
Consideriamo il gioco dell’incrocio, immaginando che l’auto A si presenti per prima all’incrocio
Il gioco non è più simultaneo ma sequenziale, l’auto A effettuerà la prima mossa e successivamente muoverà
l’auto B
La rappresentazione del gioco a forma estesa è
preferibile
Giochi sequenziali in forma estesa: induzione a ritroso
Auto A
Auto B Auto B
F P
F FP P
0 , 0 0 , 2 2 , 0 -2 , -2
Induzione a ritroso Si parte dai nodi finali del gioco e si analizzano le scelte dei
giocatori fino a risalire all’inizio del gioco
B sceglierà P che gli da 2 al
posto di 0A lo sa e sa
che se sceglierà F prenderà 0
B sceglierà F che gli da 0 al posto di -2
A lo sa e sa che se sceglierà P prenderà 2
A sceglierà P che gli
garantisce 2 mentre se
scegliesse F avrebbe 0
Minacce non credibili
Pierino
1
2 M & P
Zia Cinema
Punire Non punire
1 1
-1 -1
2 0
Gioco del bambino capriccioso
A
BB
S D
S SD
2 , 5
1 , 0 2 , 1 2 , 1 3 , 3
1 , 2
A A
D
D
DSS
3,32, 1
3,32, 5
Induzione all’indietro e perfezione nei sottogiochi
Sottogioco
Molteplicità equilibri di Nash: meccanismi istituzionali
Quando non esistono altri sistemi per eliminare la molteplicità degli equilibri possono intervenire dei
meccanismi istituzionali che regolamentano il comportamento individuale e risolvono l’ambiguità
Esempio classico il semaforo nel gioco dell’incrocio
Risolvere questo tipo di ambiguità è una delle spiegazioni della nascita delle istituzioni
Dilemma del prigioniero
• Due criminali che hanno commesso in complicità un grave delitto e sono detenuti in celle separate (non possono comunicare).
• Ci sono le prove solo per accusarli di un delitto minore la cui pena è 1 anno di reclusione
• Ogni prigioniero può confessare il delitto grave o tacere.
• Se confessa uscirà subito di prigione, mentre il complice avrà una pena di 20 anni di reclusione.
• Se entrambi confessano saranno condannati ad una pena intermedia di 5 anni.
• Se nessuno dei 2 confessa la pena sarà di 1 anno.
O.P
Nash
B
Confessa Tace
B
Confessa 5 , 5 0 , 20
Tace 20 , 0 1 , 1
Dilemma del prigioniero
L’EQUILIBRIO DI NASH È SOTT'OTTIMALE (in senso Paretiano) rispetto ad un altro esito del gioco che
sarebbe preferito da entrambi i giocatori ma che non è ottenibile
Risultato paradossale
Un comportamento
teso a massimizzare il
benessere individuale produce un
risultato non ottimo da un punto di vista
individuale
R
T A
BT 3, 3 0 , 4
A 4, 0 1 , 1
Pampers
NF FP
LinesNF 500,500 150,750
FP 750,150 250,250
Prendiamo due altri esempi di gioco
Gioco del trafficoDue soggetti (sig. Rossi e sig. Bianchi) devono decidere se
prendere l’auto o il tram
Gioco della PubblicitàDue imprese devono decidere
quanto investimento pubblicitario effettuare il prossimo anno
Dilemma del prigioniero framework generale
Sotto-ottimalità dell’equilibrio di Nashpossibili soluzioni
Meccanismi istituzionali
Mafia, malavita organizzata dilemma del prigioniero
Blocco del traffico gioco del traffico
Modificano dall’esterno la struttura degli incentivi
Meccanismi endogeni
accordo fra i giocatori
Non sono credibili perché in assenza di meccanismi istituzionali esterni qualsiasi accordo fra le parti non
sarebbe rispettato
Dilemma del prigioniero e giochi ripetuti
Ma nella realtà il gioco è spesso ripetuto
Possono emergere dei meccanismi endogeni di punizione di comportamenti devianti
Prendiamo il gioco della pubblicità
Immaginiamo un accordo (esplicito o tacito) per non
fare pubblicità
Se una delle due aziende violasse l’accordo di non fare
pubblicità l’altra farebbe pubblicità per sempre
All’inizio di ogni periodo le due imprese devono decidere se violare o meno l’accordo
Meccanismo punitivo
Dilemma del prigioniero e giochi ripetuti
.....)r1(
250
r1
250750)FP(
2
.....)r1(
500
r1
500500)NF(
2
Se si viola l’accordo
Se non si viola
l’accordo
dr1
1
Ponendo e notando che sono serie convergenti
d1
d250750)FP(
d1
500)NF(
Si ottiene
Dilemma del prigioniero e giochi ripetuti
1r se o 5.0d se )FP()NF(
Se i giocatori sono sufficientemente pazienti (attribuiscono un peso adeguato ai guadagni futuri)
Il risultato pareto ottimale può essere raggiunto
Reputazione -- Credibilità
Nota Il gioco deve durare
all’infinito o avere una durata finita ma incerta
Dilemma del prigioniero e giochi ripetuti
Altro esempio
Prendiamo il gioco seguente
Se il gioco è statico, allora gli equilibri saranno (M, C) e (B,R)
entrambi sotto ottimali rispetto a (T,L)
A
B
L C R
T 5,5 3,6 0,0
M 6,3 4,4 0,0
B 0,0 0,0 1,1
Dilemma del prigioniero e giochi ripetuti
Ma se il gioco viene ripetuto 2 volte allora le cose cambianoMentre in ciascun periodo un giocatore ha sempre 3 opzioni
possibili, se consideriamo entrambi i periodi il numero di strategie cresce a 3x3x9=81
(tre azioni possibili nel primo periodo, tre nel secondo e nove possibili risultati nel primo periodo)
Come si trova equilibrio ?
a) un primo equilibrio è semplicemente quello che replica in ciascun gioco l’equilibrio del gioco statico, ad esempio, (M,C)
Esistono nuovi equilibri ?
giocatore A: giocare T nel periodo 1 e M nel periodo 2 se si è verificato (T,L) altrimenti giocare B
giocatore B: giocare L nel periodo 1 e nel periodo 2 giocare C se nel se si è verificato (T,L) altrimenti giocare R
Dilemma del prigioniero e giochi ripetuti
Periodo 2: visto che sono entrambi equilibri nel gioco costitutivo nessuno dei due giocatori ha l’incentivo a cambiare strategia nel secondo periodo
A
B
L C R
T 5,5 3,6 0,0
M 6,3 4,4 0,0
B 0,0 0,0 1,1
Equilibrio nel gioco ripetuto
Periodo 1: giocatore A: se sceglie T in 1, allora ottiene 5 + 4, se sceglie M ottiene 6 + 1, se gioca B ottiene 0+1 e quindi non ha incentivo a variare la sua
strategia se B non la cambia
Lo stesso vale per B: se gioca L (5+4), C(6+1) R(0+1)