teoria dei giochi - d'orio - seconda parte1 gioco ripetuto un gioco ripetuto è un gioco...
TRANSCRIPT
Teoria dei giochi - D'Orio - seconda parte 1
Gioco ripetuto
Un gioco ripetuto è un gioco dinamico ad informazione completa nel quale si mette in atto un gioco a mosse simultanee almeno due volte, e ciò che succede negli stadi già giocati è osservabile nello stadio in cui si stà giocando.
Cercheremo di capire come si comportano i nostro attori in un gioco ripetuto.
Teoria dei giochi - D'Orio - seconda parte 2
Giochi ripetuti a due stadi
Il dilemma del prigioniero a due stadi Due giocatori giocano il seguente gioco simultaneo
ripetendolo due volte Il risultato di quanto successo nel primo turno viene
osservato dai giocatori prima di cominciare il secondo turno Il payoff dell’intero gioco è semplicemente la somma dei
payoff dei due turni. Vale a dire, il fattore di sconto è 1.
Player 2
L2 R2
Player 1L1 1 , 1 5 , 0
R1 0 , 5 4 , 4
Teoria dei giochi - D'Orio - seconda parte 3
Albero del dilemma del prigioniero ripetuto 2 volte
1
L1R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
1+11+1
1+51+0
1+01+5
1+41+4
1 1 1 1
5+10+1
5+50+0
5+00+5
5+40+4
0+15+1
0+55+0
0+05+5
0+45+4
4+14+1
4+54+0
4+04+5
4+44+4
Teoria dei giochi - D'Orio - seconda parte 4
Albero del gioco informale1
L1R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
11
50
05
44
1 1 1 1(1, 1) (5, 0) (0, 5) (4, 4)
11
50
05
44
11
50
05
44
11
50
05
44
Teoria dei giochi - D'Orio - seconda parte 5
Albero informale e backward induction
1
L1R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
11
50
05
44
1 1 1 1(2, 2) (6, 1) (1, 6) (5, 5)
11
50
05
44
11
50
05
44
11
50
05
44
Teoria dei giochi - D'Orio - seconda parte 6
Dilemma del prigioniero a due stadi
L’SNE sarà(L1 L1L1L1L1, L2 L2L2L2L2) Il giocatore 1 gioca L1 al primo turno, e gioca L1 al secondo turno qualsiasi sia il risultato dello stadio 1.Il giocatore 2 gioca L2 al primo turno 1, e gioca L2 al secondo turno qualsiasi sia il risultato dello stadio 1.
Player 2
L2 R2
Player 1L1 1 , 1 5 , 0
R1 0 , 5 4 , 4
Teoria dei giochi - D'Orio - seconda parte 7
Giochi ripetuti in tempo finito
Un gioco ripetuto in tempo finito è un gioco dinamico ad informazione completa nel quale un gioco (a mosse simultanee) è giocato un numero finito di volte, e i risultati dei turni già giocati sono osservati prima di passare al turno successivo.
Il gioco ripetuto in tempo finito ha un unico SNE se il singolo turno ha un unico NE (cioè il gioco a mosse simultanee). Quell’equilibrio di Nash è giocato ad ogni turno (o stadio) del gioco.
Teoria dei giochi - D'Orio - seconda parte 8
Che succede se il singolo turno di gioco ha più di un equilibrio di Nash ?
Due giocatori ripetono 2 volte il gioco illustrato in diapositiva Il risultato del primo turno è osservato prima di cominciare il
secondo turno I payoff del gioco sono pari alla somma dei payoff dei due turni di
gioco cioè il fattore di sconto è unitario. Domanda: possiamo trovare un SNE nel quale vengano giocati
M1, M2? Oppure, idue giocatori possono cooperare in un SNE?
Player 2
L2 M2 R2
Player 1
L1 1 , 1 5 , 0 0 , 0
M1 0 , 5 4 , 4 0 , 0
R1 0 , 0 0 , 0 3 , 3
Teoria dei giochi - D'Orio - seconda parte 9
Albero del gioco informale1
L1R1
2 2
L2 R2M2L2 R2M2
L2 R2M2
2
L1 R1
2 2
L2 R2M2L2 R2M2
L2 R2M2
2M1
(1, 1) (5, 0) (0, 5) (4, 4)(0, 0)
M1
(0, 0) (0, 0) (0, 0) (3, 3)1
(1, 1) (5, 0) (0, 5)(0, 0) (0, 0) (0, 0) (0, 0) (3, 3)(4, 4)
Teoria dei giochi - D'Orio - seconda parte 10
Albero del gioco informale e backward induction
1
L1R1
2 2
L2 R2M2L2 R2M2
L2 R2M2
2
L1 R1
2 2
L2 R2M2L2 R2M2
L2 R2M2
2M1
(1, 1) (5, 0) (0, 5) (4, 4)(0, 0)
M1
(0, 0) (0, 0) (0, 0) (3, 3)
1
(1, 1) (5, 0) (0, 5)(0, 0) (0, 0) (0, 0) (0, 0) (3, 3)(4, 4)
(1, 1) (1, 1) (1, 1) (3, 3)(1, 1) (1, 1) (1, 1) (1, 1) (1, 1)+
Teoria dei giochi - D'Orio - seconda parte 11
Gioco ripetuto a due stadi:
Player 2
L2 M2 R2
Player 1
L1 1 , 1 5 , 0 0 , 0
M1 0 , 5 4 , 4 0 , 0
R1 0 , 0 0 , 0 3 , 3
SNE: Il giocatore 1 gioca M1 allo stadio 1, e allo stadio 2,
gioca R1 se il risultato del primo turno è ( L1, L2 ), oppure L1 se il risultato del primo turno non è ( L1, L2 )
Il giocatore 2 gioca M2 allo stadio 1, e allo stadio 2, gioca R2 se il risultato del primo turno è ( L1, L2 ), oppure gioca L2 se il risultato del primo turno non è ( L1, L2 )
Teoria dei giochi - D'Orio - seconda parte 12
Gioco ripetuto a due stadi
Player 2
L2 M2 R2
Player 1
L1 2 , 2 6 , 1 1 , 1
M1 1 , 6 7 , 7 1 , 1
R1 1 , 1 1 , 1 4 , 4
SNE: Allo stadio 1, il giocatore 1 gioca M1, e il giocatore 2 gioca M2. Allo stadio 2,
Il giocatore 1 gioca R1 se il risultato del primo stadio è ( M1, M2 ), oppure gioca L1 se il risultato del primo stadio non è ( M1, M2 )
Il giocatore 2 gioca R2 se il risultato del primo stadio è ( M1, M2 ), oppure gioca L2 se il risultato del primo stadio non è ( M1, M2 )
I payoff del secondo stadio sono aggiunti a quello del primo.
Teoria dei giochi - D'Orio - seconda parte 13
Giochi ripetuti all’infinito
Un gioco ripetuto all’infinito è un gioco dinamico ad informazione completa nel quale un gioco (a mosse simultanee) chiamato il gioco di turno viene giocato all’infinito, e i risultati di tutti gli stadi precedente vengono osservati prima di giocare lo stadio di riferimento.
Precisamente, il gioco a mosse simultanee viene giocato negli stadi 1, 2, 3, ..., t-1, t, t+1, ..... I risultati di tutti gli t-1 stages precedenti vengono osservati prima di giocare lo stadio tesimo.
Ogni giocatore attualizza il proprio payoff di un fattore , dove 0< < 1.
Il payoff di un giocatore in un gioco ripetuto è il valore attuale della somma dei payoff di tutti gli stadi del gioco.
Teoria dei giochi - D'Orio - seconda parte 14
Valore attuale
Definizione: Dato un fattore di sconto , il valore attuale di una sequenza di payoff infinita ....... , , , , 4321 è
1
14
33
221 .......
tt
t
Esempio 1: Il valore attuale di una sequenza infinita di payoff 1,
1, 1, ....... ( 1t , per ogni t) è 1
1.
Esempio 2: Il valore attuale di una sequenza infinita di payoff 4, 1, 4, 1, 4, 1 .......(4 in ogni stadio dispari, 1 in ogni stadio pari) è
22 11
4
.
Teoria dei giochi - D'Orio - seconda parte 15
Giochi ripetuti all’infinito: esempio
Il gioco seguente viene ripetuto all’infinito I risultati precedenti allo stadio da giocare sono
osservabili Il payoff di ogni giocatore è il valore attuale del
payoff del singolo stadio in una serie infinita. Domanda: quale è il SNE?
Player 2
L2 R2
Player 1L1 1 , 1 5 , 0
R1 0 , 5 4 , 4
Teoria dei giochi - D'Orio - seconda parte 16
Esempio: sottogioco
Ogni sottogioco di un gioco ripetuto all’infinito è identico al gioco preso per intero.
1
L1R1
2
L2 R2
2
L2 R2
(1, 1) (5, 0) (0, 5) (4, 4)
Teoria dei giochi - D'Orio - seconda parte 17
Esempio: strategia
Una strategia per un giocatore deve essere un piano completo. Può dipendere dalla storia del gioco (cioè da cosa è stato giocato nei vari stadi).
Una strategia per il giocatore i: gioca Li ad ogni stadio (o ad ognuno dei suoi insiemi informativi)
Un’altra strategia chiamata “trigger strategy” (o strategia di ritorsione o di minaccia) per il giocatore i: gioca Ri allo stadio 1, e al tesimo stadio, se il risultato di ognuno degli t-1 stadi precedenti è stato (R1, R2); altrimenti, gioca Li.
Teoria dei giochi - D'Orio - seconda parte 18
Esempio: SNE perfetto
Controllate se esiste un SNE perfetto nel quale il giocatore i gioca Li ad ogni stadio (o ad ognuno dei suoi insiemi informativi).
Questo può essere fatto seguendo i due passaggi di seguito elencati:.
Passo 1: controllare se la combinazione delle strategie è un NE del gioco ripetuto all’infinito. Se player 1 gioca L1 ad ogni stadio, la risposta ottima
per player 2 è giocare L2 ad ogni stadio.
Se player 2 gioca L2 ad ogni stadio, la risposta ottima per player 1 è di giocare L1 ad ogni stadio.
Quindi, è un NE del gioco ripetuto all’infinito.
Teoria dei giochi - D'Orio - seconda parte 19
Esempio: SNE perfetto
Passo 2: controllate che l’NE del gioco ripetuto all’infinito induca un NE in ogni sottogioco del gioco ripetuto all’infinito. Ricordate che ogni sottogioco del gioco
ripetuto all’infinito è identico al gioco ripetuto all’infinito
Ovviamente, indurrà quindi un NE in ogni sottogioco
Quindi, potremo parlare di SNE perfetto.
Teoria dei giochi - D'Orio - seconda parte 20
Esempio: sottogioco1
L1R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
11
50
05
44
1 1 1 1(1, 1) (5, 0) (0, 5) (4, 4)
11
50
05
44
11
50
05
44
11
50
05
44
All’infinito
Teoria dei giochi - D'Orio - seconda parte 21
StrategieTrigger (di ritorsione o minaccia) La strategia trigger per il giocatore i: gioca Ri allo
stadio 1, e allo stadio tesimo, se il risultato di tutti i t-1 stadi precedenti è (R1, R2) allora gioca Ri; altrimenti gioca Li.
Controllate se c’è un SNE perfetto nel quale ogni giocatore gioca la sua strategia di ritorsione.
Ciò può essere fatto in due passi: Passo 1: controllate se le trigger strategy sono un NE
nel gioco ripetuto all’infinito Passo 2: se si, controllate che l’NE induca un NE in
ogni sottogioco
Teoria dei giochi - D'Orio - seconda parte 22
Trigger strategy: passo 1
Stadio 1: (R1, R2)
Stadio 2: (R1, R2)
Stadio t-1: (R1, R2)
Stadio t: (R1, L2)
Stadio t+1: (L1, L2)
Stadio t+2: (L1, L2)
Supponete che il giocatore 1 giochi la sua trigger strategy.
Può il giocatore 2 migliorare se deviasse dalla trigger strategy allo stadio t?
Se continuasse a giocare la trigger strategy allo stadio t e oltre, allora avrà una sequenza di payoffs 4, 4, 4, ... (da t ad +∞). Scontando questi payoffs allo stadio t otteniamo
1
4......4444 32
Se si deviasse dalla trigger strategy allo stadio t allora si segnala di non volere più la noncooperazione. Il giocatore 1 giocherà L1 dopo t per sempre. La strategia ottima del giocatore 2 sarà L2. Quindi il giocatore 2 otterrebbe una sequenza 5, 1, 1, 1 ... (da t ad +∞). Scontando questi payoff allo stadio t otteniamo
1
5......1115 32
Teoria dei giochi - D'Orio - seconda parte 23
Trigger strategy: passo 1
Stadio 1: (R1, R2)
Stadio 2: (R1, R2)
Stadio t-1: (R1, R2)
Stadio t: (R1, L2)
Stadio t+1: (L1, L2)
Stadio t+2: (L1, L2)
41
1
51
4
Quindi, se 4
1 , il giocatore 2 non può
migliorare se devia dalla trigger strategy. Ciò implica che se il giocatore 1 gioca la
trigger strategy la risposta ottima del
giocatore 2 è la trigger strategy per 4
1 .
Per simmetria, se il giocatore 2 gioca la trigger strategy allora la risposta ottima del giocatore 1 è la trigger strategy.
Quindi, c’è un NE nel quale entrambe i
giocatori giocano la trigger strategy se 4
1 .
Teoria dei giochi - D'Orio - seconda parte 24
Trigger strategy: passo 2
Passo 2: controllare se il NE induce un NE in ogni sottogioco del gioco ripetuto all’infinito. Vi ricordo che ogni
sottogioco del gioco ripetuto all’infinito è identico al gioco ripetuto all’infinito completo.
Stadio 1: (R1, R2)
Stadio 2: (R1, R2)
Stadio t-1: (R1, R2)
Stadio t: (R1, R2)
Stadio t+1: (R1, R2)
Stadio t+2: (R1, R2)
Teoria dei giochi - D'Orio - seconda parte 25
Passo 2: sottogioco1
L1R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
L1 R1
2
L2 R2
2
L2 R2
11
50
05
44
1 1 1 1(1, 1) (5, 0) (0, 5) (4, 4)
11
50
05
44
11
50
05
44
11
50
05
44
All’infinito
Teoria dei giochi - D'Orio - seconda parte 26
Trigger strategy: continuazione passo 2
Noi abbiamo due classi di sottogiochi: Sottogiochi che seguono una storia nella quale il
risultato degli stadi precedenti sono tutti (R1, R2) Sottogiochi che seguono una storia nella quale il
risultato degli stadi precedenti NON sono tutti(R1, R2)
L’equilibrio di Nash del gioco ripetuto all’infinito induce un NE nel quale ogni giocatore continua a giocare la sua trigger strategy per la prima classe di sottogiochi
L’equilibrio di Nash del gioco ripetuto all’infinito induce un NE nel quale si gioca (L1, L2) per sempre per la seconda classe di sottogiochi.
Teoria dei giochi - D'Orio - seconda parte 27
Riassunto
Giochi ripetuti nel tempo finito Giochi ripetuti all’infinito
Prossimo argomento Giochi ripetuti all’infinito Giochi statici ad informazione incompleta