teoria dei giochi - d'orio - seconda parte1 gioco ripetuto un gioco ripetuto è un gioco...

Teoria dei giochi - D'Orio - seconda parte 1

Gioco ripetuto

Un gioco ripetuto è un gioco dinamico ad informazione completa nel quale si mette in atto un gioco a mosse simultanee almeno due volte, e ciò che succede negli stadi già giocati è osservabile nello stadio in cui si stà giocando.

Cercheremo di capire come si comportano i nostro attori in un gioco ripetuto.


Giochi ripetuti a due stadi

Il dilemma del prigioniero a due stadi Due giocatori giocano il seguente gioco simultaneo

ripetendolo due volte Il risultato di quanto successo nel primo turno viene

osservato dai giocatori prima di cominciare il secondo turno Il payoff dell’intero gioco è semplicemente la somma dei

payoff dei due turni. Vale a dire, il fattore di sconto è 1.

Player 2

L2 R2

Player 1L1 1 , 1 5 , 0

R1 0 , 5 4 , 4


Albero del dilemma del prigioniero ripetuto 2 volte

1

L1R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

1+11+1

1+51+0

1+01+5

1+41+4

1 1 1 1

5+10+1

5+50+0

5+00+5

5+40+4

0+15+1

0+55+0

0+05+5

0+45+4

4+14+1

4+54+0

4+04+5

4+44+4


Albero del gioco informale1

L1R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

11

50

05

44

1 1 1 1(1, 1) (5, 0) (0, 5) (4, 4)

11

50

05

44

11

50

05

44

11

50

05

44


Albero informale e backward induction

1

L1R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

11

50

05

44

1 1 1 1(2, 2) (6, 1) (1, 6) (5, 5)

11

50

05

44

11

50

05

44

11

50

05

44


Dilemma del prigioniero a due stadi

L’SNE sarà(L1 L1L1L1L1, L2 L2L2L2L2) Il giocatore 1 gioca L1 al primo turno, e gioca L1 al secondo turno qualsiasi sia il risultato dello stadio 1.Il giocatore 2 gioca L2 al primo turno 1, e gioca L2 al secondo turno qualsiasi sia il risultato dello stadio 1.

Player 2

L2 R2

Player 1L1 1 , 1 5 , 0

R1 0 , 5 4 , 4


Giochi ripetuti in tempo finito

Un gioco ripetuto in tempo finito è un gioco dinamico ad informazione completa nel quale un gioco (a mosse simultanee) è giocato un numero finito di volte, e i risultati dei turni già giocati sono osservati prima di passare al turno successivo.

Il gioco ripetuto in tempo finito ha un unico SNE se il singolo turno ha un unico NE (cioè il gioco a mosse simultanee). Quell’equilibrio di Nash è giocato ad ogni turno (o stadio) del gioco.


Che succede se il singolo turno di gioco ha più di un equilibrio di Nash ?

Due giocatori ripetono 2 volte il gioco illustrato in diapositiva Il risultato del primo turno è osservato prima di cominciare il

secondo turno I payoff del gioco sono pari alla somma dei payoff dei due turni di

gioco cioè il fattore di sconto è unitario. Domanda: possiamo trovare un SNE nel quale vengano giocati

M1, M2? Oppure, idue giocatori possono cooperare in un SNE?

Player 2

L2 M2 R2

Player 1

L1 1 , 1 5 , 0 0 , 0

M1 0 , 5 4 , 4 0 , 0

R1 0 , 0 0 , 0 3 , 3


Albero del gioco informale1

L1R1

2 2

L2 R2M2L2 R2M2

L2 R2M2

2

L1 R1

2 2

L2 R2M2L2 R2M2

L2 R2M2

2M1

(1, 1) (5, 0) (0, 5) (4, 4)(0, 0)

M1

(0, 0) (0, 0) (0, 0) (3, 3)1

(1, 1) (5, 0) (0, 5)(0, 0) (0, 0) (0, 0) (0, 0) (3, 3)(4, 4)


Albero del gioco informale e backward induction

1

L1R1

2 2

L2 R2M2L2 R2M2

L2 R2M2

2

L1 R1

2 2

L2 R2M2L2 R2M2

L2 R2M2

2M1

(1, 1) (5, 0) (0, 5) (4, 4)(0, 0)

M1

(0, 0) (0, 0) (0, 0) (3, 3)

1

(1, 1) (5, 0) (0, 5)(0, 0) (0, 0) (0, 0) (0, 0) (3, 3)(4, 4)

(1, 1) (1, 1) (1, 1) (3, 3)(1, 1) (1, 1) (1, 1) (1, 1) (1, 1)+


Gioco ripetuto a due stadi:

Player 2

L2 M2 R2

Player 1

L1 1 , 1 5 , 0 0 , 0

M1 0 , 5 4 , 4 0 , 0

R1 0 , 0 0 , 0 3 , 3

SNE: Il giocatore 1 gioca M1 allo stadio 1, e allo stadio 2,

gioca R1 se il risultato del primo turno è ( L1, L2 ), oppure L1 se il risultato del primo turno non è ( L1, L2 )

Il giocatore 2 gioca M2 allo stadio 1, e allo stadio 2, gioca R2 se il risultato del primo turno è ( L1, L2 ), oppure gioca L2 se il risultato del primo turno non è ( L1, L2 )


Gioco ripetuto a due stadi

Player 2

L2 M2 R2

Player 1

L1 2 , 2 6 , 1 1 , 1

M1 1 , 6 7 , 7 1 , 1

R1 1 , 1 1 , 1 4 , 4

SNE: Allo stadio 1, il giocatore 1 gioca M1, e il giocatore 2 gioca M2. Allo stadio 2,

Il giocatore 1 gioca R1 se il risultato del primo stadio è ( M1, M2 ), oppure gioca L1 se il risultato del primo stadio non è ( M1, M2 )

Il giocatore 2 gioca R2 se il risultato del primo stadio è ( M1, M2 ), oppure gioca L2 se il risultato del primo stadio non è ( M1, M2 )

I payoff del secondo stadio sono aggiunti a quello del primo.


Giochi ripetuti all’infinito

Un gioco ripetuto all’infinito è un gioco dinamico ad informazione completa nel quale un gioco (a mosse simultanee) chiamato il gioco di turno viene giocato all’infinito, e i risultati di tutti gli stadi precedente vengono osservati prima di giocare lo stadio di riferimento.

Precisamente, il gioco a mosse simultanee viene giocato negli stadi 1, 2, 3, ..., t-1, t, t+1, ..... I risultati di tutti gli t-1 stages precedenti vengono osservati prima di giocare lo stadio tesimo.

Ogni giocatore attualizza il proprio payoff di un fattore , dove 0< < 1.

Il payoff di un giocatore in un gioco ripetuto è il valore attuale della somma dei payoff di tutti gli stadi del gioco.


Valore attuale

Definizione: Dato un fattore di sconto , il valore attuale di una sequenza di payoff infinita ....... , , , , 4321 è

1

14

33

221 .......

tt

t

Esempio 1: Il valore attuale di una sequenza infinita di payoff 1,

1, 1, ....... ( 1t , per ogni t) è 1

1.

Esempio 2: Il valore attuale di una sequenza infinita di payoff 4, 1, 4, 1, 4, 1 .......(4 in ogni stadio dispari, 1 in ogni stadio pari) è

22 11

4

.


Giochi ripetuti all’infinito: esempio

Il gioco seguente viene ripetuto all’infinito I risultati precedenti allo stadio da giocare sono

osservabili Il payoff di ogni giocatore è il valore attuale del

payoff del singolo stadio in una serie infinita. Domanda: quale è il SNE?

Player 2

L2 R2

Player 1L1 1 , 1 5 , 0

R1 0 , 5 4 , 4


Esempio: sottogioco

Ogni sottogioco di un gioco ripetuto all’infinito è identico al gioco preso per intero.

1

L1R1

2

L2 R2

2

L2 R2

(1, 1) (5, 0) (0, 5) (4, 4)


Esempio: strategia

Una strategia per un giocatore deve essere un piano completo. Può dipendere dalla storia del gioco (cioè da cosa è stato giocato nei vari stadi).

Una strategia per il giocatore i: gioca Li ad ogni stadio (o ad ognuno dei suoi insiemi informativi)

Un’altra strategia chiamata “trigger strategy” (o strategia di ritorsione o di minaccia) per il giocatore i: gioca Ri allo stadio 1, e al tesimo stadio, se il risultato di ognuno degli t-1 stadi precedenti è stato (R1, R2); altrimenti, gioca Li.


Esempio: SNE perfetto

Controllate se esiste un SNE perfetto nel quale il giocatore i gioca Li ad ogni stadio (o ad ognuno dei suoi insiemi informativi).

Questo può essere fatto seguendo i due passaggi di seguito elencati:.

Passo 1: controllare se la combinazione delle strategie è un NE del gioco ripetuto all’infinito. Se player 1 gioca L1 ad ogni stadio, la risposta ottima

per player 2 è giocare L2 ad ogni stadio.

Se player 2 gioca L2 ad ogni stadio, la risposta ottima per player 1 è di giocare L1 ad ogni stadio.

Quindi, è un NE del gioco ripetuto all’infinito.


Esempio: SNE perfetto

Passo 2: controllate che l’NE del gioco ripetuto all’infinito induca un NE in ogni sottogioco del gioco ripetuto all’infinito. Ricordate che ogni sottogioco del gioco

ripetuto all’infinito è identico al gioco ripetuto all’infinito

Ovviamente, indurrà quindi un NE in ogni sottogioco

Quindi, potremo parlare di SNE perfetto.


Esempio: sottogioco1

L1R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

11

50

05

44

1 1 1 1(1, 1) (5, 0) (0, 5) (4, 4)

11

50

05

44

11

50

05

44

11

50

05

44

All’infinito


StrategieTrigger (di ritorsione o minaccia) La strategia trigger per il giocatore i: gioca Ri allo

stadio 1, e allo stadio tesimo, se il risultato di tutti i t-1 stadi precedenti è (R1, R2) allora gioca Ri; altrimenti gioca Li.

Controllate se c’è un SNE perfetto nel quale ogni giocatore gioca la sua strategia di ritorsione.

Ciò può essere fatto in due passi: Passo 1: controllate se le trigger strategy sono un NE

nel gioco ripetuto all’infinito Passo 2: se si, controllate che l’NE induca un NE in

ogni sottogioco


Trigger strategy: passo 1

Stadio 1: (R1, R2)

Stadio 2: (R1, R2)

Stadio t-1: (R1, R2)

Stadio t: (R1, L2)

Stadio t+1: (L1, L2)


Supponete che il giocatore 1 giochi la sua trigger strategy.

Può il giocatore 2 migliorare se deviasse dalla trigger strategy allo stadio t?

Se continuasse a giocare la trigger strategy allo stadio t e oltre, allora avrà una sequenza di payoffs 4, 4, 4, ... (da t ad +∞). Scontando questi payoffs allo stadio t otteniamo

1

4......4444 32

Se si deviasse dalla trigger strategy allo stadio t allora si segnala di non volere più la noncooperazione. Il giocatore 1 giocherà L1 dopo t per sempre. La strategia ottima del giocatore 2 sarà L2. Quindi il giocatore 2 otterrebbe una sequenza 5, 1, 1, 1 ... (da t ad +∞). Scontando questi payoff allo stadio t otteniamo

1

5......1115 32



Stadio 1: (R1, R2)

Stadio 2: (R1, R2)


Stadio t: (R1, L2)



41

1

51

4

Quindi, se 4

1 , il giocatore 2 non può

migliorare se devia dalla trigger strategy. Ciò implica che se il giocatore 1 gioca la

trigger strategy la risposta ottima del

giocatore 2 è la trigger strategy per 4

1 .

Per simmetria, se il giocatore 2 gioca la trigger strategy allora la risposta ottima del giocatore 1 è la trigger strategy.

Quindi, c’è un NE nel quale entrambe i

giocatori giocano la trigger strategy se 4

1 .



Passo 2: controllare se il NE induce un NE in ogni sottogioco del gioco ripetuto all’infinito. Vi ricordo che ogni

sottogioco del gioco ripetuto all’infinito è identico al gioco ripetuto all’infinito completo.

Stadio 1: (R1, R2)

Stadio 2: (R1, R2)


Stadio t: (R1, R2)

Stadio t+1: (R1, R2)

Stadio t+2: (R1, R2)


Passo 2: sottogioco1

L1R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

L1 R1

2

L2 R2

2

L2 R2

11

50

05

44

1 1 1 1(1, 1) (5, 0) (0, 5) (4, 4)

11

50

05

44

11

50

05

44

11

50

05

44

All’infinito


Trigger strategy: continuazione passo 2

Noi abbiamo due classi di sottogiochi: Sottogiochi che seguono una storia nella quale il

risultato degli stadi precedenti sono tutti (R1, R2) Sottogiochi che seguono una storia nella quale il

risultato degli stadi precedenti NON sono tutti(R1, R2)

L’equilibrio di Nash del gioco ripetuto all’infinito induce un NE nel quale ogni giocatore continua a giocare la sua trigger strategy per la prima classe di sottogiochi

L’equilibrio di Nash del gioco ripetuto all’infinito induce un NE nel quale si gioca (L1, L2) per sempre per la seconda classe di sottogiochi.


Riassunto

Giochi ripetuti nel tempo finito Giochi ripetuti all’infinito

Prossimo argomento Giochi ripetuti all’infinito Giochi statici ad informazione incompleta

teoria dei giochi - d'orio - seconda parte1 gioco ripetuto un gioco ripetuto è un gioco...

Documents