5. teorÃa de juegos. conceptos de solución · udflrqdo gh txh fdgd mxjdgru holplqdui vxv...

45
Teoría de Juegos Teoría de Juegos Conceptos de solución Conceptos de solución

Upload: phamkhuong

Post on 13-Dec-2018

230 views

Category:

Documents


0 download

TRANSCRIPT

Teoría de JuegosTeoría de JuegosConceptos de solución Conceptos de solución

Conceptos de soluciónConceptos de solución El hecho de que en cualquier problema de teoría de

juegos existan distintos decisores con intereses generalmente contrapuestos, hace que el concepto de solución deba ser matizado con respecto al que existe en la Programación Matemática tradicional.

Parece claro que muy rara vez existirá una combinación de estrategias que sea lo mejor para todos, en el sentido

Parece claro que muy rara vez existirá una combinación de estrategias que sea lo mejor para todos, en el sentido matemático de que maximice los pagos recibidos por todos los jugadores que intervienen.

La adaptación del concepto de solución a los problemas de teoría de juegos da lugar a los distintos tipos de equilibrio.

2

Conceptos de soluciónConceptos de solución El concepto de equilibrio parece indicar una situación en la

que todos los jugadores se sienten, de alguna forma, cómodos, en el sentido de que, alcanzado este punto, ninguno tiene incentivos para cambiar de estrategia, porque puede que este cambio les condujese a situaciones peores. Así pues, en sentido amplio, el equilibrio no produce necesariamente el mejor resultado posible para cada jugador individual, pero es una resultado posible para cada jugador individual, pero es una situación que conforma a todos ante la amenaza de resultados peores.

Son varios los conceptos de equilibrio que se usan en teoría de juegos. Nosotros nos centraremos en este apartado en dos conceptos: el equilibrio en estrategias dominantes y el más importante y utilizado en la literatura, el equilibrio de Nash (o de Nash-Cournot).

3

Equilibrio en estrategias dominantes. La racionalidad de los jugadores que intervienen en el juego es

una suposición básica dentro del desarrollo de la teoría. Esta racionalidad parece llevar a una conclusión inmediata: ningún jugador escogerá una estrategia que le proporcione peores pagos que otra, para cualquier combinación de estrategias que escojan el resto de los jugadores. Esta idea da lugar al concepto de estrategia dominada, y éste a Esta idea da lugar al concepto de estrategia dominada, y éste a su vez, al de equilibrio en estrategias dominantes.

Además, es una suposición lógica que cada jugador eliminará sus estrategias dominadas previamente a hacer cualquier otra consideración sobre el juego.

Esta suposición dará lugar al método de eliminación iterativa de estrategias dominadas.

4

Vamos ahora por tanto a definir formalmente el concepto de estrategia dominada. Para ello, emplearemos la siguiente notación: para cada s S y cada ui Si, llamamos:

s\ui≡ (s1, ..., si-1, ui, si+1, ..., sn), s\ui≡ (s1, ..., si-1, ui, si+1, ..., sn), es decir, s\ui es la combinación de estrategias que resulta

al sustituir si por ui en S. Esta notación se utilizará para poder considerar casos en los que variamos la estrategia de un jugador determinado, manteniendo el resto de los jugadores constantes las suyas.

5

Definición 2 La estrategia

si’ Si se dice que es una estrategia débilmente dominada para el jugador i si existe alguna si’’ Si tal que Pi (s\ si’’) ≥ Pi(s\ si’) para cualquier s S. Si Pi (s\si’’) > Pi(s\ si’) para todo s S, entonces s ’ es fuertemente dominada. ≥ Pi(s\ si’) para cualquier s S. Si Pi (s\si’’) > Pi(s\ si’) para todo s S, entonces si’ es fuertemente dominada.

6

Así pues, una estrategia débilmente dominada nunca será elegida por un jugador racional, ya que existe otra que produce pagos al menos tan buenos como ésta, sea cual sea la combinación de estrategias del resto de los jugadores. De la misma forma, parece claro que un jugador escogería, si existiese, una estrategia que jugador escogería, si existiese, una estrategia que dominase a todas las demás:

7

Definición 3. La estrategia si’ se dice que es una estrategia débilmente

dominante para el jugador i si para cualesquiera s S y si’’ Si, se verifica que Pi(s\ si’) ≥ Pi (s\ si’’). Si, para cualesquiera s y si’’ se verifica que Pi(s\ si’) > Pi(s\ si’’), entonces se dice que si’ es fuertemente dominante. entonces se dice que si’ es fuertemente dominante.

8

Es importante tener en cuenta que un jugador no necesariamente tiene estrategias dominantes (el que una estrategia no sea dominada no implica que sea dominante).

En el caso especial en que cada jugador tuviera una tal estrategia, la combinación de estrategias formada por estrategia, la combinación de estrategias formada por todas ellas daría lugar a una situación de equilibrio, el equilibrio en estrategias dominantes:

9

Definición 4. En un juego Γ = (N, S, P), s* S es un equilibrio en estrategias dominantes si para cada i N, s es una estrategia dominante.

10

Para ilustrar estos conceptos, vamos a recurrir al conocido dilema de los presos.

Dos sospechosos son arrestados y acusados de un delito. La policía no tiene evidencias suficientes para condenar a

los sospechosos al menos que uno confiese, por lo que encierra a los sospechosos en celdas separadas y les encierra a los sospechosos en celdas separadas y les explica las consecuencias de las decisiones que tomen.

Si ninguno confiesa, ambos serán condenados por un delito menor, y sentenciados a un mes de cárcel. Si ambos confiesan, serán sentenciados a seis meses de cárcel.

11

Finalmente, si uno confiesa y el otro no, el que confiesa será puesto inmediatamente en libertad, y el otro será sentenciado a nueve meses de prisión: seis por el delito y tres más por obstrucción a la justicia.

12

Este problema se puede representar en forma estratégica mediante la siguiente matriz de pagos:

Preso 2Preso 2

Estrategia Callar Confesar

Preso 1Callar -1, -1 -9, 0

Confesar 0, -9 -6, -6

13

Así pues, cada jugador posee dos estrategias puras: callar y confesar. Puede observarse que la estrategia confesar es dominante para cada jugador. En efecto, para el jugador 1, por ejemplo, si 2 escoge callar, éste confesará, ya que será puesto en libertad en vez de pasar un mes en prisión. Por otro lado, si 2 confiesa, 1 también lo hará, y pasará 6 otro lado, si 2 confiesa, 1 también lo hará, y pasará 6 meses en prisión, en lugar de 9. El mismo razonamiento es válido para el jugador 2.

14

Por tanto, la combinación de estrategias (confesar, confesar) es un equilibrio en estrategias dominantes, y, por tanto, no parece haber duda sobre la elección de ambos jugadores. El pago que obtienen con esta combinación es (-6, -6), es decir, cada uno pasará 6 meses en prisión.

El dilema consiste en que ambos jugadores conseguirían El dilema consiste en que ambos jugadores conseguirían mejores pagos si ambos eligiesen callar. En efecto, en este caso, ambos pasarían tan sólo un mes en prisión. Pero este punto no es factible que se alcance, ya que si un preso calla, el otro obtiene un mejor resultado confesando, ya que en este caso sería puesto en libertad. Así, si un preso calla, se arriesga muy probablemente a pasar 9 meses en prisión.

15

Nótese que el origen de este dilema no es la falta de comunicación entre los presos. Incluso si pudiesen hablar y acordar no confesar, cada uno tendría el incentivo de romper el trato a expensas del jugador que lo mantenga. Por tanto, un acuerdo consistente en callar no es creíble.

16

Es importante recalcar que un equilibrio de esta forma sólo se puede anticipar como solución del juego, es decir, como la combinación de estrategias que finalmente elegirán los jugadores, si todos ellos poseen toda la información y saben que los demás también la poseen, luego en una situación de información completa (cada luego en una situación de información completa (cada jugador conoce todos los elementos de la tabla), donde además, cada jugador sabe que el otro tiene toda la información y que va a actuar racionalmente, y cada jugador sabe que el otro sabe que él tiene toda la información, y así sucesivamente

17

Por regla general, es infrecuente que en un juego exista equilibrio en estrategias dominantes. Sin embargo, el hecho racional de que cada jugador eliminará sus estrategias dominadas da lugar al llamado método de eliminación iterativa de estrategias dominadas.

Sea, por ejemplo, el juego abstracto representado en forma Sea, por ejemplo, el juego abstracto representado en forma estratégica por la siguiente matriz de pagos:

Jugador 2

Estrategia Izquierda Centro Derecha

Jugador 1Alta 1, 0 1, 2 0, 1

Baja 0, 3 -6, -6 2, 0

18

El jugador 1 tiene dos estrategias puras: alta y baja, y el jugador 2 tiene tres: izquierda, centro y derecha. Se puede observar que ningún jugador posee estrategias dominantes. Además, para el jugador 1, ninguna de sus estrategias está dominada, pero se puede observar que para el jugador 2, la estrategia derecha está dominada por centro, por lo que nunca elegirá esta opción. Si además el jugador 1 sabe que el 2 es racional y nunca elegirá esta estrategia, ambos se pueden comportar como si ésta no existiera, eliminando, la correspondiente columna, y dando lugar al juego: eliminando, la correspondiente columna, y dando lugar al juego:

Jugador 2

Estrategia Izquierda Centro

Jugador 1Alta 1, 0 1, 2

Baja 0, 3 -6, -6

19

Pero en este juego, ahora la estrategia alta domina a baja para el jugador 1, por lo que, siguiendo el mismo razonamiento que antes, podemos eliminar esta última, pasando entonces a la nueva tabla:

Jugador 2

Finalmente, izquierda está dominada por centro para el jugador 2, quedando por tanto (Alta, Centro) como el resultado del juego.

Jugador 2

Estrategia Izquierda Centro

Jugador 1 Alta 1, 0 1, 2

20

Así pues, se ha alcanzado un equilibrio en el juego original, aplicando iterativamente la idea de que ningún jugador racional escogerá estrategias dominadas. Este método tiene el obvio inconveniente de que no tienen por qué existir estrategias dominadas en los distintos pasos que se siguen, por lo que no es una técnica que se pueda aplicar siguen, por lo que no es una técnica que se pueda aplicar siempre.

21

Equilibrio de NashEquilibrio de Nash Si volvemos al ejemplo, podemos ver que el equilibrio

(Alta, Centro) que se encontró con el proceso de eliminación iterativa de estrategias dominadas tiene una característica que resulta muy importante: supuesto que un jugador mantenga su estrategia, el otro no tiene incentivos para cambiar la suya, ya que si lo hiciera nunca incentivos para cambiar la suya, ya que si lo hiciera nunca aumentaría su pago.

22

Equilibrio de NashEquilibrio de Nash Se puede observar en la matriz de pagos del juego

original que si el jugador 2 se mantiene en la estrategia Centro, entonces el 1 no desea cambiar, ya que con la combinación (Baja, Centro) obtendría un pago de 0, en vez de 1. Por su parte, si 1 mantiene la suya en Alta, entonces 2 tampoco desea cambiar, ya que obtendría 0 entonces 2 tampoco desea cambiar, ya que obtendría 0 con Izquierda y 1 con Derecha, en vez de 2, que obtiene actualmente.

Esta característica es la que define a lo que llamamos equilibrio de Nash

23

Definición 5

Un equilibrio de Nash es una combinación de estrategias s* S tal que, para cualesquiera si Si e i N, se verifica: Pi(s*) ≥ Pi(s*\si)se verifica: Pi(s*) ≥ Pi(s*\si)

24

Aunque este concepto generaliza al de equilibrio en estrategias dominantes (lo que es obvio por la definición de ambos), y además se verifica que todo equilibrio conseguido mediante el método de eliminación iterativa de estrategias dominadas también es un equilibrio de Nash, aún así no todo juego tiene necesariamente un equilibrio de Nash en juego tiene necesariamente un equilibrio de Nash en estrategias puras o mixtas. Sea, por ejemplo, el siguiente juego:

Jugador 2

Estrategia Izquierda Centro Derecha

Jugador 1Alta 1, 0 1, 2 0, 3

Baja 0, 3 0, 1 2, 0

25

Puede observarse que en cualquier situación algún jugador tiene incentivos para cambiar de estrategia si el otro mantiene la suya, y, por tanto, este juego no tiene equilibrios de Nash en estrategias puras.

En caso de que el juego tenga equilibrio, si éste es único, es intuitivamente plausible que los jugadores racionales actuarían de acuerdo con él. Pero puede suceder que un juego tenga varios equilibrios. Por ejemplo, considérese la siguiente tabla:considérese la siguiente tabla:

Jugador 2

Estrategia Izquierda Centro Derecha

Jugador 1Alta 0, 10 8, 8 -6, 7

Baja -2, 3 15, 4 3, 5

26

Este juego tiene dos equilibrios de Nash: (Alta, Izquierda) y (Baja, Derecha). Los vectores de pagos respectivos son (0, 10) y (3, 5), por lo que ninguno de estos equilibrios está dominado por el otro. En un caso como éste, las condiciones de equilibrio se pueden considerar como condiciones necesarias para una solución del juego.

Los equilibrios de Nash tienen otra característica importante, que los relaciona con otros conceptos de equilibrio que se que los relaciona con otros conceptos de equilibrio que se usan en la literatura, como son los de estrategia maximin o punto de silla, que son análogos a los desarrollados en la sección dedicada al estudio de la dualidad en Programación Matemática. En concreto, cualquier equilibrio de Nash proporciona a cada jugador un pago que es al menos tan bueno como el mayor valor que cada jugador le puede garantizar.

27

Lema 1Cualquier equilibrio de Nash S*, satisface para todos los jugadores i N que:

)

28

29

Según hemos visto anteriormente, cualquier juego no tiene necesariamente equilibrios de Nash, y mucho menos en estrategias puras.

El siguiente teorema demuestra que un equilibrio tal siempre existe en el caso en que el juego sea de información perfecta (es decir, donde cada conjunto de información consta de un único nodo). único nodo).

Previamente, vamos a establecer algunas notaciones: Para cada d D, denotamos por F1(d, k) el nodo que se alcanza cuando se realiza el k-ésimo movimiento a partir del nodo d. De esta forma, e1[F1(d, k)] = d y, para cualquier d Iij, e1

-1(d) = {F1(d, 1), ..., F1(d, mij)} = F1(d) es el conjunto de nodos sucesores de d. Estamos ya en condiciones de enunciar el teorema:

30

Teorema 1. Cualquier juego finito con información perfecta tiene al menos un punto de equilibrio en estrategias puras.

31

Demostración. Con las notaciones previamente establecidas, sea E1 = {d D /

F1(d) T}, y sea también T1 = T E1. E1 es, por tanto, el conjunto de nodos de decisión a partir de los cuales el siguiente movimiento conducirá necesariamente a un nodo terminal. En cada nodo de E , se selecciona el movimiento que maximiza En cada nodo de E1, se selecciona el movimiento que maximiza el pago del jugador al que corresponde el nodo.

Si este movimiento no es único, se escoge entonces aquel que tiene un índice más bajo. Así pues, cada nodo d E1, tiene asociado un único nodo terminal td y, a través de él, un único vector de pagos p(td). La función de pagos p se puede extender entonces desde T hasta T1, asignando p(d) ≡ p(td) para cada d E1.

32

Se puede repetir entonces este proceso recursivamente: llamamos T0 ≡T, y suponemos ya definidos Tk-1 y Ek-1, así como que la función p ya se ha extendido al conjunto Tk-1 = Tk-2 Ek-1. Sean entonces

Ek = {d D / F1(d) Tk-1}, y Tk = Tk-1 Ek. En cada nodo de Ek, cualquier movimiento y Tk = Tk-1 Ek. En cada nodo de Ek, cualquier movimiento conduce a un nodo que tiene ya asignado un único vector de pagos. En cada uno de ellos, seleccionamos nuevamente el movimiento que maximiza el pago del jugador al que pertenece el nodo, y, en caso de empate, tomamos el de menor índice. Este proceso recursivo debe terminar en un número finito de pasos, al llegar al nodo inicial d0.

33

La colección de nodos en los que mueve el jugador i, y los movimientos que se deben escoger en ellos, según el proceso descrito, forman una descripción completa de una estrategia pura πi* del jugador i. Denotemos por π* la combinación de estrategias asociada.

Es claro entonces, por construcción de esta combinación de estrategias que no existe ningún nodo en el que el

Es claro entonces, por construcción de esta combinación de estrategias que no existe ningún nodo en el que el jugador correspondiente pueda conseguir (cambiando de movimiento o introduciendo aleatorización) aumentar su pago, ni tampoco ningún jugador puede obtener un pago mejor aleatorizando sobre sus estrategias puras.

Por lo tanto, π* es un equilibrio de Nash del juego.

34

Este método constructivo con el que se obtiene un punto de equilibrio en un juego con información perfecta consiste por tanto en empezar por el final del juego y marchar hacia atrás hasta su principio. Por esta razón, esta técnica se denomina a veces inducción hacia atrás. El método lo utilizó ya Zermelo en 1912 para analizar el método lo utilizó ya Zermelo en 1912 para analizar el ajedrez, por lo que también se denomina Algoritmo de Zermelo.

35

Vamos a ver un sencillo ejemplo de su utilización. En la figura siguiente se puede observar que hemos marcado con una línea más gruesa aquellos movimientos que conducen a un mejor pago para el jugador 2 a partir de los nodos que preceden en un movimiento a los terminales. Se puede ver por tanto que el jugador 2 terminales. Se puede ver por tanto que el jugador 2 maximizará su pago eligiendo la estrategia derecha en el primer nodo, e izquierda en el segundo.

36

37

A partir de ella, podemos considerar para el jugador 1 la siguiente figura, en la que asociamos a cada posible movimiento suyo el vector de pagos al que se llegará al final del juego:

38

El jugador 1 escogerá por tanto la estrategia izquierda, que es la que maximiza su pago. Así pues, el punto de equilibrio de Nash que se alcanza es la combinación de estrategias π* = (i, (d, i) ), para la que el jugador 1 obtiene un pago de 2 unidades, y el 2 de 1 unidad.

Recuérdese que tanto el teorema como el algoritmo son Recuérdese que tanto el teorema como el algoritmo son sólo válidos cuando el juego sea de información perfecta. En efecto, se puede ver claramente que cuando existan conjuntos de información que contengan más de un nodo, el método ya no es factible, ya que el jugador correspondiente no sabe exactamente en qué nodo está, por lo que no puede maximizar su pago.

39

Existen en la literatura más conceptos de equilibrio, entre los que cabe mencionar los diversos refinamientos del concepto de equilibrio no cooperativo de Nash. Aunque no vamos a entrar de lleno en ellos, vamos, mediante un ejemplo a motivar su existencia y a esbozar su definición.

Consideremos el juego abstracto representado en forma extensiva como sigue:

40

Puede observarse que el juego posee dos equilibrios en estrategias puras, que son:

π1* = (i, (d, d) ), y π2* = (d, (i, d) ). El primero de ellos es el equilibrio que se obtiene

aplicando el algoritmo de Zermelo (que se puede aplicar por tratarse de un juego con información perfecta). por tratarse de un juego con información perfecta).

41

Vamos a estudiar el segundo. En primer lugar, vemos que es, efectivamente, un punto de equilibrio: en efecto, si 1 escoge derecha, entonces el jugador 2 mantiene su utilidad si cambia de movimiento en el primer nodo, y la disminuye si cambia en el segundo. Por otro lado, si el jugador 2 mantiene su estrategia, el 1 obtendría un pago peor si escogiese izquierda. Por tanto, estamos efectivamente ante un punto de equilibrio, pero con alguna particularidad extraña. pero con alguna particularidad extraña.

En concreto, el jugador 2 escogería izquierda si 1 escoge izquierda, lo cual parece un movimiento ilógico, puesto que en esta situación obtendría un mayor pago eligiendo derecha. Este equilibrio lo es porque de hecho, el jugador 1 no va a escoger izquierda, por lo que esta situación no se va a dar.

¿Qué interpretación se le puede dar a este equilibrio?

42

¿Qué interpretación se le puede dar a este equilibrio? Supongamos que los jugadores son autorizados a conversar

antes de empezar el juego y que el jugador 2 informa al 1 de que va a tomar esta estrategia.

Es decir, el jugador 2 amenaza al 1 con escoger izquierda si él mueve izquierda en el primer nodo. De todas formas, esta mueve izquierda en el primer nodo. De todas formas, esta amenaza es increíble, porque si el jugador 1 escogiera izquierda, el 2 no se vería beneficiado si cumpliera su amenaza, ya que obtendría un mayor pago eligiendo derecha

43

Los distintos refinamientos del concepto de equilibrio de Nash intentan eliminar casos como el que se ha expuesto previamente, es decir, que conllevan algún tipo de situación no creíble.

En el ejemplo anterior, se puede ver que la combinación de estrategias π2* no es un equilibrio si se considera sólo sobre el subjuego que comienza en el nodo de la izquierda del jugador subjuego que comienza en el nodo de la izquierda del jugador 2.

Sin embargo, el equilibrio π1* lo es también sobre cualquier subjuego del juego original. Uno de los refinamientos del concepto de equilibrio, el equilibrio perfecto en subjuegos, exige que la combinación de estrategias sea un equilibrio sobre cualquier subjuego del juego original.

44

INCOMPLETEINCOMPLETE

45