Apuntesdip Tema3 PDF

Capı́tulo 3
Juegos Bipersonales de Suma Nula
3.1. Definición de Juego Bipersonal de Suma Nula (JBSN)

En este capı́tulo nos ocupamos de los juegos más simples: juegos en los que dos jugadores
se enfrentan, de modo que lo que uno gana an el juego es lo que el otro pierde. De ahı́ el
término “suma nula”, pues si se suman los pagos de los jugadores la suma es cero. En
realidad, basta que la suma sea constante. Pero todo juego de suma constante se puede
representar como uno de suma nula, con lo cual su estudio se reduce al de los juegos de
suma nula.
La representación estratégica de un juego bipersonal de suma nula (JBSN) es apropiada
cuando la información del jugador es estática, es decir, no varı́a, mientras que la extensiva
será la apropiada cuando queramos mostrar explı́citamente cómo evoluciona el juego y los
cambios en la información que poseen los jugadores. Básicamente, estudiaremos la forma
estratégica.
Definición 3.1 Un JBSN en forma extensiva es un juego con 2 jugadores de modo que en
los nodos terminales la suma de los pagos de los jugadores es cero.
Definición 3.2 Un JBSN en forma estratégica es una terna
({1, 2}, {C1 , C2 }, {u1 , u2 }) de modo que u2 = −u1 = −u
Si suponemos que
C1 = {A1 , . . . , Am } es el conjunto de estrategias puras para 1
C2 = {B1 , . . . , Bn } es el conjunto de estrategias para 2

representaremos los pagos del juego en una matriz de orden m × n, de este modo:
C1 \ C2 B1 ··· Bn
A1 a11 ··· a1n
.. .. .. donde aij = u(Ai , Bj )
. . .
Am am1 ··· amn
La matriz A = (aij ) se denomina matriz de pagos, pues aij es el pago para el jugador 1
cuando 1 utiliza la estrategia Ai y 2 utiliza la estrategia Bj . El pago para 2 será −aij . De
modo que analizaremos el juego bajo la perspectiva del jugador 1.
Con este planteamiento, una estrategia mixta para 1 tiene la forma
σ1 = (σ11 , σ12 , . . . , σ1m ), donde σ1j será la probabilidad asociada a Aj
1
2 CAPÍTULO 3. JUEGOS BIPERSONALES DE SUMA NULA
Mientras que una estrategia mixta para 2 es:
σ2 = (σ21 , σ22 , . . . , σ2m ), donde σ2j será la probabilidad asociada a Bj
Ası́,
m X
X n
u(σ1 , σ2 ) = σ1i σ2j aij
i=1 j=1
Matricialmente, esta ecuación se escribe
u(σ1 , σ2 ) = σ1t A σ2
3.2. Criterio Maximin. Teorema Minimax

Nuestro planteamiento es, en principio, considerar que los elementos de la matriz de
pagos son beneficios, con lo cual el jugador 1 intentará maximizar la función u, mientras
que 2 intentará minimizarla. El criterio maximin que vimos en Teorı́a de la Decisión tiene su
análogo en Teorı́a de Juegos. Para el jugador 1 consiste en elegir la estrategia que maximice
el menor de los valores de u. Es decir, 1 supone que 2 elegirá la estrategia más desfavor-
able para él, y se asegura de que, en tal caso, obtendrá el máximo beneficio posible. En
este caso, no podemos decir que el criterio sea pesimista, porque realmente es ası́ como se
desarrollará el juego: como 2 gana lo que 1 pierde, intentará minimizar u, mientras que 1
intentará maximizarla. De este modo, se definen
Valor maximin
v1 = máx mı́n aij
i j
Valor minimax
v2 = mı́n máx aij
j i
Con estas definiciones, es claro que se verifica:

1. v1 ≤ v2
Dados i∗ , j ∗ se cumple que
mı́n ai∗ j ≤ ai∗ j ∗ ≤ máx aij ∗

j i
con lo cual
máx mı́n aij ≤ máx aij ∗ , ∀j ∗ ∈ {1, . . . , n}
i j i
Por tanto,
v1 = máx mı́n aij ≤ mı́n máx aij = v2
i j j i
2. El resultado del juego (lo que obtiene 1 = lo que pierde 2) será un valor en [v1 , v2 ],
puesto que 1 espera conseguir al menos un pago de v1 , y 2 espera que el resultado del
juego sea como mucho v2 .
3. Intuitivamente, cuando ambos jugadores busquen el mismo valor, el juego estará re-
suelto, porque ambos están de acuerdo. Es decir, si v1 = v2 = v, es claro que el
resultado del juego será v.
Vamos a formalizar estos comentarios. En primer lugar, veamos qué es un equilibrio de Nash
para un JBSN.
3.2. CRITERIO MAXIMIN. TEOREMA MINIMAX 3
Definición 3.3 En un JBSN, un par de estrategias puras {Ai∗ , Bj ∗ } es un equilibrio de

Nash en estrategias puras (o un punto de silla) si
aij ∗ ≤ ai∗ j ∗ ≤ ai∗ j , ∀i = 1, . . . , m, ∀j = 1, . . . , n
El valor del equilibrio de Nash es ai∗ j ∗ .
Observaciones:
1. Nótese que esta no es más que la adaptación de la definición de equilibrio de Nash a
un JBSN.
2. El valor del equilibrio de Nash ai∗ j ∗ es el mejor pago para 1 si 2 utiliza la estrategia
Bj ∗ , pues
ai∗ j ∗ = máx aij ∗
i
y es el mejor resultado para 2 si 1 utiliza la estrategia Ai∗ , pues
ai∗ j ∗ = mı́n ai∗ j
j
Definición 3.4 Ai∗ es una estrategia óptima para el jugador 1 si proporciona el valor v1 ,
o sea, si
v1 = máx mı́n aij = mı́n ai∗ j
i j j
mientras que Bj ∗ es una estrategia óptima para 2 si proporciona v2 , esto es,
v2 = mı́n máx aij = máx aij ∗
j i i
Teorema 3.1 Dado un JBSN, si v1 = v2 = v, entonces

1. Existe un equilibrio de Nash en estrategias puras
2. Los equilibrios de Nash del juego se corresponden con los pares de estrategias óptimas
3. El valor del juego es único e igual a v
Demostración: Como el juego es de dimensión finita, existen sendas estrategias óptimas
para 1 y para 2, Ai∗ y Bj ∗ . Entonces,
ai∗ j ∗ ≥ mı́n ai∗ j = v1 = v2 = máx aij ∗ ≥ ai∗ j ∗
j i
Luego v1 = v2 = ai∗ j ∗ . Ahora bien, {Ai∗ , Bj ∗ } constituye un equilibrio de Nash, pues

aij ∗ ≤ máx aij ∗ = ai∗ j ∗ = mı́n ai∗ j ≤ ai∗ j , ∀i, j
i j
Luego existe un equilibrio de Nash, y el valor del equilibrio de Nash es el valor del juego.
Además, cualquier equilibrio de Nash es un par de estrategias óptimas, claramente.
Corolario 3.1 Si en un JBSN los pares {Ai1 , Bj1 }, {Ai2 , Bj2 } son equilibrios de Nash,
entonces también lo son {Ai1 , Bj2 } y {Ai2 , Bj1 }.
Sin embargo, no siempre coinciden los valores v1 y v2 , y en tal caso para resolver el
juego tendremos que utilizar las estrategias mixtas, es decir, tomaremos la extensión mixta
del juego. Para ello, redefiniremos los valores maximin y minimax de este modo:
v1∗ = máx∗ mı́n∗ σ1t A σ2
σ1 ∈ C1 σ2 ∈ C2
v2∗ = mı́n ∗ máx∗ σ1t A σ2

σ2 ∈ C2 σ1 ∈ C1
Definición 3.5 En un JBSN, un par de estrategias mixtas {σ1∗ , σ2∗ } constituyen un equilib-
rio de Nash en estrategias mixtas (o un punto de silla) si
σ1t A σ2∗ ≤ (σ1∗ )t A σ2∗ ≤ (σ1∗ )t A σ2 , ∀σ1 ∈ C1∗ , σ2 ∈ C2∗
El valor del equilibrio de Nash es (σ1∗ )t A σ2∗ .
Análogamente, redefinimos las estrategias óptimas:
Definición 3.6 Una estrategia mixta σ1∗ ∈ C1∗ es óptima para el jugador 1 si proporciona
el valor v1∗ , esto es,
v1∗ = mı́n ∗ (σ1∗ )t Aσ2
σ2 ∈ C 2
mientras que σ2∗ ∈ C2∗ es una estrategia óptima para 2 si proporciona v2 ∗, esto es,
v2∗ = máx∗ σ1t Aσ2∗

σ1 ∈ C 1
Nótese que los equilibrios de Nash para estrategias mixtas se corresponden con los pares de
estrategias mixtas óptimas.
Definición 3.7 Una estrategia pura Ai∗ es admisible para el jugador 1 si existe una es-
trategia mixta óptima para 1 σ1∗ tal que la coordenada correspondiente a Ai∗ es no nula,
∗ > 0.
esto es, σ1i ∗
Análogamente, Bj ∗ es una estrategia admisible para 2 si existe σ2∗ ∈ C2∗ óptima tal que
∗
σ2j ∗ > 0.
El siguiente teorema, demostrado por Von Neumann en 1953, demuestra que todo JBSN
(su extensión mixta) tiene solución.
Teorema 3.2 Teorema Minimax Dado un JBSN, se verifica que
v1∗ = máx∗ mı́n ∗ σ1t A σ2 = mı́n ∗ máx∗ σ1t A σ2 = v2∗

σ1 ∈ C 1 σ2 ∈ C 2 σ2 ∈ C2 σ1 ∈ C1
El valor v1∗ = v2∗ = v ∗ es el valor del juego, también llamado resultado del juego. Llamamos
solución del juego a un par de estrategias óptimas junto con el valor o resultado del juego.
Demostración:
En primer lugar, es claro que v1∗ ≤ v2∗ , tal y como los hemos definido. Probaremos
entonces que v2∗ ≤ v1∗ .
Sea (σ1∗ , σ2∗ ) un equilibrio de Nash, del cual tenemos asegurada la existencia gracias al
teorema de Nash. Entonces,
v2∗ ≤ máx∗ σ1t A σ2 = (σ1∗ )t A σ2∗ = mı́n ∗ (σ1∗ )t A σ2 ≤ v1∗

σ1 ∈ C1 σ2 ∈ C 2
Por tanto, los equilibrios de Nash (o, lo que es lo mismo, los pares de estrategias óptimas),
junto con el valor del equilibrio de Nash (que es único), proporcionan la solución de todo
JBSN.
3.3. FORMULACIÓN DE UN JBSN COMO UN PPL 5
3.3. Formulación de un JBSN como un PPL

Dado un JBSN ({1, 2}, {C1 , C2 }, u), vamos a ver cómo se puede plantear como un Proble-
ma de Programación Lineal (PPL), y, por tanto, resolver mediante el algoritmo del simplex.
Para buscar la solución del juego, ya hemos visto que lo que debemos buscar es simplemente
un equilibrio de Nash (σ1∗ , σ2∗ ), y el valor del equilibrio de Nash v ∗ = u(σ1∗ , σ2∗ ) es el valor
del juego. Es decir, buscamos (σ1∗ , σ2∗ ) tales que
u(Ai , σ2∗ ) ≤ u(σ1∗ , σ2∗ ) = v ∗ , ∀i = 1, . . . , m
u(σ1∗ , Bj ) ≥ u(σ1∗ , σ2∗ ) = v ∗ , ∀j = 1, . . . , n
Esto es,
n
X
∗
σ2j aij ≤ v ∗ , ∀i = 1, . . . , m
j=1
Xm
∗
σ1i aij ≥ v ∗ , ∀j = 1, . . . , n
i=1
En realidad, el jugador 2 se plantea el siguiente PPL:



 Min v ∗

 Xn
s.a. aij σ2j ≤ v ∗ , ∀i = 1, . . . , m (3.1)




j=1 Pn
σ2j ≥ 0, ∀j = 1, . . . , n, j=1 σ2j = 1
Definiendo
σ2j
Yj = , j = 1, . . . , n
v∗
resulta que Y1 + · · · + Yn = 1/v ∗ , luego el problema (1.1) será equivalente a


 Max Y1 + · · · + Yn

 Xn
s.a. aij Yj ≤ 1, ∀i = 1, . . . , m (3.2)



 j=1
Yj ≥ 0, ∀j = 1, . . . , n
La solución (Y1∗ , . . . , Yn∗ ) del PPL (1.2) proporciona la estrategia óptima para el jugador 2,
1
σ2∗ = (v ∗ Y1∗ , . . . , v ∗ Yn∗ ), donde v ∗ =
Y1 + . . . + Yn
Asimismo, el problema dual de (1.2) proporciona la estrategia óptima para el jugador 1,
pues el PPL asociado a 1 es


 Max v ∗

 Xm
s.a. aij σ1j ≥ v ∗ , ∀j = 1, . . . , n (3.3)



 i=1 Pm
σ1j ≥ 0, ∀i = 1, . . . , m, i=1 σ1j = 1
que es el dual de (1.1). Haciendo un cambio de variable similar al anterior, tenemos el dual
de (1.3), que es finalmente


 Min Y1 + . . . + Ym

 Xm
s.a. aij Yi ≥ 1, ∀j = 1, . . . , n (3.4)



 i=1
Yi ≥ 0, ∀i = 1, . . . , m
3.4. Cálculo de la solución del juego

3.4.1. Reducciones por Dominación
Antes de resolver el juego, debemos eliminar las estrategias fuertemente dominadas, pues
el juego puede simplificarse o incluso ser resuelto por dominación. El concepto de estrategia
fuertemente dominada para un JBSN es el siguiente:
Una estrategia Ai∗ del jugador 1 está fuertemente dominada si existe σ1 ∈ C1∗ tal que
u(Ai∗ , Bj ) < u(σ1 , Bj ), ∀j = 1, . . . , n

P
Es decir, si existen σ11 , . . . , σ1m ≥ 0 cumpliendo i σ1i = 1 tales que
m
X
ai∗ j < σ1i aij , ∀j = 1, . . . , n
i=1
Análogamente,
P Bj ∗ estará fuertemente dominada para 2 si existen σ21 , . . . , σ2n ≥ 0 cumplien-
do j σ2j = 1 tales que
n
X
aij ∗ > σ2j aij , ∀i = 1, . . . , m
j=1
Por tanto, para resolver un juego los pasos a llevar a cabo son:
1. Realizar las reducciones por dominación
2. Si el juego no es resoluble por dominación, calcular los valores v1 y v2 . Si v1 = v2 , el

juego se puede resolver con estrategias puras. La solución del juego serán las estrategias
que proporcionen los valores v1 y v2 junto con el valor del juego v = v1 = v2 .
3. En caso de que v1 6= v2 , nos trasladaremos a la extensión mixta del juego. Buscaremos

un equilibrio de Nash.
En el siguiente apartado, veremos cómo se busca el equilibrio de Nash en los juegos en forma
estratégica del tipo 2 × n o m × 2.
3.4.2. Solución en la forma estratégica

Dado un JBSN, la búsqueda de estrategias admisibles nos permitirá resolver el juego.
La razón de esto se deduce del siguiente resultado.
Proposición 3.1 El valor de la función de utilidad cuando uno de los jugadores utiliza una
estrategia óptima y el otro una estrategia admisible es el valor del juego.
Demostración:
Sean σ1 , σ2 sendas estrategias óptimas para 1 y 2, respectivamente. Supongamos que
σ1 = (σ11 , . . . , σ1k , 0, . . . , 0), donde σ1i > 0, ∀i = 1, . . . , k
reordenando las estrategias puras si fuera preciso. Llamemos vi = u(Ai , σ2 ) ≤ v ∗ . Entonces,
k
X k
X
v ∗ = u(σ1 , σ2 ) = σ1i vi ≤ σ1i v ∗ = v ∗
i=1 i=1
3.4. CÁLCULO DE LA SOLUCIÓN DEL JUEGO 7
Con lo cual la desigualdad de la ecuación es una igualdad

k
X k
X
σ1i vi = σ1i v ∗
i=1 i=1
y, por tanto, vi = v ∗ , ∀i = 1, . . . , k, como querı́amos demostrar.
Sea entonces un JBSN de la forma 2 × n, esto es,
({1, 2}, {C1 = {A1 , A2 }, C2 = {B1 , . . . , Bn }}, u)
Buscamos una estrategia óptima para 1, σ1 = (x, 1 − x) ∈ C1∗ , x ∈ [0, 1]. Dada Bj ∈ C2 ,
u(σ1 , Bj ) = xu(A1 , Bj ) + (1 − x)u(A2 , Bj ) = xa1j + (1 − x)a2j
Calcularemos x∗ que proporcione
máx mı́n{xa1j + (1 − x)a2j } = v ∗

x∈[0,1] j
Con lo que
σ1 = (x∗ , 1 − x∗ )
será la estrategia óptima para 1, mientras que
v ∗ = x∗ a1j + (1 − x∗ )a2j
será el valor del juego. Además, las estrategias de 2 que proporcionen el valor v ∗ nos indican
estrategias admisibles. Hallaremos una estrategia óptima σ2 para 2 imponiendo que
u(A1 , σ2 ) = u(A2 , σ2 ) = v ∗
Ejemplo 3.1 Supongamos que tenemos el JBSN dado por la matriz de pagos siguiente:
B1 B2 B3
A1 0 5/6 1/2
A2 1 1/2 3/4
Planteamos σ1 = (x, 1 − x)
u(σ1 , B1 ) = 1 − x
u(σ1 , B2 ) = 5/6x + 1/2(1 − x)
u(σ1 , B3 ) = 1/2x + 3/4(1 − x)
½
5/6x + 1/2(1 − x) si x ∈ [0, 3/8]
mı́n{1 − x, 5/6x + 1/2(1 − x), 1/2x + 3/4(1 − x)} =
1−x si x ∈ [3/8, 1]
Con lo cual
x∗ = 3/8 y v ∗ = 1 − x∗ = 5/8
La estrategia óptima para 1 es σ1 = (3/8, 5/8). La estrategia óptima para 2 es de la forma
σ2 = (y, 1 − y, 0), y ∈ [0, 1], puesto que B3 no es una estrategia admisible para 2. Luego
u(A1 , σ2 ) = 5/6(1 − y) = v ∗ = 5/8
Con lo que y ∗ = 1/4 y σ2 = (1/4, 3/4, 0)
Nota: Es evidente que de este modo también se resuelven los juegos m × 2.

Apuntesdip Tema3 PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Apuntesdip Tema3 PDF

Uploaded by

Copyright:

Available Formats

Capı́tulo 3

Juegos Bipersonales de Suma Nula

3.1. Definición de Juego Bipersonal de Suma Nula (JBSN)

Definición 3.2 Un JBSN en forma estratégica es una terna

({1, 2}, {C1 , C2 }, {u1 , u2 }) de modo que u2 = −u1 = −u

C2 = {B1 , . . . , Bn } es el conjunto de estrategias para 2

σ1 = (σ11 , σ12 , . . . , σ1m ), donde σ1j será la probabilidad asociada a Aj

Mientras que una estrategia mixta para 2 es:

σ2 = (σ21 , σ22 , . . . , σ2m ), donde σ2j será la probabilidad asociada a Bj

Matricialmente, esta ecuación se escribe

3.2. Criterio Maximin. Teorema Minimax

Con estas definiciones, es claro que se verifica:

mı́n ai∗ j ≤ ai∗ j ∗ ≤ máx aij ∗

Definición 3.3 En un JBSN, un par de estrategias puras {Ai∗ , Bj ∗ } es un equilibrio de

Teorema 3.1 Dado un JBSN, si v1 = v2 = v, entonces

Luego v1 = v2 = ai∗ j ∗ . Ahora bien, {Ai∗ , Bj ∗ } constituye un equilibrio de Nash, pues

v2∗ = mı́n ∗ máx∗ σ1t A σ2

σ1t A σ2∗ ≤ (σ1∗ )t A σ2∗ ≤ (σ1∗ )t A σ2 , ∀σ1 ∈ C1∗ , σ2 ∈ C2∗

El valor del equilibrio de Nash es (σ1∗ )t A σ2∗ .

Análogamente, redefinimos las estrategias óptimas:

v2∗ = máx∗ σ1t Aσ2∗

Teorema 3.2 Teorema Minimax Dado un JBSN, se verifica que

v1∗ = máx∗ mı́n ∗ σ1t A σ2 = mı́n ∗ máx∗ σ1t A σ2 = v2∗

v2∗ ≤ máx∗ σ1t A σ2 = (σ1∗ )t A σ2∗ = mı́n ∗ (σ1∗ )t A σ2 ≤ v1∗

3.3. Formulación de un JBSN como un PPL

En realidad, el jugador 2 se plantea el siguiente PPL:

3.4. Cálculo de la solución del juego

u(Ai∗ , Bj ) < u(σ1 , Bj ), ∀j = 1, . . . , n

1. Realizar las reducciones por dominación

2. Si el juego no es resoluble por dominación, calcular los valores v1 y v2 . Si v1 = v2 , el

3. En caso de que v1 6= v2 , nos trasladaremos a la extensión mixta del juego. Buscaremos

3.4.2. Solución en la forma estratégica

σ1 = (σ11 , . . . , σ1k , 0, . . . , 0), donde σ1i > 0, ∀i = 1, . . . , k

reordenando las estrategias puras si fuera preciso. Llamemos vi = u(Ai , σ2 ) ≤ v ∗ . Entonces,

Con lo cual la desigualdad de la ecuación es una igualdad

y, por tanto, vi = v ∗ , ∀i = 1, . . . , k, como querı́amos demostrar.

Sea entonces un JBSN de la forma 2 × n, esto es,

({1, 2}, {C1 = {A1 , A2 }, C2 = {B1 , . . . , Bn }}, u)

u(σ1 , Bj ) = xu(A1 , Bj ) + (1 − x)u(A2 , Bj ) = xa1j + (1 − x)a2j

Calcularemos x∗ que proporcione

máx mı́n{xa1j + (1 − x)a2j } = v ∗

u(A1 , σ2 ) = 5/6(1 − y) = v ∗ = 5/8

Con lo que y ∗ = 1/4 y σ2 = (1/4, 3/4, 0)

Nota: Es evidente que de este modo también se resuelven los juegos m × 2.

You might also like