You are on page 1of 7

Capı́tulo 3

Juegos Bipersonales de Suma Nula

3.1. Definición de Juego Bipersonal de Suma Nula (JBSN)


En este capı́tulo nos ocupamos de los juegos más simples: juegos en los que dos jugadores
se enfrentan, de modo que lo que uno gana an el juego es lo que el otro pierde. De ahı́ el
término “suma nula”, pues si se suman los pagos de los jugadores la suma es cero. En
realidad, basta que la suma sea constante. Pero todo juego de suma constante se puede
representar como uno de suma nula, con lo cual su estudio se reduce al de los juegos de
suma nula.
La representación estratégica de un juego bipersonal de suma nula (JBSN) es apropiada
cuando la información del jugador es estática, es decir, no varı́a, mientras que la extensiva
será la apropiada cuando queramos mostrar explı́citamente cómo evoluciona el juego y los
cambios en la información que poseen los jugadores. Básicamente, estudiaremos la forma
estratégica.
Definición 3.1 Un JBSN en forma extensiva es un juego con 2 jugadores de modo que en
los nodos terminales la suma de los pagos de los jugadores es cero.

Definición 3.2 Un JBSN en forma estratégica es una terna

({1, 2}, {C1 , C2 }, {u1 , u2 }) de modo que u2 = −u1 = −u

Si suponemos que
C1 = {A1 , . . . , Am } es el conjunto de estrategias puras para 1

C2 = {B1 , . . . , Bn } es el conjunto de estrategias para 2


representaremos los pagos del juego en una matriz de orden m × n, de este modo:
C1 \ C2 B1 ··· Bn
A1 a11 ··· a1n
.. .. .. donde aij = u(Ai , Bj )
. . .
Am am1 ··· amn
La matriz A = (aij ) se denomina matriz de pagos, pues aij es el pago para el jugador 1
cuando 1 utiliza la estrategia Ai y 2 utiliza la estrategia Bj . El pago para 2 será −aij . De
modo que analizaremos el juego bajo la perspectiva del jugador 1.
Con este planteamiento, una estrategia mixta para 1 tiene la forma

σ1 = (σ11 , σ12 , . . . , σ1m ), donde σ1j será la probabilidad asociada a Aj

1
2 CAPÍTULO 3. JUEGOS BIPERSONALES DE SUMA NULA

Mientras que una estrategia mixta para 2 es:

σ2 = (σ21 , σ22 , . . . , σ2m ), donde σ2j será la probabilidad asociada a Bj

Ası́,
m X
X n
u(σ1 , σ2 ) = σ1i σ2j aij
i=1 j=1

Matricialmente, esta ecuación se escribe

u(σ1 , σ2 ) = σ1t A σ2

3.2. Criterio Maximin. Teorema Minimax


Nuestro planteamiento es, en principio, considerar que los elementos de la matriz de
pagos son beneficios, con lo cual el jugador 1 intentará maximizar la función u, mientras
que 2 intentará minimizarla. El criterio maximin que vimos en Teorı́a de la Decisión tiene su
análogo en Teorı́a de Juegos. Para el jugador 1 consiste en elegir la estrategia que maximice
el menor de los valores de u. Es decir, 1 supone que 2 elegirá la estrategia más desfavor-
able para él, y se asegura de que, en tal caso, obtendrá el máximo beneficio posible. En
este caso, no podemos decir que el criterio sea pesimista, porque realmente es ası́ como se
desarrollará el juego: como 2 gana lo que 1 pierde, intentará minimizar u, mientras que 1
intentará maximizarla. De este modo, se definen
Valor maximin
v1 = máx mı́n aij
i j

Valor minimax
v2 = mı́n máx aij
j i

Con estas definiciones, es claro que se verifica:


1. v1 ≤ v2
Dados i∗ , j ∗ se cumple que

mı́n ai∗ j ≤ ai∗ j ∗ ≤ máx aij ∗


j i

con lo cual
máx mı́n aij ≤ máx aij ∗ , ∀j ∗ ∈ {1, . . . , n}
i j i

Por tanto,
v1 = máx mı́n aij ≤ mı́n máx aij = v2
i j j i

2. El resultado del juego (lo que obtiene 1 = lo que pierde 2) será un valor en [v1 , v2 ],
puesto que 1 espera conseguir al menos un pago de v1 , y 2 espera que el resultado del
juego sea como mucho v2 .

3. Intuitivamente, cuando ambos jugadores busquen el mismo valor, el juego estará re-
suelto, porque ambos están de acuerdo. Es decir, si v1 = v2 = v, es claro que el
resultado del juego será v.
Vamos a formalizar estos comentarios. En primer lugar, veamos qué es un equilibrio de Nash
para un JBSN.
3.2. CRITERIO MAXIMIN. TEOREMA MINIMAX 3

Definición 3.3 En un JBSN, un par de estrategias puras {Ai∗ , Bj ∗ } es un equilibrio de


Nash en estrategias puras (o un punto de silla) si
aij ∗ ≤ ai∗ j ∗ ≤ ai∗ j , ∀i = 1, . . . , m, ∀j = 1, . . . , n
El valor del equilibrio de Nash es ai∗ j ∗ .
Observaciones:
1. Nótese que esta no es más que la adaptación de la definición de equilibrio de Nash a
un JBSN.
2. El valor del equilibrio de Nash ai∗ j ∗ es el mejor pago para 1 si 2 utiliza la estrategia
Bj ∗ , pues
ai∗ j ∗ = máx aij ∗
i
y es el mejor resultado para 2 si 1 utiliza la estrategia Ai∗ , pues
ai∗ j ∗ = mı́n ai∗ j
j

Definición 3.4 Ai∗ es una estrategia óptima para el jugador 1 si proporciona el valor v1 ,
o sea, si
v1 = máx mı́n aij = mı́n ai∗ j
i j j
mientras que Bj ∗ es una estrategia óptima para 2 si proporciona v2 , esto es,
v2 = mı́n máx aij = máx aij ∗
j i i

Teorema 3.1 Dado un JBSN, si v1 = v2 = v, entonces


1. Existe un equilibrio de Nash en estrategias puras
2. Los equilibrios de Nash del juego se corresponden con los pares de estrategias óptimas
3. El valor del juego es único e igual a v
Demostración: Como el juego es de dimensión finita, existen sendas estrategias óptimas
para 1 y para 2, Ai∗ y Bj ∗ . Entonces,
ai∗ j ∗ ≥ mı́n ai∗ j = v1 = v2 = máx aij ∗ ≥ ai∗ j ∗
j i

Luego v1 = v2 = ai∗ j ∗ . Ahora bien, {Ai∗ , Bj ∗ } constituye un equilibrio de Nash, pues


aij ∗ ≤ máx aij ∗ = ai∗ j ∗ = mı́n ai∗ j ≤ ai∗ j , ∀i, j
i j

Luego existe un equilibrio de Nash, y el valor del equilibrio de Nash es el valor del juego.
Además, cualquier equilibrio de Nash es un par de estrategias óptimas, claramente.
Corolario 3.1 Si en un JBSN los pares {Ai1 , Bj1 }, {Ai2 , Bj2 } son equilibrios de Nash,
entonces también lo son {Ai1 , Bj2 } y {Ai2 , Bj1 }.

Sin embargo, no siempre coinciden los valores v1 y v2 , y en tal caso para resolver el
juego tendremos que utilizar las estrategias mixtas, es decir, tomaremos la extensión mixta
del juego. Para ello, redefiniremos los valores maximin y minimax de este modo:
v1∗ = máx∗ mı́n∗ σ1t A σ2
σ1 ∈ C1 σ2 ∈ C2

v2∗ = mı́n ∗ máx∗ σ1t A σ2


σ2 ∈ C2 σ1 ∈ C1
4 CAPÍTULO 3. JUEGOS BIPERSONALES DE SUMA NULA

Definición 3.5 En un JBSN, un par de estrategias mixtas {σ1∗ , σ2∗ } constituyen un equilib-
rio de Nash en estrategias mixtas (o un punto de silla) si

σ1t A σ2∗ ≤ (σ1∗ )t A σ2∗ ≤ (σ1∗ )t A σ2 , ∀σ1 ∈ C1∗ , σ2 ∈ C2∗

El valor del equilibrio de Nash es (σ1∗ )t A σ2∗ .

Análogamente, redefinimos las estrategias óptimas:

Definición 3.6 Una estrategia mixta σ1∗ ∈ C1∗ es óptima para el jugador 1 si proporciona
el valor v1∗ , esto es,
v1∗ = mı́n ∗ (σ1∗ )t Aσ2
σ2 ∈ C 2

mientras que σ2∗ ∈ C2∗ es una estrategia óptima para 2 si proporciona v2 ∗, esto es,

v2∗ = máx∗ σ1t Aσ2∗


σ1 ∈ C 1

Nótese que los equilibrios de Nash para estrategias mixtas se corresponden con los pares de
estrategias mixtas óptimas.

Definición 3.7 Una estrategia pura Ai∗ es admisible para el jugador 1 si existe una es-
trategia mixta óptima para 1 σ1∗ tal que la coordenada correspondiente a Ai∗ es no nula,
∗ > 0.
esto es, σ1i ∗

Análogamente, Bj ∗ es una estrategia admisible para 2 si existe σ2∗ ∈ C2∗ óptima tal que

σ2j ∗ > 0.

El siguiente teorema, demostrado por Von Neumann en 1953, demuestra que todo JBSN
(su extensión mixta) tiene solución.

Teorema 3.2 Teorema Minimax Dado un JBSN, se verifica que

v1∗ = máx∗ mı́n ∗ σ1t A σ2 = mı́n ∗ máx∗ σ1t A σ2 = v2∗


σ1 ∈ C 1 σ2 ∈ C 2 σ2 ∈ C2 σ1 ∈ C1

El valor v1∗ = v2∗ = v ∗ es el valor del juego, también llamado resultado del juego. Llamamos
solución del juego a un par de estrategias óptimas junto con el valor o resultado del juego.

Demostración:
En primer lugar, es claro que v1∗ ≤ v2∗ , tal y como los hemos definido. Probaremos
entonces que v2∗ ≤ v1∗ .
Sea (σ1∗ , σ2∗ ) un equilibrio de Nash, del cual tenemos asegurada la existencia gracias al
teorema de Nash. Entonces,

v2∗ ≤ máx∗ σ1t A σ2 = (σ1∗ )t A σ2∗ = mı́n ∗ (σ1∗ )t A σ2 ≤ v1∗


σ1 ∈ C1 σ2 ∈ C 2

Por tanto, los equilibrios de Nash (o, lo que es lo mismo, los pares de estrategias óptimas),
junto con el valor del equilibrio de Nash (que es único), proporcionan la solución de todo
JBSN.
3.3. FORMULACIÓN DE UN JBSN COMO UN PPL 5

3.3. Formulación de un JBSN como un PPL


Dado un JBSN ({1, 2}, {C1 , C2 }, u), vamos a ver cómo se puede plantear como un Proble-
ma de Programación Lineal (PPL), y, por tanto, resolver mediante el algoritmo del simplex.
Para buscar la solución del juego, ya hemos visto que lo que debemos buscar es simplemente
un equilibrio de Nash (σ1∗ , σ2∗ ), y el valor del equilibrio de Nash v ∗ = u(σ1∗ , σ2∗ ) es el valor
del juego. Es decir, buscamos (σ1∗ , σ2∗ ) tales que
u(Ai , σ2∗ ) ≤ u(σ1∗ , σ2∗ ) = v ∗ , ∀i = 1, . . . , m
u(σ1∗ , Bj ) ≥ u(σ1∗ , σ2∗ ) = v ∗ , ∀j = 1, . . . , n
Esto es,
n
X

σ2j aij ≤ v ∗ , ∀i = 1, . . . , m
j=1
Xm

σ1i aij ≥ v ∗ , ∀j = 1, . . . , n
i=1

En realidad, el jugador 2 se plantea el siguiente PPL:




 Min v ∗

 Xn
s.a. aij σ2j ≤ v ∗ , ∀i = 1, . . . , m (3.1)




j=1 Pn
σ2j ≥ 0, ∀j = 1, . . . , n, j=1 σ2j = 1

Definiendo
σ2j
Yj = , j = 1, . . . , n
v∗
resulta que Y1 + · · · + Yn = 1/v ∗ , luego el problema (1.1) será equivalente a


 Max Y1 + · · · + Yn

 Xn
s.a. aij Yj ≤ 1, ∀i = 1, . . . , m (3.2)



 j=1
Yj ≥ 0, ∀j = 1, . . . , n
La solución (Y1∗ , . . . , Yn∗ ) del PPL (1.2) proporciona la estrategia óptima para el jugador 2,
1
σ2∗ = (v ∗ Y1∗ , . . . , v ∗ Yn∗ ), donde v ∗ =
Y1 + . . . + Yn
Asimismo, el problema dual de (1.2) proporciona la estrategia óptima para el jugador 1,
pues el PPL asociado a 1 es


 Max v ∗

 Xm
s.a. aij σ1j ≥ v ∗ , ∀j = 1, . . . , n (3.3)



 i=1 Pm
σ1j ≥ 0, ∀i = 1, . . . , m, i=1 σ1j = 1

que es el dual de (1.1). Haciendo un cambio de variable similar al anterior, tenemos el dual
de (1.3), que es finalmente


 Min Y1 + . . . + Ym

 Xm
s.a. aij Yi ≥ 1, ∀j = 1, . . . , n (3.4)



 i=1
Yi ≥ 0, ∀i = 1, . . . , m
6 CAPÍTULO 3. JUEGOS BIPERSONALES DE SUMA NULA

3.4. Cálculo de la solución del juego


3.4.1. Reducciones por Dominación
Antes de resolver el juego, debemos eliminar las estrategias fuertemente dominadas, pues
el juego puede simplificarse o incluso ser resuelto por dominación. El concepto de estrategia
fuertemente dominada para un JBSN es el siguiente:
Una estrategia Ai∗ del jugador 1 está fuertemente dominada si existe σ1 ∈ C1∗ tal que

u(Ai∗ , Bj ) < u(σ1 , Bj ), ∀j = 1, . . . , n


P
Es decir, si existen σ11 , . . . , σ1m ≥ 0 cumpliendo i σ1i = 1 tales que
m
X
ai∗ j < σ1i aij , ∀j = 1, . . . , n
i=1

Análogamente,
P Bj ∗ estará fuertemente dominada para 2 si existen σ21 , . . . , σ2n ≥ 0 cumplien-
do j σ2j = 1 tales que
n
X
aij ∗ > σ2j aij , ∀i = 1, . . . , m
j=1

Por tanto, para resolver un juego los pasos a llevar a cabo son:

1. Realizar las reducciones por dominación

2. Si el juego no es resoluble por dominación, calcular los valores v1 y v2 . Si v1 = v2 , el


juego se puede resolver con estrategias puras. La solución del juego serán las estrategias
que proporcionen los valores v1 y v2 junto con el valor del juego v = v1 = v2 .

3. En caso de que v1 6= v2 , nos trasladaremos a la extensión mixta del juego. Buscaremos


un equilibrio de Nash.

En el siguiente apartado, veremos cómo se busca el equilibrio de Nash en los juegos en forma
estratégica del tipo 2 × n o m × 2.

3.4.2. Solución en la forma estratégica


Dado un JBSN, la búsqueda de estrategias admisibles nos permitirá resolver el juego.
La razón de esto se deduce del siguiente resultado.

Proposición 3.1 El valor de la función de utilidad cuando uno de los jugadores utiliza una
estrategia óptima y el otro una estrategia admisible es el valor del juego.

Demostración:
Sean σ1 , σ2 sendas estrategias óptimas para 1 y 2, respectivamente. Supongamos que

σ1 = (σ11 , . . . , σ1k , 0, . . . , 0), donde σ1i > 0, ∀i = 1, . . . , k

reordenando las estrategias puras si fuera preciso. Llamemos vi = u(Ai , σ2 ) ≤ v ∗ . Entonces,

k
X k
X
v ∗ = u(σ1 , σ2 ) = σ1i vi ≤ σ1i v ∗ = v ∗
i=1 i=1
3.4. CÁLCULO DE LA SOLUCIÓN DEL JUEGO 7

Con lo cual la desigualdad de la ecuación es una igualdad


k
X k
X
σ1i vi = σ1i v ∗
i=1 i=1

y, por tanto, vi = v ∗ , ∀i = 1, . . . , k, como querı́amos demostrar.

Sea entonces un JBSN de la forma 2 × n, esto es,

({1, 2}, {C1 = {A1 , A2 }, C2 = {B1 , . . . , Bn }}, u)

Buscamos una estrategia óptima para 1, σ1 = (x, 1 − x) ∈ C1∗ , x ∈ [0, 1]. Dada Bj ∈ C2 ,

u(σ1 , Bj ) = xu(A1 , Bj ) + (1 − x)u(A2 , Bj ) = xa1j + (1 − x)a2j

Calcularemos x∗ que proporcione

máx mı́n{xa1j + (1 − x)a2j } = v ∗


x∈[0,1] j

Con lo que
σ1 = (x∗ , 1 − x∗ )
será la estrategia óptima para 1, mientras que

v ∗ = x∗ a1j + (1 − x∗ )a2j

será el valor del juego. Además, las estrategias de 2 que proporcionen el valor v ∗ nos indican
estrategias admisibles. Hallaremos una estrategia óptima σ2 para 2 imponiendo que

u(A1 , σ2 ) = u(A2 , σ2 ) = v ∗

Ejemplo 3.1 Supongamos que tenemos el JBSN dado por la matriz de pagos siguiente:

B1 B2 B3
A1 0 5/6 1/2
A2 1 1/2 3/4

Planteamos σ1 = (x, 1 − x)

u(σ1 , B1 ) = 1 − x
u(σ1 , B2 ) = 5/6x + 1/2(1 − x)
u(σ1 , B3 ) = 1/2x + 3/4(1 − x)
½
5/6x + 1/2(1 − x) si x ∈ [0, 3/8]
mı́n{1 − x, 5/6x + 1/2(1 − x), 1/2x + 3/4(1 − x)} =
1−x si x ∈ [3/8, 1]
Con lo cual
x∗ = 3/8 y v ∗ = 1 − x∗ = 5/8
La estrategia óptima para 1 es σ1 = (3/8, 5/8). La estrategia óptima para 2 es de la forma
σ2 = (y, 1 − y, 0), y ∈ [0, 1], puesto que B3 no es una estrategia admisible para 2. Luego

u(A1 , σ2 ) = 5/6(1 − y) = v ∗ = 5/8

Con lo que y ∗ = 1/4 y σ2 = (1/4, 3/4, 0)

Nota: Es evidente que de este modo también se resuelven los juegos m × 2.

You might also like