You are on page 1of 17

Teoría de Juegos.

Apuntes de Clase Juan Escobar

La teoría de juegos se trata de modelar decisiones estratégicas, es decir, decisiones donde se


consideran las motivaciones de los demás jugadores. Se utiliza el supuesto de racionalidad, esto
es, se considera que los jugadores tienen objetivos definidos y en consideración de estos buscan
maximizar su utilidad.

Parte I. Juegos en Forma Normal (JFN)


Un JFN es un modelo estático definido como , donde (1) es el
conjunto de los jugadores, (2) es el conjunto de estrategias (acciones) para (y
S= el producto cruz de las acciones de todos los jugadores -perfil de
acciones-), (3) es la utilidad (o pago) definida para cada jugador. Si el perfil de acciones
es s=( ), la utilidad del jugador i es ; es decir, la utilidad depende de las
acciones de todos los jugadores, lo que implica que existen externalidades.
Idea. Jugadores deciden las acciones simultáneamente. Esto es equivalente a tomar
decisiones secuencialmente pero sin observar las acciones realizadas por los demás.
Notación. es un perfil de acciones = Ejemplo: Si
hay dos firmas eligiendo precios Si hay N firmas eligiendo precios

Ejemplo 1. Dilema del prisionero o juego de equipo. , = (Trabajar y


No Trabajar) y queda expresada en la siguiente matriz de pagos, donde en las filas se presentan
las acciones del jugador 1, en las columnas las del jugador 2, y en las casillas: los pagos del jugador
1, los pagos del jugador 2.
T NT La producción total corresponde a 4( ), donde es una
T 1,1 -1,2 indicatriz que toma un valor=1 si la condición del subíndice se cumple y 0 en
NT 2,-1 0,0 caso contrario. Además jugar T tiene un costo c(T)=3 para cada jugador I, y NT
no tiene costo(c(NT)=0). De este modo, la matriz de pago expresa la siguiente
función de utilidad: .
Ejemplo 2. Juego de Cournot. , = (Firmas eligen cantidad) y
, donde p es una función de demanda inversa con p'<0 (es
decreciente en ) y es una función de costos con '>0 (costos crecientes en ).
Ejemplo 3. Juego de Coordinación. , (Estadio y Opera). E O
queda expresada en la matriz de pagos de la derecha. Los pagos dan cuenta E 2,2 0,0
de que ambos quieren encontrarse, pero prefieren hacerlo en el estadio. O 0,0 1,1
Ejemplo 4. La Batalla de los sexos. ,
E O
(Estadio y Opera). queda expresada en la matriz de pagos de la
E 2,1 0,0
izquierda. Los pagos dan cuenta de que ambos quieren encontrarse, pero el
O 0,0 1,2 hombre prefiere hacerlo en el estadio y la mujer en la opera.

Estrategias Mixtas (EM)


Una estrategia mixta es una distribución de probabilidad sobre las estrategias puras.
Formalmente, una EM (un vector con tantos elementos como acciones tiene ) es tal que
. El espacio de las EM será . Nótese
que una estrategia pura es una EM con probabilidad=1 en una acción, es decir

Obs. se extiende a estrategias mixtas usando el criterio de utilidad esperada. Esto es,
, donde es un perfil de EM (donde cada componente da
cuenta de la estrategia mixta de un jugador) y .

Estrategias Dominadas
T NT Ejemplo 1. Dilema del prisionero. Si el jugador 1 cree que el jugador 2
T 1,1 -1,2 jugará T, él prefiere NT; si cree que va a NT, también prefiere NT. Por tanto bajo
NT 2,-1 0,0 ninguna creencia sobre la acción del rival T es óptimo.
Def. es estrictamente dominada para el jugador i si
.
Esto quiere decir que una estrategia está estrictamente dominada si, independiente de la
conjetura sobre la acción del rival, existe otra que le da mayor utilidad.
Ejemplo 1. Dilema del prisionero. T está dominada por NT. El resultado (NT,NT) está pareto
dominado por (T,T). (NT,NT) es un resultado no eficiente dado que ha externalidades que no
internalizan los jugadores: al jugar T aumento el pago del rival.
Ejemplo 5. Si el jugador 2 juega a, para el jugador 1 es óptimo jugar
a b c
A; si juega b, es óptimo jugar A y si juega c es óptimo jugar B. Si jugador
A 4,10 3,0 1,3
1 juega A, es óptimo para el jugador 2 jugar a, y si juega B es óptimo
B 0,0 2,10 10,3
jugar b. El jugador 1 no tiene estrategias estrictamente dominadas. Para
el jugador 2 c está dominada por , dado que
y que ; es decir, independiente de la decisión del
rival le da mayor utilidad que c.
Idea. Jugador racional motivado por maximizar su utilidad no usa estrategias dominadas.
Nota. En Equilibrio de Nash no se pone peso positivo en estrategias estrictamente dominadas.

Eliminación Iterada de Estrategias estrictamente dominantes (EIEED) y función de


mejor respuesta
a b Ejemplo 5. Dado que c está dominada por la mixta , por reconocimiento
A 4,10 3,0 común de la racionalidad el jugador 1 inferirá que el jugador 2 no jugará c, y
por ende el juego puede dibujarse como el de la izquierda.
B 0,0 2,10 a b
Eliminando c, B estará dominada por A para el jugador 1.
A 4,10 3,0
Por conocimiento común, el jugador 2 puede inferir que el jugador 1 no jugará
B, quedando el juego como el de la derecha, donde ahora, para el jugador 2, b está dominada por
a. La solución del juego es (A,a) suponiendo que racionalidad es conocimiento común.

El procedimiento anterior se llama EIEED, el cual usa el supuesto de conocimiento común de la


racionalidad (y del juego y de sus pagos) para eliminar iterativamente estrategias estrictamente
dominadas. Si al procedimiento sobrevive un solo perfil s*, s* es la solución de EIEED (o de
Dominancia).
Ejemplo 3. Juego de Coordinación. En el juego de coordinación, ninguna estrategia está
estrictamente dominada por lo que las estrategias que sobreviven a EIEED son
, es decir no entrega solución.
Ejemplo 6. Cournot lineal. , = (Firmas eligen cantidad). Los precios
son Los costos son =0 y
.
Def. Una función de mejor respuesta para i, indica la acción óptima de i en función de la acción
del rival. Formalmente: .
Ejemplo 6. Cournot lineal. La función de mejor respuesta es .
Lema. Si , todo y todo está dominado. De hecho,
está dominada por y por .
Caso . "Demostración Gráfica". Buscamos mostrar que
< . En primer lugar, por definición de mejor respuesta,
sabemos que -línea roja- tiene su máximo en . En segundo lugar, si
=(100 ) ; (100 ); -1<0. Esto indica que la utilidad
marginal de i cae al aumentar (esto nos permite dibujar la pendiente de -línea azul-).
También, notemos que en el caso de =(100 ) ; (100 )< 100
(dado ), por lo cual
tendrá mayor pendiente. Además, notemos que
si < , dado , el precio será mayor, y será
mayor la utilidad de la firma i, por eso
está más arriba que . Construyendo en
base a esto el gráfico, observamos que
< (que el punto 1 da
menos utilidad que el punto 2).
Obs. no necesariamente .
Caso . Demostración.
Tomamos y definimos
D( )= - . Queremos mostrar que D( )>0 .
>0 (1) (por definición de mejor respuesta).
D( )= -
(2).
Ejemplo 6. Cournot lineal. Aplicaremos el lema para hacer EIEED. . Por lema jugar
y -siendo cantidad de monopolio- están estrictamente
dominados por ende . Notemos que eliminamos las mismas estrategias para
ambos jugadores, lo cual se continúa realizando -por simetría- en las rondas siguientes. Luego,
jugar y está dominado, por ende
, donde son las estrategias no dominadas en la segunda ronda de
EIEED. Notemos que = . De forma general y
= Entonces la solución de EIEED=( .
Esto se puede mostrar gráficamente, donde q está en el
eje x, BR(q) en el eje y, y se dibuja la identidad (recta de 45°
que pasa por el origen), para poder proyectar los valores de
q del eje y al eje x. El siguiente paso es dibujar la función de
BR, dado , cuando q=0, BR=50
y cuando q=100, BR=0, por ende BR es la recta que va desde
(0,50) a (100,0) en el gráfico. Usamos la identidad para
proyectar el 50 del eje y al eje x. Esto nos indica que en
equilibrio q estará entre 0 y 50-tramo azul- (Gráfico A).
Ahora usando la BR dibujada buscamos en el eje y
BR(50) (punto verde). Luego proyecto este valor desde el eje y al eje x, usando la identidad.
Entonces ahora sabemos que q estará entre BR(50) y 50 -tramo azul- (gráfico B).
Ahora buscamos la BR(BR(50)) en el eje y (punto naranjo), y lo proyecto nuevamente al eje x
usando la identidad. Entonces ahora sabemos que q estará entre BR(50) y BR(BR(50)) -tramo azul-
(gráfico C). Repitiendo el proceso se converge a la solución q*=100/3.

Ejemplo 7. En el juego de la izquierda, c está dominada por d. Eliminando c, no hay


estrategias dominadas por puras para el jugador 1 ni para el 2.
a b c d Descartando c del juego, verificamos si d no está dominada por
A 4,10 3,0 1,3 2,6 la mixta . .
B 0,0 2,10 10,3 3,6 . Esta mixta no domina a d
(5<6). Las estrategias que sobreviven EIEED es .

Estrategias racionalizables
Dado que EIEED no siempre nos da una solución interesa buscar otros modos de definir
racionalidad. Se introducen las creencias, como historias que le den sentido a las estrategias del
agente.
Def. es 1-racionalizable si tal que: . Es
decir es 1-racionalizable si es mejor respuesta a alguna conjetura sobre el comportamiento de los
rivales.
Def. es k-racionalizable si es una mejor respuesta a alguna conjetura (mixta o pura)
sobre la estrategias de los rivales que son (k-1) racionalizables.
Def. es racionalizable si es k-racionalizable .
La definición de k-racionalizable y racionalizable utiliza el supuesto de conocimiento común de
la racionalidad.
Ejemplo 7. A es 1-racionalizable (A=BR(a)), a es 1-racionalizables (a=BR(A)), B es 1-
racionalizable (BR(c)=B y BR(d)=B), d es 1-racionalizable (BR(1/2,1/2)=d), pero c no es 1-
racionalizable (porque d es mejor a c siempre). Descartando c, todas son 2-racionalizables. Por
ende las estrategias racionalizables son y

Relación entre racionalizables y dominadas. es 1-racionalizable,


, y si es dominada
; por ende si es 1-racionalizable no está dominada.
Si es dominada, podemos reemplazar de la expresión anterior, por su esperanza:
. Entonces
existe un tq , lo cual contradice que es 1-racionalizable.
Proposición. Si I=2, y , es racionalizable ssi no es estrategia dominada. Estos
resultados indican que los agentes no pueden llegar muy lejos por introspección. Demostración :
Sean dos jugadores I=(i,j). Supongamos que no está dominada, luego
(si no estaría dominada por ). Definimos para un vector
(vector de todas las utilidades de las estrategias mixtas dejando fija
- solo varía ). Definimos el conjunto V=
; el cual es convexo y
compacto, y
. Notemos que del
conjunto, si no indicaría que otra estrategia daría mayor utilidad
(y la dominaría). En algún momento para algún si:
siempre puedo encontrar un plano separador que separe
del resto. ,
tq
.
Esto implica que existe es racionalizable.

Nota. Estrategias racionalizables son exactamente las que sobreviven a EIEED cuando I=2. Por
tanto, conocimiento común de racionalidad no permite resolver muchos juegos.

Equilibrio de Nash (EN)


EIEED o racionabilidad no siempre entregan una solución. Para eso se usa el equilibrio de Nash
el cual busca poner consistencia entre creencias y acciones de los agentes.
Def. Un perfil es un EN si, . Esta definición
tiene 2 implicancias: (1) jugadores racionales maximizan sus utilidades, dadas las creencias acerca
del rival - -i jugará -, (2) las creencias son consistentes con las acciones (se realizan).
Ejemplo 1. Dilema del prisionero. Para verificar si un perfil es EN se puede verificar que no
haya incentivos unilaterales al desvío (fijando la acción del rival). Por esto (T,T) no es EN: hay
incentivo a desviarte a NT. (NT,NT) es EN: no hay incentivos unilaterales al desvío.
Ejemplo 3. Juego de Coordinación. son las estrategias racionalizables. Acá no
hay requerimiento de consistencia entre acciones y creencias. Notamos que (E,O) no es EN: ambos
tienen incentivos al desvío, (E,E) y (O,O) son EN, dado que no hay incentivo unilaterales al desvío.
Ejemplo 6. Cournot lineal. , = (Firmas eligen cantidad). Los precios
son Los costos son =0 y .
EN es el perfil
. Podemos graficar las curvas de mejor respuesta BR y ubicar el EN que
corresponde a la intersección de ambas. Notamos que cuando y
, por ende la recta BR del jugador 1 va desde (0,50) hasta (100,0),
considerando que va en el eje x. A su vez dado que está en el eje y, la recta BR del jugador 2
va desde el punto (0,100) hasta (50,0). La intersección está en (100/3, 100/3). El único EN coincide
con la solución de EIEED.
Lema. . Dem.
Por definición de EN, es mejor respuesta a
.
Ejemplo 8. Bertrand con productos homogéneos. n firmas seleccionan precios .
Consumidores compran a la firma que anuncia menor precio, y en caso de empate las firmas se
reparten la demanda. La cantidad comprada Q(p) es función del menor precio. Suponemos Q( )
decreciente y continua. Firmas tienen costos marginales c (esto implica retornos constantes a

escala). .

Solución. Si p* es EN . Esta es la paradoja de Bertrand porque el resultado


es equivalente a competencia perfecta.. Dem. Denotaremos Digamos que
ordenamos los precios de modo que , por tanto . Paso 1: Demostrar
que . Si no fuese así, la firma 1 tendría pérdidas y preferiría fijar precio=c. . Paso 2:
Demostrar que . Si no fuese así, . Si y , la firma 2 está teniendo
utilidad 0 (no vende) por lo que puede desviarse a precio y obtener utilidad >0. Si y

, las firmas 1 y 2 obtienen utilidad , con desigualdad estricta si hay otras


firmas jugando ; por tanto las firmas 1 o 2 pueden fijar y obtener utilidad=Q(

> , por ende hay incentivos unilaterales al desvío.


Por ejemplo, si hay 2 firmas jugando p=c, y la tercera tiene p>c, si baja su precio a p=c, sigue
teniendo utilidad 0, por ende no tiene incentivos unilaterales al desvío.
Nota. p* es EN ssi . Si solo una firma jugara
p=c, podría subir su precio, y aumentar su utilidad.
Nota. Este resultado se obtiene sin supuesto de elasticidad de q, esto porque la demanda
residual (de 1 firma) es muy elástica, es decir, baja un poco el precio, y cambia mucho. Además el
resultado se sostiene en que hay productos homogéneos, retornos constantes a escala, simetría
(iguales costos marginales) y no colusión.
Teorema [Existencia]. Si es convexo y compacto, es
cuasicóncava en (esto equivale a que la función de mejor respuesta tiene valores convexos) y
continua en s , existe un EN (en estrategias puras). Obs. Esto no aplica a juegos discretos o con
estrategias finitas dado que las acciones no forman un conjunto convexo. Tampoco aplica en
juegos tipo Bertrand. En el caso de Bertrand el conjunto de acciones No es compacto y la función
no es continua porque ante un empate, si varío en el precio, la utilidad varía mucho.
Conceptos relevantes para la demostración del teorema. (i) cuasiconcavidad: Una función f:
es cuasicóncava si
Si f es cóncava entonces f es cuasicóncava.
(ii) hemi-continuidad superior (HCS): Una correspondencia F:x y es HCS si:
. Si la correspondencia es una función, HCS=continuidad. El Gráfico
A muestra una correspondencia HCS porque el conjunto es cerrado: cada punto del grafo tiene
como límite un punto del grafo. El gráfico B muestra una correspondencia no HCS porque los
puntos >1/2 no convergen en el conjunto.
. El gráfico C muestra
otro ejemplo HCS.
(iii) convexidad: F:x y
tiene valores convexos si
es un conjunto
convexo. Ejemplo A y B tienen
valores convexos. El Ejemplo C
no tiene valores convexos.
(iv) Teorema de puntos fijo
de Kakutani: siendo X convexo y compacto, F:x X con valores no vacíos, convexos y HCS;
entonces . Esto garantiza la existencia
de un punto fijo si fuese función y
para correspondencias en general. El
teorema garantiza que la correspondencia cruce la
diagonal en el gráfico. Graficamos 2 ejemplos con
X , ninguno cruza la diagonal, en el caso D
porque la correspondencia no es convexa, en el caso
E porque no es HCS.
Dem. Definimos para cada , para cada .
Sea BR: , BR(s)= . Un perfil es EN ssi . Usaremos el teorema
de Kakutani. En primer lugar S es convexo y compacto (cada es convexo y compacto, por ende
su producto también).
En segundo lugar es convexo y no vacío (porque por continuidad y convexidad, toda
función tiene un máximo, y por ende un argumento máximo; además si la función es cuasi-
cóncava, el conjunto de puntos que alcanzan el máximo es convexo). Verificamos la convexidad:
Sea , buscamos que .
Sabemos que el Min .
En tercer lugar es HCS: ,
Esto se demuestra por la continuidad de la función de utilidad y el teorema del máximo.
Este último plantea que en un problema de maximización de una función continua, modificar un
parámetro-la estrategia del rival en este caso- cambia continuamente la solución. Supongamos
. Por continuidad de cuando
, y . Por ende, para n
suficientemente grande, .
Luego, por Kakutani, existe s* tq y s* es EN.
Ejemplo 9. Cournot. firmas, = . Los costos son son no-
decrecientes, =0y P( ) estrictamente decreciente. .
Verificaremos la existencia de EN. Notemos que = no es compacto, pero sabemos que
cantidades muy grandes están dominadas por q=0 y por ende no se jugaran, es decir:
. Sea , .
por tanto tomamos obteniendo un conjunto convexo y compacto. En segundo lugar,
dado que p y son continuos, es continua en . En tercer lugar para que sea cuasi-
cóncava basta con que sea cóncava. Para que sea cóncava imponemos: convexos (lo que
implica que - es cóncavo) -retornos decrecientes a escala- y P cóncava; dado que la suma de
cóncavos es cóncava, con esto es cóncava. Por teorema, existe q* que es EN.
Lema. Suponemos precios y costos diferenciables. Sea q* un EN tq para algún i,
P(Q*)>Max , con . Idea. EN en Cournot no coincide con
competencia perfecta (costo marginal=precio). Dem. Para por CPO,
, dado que P es estrictamente
decreciente .
Ineficiencias en Cournot. En el EN de Cournot hay dos ineficiencias: (1) Ineficiencia asignativa:
P> costo marginal, esto implica que se produce menos de lo que se podría -hay demanda
insatisfecha-; (2) Ineficiencia productiva: se trata de producir de modo eficiente -a costo mínimo-.
Una condición necesaria para que se produzca a costo mínimo es que todos los que produzcan
tengan iguales costos marginales (sino debiera reasignarse la producción para que produjera más
el más eficiente). Es decir, si Q* se produce de modo eficiente,
. Pero esto no sucede: la firma manipula precios porque no internaliza en el efecto en sus rivales.
Tomando la CPO para i y para j:
. Restando ambas: . por ende su ,
.
En el caso de n firmas tal que , en EN simétrico se tiene que
Reemplazando en

. Si está acotado . Es
decir, el precio converge al costo marginal, lo que implica que la ineficiencia asignativa tiende a
desaparecer. Es decir al aumentar el número de firmas se converge a competencia perfecta.

Equilibrio de Nash en Estrategias Mixtas (ENEM)


Dado un JFN , con finito, la extensión mixta del juego es
. Es decir, el espacio de acciones corresponde al espacio de estrategas
mixtas . Para , donde
, donde , es una EM para i.
Def. es un ENEM para si es un EN de su extensión mixta.
Lema. Sea , con finito , es un ENEM ssi
ssi .
Corolario. Si es un ENEM entonces tq si >0 se tiene
que .
C S Ejemplo 10. Matching Pennies. No siempre existe un EN en estrategias
C 1,-1 -1,1 puras, como en este caso. Definimos y
S -1,1 1,-1 . Utilizando corolario se tiene que en ENEM:

. Por Simetría,
Ejemplo 11. Competencia de Bertrand con restricciones de capacidad. Dos firmas, cada una
con una capacidad k y costos . Hay un solo comprador con demanda Q tal que k<Q<2k. Las firmas
anuncian precios, el comprador compra k de la firma más barata (si el precio es menor que su
valoración) y compra Q-L de la otra (si este precio es menor que su valoración). Los costos son
. La demanda del comprador es Q(p) . Notemos que si K>Q
no hay restricciones de capacidad. Las utilidades de las firmas son:

Buscamos EN en Puras p*=( . (i) Caso 1: : la firma j puede fijar un precio


y aumentar sus utilidades (no es EN). (ii) Caso 2: : la firma i o la j puede fijar
precio y aumentar sus utilidades (no es EN). (iii) Caso 3: : la firma i o la j
puede aumentar su precio, disminuir la cantidad que vende, pero obteniendo un margen que le da
utilidades positivas. .
Buscamos un ENEM. Nos restringiremos a F continua con soporte [a,v] con a>0 por ser
determinado, donde el soporte es el conjunto más pequeño que tiene probabilidad =1 de ser
jugado. Esto implica que no hay empate en precios (ocurre con probabilidad =0). Dado ,
(Ecuación 1) , donde c es una constante. Es decir, en el soporte se tiene la misma utilidad.
Despejando en la ecuación 1 se obtiene (Ecuación 2). Además, imponemos 2
condiciones: (1) F(v)=1 y (2) F(a)=0. Reemplazamos p por v en la ecuación 2, obtenemos:
, reemplazando
F(v)=1, . Dado que sabemos que c es constante en el
soporte, reemplazamos c en la ecuación 2:
(Ecuación 3). Ahora
evaluamos la ecuación 3 en a y la igualamos en a (por la condición (2)), para encontrar a.

.
Con esto tenemos que el jugador
pondría peso 0 en estrategias menores a a,
y pondría peso positivo en estrategias
entre a y v, de modo que F se vería como
en el gráfico. Pero la indiferencia entre las
acciones del soporte es condición
necesaria pero no suficiente para ENEM, es necesario verificar que
utilizando esta estrategia mixta se tenga mayor utilidad en el soporte que fuera de él. Es decir, la
utilidad debe verse como en el gráfico.
Analizaremos por casos utilizando estática comparativa. (1) Caso : los precios serán
más altos porque cada firma tiene virtualmente K
asegurado. Más formalmente .
(2) Caso : quien tiene mayor precio no
vende, lo que genera compentencia más intensa
. Es decir las firmas
tienden a poner todo el peso en jugar 0. Los
resultados se parecen al Bertrand clásico.

Estrategias débilmente dominadas (EDD)


Def. es EDD si tal que con desigualdad
estricta para algún .
Existen EN que incorporan EED, por ejemplo Bertrand-homogéneo. Dado esto la eliminación
iterada de estrategias débilmente dominadas puede eliminar un EN.
Ejemplo 12. Bertrand con productos homogéneos. n firmas seleccionan precios .
Hay demanda unitaria: 1 consumidor compra a la firma que anuncia menor precio, y en caso de
empate se sortea. Firmas tienen costos marginales c . Notemos que p'<c está débilmente
dominada por p''=c. Fijando p'<0 obtengo utilidades ≤0 (con desigualdad estricta si el otro juega
p'=c), u con p''=c, tengo utilidades ≥0. Por otro lado p'=c está débilmente dominado por p''=c+ .
Por ende vemos que el EN puede involucrar estrategias débilmente dominadas.
Las ED se utilizan para refinar EN cuando hay muchos.
Ejemplo 13. Bertrand con productos homogéneos. n firmas seleccionan precios .
Hay demanda unitaria: 1 consumidor compra a la firma que anuncia menor precio, y en caso de
empate se sortea. Firmas tienen costos marginales . Cuando definimos p , no hay EN
en estrategias puras. Una alternativa es modelar el juego con . Existen EN
con y . Consideremos el caso: y .
Si la firma 2 disminuye su precio recibe utilidad , si la firma 1 aumenta su precio, disminuye su
utilidad: ( . Esto se da porque . Hay por ende
multiplicidad de EN en el juego. utilizando el criterio de las EDD se pueden eliminar los EN en
estrategias puras menos razonables. Por el análisis realizado sin discretizar el juego, sabemos que
están DD, por ende EN que no involucra EDD es y

Parte II. Juegos con Información Incompleta (JII)


Se trata de modelar situaciones donde al menos uno de los jugadores desconoce las
motivaciones del rival; es decir, cada jugador tiene información privada. Por ejemplo un
comprador desconoce la calidad del bien, firmas tienen como información privada sus costos,
jugadores tienen información privada de sus creencias, etc.
Def. Un JII es un juego donde hay (1) un conjunto de jugadores , (2) estrategias
para cada i, (3) un conjunto de tipos de i (información privada) , (4) una distribución de
probabilidad p sobre = , y (5) Utilidades para cada i.
Ejemplo 14. Bertrand con costos privados. El juego esta caracterizado por: (1) n=2; (2)
, (3) (costos marginales de las firmas), (4) independiente de ,

(5) .

El juego consiste en los siguientes pasos: (1) Se realiza de acuerdo a una distribución p, (2)
Jugador i conoce (pero no ; desde el comienzo conoce distribución p), (3) jugador i
decide , (4) Se realizan los pagos .
Def. Una estrategia para i es una función que a cada tipo i le asigna una acción. Es decir una
estrategia para i es . Nótese que no es dado que no conoce el tipo del rival
( ).
Dado , . Si es el conjunto de estrategias
(puras) para i, tenemos un JFN , donde el Equilibrio Bayesiano (EB) es el EN de
ese juego.
Def. es EB si es EN del juego .
Def. Un EB es un perfil de estrategias donde cada jugador juega óptimamente dada la
información privada que tiene (dado su tipo). es EB si , es el argumento
máximo del problema:

La Primera definición corresponde a maximizar utilidad considerando la esperanza de mi tipo,


y la segunda, corresponde a, dado mi tipo, maximizar la utilidad esperada.
Prop. Supongamos , entonces las definiciones son equivalentes. Obs. Salvo tecnicidades,
el resultado se tiene si no es finito.
Ejemplo 15. n=1. En base a la definición 1, . En
base a la definición 2, . Por optimalidad, para maximizar la
primera utilidad, se debe estar maximizando para cada tipo, y viceversa; esto hace ambas
definiciones equivalentes.
Ejemplo 16. Licitación primer precio. n=2. Cada participante valora el bien en lo cual es
información privada de i. son iid de acuerdo a F:[0,1] [0,1], con F continua y estrictamente
creciente. Los participantes ofrecen , gana la mejor oferta y el ganador paga su oferta. La
utilidad es función del perfil de tipos y del perfil de ofertas:
Es posible notar que los pagos de i no dependen directamente de , pero si indirectamente,
dado que incide en .
Buscamos un EB simétrico (la simetría no implica iguales ofertas, dado que
tienen diferentes tipos), estrictamente crecientes y diferenciables. será la oferta del rival.

Notemos que en la utilidad hay probabilidades porque es desconocido. Además, dado


estrictamente crecientes, tiene inversa.

Por ser una variable continua,

En EB .
En este juego existe un trade-off entre: aumentar la probabilidad de ganar subiendo la oferta y
aumentar lo que se gana, en caso de ganar, bajando la oferta.
El jugador resuelve:
CPO =0.
Nótese que se usó regla de la cadena y derivada de la inversa para el último término. Además,
dado que buscamos un equilibrio simétrico se usa . Dado que
, tenemos que:

(EDO)
Para resolver la Ecuación diferencial ordinaria (EDO) se usa la condición de borde
Supongamos ahora que F es uniforme [0,1] tal que F(v)=v. Entonces tenemos que:

.
Este resultado muestra (y también se obtiene de forma más general) que en equilibrio
los agentes ofertan menos de su valoración para ganar algo en caso de llevarse el
bien. Además muestra que el equilibrio es eficiente en tanto se lleva el bien quien lo valora más
(que es a quien se le asignaría en caso de que hubiese un planificador central).
Además, cuando la licitación se realiza, potencialmente los jugadores se arrepienten ya que
podrían haber ganado más ofertando menos. Esto ya que al conocer las apuestas de los otros
conocen las valoraciones, información que no tenían al momento de jugar.
Ejemplo 17. El problema de los limones. Dos jugadores: un vendedor y un comprador. El
vendedor tiene un auto de calidad . El vendedor conoce la calidad, pero el comprador no.
El comprador cree que . Los jugadores simultáneamente escogen precios (precio
del vendedor y precio del comprador, respectivamente), con Si hay
transacción a precio . Si no, no hay transacción. Los pagos del vendedor y del comprador serán
respectivamente: , . Notamos
que el comprador valora el auto más que el vendedor, por ende es eficiente que se realice la
compra.
Para el comprador es estrategia óptima. Si oferta mayor precio deja a
compradores fuera, disminuyendo las transacciones posibles. Esto es distinto de las licitaciones,
dado que al aumentar el precio el vendedor, no altera el precio del intercambio ( ), si no solo las
posibilidades de transacción.
Para el comprador , dado que solo si , hay transacción. Esto
implica, que solo hay transacción si , por ende
. Dado que solo hay transacción si , solo hay transacción si el auto es malo, por
ende, para protegerse de la maldición del ganador el comprador ofrece precio 0 y no hay
transacción.

Purificación de Harsanyi
Ejemplo 4. La Batalla de los sexos. Sabemos que hay 2 EN en estrategias
E O puras: (E,E), (O,O). Buscamos ENEM. Si el jugador juega , el
E 2,1 0,0 jugador 1 juega una mixta con peso positivo en ambas estrategias ssi:
O 0,0 1,2
Análogamente se deduce que Por tanto [( ) ,( ),] es un ENEM.
Intuitivamente resulta extraño pensar que estando alguien indiferente juegue exactamente
con dichas probabilidades, y se desconoce la fuente de aleatoriedaded de las estrategias mixtas.
Harsanyi plantea que las estrategias de los ENEM pueden ser
E O reinterpretadas como modelos de información incompleta. En el
E 2+ ,1+ ,0 ejemplo a los pagos del estadio se le agrega un shock( )>0 pequeño
O 0, 1,2 multiplicado por información privada .
Buscamos un EB con estrategias . No buscamos EB simétricos dado que el
juego no es simétrico. .
0 . Dado lo anterior, el jugador 1 preferirá jugar E
sobre E ssi:

. Notemos que a mayor , más atractivo se hace


ir al estadio, de modo que las estrategias de EB serán de tipo cut-off. ,
donde debe ser encontrado. Notemos que sucede con probabilidad=0, por ende habrá
preferencias estrictas sobre una u otra estrategia.
Definimos , como la probabilidad de que i juegue E. Usando esto y la ecuación
(1); el jugador 1 jugará E, ssi . Esto implica que

. Siguiendo los mismos pasos para el jugador 2 se tiene que .


Resolviendo el sistema de ecuaciones se tiene que: y . Cuando ,
y Es decir, convergen a las estrategias mixtas del ENEM del juego con información
completa. De este modo las estrategias mixtas se interpretan de modo que (1) la fuente de la
aleatoriedad es la información privada y (2) no hay indiferencia entre las estrategias puras, si no
incentivos estrictos para preferir una.

Parte III. Juegos en forma extensiva (JFE)


Los JFE pretenden modelar la dinámica de la toma de decisiones. Los
E elementos del juego son: (1) Jugadores, (2) quién mueve en qué
momento y cuáles son sus alternativas, (3) qué sabe cada jugador al
NE E
momento de decidir, (4) pagos.
I Ejemplo 18. Entrante e Incumbente. Una firma entrante (E), decide
G A si entrar o no entrar (E y NE respectivamente) a un mercado. La
firma incumbente (I), pude hacer guerra de precios (G) o
acomodarse (A). E mueve primero, I mueve solo si E entro. Los
pagos son un vector para cada nodo terminal donde el primer
componente indica el pago del jugador 1, y el segundo el del 2.
1 momento de decidir, (4) pagos.
qH Ejemplo 19. Stackelberg. Dos firmas eligen cantidades , con
qL
. La firma 1 elige primero, la firma 2 observa la jugada y
2 2
luego elige su cantidad. Dado un nodo terminal
qL qL q L q H .
Def. Un JFE (finito) es (1) un conjunto de jugadores i= , (2)
un conjunto de nodos X (finito) que forman un árbol, (3) un conjunto
de nodos terminales (es donde el juego se acaba; son nodos con 1
conexión -grado1-) , (4) función de pagos que a cada nodo
terminal, y a cada jugador, le asigna un real: .
(5) Para cada X : (5.1) i(X): identidad de jugador que mueve en X; (5.2) A(x): acciones
factibles que tiene el jugador que mueve (i(x)); (5.3) n(X,a): dado , el nodo sucesor (el
nodo al que llega i(X) al jugar a); (5.4) una partición de información: h(x) denota el conjunto
de nodos que i(X) no puede distinguir.
Usamos i(h) para denotar el jugador que juega en el conjunto de información h. es el conjunto
de conjuntos de información donde i mueve: .
Generalmente, identificaremos a los nodos por la historia de decisiones que nos llevan a él.
Obs. Los juegos de información incompleta pueden ser modelados como JFE donde la
naturaleza juega inicialmente determinando los "tipos", de los jugadores.
Def. Una estrategia Pura para i es un plan de acciones ante toda posible contingencia.
Formalmente es (a cada conjunto de información donde mueve le asigna una
acción factible=, con (tal que pueda jugar la acción prescrita en el nodo
asignado). es el conjunto de estrategias para i. Definimos un perfil de estrategias s=
. z(s) es el nodo terminal resultante de jugar dicho perfil de estrategias. Definimos
(s)= (z(s)). Considerando esto, es la representación en forma normal del
JFE.
Idea. La estrategia prescribe comportamiento en toda posible contingencia.
Ejemplo 20. Los dibujos muestran dos versiones de Matching Pennies. |X|=7 en ambas
versiones. En la versión 1, h(c)=c, y en la versión 2, h(c)=h(s)={c,s}. En la versión 1,
en la versión 2, En la versión 1,
(ej. . En la versión 1,
Versión 1 Versión 2
1 1
C S S
C
2 2 2
2
C C S C S
S C

Ejemplo 21. Stackelberg continuo. En los juegos de acciones continuas, se dibuja un arco. Se
diferencia de Courtnot en que en este último caso el jugador 2 no observa lo que hizo el 1.
Stackelberg Cournot
1 1

2 2

Def. Una Estrategia Mixta para i es . La idea es que se distribuyen probabilidades


respecto a planes de estrategias.
Def. Una Estrategia de comportamiento es , con asignando peso positivo
solo en A(h) . La idea es que en cada historia, se distribuyen probabilidades respecto acciones.
Ejemplo 22. En el juego de la izquierda. es una
estrategia mixta y , es una estrategia de
comportamiento. Ambas inducen a
igual distribución de probabilidades de
los nodo terminales (1/2, 0, 1/2).
Teo[Kuhn]. Muestra que en juegos
con perfect recall, las estrategias mixtas y de
comportamiento son equivalentes.
Ejemplo 23. En este juego h(A)=h(B)={A,B}.
EN y Equilibrio Perfecto en el Subjuego (EPS)
Def. S*= es EN del JFE si es EN de su representación como JFN. Esta definición
captura EN que no necesariamente se capturan en la realidad. Por ejemplo, amenazas no creíbles.
G A Ejemplo 18. Juego del entrante y el incumbente. En este ejemplo,
E -1,-1 1,2 y . Si dibujamos su versión como JFN hay dos EN (NE,G)
NE 0,2 0,2 y (E,A), donde el primero de ellos incluye la amenaza no creíble, de que si el
entrante entra, el incumbente le hará la guerra.
Def. Sea G un JFE, un subjuego G' de G consiste en (i) Y formado por un único nodo no
terminal "y" y todos sus sucesores, con la propiedad de que si y , y tengo y' . (ii)
conjuntos de información, acciones factibles, etc. (tal como se define G).
En los grafos, tenemos que el 1 tiene 3 subjuegos (en azul), el 2 tiene 1 subjuego (el juego
completo) ya que el sector marcado en rojo no es un subjuego porque el conjunto de información
inicial no es singleton, y el 3 tiene 2 subjuegos (en azul) ya que el sector marcado en rojo no es
subjuego porque no se contienen todas las historias posteriores al nodo inicial.

Ejemplo 24. Juego en 2 etapas. Este juego tiene 5


subjuegos.
Def. s* es un EPS si induce un EN en cada
subjuego. Es decir, se debe estar jugando el óptimo en
cada posible contingencia (aunque nunca se llegue a
ella). Obs. s* es un EPS implica que es EN.
Ejemplo 18. Juego del entrante y el incumbente.
Aquí (E,A) es EPS, pero (NE,G) no es EPS.
Ejemplo 24. Juego lider-seguidor (tipo Stackelberg). En t=1, la firma 1 escoge ; en t=2, la
firma 2 observa y escoge . Hay precios P( )=1-( ). Las firmas reciben pagos
. Los supuestos son: (1) externalidades negativas

(2) los bienes son sustitutos Un EPS en este juego se define:


tal que, .
Sea el EN del juego de movidas simultáneas. Se tiene que:
. Si el jugador 1 juega , se asegura También se tiene
que .
Lema. es una función decreciente en , dado que los bienes son sustitutos, si el
jugador 1 aumenta , entonces el jugador 2 disminuye .
La CPO del problema es . Se tiene que:

. Entonces, , donde ,
y . Con esto se concluye que
.
Ejemplo 25. Inconsistencia Temporal. El modelo clásico de decisión intertemporal no genera
inconsistencias dinámicas. Por ejemplo: al comienzo el jugador resuelve
2 ( 3) SA 1+ 2 . Considerando = , =0,5. Tendríamos, 1≈76, 2≈ 9 3≈ .
Luego, en T=2 resuelve , , ≈ 9 ≈
Para reflejar la inconsistencia temporal se asume un descuento hiperbólico: hay un factor de
descuento entre periodos, y un factor de descuento que afecta a cualquier consumo futuro
por igual. Aquí se tiene que en el primer periodo se maximiza utilidad
. En el tiempo 2, el agente busca maximizar . Considerando
, en el tiempo 1 la respuesta optima es , pero cuando resuelve
en t=2, Max , entonces se tiene y .
Hay dos aproximaciones al problema (1) el consumidor es naive/ingenuo, y no se da cuenta de
su inconsistencia dinámica (ejemplo previo), o (2) el consumidor es sofisticado, y entiende que
mañana sus preferencias serán distintas y se anticipa a ello. Buscamos EPS de este segundo caso.
Se puede modelar como si el jugador del tiempo 1 fuese distinto del jugador 2, al tener distintas
preferencias.
En el tiempo 2, el jugador 1 (t=2) decide, dado , el valor de . Para ello resuelve
SA El resultado es
. Esto es EN del subjuego (después de que el jugador 1 (t=1) decidió ). Luego, en
t=1, un jugador sofisticado sabe cuáles serán y lo considera al decidir. Con
, en el primer periodo resuelve, .
Resolviendo esto se llega a que, 6 6 6 . El EPS es 6
(implica un plan ante toda posible contingencia).
Ejemplos de aplicación del problema de inconsistencia temporal son (1) los planes de gimnasio
con alto precio fijo y bajo variable: esto sirve para que un jugador sofisticado pueda liberar de
carga al yo futuro, (2) la procastinación: existen páginas web que cobran por meterse a internet
(un jugador sofisticado puede anticiparse a que querrá procastinar y contratar a dicha página). A
su vez, modelos como esto justifican la obligación a ahorrar. Al jugador 1 de t=1 le gustaría verse
obligado a ahorrar porque en t=2 querrá consumir. En el modelo
estándar de elección racional, las restricciones solo restan utilidad,
pero acá el jugador 1 podría beneficiarse; desde un punto de vista
normativo el jugador 1(t=1) valoraría la restricción.
Def. Un JFE es de información perfecta si cada conjunto de
información es un singleton.
Teo. [Zermelo]. Un JFE finito de información perfecta tiene un EPS
(tiene un En que es EPS. Los EPS por definición son EN).
Demostración. Se mostrará por inducción reversa, es decir ir
encontrando los EN de los subjuegos que ocurren al final, hasta el
subjuego que incluye todo el juego.
Sea L el largo del juego, es decir el camino más largo desde el nodo inicial. Si L=1, estamos en
el problema de decisión de un agente con un numero finito de acciones. Este tiene un EN que es
EPS, por definición. Supongamos que cualquier juego de tiene EN. Argumentaremos
que cualquier juego de L=n+1 también tiene EN: Sea jugador 1 quien mueve en el nodo inicial y
sea A( ) su conjunto de decisiones, para a cada a , el subjuego con nodo inicial a posee EN
. Sea el pago que recibe i en el EN asociado a . Construimos un EN del juego
completo : el jugador 1 elige a* en el nodo inicial. En cualquier (nodo no
inicial ni terminal) , i(x) escoge de acuerdo a , donde es la única
acción tomada en el nodo inicial. es EN: (1) i≠1 no quiere desviarse porque no puede obtener
mayor utilidad (prescribe EN en cada subjuego) ; (2) i=1 tampoco. Sea estrategia que le da pago
. Sea la acción tomada por el jugador 1 en el nodo inicial,
, donde es el pago por jugar optimo en el subjuego de . Esto es lo que se
conoce como inducción reversa. Dado que la construcción también aplica a los subjuegos, es
EPS.
Idea. La inducción reversa aplica a juegos de información imperfecta. Se identifican subjuegos
terminales y se impone EN.
Ejemplo 26. Ciempiés. En este juego con cada avance se
duplica el dinero a repartir, pero cambia quien se queda con
la fracción pequeña y quien con la grande. El EPS es parar
siempre. La evidencia empírica muestra que se sigue
bastante.