Professional Documents
Culture Documents
Elemente de
teoria jocurilor
ANUL II Semestrul IV
1
Cluj-Napoca 2013
Cuprins
TEME DE CONTROL 61
TEME DE CONTROL 84
TEME DE CONTROL 94
2
UNIVERSITATEA „BABEŞ-BOLYAI” CLUJ-NAPOCA
SEMESTRUL: IV
I. Informaţii generale
Telefon: 0264-418653
Fax: 0264-412570
E-mail: anton.muresan@econ.ubbcluj.ro
Anul II Semestrul IV
3
Locul de desfăşurare a cursului: Clădirea Campus, săli etajul II
Descrierea cursului :
4
Materiale bibliografice obligatorii:
1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2, ed.
Promedia Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press,
Prenceton, New Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed.
Transilvania Press, Cluj-Napoca, 1996
5. Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca, 1997
Studentii cu dizabilitati:
6
I. Suportul de curs propriu-zis
Modulul 1
Obiective:
c. notiunea de solutie
Rezultate aşteptate:
Obiective:
CONŢINUTUL UNITĂŢII
Există situaţii în care modelele matematice la care se ajunge se prezintă sub forma
unor jocuri matriciale. Asa sunt, de exemplu, acelea in care 2 sau mai
1 (capul) 1 -1
2 (pajura) -1 1
De asemenea, ele pot fi scrise in matricele de castig pentru cei doi jucatori:
1 − 1 − 1 1
H1 = , H2 =
− 1 1 1 − 1
Spunem ca fiecare jucator are doua strategii (actiuni, mutari, decizii). In matricea
H1 prima linie reprezinta prima strategie a jucatorului 1, a doua linie reprezinta a
8
doua strategie a jucatorului 1. Daca jucatorul 1 alege strategia 1, inseamna ca
moneda sa arata capul deasupra. Strategia 2 inseamna pajura deasupra. Similar,
prima si a doua second coloana a matricei H1 corespunde respectiv la prima si a
doua strategie a jucatorului 2. In H 2 avem aceleasi situatii, dar pentru jucatorul 2.
Observatia 1.1. Acest ansamblu de “concurs” (competitie) este un joc de doua
persoane cu suma nula (zero). Simplu spunand, un joc este o multime de reguli
in care se precizeaza intregul process de competitie (sau concurs), incluzand
jucatorii, strategiile, si castigurile (rezultatele) dupa fiecare jucare a jocului. Toate
acestea sunt descrise complet.
Observatia 1.2. Datele (elementele) din tabelul de mai sus formeaza o matrice
de castig (payoff matrix a jucatorului 1, adica H1 ). Matricea H 2 este matricea
de castig a jucatorului 2, si avem
H1 H t2 O2 ,
9
Jucătorul 2
1 2 3
Jucătorul 1 1 0 -1 1
2 1 0 -1
3 -1 1 0
Avem H1 = H 2 si H1 + H 2t = O3 .
Exemplul 1.3. Consideram jocul de doua personae cu suma nula pentru care
matricea de castig este data in urmatorul tabel:
Jucătorul 2
q 0 1 2
Jucătorul 1 0 0 1 4
1 -1 2 7
2 -4 1 8
3 -9 -2 7
In fiecare din exemplele de mai sus exista doi jucatori, anume jucatorul 1 si
jucatorul 2, si o matrice de castig, H1 (exista de asemenea si matricea H 2 asa ca
H1 + H 2t = 0 ). Fiecare jucator are mai multe strategii. Strategiile jucatorului 1 sunt
reprezentate de liniile matricei de castig H1 , si acelea ale jucatorului 2 de
coloanele matricei de castig H1 . (Strategiile jucatorului 2 sunt reprezentate de
liniile matricei de castig H 2 , si acelea ale jucatorului 1 de coloanele matricei de
castig H 2 ).
Jucatorul 1 alege o strategie din multimea strategiilor sale, si jucatorul 2,
independent, alege o strategie din multimea strategiilor sale. Dupa ce cele doua
alegeri au fost facute, jucatorul 2 plateste jucatorului 1 o valoare, care este castigul
corespunzator acestei situatii jucare a jocului. Aceasta valoare este reprezentata in
matricea de castig. Aceasta valoare poate fi pozitiva, 0, sau negativa. Daca castigul
este pozitiv, jucatorul 1 primeste o valoare pozitiva de la jucatorul 2, adica,
jucatorul 1 castiga o valoare de la jucatorul 2. Daca castigul este negativ, jucatorul
1 primeste o valoare negativa de la jucatorul 2, adica, jucatorul 1 pierde o valoare
catre jucatorul 2 (jucatorul 2 castiga o valoare de la jucatorul 1). Castigul
jucatorului 1 este egal cu pierderea jucatorului 2. Ce jucatorul 1 castiga este tocmai
ceea ce jucatorul 2 pierde, si vice versa. De aceea, un astfel de joc este numit un
joc cu suma zero (nula).
Jocuri matriciale
11
Definitia 1.1. Numim joc matricial jocul care este complet determinat de matricea
A de mai sus.
Sa rezolvam jocul, adica sa gasim solutia (ce castig maxim are jucatorul 1 si ce
startegii sunt alese de ambii jucatori pentru a obtine aceasta) examinam elementele
matricei A .
In acest joc, jucatorul 1 vrea sa obtina un castig aij cat mai mare posibil, in timp
ce jucatorul 2 va face alegerea sa cea mai buna si conduca la o valoare aij cat mai
mica posibil. Interesele celor doi jucatori sunt complet opuse (in conflict).
Daca jucatorul 1 alege strategia i el poate fi sigur ca va obtine cel putin castigul
min a ij . #
1 j n
max min a ij . #
1 i m 1 j n
Cu alte cuvinte, daca jucatorul 1 face cea mai buna alegere a sa, ceea ce obtine el
nu poate fi mai mic decat valoarea de mai sus.
Similar, daca jucatorul 2 alege strategia sa j , el va pierde cel mult
max a ij . #
1 i m
Dar, jucatorul 2 vrea sa-si minimizeze pierdearea sa, iar pentru asta va incerca sa
sa-si aleaga strategia sa j asa ca sa obtina minimul valorii de mai sus. Anume,
jucatorul 2 poate alege j asa incat pierderea sa sa fie nu mai mare decat
min max a ij . #
1 j n 1 i m
Asa, daca jucatorul 2 face cea mai buna alegere a sa, castigul pe care il obtine
jucatorul 1 nu poate fi mai mare decat valoarea de mai sus.
Am vazut ca jucatorul 1 poate alege strategia i care sa-I asigure un castig care sa
fie cel putin
12
v1 max min a ij ,
1 i m 1 j n
v2 min max a ij .
1 j n 1 i m
a ij ≤ max a ij , i = 1, m
1≤ j ≤ n
Deci inegalitatea
min a ij max a ij
1 j n 1 i m
adica,
min a ij v2.
1 j n
14
Daca egalitatea (7) are loc, atunci exista un i∗ si un j ∗ astfel incat
min ai ∗ j = max min aij = v,
1≤ j ≤ n 1≤ i ≤ m 1≤ j ≤ n
si
max aij ∗ = min max aij = v.
1≤ i ≤ m 1≤ j ≤ n 1≤ i ≤ m
Deci
min ai ∗ j = max aij ∗ .
1≤ j ≤ n 1≤ i ≤ m
Astfel
max aij ∗ = ai ∗ j ∗ = v = min ai ∗ j .
1≤ i ≤ m 1≤ j ≤ n
Observatia 1.8. Un joc matriceal poate avea mai mult decat un punct sa in
startegii pure. Totusi, castigurile la diferitele puncte sa sunt egale,. Valoarea lor
comuna fiind valoarea jocului.
15
Exemplul 1.4. Consideram jocul matrieal cu matricea de castig
4 3 6 2
A = 1 2 0 0
5 6 7 5
a 31 a 34 v 5.
Observatia 1.9. Daca jocul matricial are un punct sa in startegii pure (i∗ , j ∗ ) ,
atunci el este foarte usor de gasit. Realmente, prin Definitia 1.3 a unui astfel de
punct sa in startegii pure (8), valoarea ai j este un element din matricea de castig
∗ ∗
A = (aij ) care este in acelasi timp minimul din linia sa si maximul din coloana sa.
In Exemplul 1.3, (1,1) este un punct sa in strategii pure al jocului deoarecei a11 = 0
este cel mai mic element din prima linie si in acelasi timp este cele mai mare
element din prima coloana.
In Exemplul 1.4 a31 = a34 = 5 sunt doua elemente cu cea mai mica valoare in linia
a treia si in acelasi timp cele mai mari din prima si a patra coloana, respective.
Un joc matricial poate avea mai multe puncte sa in strategii pure. In acest caz
putem demonstra urmatorul rezultat:
16
Lema 1.2. Fie (i∗ , j ∗ ) si (i∗∗ , j ∗∗ ) puncte sa in strategii pure ale unui joc
matricial. Atunci (i∗ , j ∗∗ ) si (i∗∗ , j ∗ ) sunt de asemnea puncte sa in strategii pure si
valorile la toate aceste puncte sa sunt egale, adica
ai ∗ j ∗ = ai ∗∗ j ∗∗ = ai ∗ j ∗∗ = ai∗∗ j ∗ .
pentru toti i=1,m si toti j=1,n . Deoarece (i∗∗ , j ∗∗ ) este un punct sa in strategii
pure avem
aij ∗∗ ≤ ai∗∗ j ∗∗ ≤ ai∗∗ j
care dovedesc (9). Prin (9) si prin inegalitatile de mai sus avem
aij ∗ ≤ ai ∗ j ∗∗ ≤ ai ∗ j
pentru toti i=1,m si toti j=1,n . Deci (i∗ , j ∗∗ ) este un punct sa in strategii pure.
Din aceasta lema rezulta ca un joc matricial cu puncte sa in strategii pure are
urmatoarele proprietati:
-- interschimarea sau proprietatea rectangulara a punctelor sa in strategii pure,
-- egalitatea valorilor la toate punctele sa in startegii pure.
Exemplul 1.5. Jocul cu matricea de castig
3 0 − 5
A = − 7 − 1 4
2 1 1
17
0 − 1 − 1
A = 1 0 − 1
1 1 0
Avem v = 0 .
Exemplul 1.7. Perechea (2, 3) este un punct sa in strategii pure pentru jocul cu
matricea de castig
2 − 3 −1 4
A = 1 2 0 1
− 2 3 − 1 − 2
are patru puncte sa in strategii pure deoarece avem (vezi Lema 1.2)
a12 = a13 = a22 = a23 = 1 = v.
si v2 = min (14, 9, 8) = 8.
18
Unitatea 2
Obiective:
CONTINUTUL UNITǍTII
Prin alegearea strategiei mixte X ∈ S m jucatorul 1 poate obtine celk putin castigul
asteptat
min XA j u.
1 j n
∑a
i =1
ij xi ≥ u , j = 1.n
cu
m
∑x
i =1
i =1 xi ≥ 0, i = 1, m.
19
∑a ij xi, ≥ 1, j = 1, n
1
∑x ,
i =
u
xi, ≥ 0, i = 1, m
min f x1 x2 xm #
#
m
a ij x i 1, j #
i 1
#
xi 0, i #
∑a j =1
ij y j ≤ w, i = 1.m
unde
m
∑y
j =1
j =1 y j ≥ 0, j = 1, n,
Notam y j / w = y ,j , j = 1, n .
20
max g y1 y2 yn #
#
n
a ij y j 1, i #
j 1
#
yj 0, j . #
Astfel problema gasirii solutiei unui joc matricial este este echivalenta cu
problema rezolvarii unei perechi de probleme de programare liniara duale.
Observatia 1.28. Datorita teoremei dualitatii, bine cunoscuta in programarea
liniara, este suficient sa se rezolve una singura dintre acele probleme de mai sus.
Sa obtinem aij > 0 vom aduna constanta 1 la fiecare element al matriei B si asa
vom obtine
5 3 4
A = 4 5 3
5 1 9
5 y1, + 3 y 2, + 4 y 3, ≤ 1
4y + 5y + 3y
,
1
,
2
,
3 ≤ 1
5y + y + 9y
,
1
,
2
,
3 ≤ 1
, ,
y ,y ,y
1 2
,
3 ≥ 0
21
Unitatea 3
Joc necooperativ
Obiective:
CONŢINUTUL UNITĂŢII
22
n) şi pentru i fixat si = 1, mi ( si variază de la 1 la mi ). Luând câte o strategie a
fiecărui jucător se obţine o situaţie (strategie) a jocului s = (s1 ,..., s n ) , element al
produsului cartezian S = S1 x...xS n = Π S i .
i∈I
Γ =< I , S1 , S 2 , H 1 , H 2 > .
H 1 (1,1) H 1 (1,2 ) 1 − 1
H 1 (s ) = =
H 1 (2,1) H 1 (2,2 ) − 1 1
H 2 (1,1) H 2 (2,1) − 1 1
H 2 (s ) = =
H 2 (1,2 ) H 2 (2,2 ) 1 − 1
s1 ... sn H1 ... Hn
s1 s2 H1 H2
1 1 1 -1
1 2 -1 1
2 1 -1 1
2 2 1 -1
24
câştig negativ) permanent. Situaţie similară s-ar produce dacă jucătorul 1 ar aplica
permanent strategia a doua.
Din cele stabilite rezultă că în orice situaţie s = (s1 , s 2 ), unul dintre jucători are o altă
situaţie preferată s' , faţă de cea existentă s în acel moment, la care se poate ajunge
modificând numai strategia jucătorului cu altă preferinţă:
1 2
(1,1) (1,2)
(1,2) (2,2)
(2,1) (1,1)
(2,2) (2,1)
totalitatea jocurilor jucate, pentru fiecare jucător, sau, ceea ce este acelaşi lucru, de
a asigura valoarea medie cea mai mare posibilă a câştigului pentru fiecare jucător.
25
Cu Pi notăm strategia mixtă a tuturor jucătorilor j, cu excepţia jucătorului i,
luaţi la un loc, presupunând că fiecare jucător şi-a fixat strategia sa în mod
independent de restul jucătorilor: Pi = Π Pj . Aici înmulţirea vectorilor se consideră
j ≠i
P1 = P2 × P3 =
= [ p 21 p31 , p 21 p 32 , p 21 p33 , p 21 p 34 , p 22 p31 , p 22 p 32 , p 22 p 33 , p 22 p34 , p 23 p31 , p 23 p32 , p 23 p33 , p 23 p34 ]
P2 = P1 × P3 =
= [ p11 p 31 , p11 p 32 , p11 p 33 , p11 p 34 , p12 p 31 , p12 p 32 , p12 p 33 , p12 p 34 ]
P3 = P1 × P2 =
= [ p11 p 21 , p11 p 22 , p11 p 23 , p12 p 21 , p12 p 22 , p12 p 23 ].
F1 F2
P2 p 21 p 22 P1 p11 p12
P1 P2
p11 1 -1 p 21 -1 1
p12 -1 1 p 22 1 -1
26
p11 + p12 = 1, p 21 + p 22 = 1,
F1 = ( p 21 − p 22 ) p11 + (− p 21 + p 22 ) p12 ,
F2 = (− p11 + p12 ) p 21 + ( p11 − p12 ) p 22 .
[ ] ( )
P10 = p110 , p120 pentru care F10 = F1 P10 , P2 > F1 = F1 (P1 , P2 ), unde
[
P20 = p 21
0 0
, p 22] ( )
pentru care F20 = F2 P1 , P20 > F2 = F2 (P1 , P2 ), unde
Pi H i PiT = Pi Φ Ti ,
adică
( )
Pi H i PiT − Φ Ti = 0,
unde
Pi ≥ 0, i = 1, n şi H i Pi T − Φ Ti ≤ 0.
27
Dacă componenta j a vectorului H i PiT − Φ Ti ar fi pozitivă, atunci prin
înmulţirea la stânga cu vectorul Pi ∗ cu toate componentele egale cu 0, exceptând
componenta j egală cu 1, ar rezulta Fi ∗ = Pi ∗ H i PiT > Fi , contrar definiţiei 1 conform
căreia Fi este valoarea maximă a expresiei Pi ∗ H i PiT pentru Pi fixat.
( )
H i s i0 Pi T = max
0
si
( )
H i si0 Pi T ,
unde si0 este o strategie oarecare. Aici cu H i (si )PiT , respectiv H i (si0 )PiT am notat
elementul cu indice de linie si , respectiv si0 al matricei H i PiT .
[ ]
Ti = t i1 ,..., t imi ,
H i Pi T − Φ Ti ≤ 0 ; Φ Ti − H i PiT = TiT .
Pi J iT = 1, Φ Ti − H i PiT = TiT , Pi Ti T = 0,
unde i = 1, n .
unde
P1 = [ p11 , p12 ], P2 = [ p 21 , p 22 ],
P1 = P2 , P2 = P1 ,
J 1 = J 2 = [1,1]
T1 = [t11 , t12 ], T2 = [t 21 , t 22 ],
1 − 1 − 1 1
H1 = , H2 =
− 1 1 1 − 1
[ ] [
Φ 1 = F1' − F1'' , F1' − F1'' , Φ 2 = F2' − F2'' , F2' − F2'' , ]
unde
29
− p11 + p12 − F2' + F2'' + t 21 = 0,
p11 − p12 − F2' + F2'' + t 22 = 0
Rezolvând acest sistem prin metoda eliminării se obţine soluţia găsită cu ocazia
rezolvării problemei din exemplul 1, punctul 2. prin procedeul particular.
p 21t 21 + p 22 t 22 = 0 ⇔ p 21t 21 = 0, p 22 t 22 = 0,
Un astfel de joc permite o rezolvare mai simplă. Problema formulată prin teorema
1 din punctul 4.3. având în vedere că P1 = P2 şi P2 = P1 poate fi descompusă în trei
subprobleme independente. Subproblema (1) constă în rezolvarea în numere
nenegative P2 a sistemului de ecuaţii liniare
P2 J 2T = 1,
T , (1)
Φ 1 − H 1 P2 = T1
T T
P1 J 1T = 1,
T (2)
Φ 2 − H 2 P1 = T2
T T
30
P1T1T = 0 , P2T2T = 0.
p1s1 = 0
Deci pentru toate cazurile t1s ≠ 0 avem p1s = 0 şi la fel pentru t 2 s ≠ 0 rezultă
1 1 21
p 2 s21 = 0 proprietatea care permite stabilirea soluţiei care verifică sistemul (3).
p 21 + p 22 = 1,
p 21 − p 22 − F1 + F1 + t11 = 0
' ''
(1 ) '
− p + p − F ' + F '' + t = 0
21 22 1 1 12
p11 + p12 = 1,
− p11 + p 22 − F2 + F2 + t 21 = 0
' ''
(2 ) '
p − p − F ' + F '' + t = 0
11 12 2 2 22
1 1 0 0 0 0 1
1 −1 −1 1 1 0 0
S1 = .
− 1 1 − 1 1 0 1 0
0 0 0 0 0 0 0
31
Astfel de uniformizări vor fi folosite şi în continuare, ori de câte ori va fi necesar
fără nici o precizare specială.
1 1 0 0 0 0 1
− 1 1 − 1 1 1 0 0
S2 =
1 −1 −1 1 0 1 0
0 0 0 0 0 0 0
1 1
X 21 = , , 0, 0, 0, 0, X 22 = [1, 0,1, 0, 2, 0], X 23 = [0,1,1, 0, 0,2 ]
2 2
Să notăm cu X ij' , i = 1,2; j = 1,3, vectorii care se obţin prin omiterea componentelor
Fi ' , Fi '' , i = 1,2. Obţinem:
1 1 1 1
X 11' = , , 0, 0, '
X 21 = , , 0, 0,
2 2 2 2
Pentru a stabili perechile de soluţii (X 1'i , X 2' j ) care să fie soluţii ale problemei
de joc bimatriceal, trebuie să fie îndeplinită condiţia t1s ≠ 0 ⇒ p1s = 0 şi 1 1
1 1
t 2 s21 ≠ 0 ⇒ p 2 s21 = 0 Se constată că există o singură soluţie P1 = P2 = , obţinută
2 2
pentru t11 = t12 = t 21 = t 22 = 0 şi F1' = F1'' = F2' = F2'' = 0 şi prin urmare F1 = F2 = 0 .
32
Având în vedere că orice egalitate este echivalentă cu două inegalităţi,
sistemele (1), (2) şi (3) din punctul 4. pot fi scrise în următoarea formă:
H 1 P2T − Φ 1T ≤ 0
− J 2 P2 ≤ −1
T
(4)
J P T ≤ 1,
2 2
P1 H 1 − Φ 2 ≥ 0
P1 J 1 ≥ 1
T
(5)
− P J T ≥ −1,
1 1
P1 ( H 1 P2T − Φ 1T ) = 0
( P1 H 1 − Φ 2 ) P2 = 0
T
(6)
unde Φ1 conţine ca elemente una şi aceiaşi valoare F1 , iar Φ 2 conţine una şi aceiaşi
valoare − F2 ,
Aceste valori pot fi considerate şi ca alori minimax (minumul unor valori maxime)
obţinute prin minimizarea funcţiei F1 , (maximul este infinit), respectiv maximin
(maximul unor valori minime) obţinute prin maximizarea funcţiei − F2 = F1
(minimul este infinit).
33
min max F (P1 , P2 ) = max min F (P1 , P2 ).
P2 P1 P1 P2
1 1 0 0 0 0 1
1 −1 −1 1 1 0 0
− 1 1 − 1 1 0 1 0
0 0 1 −1 0 0 0
34
Unitatea 4
Aplicatii economice
Obiective:
CONŢINUTUL UNITĂŢII
Aplicatii in economie
In cele ce urmeaza dam ceva aplicatii ale jocurilor in economic. Vom evalua
functia de castig pentru fiecare jucator, care va fi dependenta de strategiile
jucatorilor. Aici multimile strategiilor vor fi intervale ale axei reale.
1. Modelul Cournot al duopolului
Cum stim, un punct de echilibru (echilibrul Nash) este perechea (q1∗ , q2∗ ) unde qi∗ ,
pentru fiecare firma i , rezolva problema de optimizare
max π i (qi , q ∗j ) = max qi [a − (qi + q ∗j ) − c].
0 ≤ qi < ∞ 0 ≤ qi < ∞
qi =
1
2
(
a − q *j − c )
Astfel, daca perechea de cantitati (q1∗ , q2∗ ) este un echilibru Nash, cantitatile alese
ale firmelor trebuie sa satisfaca sistemul de ecuatii
q1 =
1
2
(
a − q 2* − c , ) q1 =
1
2
(a − q1* − c )
Rezolvand acest sistem de ecuatii obtinem q1* =q2* = (a-c)/2, care este intr-adevar
mai mic decat a − c , cum a fost presupus.
Intuitiv interpretarea acestui echilibru este simpla.
Fiecare firma va dori, desigur, sa fie un monopol in aceasta piata, in care caz ea va
vrea sa aleaga cantitatea qi care sa maximizeze π i (qi , 0) = qi (a − qi − c) , si in
consecinta ea va produce cantitatea monopolista qm =(a-c)/2 , si va obtine
profitul monopolistic π(qm ,0) = (a-c)2 /4.
Dandu-se ca exista doua firme, profitul agregat pentru duopol va fi maximizat prin
luarea cantitatii agregate q1 + q2 egala cu cantitatea monopolista qm , care va apare
daca qi =qm /2 pentru fiecare i , de exemplu. Problema cu acest aranjament este ca
fiecare firma are tendinta de a devia: deoareca cantitatea monopolista este mica,
pretul asociat P(qm ) este inalt, si la acest pret fiecrae firma va dori sa-si mareasca
a ei cantitate, in speta datorita faptului ca o asa crestere a productiei conduce la un
pret care curata piata mai mic. Sa vedem aceasta , folosim (48) sa aratam ca qm /2
nu exista un cel mai bun raspuns al firmei 2 la alegerea qm /2 a firmei 1. In
36
echilibrul Cournot, din contra, cantitatea agregata este mare, asa ca pretul asociat
este scazut, asa ca tentatia de a creste outputul este redusa.
Observatia 1.37.
O alta rezolvare, inafara de cea algebrica, pentru echilibrul Nash in jocul Cournot
se poate lua un procedeu grafic folosind cel mai bun raspuns pentru o firma:
Acest model al lui Bertrand este bazat pe faptul ca firmele acum isi aleg preturile,
altfel decat la modelul lui Cournot. Modelul lui Bertrand este un joc diferit decat
modelul jocului lui Cournot deoarece spatial strategiilor este diferit si functiile de
castig sunt diferite. Astfel obtinem un alt punct de echilibru, dar conceptual de
echilibru folosit este tot de echilibru Nash definit in sectiunile precedente.
Consideram cazul produselor diferentiate. Daca firmele 1 si 2 aleg preturile p1 and
p2 , respectiv, cantitatea ce consumatorii o cer de la firma i este
qi ( pi , p j ) = a − pi + bp j ,
unde b > 0 reflecta extinderea la care produsul firmei i este un substitut pentru
produsul firmei j. Aceasta o nerealista functie de cerere pentru ca cererea pentru
produl firmei i este positiva chiar cand firma i isi alege un pret arbitrar de inalt,
cu conditia ca firma j de asemenea isi alege un pret destul de inalt. Presupunem ca
sunt costuri de productie constante, ca sunt costurile marginale constante, la c ,
unde c < a , si ca firmele actioneaza simultan (isi aleg preturile lor). Translatam
problema economica intr-un joc necooperativ. Exista din nou doi jucatori. In acest
moment totusi, strategiile posibile la fiecare firma sunt preturile diferite care se pot
schimba, altfel decat diferitele cantitati ce se pot produce. Vom presupune ca
preturile negative nu sunt admisibile, dar ca orice pret nenegativ poate fi ales – nu
exista nici o restrictie la preturi determinate de monede. Astfel la fiecare firma
spatiul strategiilor poate fi din nou reprezentat ca Si = [0, ∞) , si o strategie tipica
si esste acum un pret, pi ≥ 0 .
37
Vom presupune din nou ca functia de castig pentru fircare firma este tocmai
profitul. Profitul firmei i cand este ales pretul pi si rivala sa alege pretul pj este
i p i, p j q i p i, p j pi c a pi bp j p i c.
Astfel, perechea de preturi ( p1∗ , p2∗ ) este un echilibru Nash daca, pentru fiecare
firma i , pi∗ rezolva problema
max π i ( pi , p∗j ) = max ( a − pi + bp∗j )( pi − c).
0 ≤ pi < ∞ 0 ≤ pi < ∞
pi* =
1
2
(
a + b ⋅ p *j + c )
Deci, daca perechea de preturi ( p1∗ , p2∗ ) este sa fie un echilibru Nash, pretul ales de
firme trebuie sa satisfaca sistemul
p1* =
1
2
(
a + b ⋅ p 2* + c , ) p 2* =
1
2
(
a + b ⋅ p1* + c , )
Rezolvand acest sistem de ecuatii suntem condusi la
a+c
p1* = p 2* = .
2−b
− 9 − 6 − 3 − 6
H 2 = − 3 − 5 − 4 − 5 deoarece H 1 + H 2t = 0 .
− 1 − 8 − 10 − 6
Jucătorul 1 are 4 strategii deoarece matricea A are 4 linii. Jucătorul 2 are 3 strategii deoarece matricea
A are 3 coloane.
38
2. Doi jucători scriu, independent , unul din numerele 1, 2 sau 3. Dacă ei au scris acelaşi număr
atunci jucătorul 1 plăteşte jucătorului 2 un număr de unităţi monetare egal cu numărul scris de
primul jucător. În caz contrar, jucătorul 2 plăteşte jucătorului 1 numărul de unităţi monetare egal
cu numărul pe care jucătorul 1 l-a scris. Care este matricea de câştig a acestui joc?
Soluţie. Este uşor de constatat că matricea de câştig a jucătorului 1 este:
− 1 1 1
A = 2 − 2 2
3 3 − 3
Cum v1 = v 2 = 5 rezultă că primul joc are punct şa în strategii pure. Este usor de verificat că (2,2) şi
(4,2) sunt puncte şa în strategii pure deoarece a 22 = a 42 = 5.
4 3
X ⋅ A ⋅Y t = ∑ ∑a ij xi y j = 9 x1 y1 + 3 x1 y 2 + x1 y 3 + 6 x 2 y1 + 5 x 2 y 2 +
i =1 j =1
+ 8 x 2 y 3 + 3 x3 y1 + 4 x3 y 2 + 10 x3 y 3 + 6 x 4 y1 + 5 x 4 y 2 + 6 x 4 y 3 .
39
Pentru al doilea joc, fie X = ( x1 , x 2 , x3 ) şi Y = ( y1 , y 2 , y 3 ) strategiile mixte ale jucătorului 1,
respectiv 2. Atunci câştigul aşteptat al jucătorului 1 este:
3 3
X ⋅ A ⋅Y t = ∑ ∑a ij xi y j = − x1 y1 + x1 y 2 + x1 y 3 + 2 x 2 y1 − 2 x 2 y 2 +
i =1 j =1
+ 2 x 2 y 3 + 3 x3 y1 + 3 x3 y 2 − 3 x3 y 3 .
5. Folosind eliminarea iterată a strategiilor strict dominate rezolvaţi jocul cu matricea de câştig:
0 − 1 − 1
A = 1 0 − 1
1 1 0
Soluţie. În matricea A, elementele primei linii sunt mai mici decât elementele corespunzătoare din
linia a 3-a. În consecinţă, jucătorul 1 niciodată nu va folosi prima sa strategie. Prima linie va fi
eliminată. Obţinem astfel matricea de câştig redusă:
1 0 − 1
A' =
1 1 0
Acum, în această matrice A' fiecare element al primei coloane este mai mare decât elementele
corespunzătoare ale coloanei a 3-a. În consecinţă jucătorul 2 nu va folosi niciodată prima sa strategie,
deci prima coloană poate fi eliminată. Aşa obţinem matricea redusă:
0 − 1
A' ' =
1 0
Astfel strategiile optimale (pure) sunt X ∗ = (0,0,1), Y ∗ = (0,0,1) şi valoarea jocului este v = 0.
( )
Avem, desigur, un punct şa în strategii pure i ∗ , j ∗ = (3,3) deoarece a 33 = v = 0.
Soluţie. Acestea sunt jocuri matriciale 2 x 2. Astfel, putem folosi strategiile mixte
X ∗ = ( p,1 − p ), Y ∗ = (q,1 − q ) unde
d −c d −b ad − bc
p∗ = , q∗ = , v=
a+ d −b−c a + d −b−c a+d −b−c
a) Obţinem:
3 −1 1 3−0 3 2 ⋅ 3 − 0 ⋅1 3
p∗ = = , q∗ = = , v= = ,
2 + 3 − 0 −1 2 2 + 3 − 0 −1 4 2 + 3 − 0 −1 2
40
1 1 3 1 3
Deci X ∗ = , , Y ∗ = , , v = .
2 2 4 4 2
b) Avem:
0−2 2 0−2 2 2⋅0 − 2⋅2 4
p∗ = = , q∗ = = , v= = ,
1+ 0 − 2 − 2 3 1+ 0 − 2 − 2 3 1+ 0 − 2 − 2 3
2 1 2 1 4
Deci X ∗ = , , Y ∗ = , , v = .
3 3 3 3 3
c) Obţinem:
1 − (− 1) 1 1 1 ⋅ 1 − (− 1) ⋅ (− 1)
p∗ = = , q∗ = , v = = 0,
1 + 1 − (− 1) − (− 1) 2 2 4
1 1
Deci X ∗ = Y ∗ = , , v = 0.
2 2
x1 1− 3 1
a) Obţinem x1 + x 2 = 1, = = 1, deci x1 = x 2 , x1 = x 2 = , respectiv
x2 2−0 2
y1 3 − 0 3 1
y1 + y 2 = 1, = = 3, deci 3 y 2 = y1 , y1 = , y 2 = .
y2 1 − 2 4 4
1 1 3 1
Astfel X ∗ = , , Y ∗ = , şi atunci
2 2 4 4
3 3
∗ ∗ ∗t 1 1 2 0 4 1 1 2 3
v = X ⋅ A⋅Y = , ⋅ = , =
2 2 1 3 1 2 2 3 2
4 2
x1 2−0 2 1
b) Avem x1 + x 2 = 1, = = 2, deci x1 = 2 x 2 , x1 = , x 2 = , respectiv
x2 1 − 2 3 3
y1 0−2 2 1 2 1
y1 + y 2 = 1, = , y1 = , y 2 = . Astfel X ∗ = Y ∗ = , , şi
y2 2 −1 3 3 3 3
2 2
2 1 1 2 3 4 4 3 4
v∗ = X ∗ ⋅ A ⋅ Y ∗ = , = , =
t
3 3 2 0 1 3 3 1 3
3 3
41
x1 −1−1 1
c) Avem x1 + x 2 = 1, = = 1 deci x1 = x 2 , x1 = x 2 = , respectiv
x 2 1 − (− 1) 2
y1 1 − (− 1) 1 1 1
y1 + y 2 = 1, = = 1, y1 = y 2 , y1 = y 2 = . Astfel X ∗ = Y ∗ = , , şi
y2 −1−1 2 2 2
1
∗ 1 1 1 − 1 2
v = , ⋅ = 0.
2 2 − 1 1 1
2
8. Rezolvaţi problema 6 cu metoda grafică descrisă pentru jocurile matriceale de tip 2 × n respectiv
m×2 .
Soluţie. Fie X = ( x,1 − x ), y = ( y,1 − y ) respectiv, strategiile mixte pentru jucătorii 1 şi 2. Trasăm
liniile drepte ac, bd şi ab, cd respectiv în cele două figuri (sistemele de coordonate) în planele xOv
respectiv yOv. Apoi determinăm coordonatele punctelor de intersecţie ale acestor linii drepte.
2 0
a) Matricea de câştig este A = , astfel avem liniile drepte care unesc punctele de coordonate
1 3
(1,2), (0,1) respectiv (1,0), (0,3). Ecuaţiile acestor drepte sunt:
x −1 v − 2 x −1 v − 0
= respectiv =
0 −1 1− 2 0 −1 3 − 0
Sau
v = x + 1 respectiv v = −3 x + 3
1 3 1 1
Punctul de intersecţie are coordonatele: x = , v = . Astfel X ∗ = , , este strategia optimală
2 2 2 2
3
a jucătorului 1 iar v = este valoarea jocului.Pentru strategia optimală a jucătorului 2 considerăm
2
liniile drepte ce unesc punctele de coordonate (1,2), (0,1) respectiv (1,1), (0,3). Ecuaţiile acestor
drepte sunt:
y −1 v − 2 y −1 v −1
= respectiv =
0 −1 0 − 2 0 −1 3 −1
Sau
v = 2 y respectiv v = −2 y + 3
3 3 3 1
Punctul de intersecţie are coordonatele y = , v = . Astfel Y ∗ = , este strategia optimală a
4 2 4 4
3
jucătorului 2, iar v = este valoarea jocului.
2
42
2 2 4
b) Procedând ca şi în cazul punctului a) găsim valorile x = , y = , v = aşa încât strategiile
3 3 3
2 1 4
optimale sunt X ∗ = Y ∗ = , şi valoarea jocului este v = .
3 3 3
1 1 1 1
c) Găsim valorile x = , y = , v = 0, deci X ∗ = Y ∗ = , sunt strategiile optimale, iar
2 2 2 2
valoarea jocului este v = 0 .
9. Folosind metoda grafică, rezolvaţi jocurile matriceale cu matricele de câştig:
5 6
2 9 6 3
a) A = , b) A = 9 4
8 3 7 5 1 8
Soluţie.
a) Fie X = ( x,1 − x ) o strategie mixtă a jucătorului 1. Liniile drepte ae; df; cg; dh; care unesc
punctele: (1,2), (0,8); (1,9), (0,3); (1,6), (0,7); (1,3), (0,5) au ecuaţiile:
x −1 v − 2 x −1 v − 9 x −1 v − 6 x −1 v − 3
= ; = ; = ; = .
0 −1 8 − 2 0 −1 3 − 9 0 −1 7 − 6 0 −1 5 − 3
Punctul de intersecţie ce corespunde maximului minimelor este determinat de dreptele care unesc
punctele (1,9), (0,3) respectiv (1,3), (0,5), adică
x −1 v − 9 x −1 v − 3
= respectiv = ,
0 −1 3 − 9 0 −1 5 − 3
sau v = −2 x + 5 respectiv v = 6 x + 3.
1 9
Coordonatele punctului de intersecţie (maximul minimelor) sunt x = ,v= .
4 2
1 3 9
Astfel X ∗ = , este strategia optimală a jucătorului 1, iar valoarea jocului este v = .
4 4 2
y1 + y 2 + y 3 + y 4 = 1
26 y1 + 18 y 2 + 27 y 3 + 18 y 4 = 18
yj ≥ 0 j = 1,4
1 1 3
Se consideră că q = , deci strategia optimală a jucătorului 2 este Y ∗ = 0, ,0, .
4 4 4
43
b) Fie Y = ( y,1 − y ) o strategie mixtă pentru jucătorul 2. Liniile drepte ab, cd, ef care unesc
punctele (1,5), (0,6); (1,9), (0,4); (1,1), (0,8) au ecuaţiile
y −1 v − 5 y −1 v − 9 y −1 v −1
= , = , = .
0 −1 6 − 5 0 −1 4 − 9 0 −1 8 −1
Punctul de intersecţie (minimul maximelor este acelaşi pentru oricare două drepte) se obţine din
sistemul de ecuaţii (format cu ultimele două, pentru minimul maximelor)
v = 5 y + 4, v = −7 y + 8.
1 17 1 2
Astfel avem y = , v= şi atunci Y ∗ = , este strategia optimală pentru jucătorul al doilea
3 3 3 3
17
iar valoarea jocului este v = .
3
x1 + x 2 + x3 = 1
17 x1 + 17 x 2 + 17 x3 = 17
xi ≥ 0 i = 1,3
7 5
Se constată că strategia optimală a jucătorului 1 este X ∗ = 0, , .
12 12
6 0 3
A = 8 − 2 3.
4 6 5
1 5 1 3
Astfel regiunea R1 , este delimitată de punctele 0, , ,0, şi (0,0,1)
6 6 4 4
14 9
Întrucât X ⋅ A•1 1 5
= , X ⋅ A•1 1 3
= , X ⋅ A•1 (0, 0 ,1) = 4 constatăm că valoarea maximă
0, ,
6 6
3 , 0,
4 4
2
14 14
este , max = .
3 3
1 5 1 3
Astfel regiunea R2 , este delimitată de punctele (1,0,0 ), (0,1,0 ), 0, , , ,0, .
6 6 4 4
14 9
Întrucât X ⋅ A⋅2 (1,0 , 0 ) = 0, X ⋅ A⋅2 (0,1, 0 ) = −2, X ⋅ A⋅2 1 5
= , X ⋅ A⋅2 1 3
= , constatăm
0, ,
6 6
3 ,0,
4 4
2
14 14
că valoarea maximă este , max = .
3 3
1 5 1 3
Astfel regiunea R3 , este determinată de punctele 0, , , ,0, .
6 6 4 4
14 9
Întrucât X ⋅ A⋅3 1 5
= , X ⋅ A⋅3 1 3
= , constatăm că valoarea maximă este
0, ,
6 6
3 ,0,
4 4
2
14 14
, max = .
3 3
45
14 14 14 14
= min , , = .
3 3 3 3
1 5
Strategia optimală a jucătorului 1, pentru care se obţine valoarea jucătorului este X ∗ = 0, , .
6 6
Regiunea T1 , în care max Ai⋅Y t = A1⋅Y t , se determină din inegalităţile A1⋅Y t ≥ A2⋅Y t şi A1⋅Y t ≥ A2⋅Y t ,
1≤i ≤3
1
care ne dau y1 − y 2 ≤ 0 şi y1 − y 2 ≥ .
2
Regiunea T2 , în care max Ai⋅Y t = A2⋅Y t , se determină din inegalităţile A2⋅Y t ≥ A1⋅Y t şi
1≤i ≤ 3
1
A2⋅Y t ≥ A3⋅Y t , care ne dau y1 − y 2 ≥ 0 şi y1 − y 2 ≥ .
3
2 1 1 1
. Regiunea T2 este delimitată de punctele (1,0,0 ), , ,0 , ,0 .
1
Rămâne doar y1 − y 2 ≥
3 3 3 3 3
14 14
Întrucât A2⋅Y t (1, 0 ,0 ) = 8, A2⋅Y t 2 1
= , A2⋅Y t 2 1
= , constatăm că valoarea minimă este
, ,0
3 3
3 ,0,
3 3
3
14 14
, min = .
3 3
Regiunea T3 , în care max Ai⋅Y t = A3⋅Y t , se determină din inegalităţile A3⋅Y t ≥ A1⋅Y t şi A3⋅Y t ≥ A2⋅Y t ,
1≤i ≤ 3
1 1
care ne dau y1 − y 2 ≤ şi y1 − y 2 ≤ .
2 3
1
Rămâne doar y1 − y 2 ≤ .
3
2 1 1 2
Regiunea T3 este delimitată de punctele , ,0 , (0,1,0 ), (0,0,1), ,0, .
3 3 3 3
14 14
Întrucât A3⋅Y t 2 1
= , A3⋅Y t (0 ,1, 0 ) = 6, A3⋅Y t (0 , 0,1) = 5, A3⋅Y t 1 2
= , constatăm că
, ,0
3 3
3 , 0,
3 3
3
14 14
valoarea minimă este , v= .
3 3
46
14 14 14
v = min max Ai⋅Y t = max min Ai⋅Y t , min Ai⋅Y t , max Ai⋅Y t = max , = .
X ∈S3 1≤i ≤3 Y ∈S3 IT1 X ∈S 3 IT2 X ∈S3 IT3 3 3 3
2 1 1 2
Strategiile optimale ale jucătorului 2 sunt Y1∗ = , ,0 , Y2∗ = ,0, . Astfel soluţia (strategia
3 3 3 3
optimală) pentru jucătorul 2 este Y ∗ = λY1∗ + (1 − λ )Y2∗ cu λ ∈ [0,1], iar valoarea jocului
14
v= .
3
n
[max ]g = y1' + y 2' + ... + y n' ∑ aij y 'j ≤ 1, i = 1, m y 'j ≥ 0, i = 1, n.
j =1
0 2 1 0 1
5 1 0 1 1
1 1 0 0 0
1 1
0 1 0
0 2 1 0 1 2 2
1 1 1 1 1 1
1 0 → 1 0 −
5 5 5 10 5 10
0 4
0 −
1
−
1 0 0 −
2
−
1
−
3
5 5
5
5 5 5
3 1 5 1 1
Astfel g max = = , deci w = şi y1' = deci y1 = w ⋅ y1' = ,
5 w 3 10 6
1 5
y 2' = , deci y 2 = .
2 6
47
În plus y 3' = y 4' = 0, deci y 3 = y 4 = 0.
2 2 1 1
De asemenea x1' = aşa încât x1 = w ⋅ x1' = , x 2' = , deci x 2 =
5 3 5 3
2 1 1 5
În concluzie strategiile optimale ale celor doi jucători sunt X ∗ = , , Y ∗ = , , iar valoarea
3 3 6 6
5
jocului este w = v = .
3
6 0 3 5 1 0 0 1
8 − 2 3 9 0 1 0 1
.
4 6 5 4 0 0 1 1
1 1 1 1 0 0 0 0
3 3 7 3 1 23 9 3 1
0 2 − 1 − 0 0 0 0 − 1 − −
4 4 4 4 14 14 14 7
1 3 9 1 1 1 31 3 1 1
1 − 0 0 1 0 0
4 8 8 8 8 → 2 14 28 28 7
0 7 7
−
1
0 −
1
1
1 0 1
1
−
1
0 −
1 1 1
2 2 2 2 2 14 14 7 14
5 5 1 1 1 1 1 5 3
0 − 0 − 0 − 0 0 0 − 0 − − −
4 8 8 8 8 28 28 28 14
3 1 14
Astfel avem g max = = , deci w = respectiv
14 w 3
1 1 1
y1, = , y 2, = , y 3, = 0, y 4, = 0, y 5, = , y 6, = 0, y 7, = 0, aşa încât:
7 14 7
2 1 2
y1 = w ⋅ y1, = , y 2 = , y 3 = 0, y 4 = 0, y 5 = , y 6 = 0, y 7 = 0. În concluzie o strategie optimală
3 3 3
2 1 14
a jucătorului 2 este Y ∗ = , ,0,0 , iar valoarea jocului este w = v = . De asemenea avem
3 3 3
48
1 5 1
x1, = 0, x 2, = , x3, = , x 4, = 0, x5, = 0, x6, = 0, x7, = , aşa încât
28 28 28
1 5 1
x1 = w ⋅ x1, = 0, x 2 = , x3 = , x 4 = 0, x5 = 0, x6 = 0, x7 = . Strategia optimală a jucătorului 1
6 6 6
1 5
este X ∗ = 0, , . Observăm că există şi o altă soluţie pentru că în ultima linie a matricei precedente
6 6
este un element egal cu 0 într-o coloană neredusă. Obţinem
23 9 3 1
0 0 0 − 1 − −
14 14 14 7
16 5 3 1
1 − 1 0 0 −
7 28 28 14
0 2 1 −
1
0 −
1 2 1
7 7 7 7
1 1 5 3
0 0 0 − 0 − − −
28 28 28 14
1 1 1
Astfel y1, = , y 2, = 0, y 3, = , y 4, = 0, y 5, = , y 6, = 0, y 7, = 0, deci
14 7 7
1 2 2
y1 = , y 2 = 0, y 3 = , y 4 = 0, y 5 = , y 6 = 0, y 7 = 0.
3 3 3
∗ 1 2
O altă soluţie (strategie optimală) pentru jucătorul 2 este Y2 = ,0, ,0 .
3 3
Trei firme utilizează, cu scop tehnologic, apa dintr-un acelaşi rezervor. Fiecare firmă are la dispoziţie
două strategii: îşi construieşte staţie de purificare (strategia 1) sau foloseşte apa nepurificată (strategia 2).
Se ştie că dacă cel mult o firma foloseşte apa nepurificată atunci apa din rezervor este bună şi nu apar
cheltuieli. Dacă, însă, cel puţin două firme folosesc apa nepurificată atunci fiecare firmă pierde 3 unităţi
monetare. Construirea staţiei de purificare costă o unitate monetară. Scrieţi matricele de câştig pentru
acest joc.
Soluţie. Având în vedere anunţul constatăm că este un joc de 3 ,,persoane” la care fiecare ,,jucător” are 2
strategii. Deci n = 3, m1 = m 2 = m3 = 2. Numărul situaţiilor jocului este m1 ⋅ m2 ⋅ m3 = 8 , iar
câştigurile jucătorilor sunt reprezentate în următorul tabel (reprezentare generală):
49
Situaţii Câştiguri
1 1 1 -1 -1 -1
1 1 2 -1 -1 0
1 2 1 -1 0 -1
1 2 2 -4 -3 -3
2 1 1 0 -1 -1
2 1 2 -3 -4 -3
2 2 1 -3 -3 -4
2 2 2 -3 -3 -3
Valorile ,,câştigurilor au fost calculate având în vedere enunţul. Spre exemplu, în situaţia (1,2,2), firmele
2 şi 3 folosesc apa nepurificată deci (cum sunt două) fiecare firmă pierde 3 unităţi monetare. Firma 1,
însă, îşi construieşte staţie de purificare, deci mai cheltuieşte o unitate monetară, deci, ,,câştigul” ei este -
4.
Două fabrici produc acelaşi tip de produs A, respectiv B, în două sortimente A1 şi A2 respectiv
B1 şi B2 . Produsele sunt interschimbabile. În urma unui test, făcut în avans, s-a constatat că preferinţele
cumpărătorilor, exprimate în procente, sunt reprezentate în următorul tabel
A B1 B2
A1 40 90
A2 70 20
Precizăm că precedentele date se referă la prima fabrică (primul produs), în timp ce precedentele pentru a
doua fabrică (al doilea produs) sunt completare faţă de procentul de 100%. Scrieti matricele de câştig
pentru acest joc.
Soluţie. Sunt 2 jucători (fabricile) şi fiecare are câte 2 strategii (posibilităţi, sortimente). Din enunţ se
constată că sunt precizate în tabelul cu cu punctele chiar ,,câştigurile” primului ,,jucotor”. Astfel într-o
reprezentare generală (tabelară) matricile de câştig pentru cei doi jucători pot fi scrise în tabelul:
50
Situaţii Câştiguri
s1 s2 H1(s) H2(s)
1 1 40 60
1 2 90 10
2 1 70 30
2 2 20 80
În acest caz (pentru că sunt doar doi jucători) se poate utiliza şi reprezentarea bi-matriceală (obişnuită)
pentru matricele de câştig. Astfel avem:
Soluţie. Se păstrează datele privind jucătorii şi stagiile (,,mutările”) de la problema precedentă. Sunt
modificări doar la valorile ,,câştigurilor”.
Situaţii Câştiguri
s1 s2 H1(s) H2(s)
1 1 400 600
1 2 900 100
2 1 700 300
2 2 600 900
Se consideră că modificările ,,esenţiale” sunt doar la situaţia (2,2) (în rest sunt datele de la problema
precedentă la care procentele (100%) au fost înlocuite cu unităţile vândute (1000)), care au fost calculate
conform relaţiilor
51
1 1
200 + ⋅ 800 = 600, 800 + ⋅ 200 = 900.
2 2
b) Întrucât
1000 1000
H1 + H 2 =
t
1000 1500
deci nu este o matrice cu toate elementele egale (sumă constantă) jocul din această problemă este un joc
bi-matriceal (nu este antagonist). Pentru a-l rezolva trebuie să găsim toate soluţiile admisibile de bază
pentru două sisteme de ecuaţii liniare, iar apoi se vor păstra doar perechile de soluţii care verifică şi al
treilea sistem de ecuaţii.
p 21 + p 22 =1
400 p 21 + 900 p 22 − F1 + F1 + t11 =0
' ''
1 1 1 1
0 − 0 − 1
1 1 0 0 0 0 1
7 700 700 700
400 900 − 1 1 1 0 0 → 0 3900 −
3 3
1 −
4
0 →
7 7 7 7
700 600 − 1 1 0 1 0 1 0
6 1 1 1
− 0
7 700 700 700
1 5
0 0 1 −1 − − 650
0 100 1 − 1 0 − 1 700
6 6
1 1 1
→ 0 600 0 0 1 − 1 300 → 0 1 0 0 − →
600 600 2
1 1 0 0 0 0 1 1 0 0 0 − 1 1 1
600 600 2
500 0 1 − 1 − 1 0 900
→ 1 1 0 0 0 0 1 .
600 0 0 0 − 1 1 300
52
Ι p 21 = 1, p 22 = 0, F1' = 700, F1'' = 0, t11 = 300, t12 = 0,
1 1
ΙΙ p 21 = , p 22 = , F1' = 650, F1'' = 0, t11 = 0, t12 = 0
2 2
ΙΙΙ p 21 = 0, p 22 = 1 F1' = 900, F1'' = 0 t11 = 0, t12 = 300.
p 21 + p 22 =1
600 p11 + 300 p12 − F2 + F2 + t 21 =0
' ''
1 1 1 1
0 − − 0 1
1 1 0 0 0 0 1
2 600 600 600
600 300 − 1 1 1 0 0 → 1 1
−
1 1 1
0 0 →
2 600 600 600
100 900 − 1 1 0 1 0 0 1700 1 0
5 5 1
− −
2 6 6 6
8 3 5100
0 0 1 −1 − −
0 300 1 − 1 − 1 0 600 11 11 11
6
→ 1 1 0 0
0 0 1 → 1 0 0 0
1
−
1
→
1100 1100 11
0 1100 0 0 − 1 1 500 0 1 0 0 − 1 1 5
1100 1100 11
800 0 1 − 1 0 − 1 900
→ 1100 0 0 0 1 − 1 600.
1 1 0 0 0 0 1
deci produsul dintre un ,,p”, şi un ,,t” cu aceeaşi indici trebuie sa fie 0 (zero).
Testând toate cele 9 combinaţii posibile (fiecare cu fiecare) constatăm că doar soluţiile (combinaţiile) (2,
II) satisfac acest ultim sistem. Întradevăr
6 5 1 1
p11 ⋅ t11 = ⋅ 0 = 0, p12 ⋅ t12 = ⋅ 0 = 0, p 21 ⋅ t 21 = ⋅ 0 = 0, p 22 ⋅ t 22 = ⋅ 0 = 0.
11 11 2 2
53
Nici o alta combinaţie (din cele 8 rămase) nu se poate accepta pentru ca măcar o ecuaţie din ultimul
sistem nu este verificată. Spre exemplu combinaţia (3, I) nu convine pentru că deşi
totuşi p 21 ⋅ t 21 = 1 ⋅ 600 ≠ 0.
În concluzie unica soluţie (care verifică toate cele trei sisteme) este:
6 5 1 1 5100
p11 = , p12 = , p 21 = , p 22 = , F1, = 650, F1,, = 0, F2, = , F2,, = 0,
11 11 2 2 11
t11 = t12 = t 21 = t 22 = 0.
6 5
Astfel strategia optimală a jucatorului 1 este P1 = , , cu caştigul
11 11
1 1
F1 = F1, − F1,, = 650, iar strategia optimală a jucătorului 2 este P2 = , cu caştigul
2 2
5100
F2 = F2, − F2,, = .
11
a) Rezolvaţi jocul.
şi cum
100 100
H1 + H 2 =
t
jocul este antagonist cu suma constantă 100.
100 100
a) Pentru a rezolva un astfel de joc este nevoie să rezolvăm problema de programare liniară
corespunzătoare. În cazul de faţă avem
54
p 21 + p 22 =1
40 p 21 + 90 p 22 − F1 + F1 + t11 =0
' ''
1 1 0 0 0 0 1 1 1 0 0 0 0 1
40 90 − 1 1
1 0 0 40 90 − 1 1 1 0 0
→ →
70 20 − 1 1 0 1 0 70 20 − 1 1 0 1 0
0 0 1 −1 0 0 0 1 1 0 0 0 0 1
5 1 1 1
0 7 − 0 − 1
70 70 70
550 3 3 4 0 50 1 − 1 0 − 1 70
0 − 1 − 0 0 100 0 0 1 − 1 30
→ 7 7 7 7 → →
1 1 1 0 0 0 0 1
0
2 1 1 1
− 0
7 70 70 70
5 1 1 1 0 0 0 0 0 0 0
0 − 0 − 1
7 70 70 70
0 50 1 − 1 0 − 1 70 0 50 1 −1 0 −1 70
0 100 0 0
1 − 1 30 0 100 0 0 1 − 1 30
→ → →
1 1 0 0 0 0 1 1 1 0 0 0 0 1
0 0 1 − 1 0 0 0 0 − 50 0 0 0 1 − 70
1 1 1 1
0 0 1 −1 − − 65 0 0 1 −1 − − 65
2 2 2 2
1 1 3 1 1 3
0 1 0 0 − 0 1 0 0 −
→ 100 100 10 → 100 100 10 →
1 0 0 0 −
1 1 7 1 0 0 0 −
1 1 7
100 100 10 100 100 10
0 0 0 0 0 0 0 0 0 1 −1 0 0 0
1 1
0 0 1 −1 − − 65
2 2
1 1 3
0 1 0 0 −
→ 100 100 10 .
1 0 0 0 −
1 1 7
100 100 10
1 1
0 0 0 0 − 65
2 2
55
7 3
p 21 = , p 22 = , F1' = 65, F1'' = 0, t11 = 0, t12 = 0.
10 10
Problema duală (pentru primul jucător) are soluţia (citibilă tot din ultima matrice)
1 1 1 1
p11 = , p12 = . Deci P1 = , este strategia optimală a primului jucător, care va obţine câştigul
2 2 2 2
7 3
maxim F1 = 65, iar strategia optimală a jucătorului 2 este P2 = , care va obţine câştigul
10 10
maxim F2 = 65.
b) Matricele de structură (care reflectă împărţirea câştigurilor pe jucători, corespunzător deciziilor alese)
sunt date în următoarele tabele
B B1 B2
∑ A
= A1 14 13,5 27,5
A2 24,5 3 27,5
38,5 16,5 55
A A1 A2
∑ B
= B1 21 10,5 31,5
B2 1,5 12 13,5
22,5 22,5 45
Elementele din matricele de structură constituie termenii rezultaţi ca urmare a exprimării funcţiilor de
câştig. Astfel în prima matrice au fost trecuţi termenii lui
1
7 3 40 90 2
F1 = P1 ⋅ H 1 ⋅ P = P1 ⋅ H 1 ⋅ P =
t t
10 10 70 20 1
1 2
2
7
1 1 60 30 10
F2 = P2 ⋅ H 2 ⋅ P2t = P2 ⋅ H 2 ⋅ P1t =
2 2 10 80 3
10
De altfel situaţia sintetică, exprimată în procente, asupra structurii tipurilor de produse, este următoarea:
Asta în condiţia că producţia ambelor fabrici este 100%. Datorită antagonicităţii pieţei, a doua fabrică
realizează o vânzare mai mică decât prima, care este de 45%.
16. Considerăm problema 15 în ipoteza că a doua fabrică, la momentul când îşi alege strategia sa,
cunoaţte strategia aplicată de prima fabrică. Se cere:
b) Rezolvaţi jocul.
Soluţie. a) Faţă de problema anterioară (15) acum al doilea jucător are o informaţie suplimentară: ştie
ce strategie a ales primul jucător. În consecinţă se va modifica matricea de câştig a jucătorului 1, deoarece
jucătorul 2 poate aplica alte două strategii obţinute prin combinarea strategiilor sale B1 şi B2 , după
cum urmează:
57
B B1 B1 B2 B2
A B1 B2 B1 B2
B1 40 40 90 90
B2 70 20 70 20
a) Pentru rezolvare, observăm mai întâi că strategia a treia este dominantă aşa încât poate fi
eliminată, deci p 23 = 0 şi atunci problema de programari liniară ce trebuie rezolvată este
p 21 + p 22 + p 24 =1
40 p 21 + 40 p 22 + 90 p 24 − F1 + F1 + t11 =0
' ''
Avem succesiv
1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1
40 40 90 − 1 1 1 0 0 40 40 90 − 1 1 1 0 0
→ →
70 20 20 − 1 1 0 1 0 70 20 20 − 1 1 0 1 0
0 0 0 1 −1 0 0 0 1 1 1 0 0 0 0 1
5 5 1 1 1
0 − 0 − 1
7 7 70 70 70
200 550 3 3 4 0 50 50 1 − 1 0 − 1 70
0 − 1 − 0 0 50 100 0 0 1 − 1 30
7 7 7 7 7 → →
1 1 1 0 0 1
0
2 2 1 1 1 1 0 0
− 0
7 7 70 70 70
5 5 1 1 1 0 0 0 0 0 0 0 0
0 − 0 1
7 7 70 70 70
0 50 50 1 − 1 0 − 1 70 0 50 50 1 −1 0 −1 70
0 50 100 0 0
1 − 1 30 0 50 100 0 0 1 − 1 30
→ → →
1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1
0 0 0 1 −1 0 0 0 0 − 50 − 50 0 0 0 1 − 70
58
1 1
0 25 0 1 −1 − 55
2 2
1 1 1 3
0 1 0 0 −
→ 2 100 100 10 →
1 1
0 0 0 −
1 1 7
2 100 100 10
1 1
0 − 25 0 0 0 − 55
2 2
0 0 − 50 1 −1 −1 1 40
1 1 3
0 1 2 0 0 −
→ 50 50 5 .
1 1 2
1 0 −1 0 0 −
50 50 5
0 0 50 0 0 1 0 − 40
2 3
Soluţia optimă este p 21 = , p 22 = , p 24 = 0, F1' = 40, F1'' = 0, t11 = 0, t12 = 0, deci
5 5
2 3
P2' = , ,0 este o strategie optimală a jucătorului 2. Se constată că mai există şi o altă soluţie,
5 5
conform matricei
− 50 0 0 1 −1 0 0 20
1 1 1 0 0 0 0 1
,
50 0 − 50 0 0 − 1 1 20
0 0 50 0 0 1 0 − 40
2 3
deci p 21 = , p 22 = , p 24 = 0, F1' = 40, F1'' = 0, t11 = 0, t12 = 20.
5 5
În concluzie, ţinând cont şi de faptul că p 23 = 0, soluţia generală (strategia optimală a jucătorului 2) este
2 3
P2 = λ1 P2' + λ2 P2'' = λ1 , ,0,0 + λ 2 [0,1,0,0], cu λ1λ2 ∈ [0,1] λ1 + λ 2 = 1 iar valoarea maximă a lui
5 5
F1 este F1 = F1' − F1'' = 40, cu P1 = [1,0].
59
B B1 B1
A B1 B2
∑ A
= A1 16λ2 40λ1+24λ2 40
16λ2 40λ1+24λ2 40
A A1
∑ B
= B1 B1 24λ2 24λ2
B1 B2 60λ1+36λ2 60λ1+36λ2
60 60
Constatăm o descreştere cu 15% pentru prima fabrică, ceea ce dă o creştere cu 15% pentru fabrica a doua.
Aceasta se datorează informaţiei suplimentare pe care a avut-o fabrica a doua. Mai putem spune că prima
fabrică va face 40% din sortimentul A1 iar a doua fabrică va face numai sortimentul B1, în total de 60%
(cu împărţirea: 24λ2% datorită ,,strategiei” B1: B1 şi (60λ1+36λ2) % datorită ,,strategiei” B1: B2, cu
λ1λ 2 ∈ [0,1], λ1 + λ2 = 1 ).
60
TEME DE CONTROL
3 6 9 6
H 1 = A = 10 6 1 8
4 5 3 5
Care este matricea de câştig a jucătorului 2? Câte strategii are jucătorul 1, respectiv jucătorul 2?
2. (Jocul Morra). Doi jucători arată simultan unul sau două degete de la mâna stângă şi în acelaşi timp
spun numărul de degete pe care ei cred că îl va arăta oponentul.Dacă un din jucător nimereşte numărul de
degete arătat de oponent, el primeşte aşa de multe unităţi monetare cât este numărul de degete pe care le-
au arătat împreună. Dacă ambii jucători nimeresc sau niciunul nu nimereşte atunci niciunul nu primeşte
nimic. Care este matricea de câştig a acestui joc?
1 − 1 − 2 0
3 0 2 4
A=
4 5 1 5
2 3 − 1 3
6. Găsiţi strategiile optimale şi valoarea jocului (cu relaţiile de calcul) pentru jocurile cu următoarele
matrice de câştig:
2 3 6 − 1 2 4
a) A = ; b) A = ; c) A = .
5 2 4 5 3 1
61
2 4
3 1
2 1 4
a) A= , b) A =
3 5 1 1 6
5 0
1 − 1 − 2
A = − 1 1 1
2 − 1 0
2 3 0 7 5 6
a) A = − 1 8 − 3 ,
b) A = 0 9 4 .
0 − 1 2 14 1 8
12. O firmă produce trei tipuri de produse P1 , P2 , P3 , folosind trei tipuri de materiale M 1 , M 2 , M 3 .
M P1 P2 P3
M1 4 4 6
M2 3 5 3
M3 5 2 4
13. Două ramuri economice au de făcut investiţii în 4 obiective. Strategia cu codul i constă în a finanţa
obiectivul i, i = 1,4. Ca urmare a tuturor analizelor făcute s-a constatat că, pentru prima ramură,
câştigurile sunt date de matricea:
0 1 −1 2
− 1 0 3 2
A=
0 1 2 − 1
2 0 0 0
Se presupune că fiecare ramură îşi materializează câştigul în înţelegere cu cealaltă, adică ceea ce câştigă
una pierde cealaltă şi invers.
1 7 1 8
H1 = , H2 =
3 4 7 8
Rezolvaţi jocul.
15. Pentru dezvoltarea economică şi socială a unui oraş apare problema construirii sau nu a două
obiective economice. Există două strategii corespunzătoare Ministerului tutelar şi pentru autorităţile
locale ale oraşului: 1 – a construi primul obiectiv, 2 – a construi al doilea obiectiv. Autorităţile oraşului au
2 strategii: 1 – agreează (acceptă) propunerea Ministerului, 2 – nu agreează (acceptă) propunerea.
− 10 2 5 − 2
H1 = , H2 =
1 − 1
− 1 1
16.1. Care sunt procentele p1 , p 2 , p3 pe care să le facem, în avans, pentru oferta cu materialele în aşa
fel încât stocul să fie sigur asigurat şi să se realizeze o valoare maximă a producţiei?
16.2. Găsiţi un plan de producţie corespunzător unui tabel de producţie de 4 milioane unităţi moetare.
Răspunsuri.
1. Trei strategii pentru jucătorul 1 şi patru strategii pentru jucătorul 2. Matricea de câştig a
jucătorului 2 este
1.
− 3 − 10 − 4
− 6 − 6 − 5
H2 =
− 9 − 1 − 3
− 6 − 8 − 5
2.
63
0 2 − 3 0 L11
− 2 0 0 3 L12
H1 = A =
3 0 0 − 4 L21
0 −3 4 0 L22
3. v1 = max min a ij = 3, v 2 = min max aij = 6, deci nu există punct şa în strategii pure, pentru
primul joc; v1 = −2, v 2 = 2; deci nu există punct şa în strategii pure, pentru al doilea joc.
3 4
4. ∑ ∑a
i =1 j =1
ij xi y j = 3 x1 y1 + 6 x1 y 2 + ... + 5 x3 y 4 ;
4 4
∑ ∑a
i =1 j =1
ij xi y j = 2 x1 y 2 − 3 x1 y 3 − 2 x 2 y1 + 3 x 2 y 4 + 3 x3 y1 − 4 x3 y 4 −
− 3x4 y 2 + 4 x4 y3 .
2 1 1 5 5
5. X ∗ = 0, , ,0 , Y ∗ = 0, , ,0 , v = .
3 3 6 6 3
6 – 8.
1 3 3 1
a) X ∗ = , , Y ∗ = , , v = 1.
4 4 4 4
3 1 1 7 17
b) X ∗ = , , Y ∗ = , , v = .
4 4 8 8 4
3 1 1 1 5
c) X ∗ = , , Y ∗ = , , v = .
4 4 2 2 2
9.
1 1 3 1 5
a) X ∗ = , , Y ∗ = ,0, , v = .
2 2 4 4 2
1 2 1 2 1
b) X ∗ = 0, ,0, , Y ∗ = , , v = .
3 3 3 3 3
64
3 2 2 3 1
10. X ∗ = 0, , , Y ∗ = , ,0 , v = .
5 5 5 5 5
4 4 6
12. H 1 = 3 5 3
5 2 4
0 1 −1 2
− 1 0 3 2
13. H 1 =
0 1 2 − 1
2 0 0 0
3 2
A doua soluţii: P1 = (1,0 ), P2 = , , P2'' = (1,0 ), F1 =
17
'
λ1 + 3λ2 , F2 = 8, unde
5 5 5
λ1 , λ2 ≥ 0, λ1 + λ2 = 1, P2 = λ1 P2' + λ 2 P2'' .
1 2
15. P1 , , P2 (0,21; 0,79 ), F1 = −0,57; F2 = 0,33
3 3
Bibliografie modul
1. Blaga P. Muresan A.S., Lupas Al., Matematici aplicate in economie, vol. 2, ed. Promedia
Plus, Cluj-Napoca, 1999
2. Gibbons, R., Game theory for applied economists Princeton Univ. Press, Prenceton, New
Jersey
3. Muresan, A.S., Non cooperative games, Ed. Mega, Cluj-Napoca, 2012
4. Muresan A.S.Blaga P., Matematici aplicate in economie, vol. 2, ed. Transilvania Press,
Cluj-Napoca, 1996
5.Muresan A.S., Cercetari operationale, vol. 1 si 2, lito. UBB, Cluj-Napoca, 1997
65
Modulul 2
JOC POZITIONAL
Obiective:
Rezultate aşteptate:
Unitatea 1
Obiective:
CONŢINUTUL UNITĂŢII
66
succesiune finită de acţiuni, declanşate în urma unor decizii luate în diferite
momente de către cei n jucători care participă la joc. Momentele de decizie se
succed în mod discret, fiind net separate unele de altele. În fiecre moment de
decizie se ştiu
67
trece în x1 , adică de a începe jocul. Pentru a deosebi clasele cu vârfuri iniţiale
echivalente din punct de vedere informaţional, asociem celor h clase
informaţionale diferite, tot atâtea simboluri diferite ct , t = 1, h . Aceste simboluri pot
fi, de exemplu, primele h numere naturale pozitive. Menţionăm că echivalenţa
informaţională a vârfurilor iniţiale implică echivalenţa informaţională a arcelor
incidente spre exterior. Jucătorii raţionali se vor nota cu primele n numere naturale
pozitive, iar natura cu numărul natural 0. Jocul poziţional asociat arborescenţei A
este o funcţie de arborescenţă (arc) F(A), definită prin 6+n caracteristici asociate
fiecărui arc: g codul (numărul) arcului, x j codul vârfului iniţial al arcului, xk codul
vârfului final al arcului, i codul (numărul) jucătorului care ia decizia în vârful
iniţial al arcului, ct codul (numărul) clasei de vârfuri echivalente din punct de
vedere informaţional de care aparţine vârful iniţial al arcului, p(g ) probabilitatea
alegerii variantei reprezentate de arcul respectiv, H 1 (g ),..., H n (g ) sunt componentele
vectorului de câştig, în cazul când arcul este un arc suspendat. Schematic, în formă
tabelară se poate scrie:
g xj xk i ct p(g ) H 1 (g ) … H n (g )
(x j ''
)
, x k '' pentru vârfurile iniţiale x j ' si x j '' diferite, se succed aceeaşi ordine, şi în
mod implicit, sunt în acelaşi număr.
1. Arborescenţa A.
2. Funcţia de câştig H i (g ) definită pentru fiecare arc suspendat g şi
pentru fiecare jucător i, i ∈ I , I = {1,..., n} . Dacă jocul se termină în arcul suspendat g
jucătorul i primeşte suma H i (g ) .
68
3. Aplicaţia T a vârfurilor iniţiale x j , x j ∈ X , X = {x1 , ..., x m } , pe mulţimea
jucătorilor (inclusiv natura 0) I 0 , I 0 = I ∪ {0}. Deci Tx j = i , atunci jucătorul i este cel
care ia decizia în vârful x j .
4. Probabilităţile asociate arcelor incidente spre exterior vârfului x j .
Dacă în vârful x j decide natura 0 se asociază arcelor g k = (x j , x k ) probabilităţile
p( g k ) care însumate, în raport cu k , pentru toate arcele cu vârful iniţial x j , dau
valoarea 1. Dacă în vârful x j decide un jucător raţional i, i ≠ 0 , în ipoteza unei
strategii pure locale de alegere a variantei (x j , x k ) , arcului respectiv i se asociază
probabilitatea egală cu 1. Totodată restului arcelor cu acelaşi vârf iniţial x j li se
asociază probabilitatea egală cu 0.
5. O descompunere a mulţimii vârfurilor iniţiale într-o mulţime de clase
ct , t = 1, h , de vârfuri, echivalente din punct de vedere informaţional, caracterizată
prin următoarele:
a. Vârfurilor x j şi x j aparţinătoare aceleiaşi clase ct , li se asociază acelaşi
''
jucător i: Tx j = Tx j = i.
' ''
al q-lea arc, în ordine, dintre arcele cu vârful iniţial x j , şi (x j , xk ) este al q-lea arc,
'' '' ''
Sunt doi jucători. Primul jucător alege unul dintre numerele 1 şi 2. Jucătorul 2,
cunoscând alegerea jucătorului 1, alege unul dintre numerele 1 şi 2. Jucătorul 1,
cunoscând alegerea jucătorului 2, dar necunoscând prima sa alegere, alege unul
dintre numerele 1 şi 2. Ce câştigă unul dintre jucători pierde celălalt jucător.
Funcţia de câştig este dată prin următoarele valori:
69
Tabelul 1
x y z H1 H2
1 1 1 -2 2
1 1 2 -1 1
1 2 1 3 -3
1 2 2 -4 4
2 1 1 5 -5
2 1 2 2 -2
2 2 1 2 -2
2 2 2 6 -6
Aici x este numărul ales de primul jucător la prima decizie, y este numărul ales de
cel de al doilea jucător şi z este numărul ales de primul jucător la a doua decizie.
70
Jucătorul 1, în vârful x1 , are două alternative, cărora le asociem arcul al
doilea (x1 , x 2 ) şi arcul al treilea (x1 , x3 ) . Clasa informaţională trebuie să difere de c1 :
punem c 2 = 2 pentru vârful x1 . Probabilitatea asociată poate fi 1, pentru arcul
(x1 , x2 ) şi 0, pentru arcul (x1 , x3 ) sau, 0 pentru arcul (x1 , x2 ) , şi 1, pentru arcul (x1 , x3 ) ,
în funcţie de strategia pură locală aleasă, după cum jucătorul 1 alege varianta
(x1 , x2 ) , respectiv alege varianta (x1 , x3 ) . Arcele nefiind suspendate, coloanele H 1 şi
H 2 nu se completează.
Urmează din nou primul jucător. Deoarece nu-şi cunoaşte prima sa alegere,
în vârfurile x4 şi x6 , respectiv x5 şi x7 posedă aceeaşi informaţie: în primul caz ştie
că jucătorul 2 a ales numărul 1, în al doilea caz ştie că jucătorul 2 a ales numărul 2.
Prin urmare, pentru cele două perechi de vârfuri avem două noi clase
informaţionale: c5 = 5 şi c6 = 6 . Strategiile pure locale, în poziţiile x 4 şi x6 ,
respectiv x5 şi x7 , nu sunt independente deoarece ele aparţin aceleiaşi clase
informaţionale. Astfel în vârfurile x4 şi x6 , aparţinătoare clasei informaţionale c5 ,
fie se aleg simultan variantele (x 4 , x8 ), (x6 , x12 ) , fie se aleg simultan variantele
(x4 , x9 ), (x6 , x13 ) . La fel se pune problema alegerii variantelor în vârfurile x5 şi x7 .
Toate arcele fiind suspendate, în coloanele H 1 (g ) şi H 2 (g ) sunt trecute câştigurile
corespunzătoare celor doi jucători. Jocul fiind cu sumă nulă, suma câştigurilor
corespunzătoare este egală cu 0 (şi de aceea se putea renunţa la precizarea
individuală a valorilor din coloana H 2 (g ) ).
71
Tabelul 2
g xj xk i ct p (g ) H 1 (g ) H 2 (g ) Numărul
ales
1 x0 x1 0 1 1
2 x1 x2 1 2 1 0 1
3 x1 x3 1 2 0 1 2
4 x2 x4 2 3 1 0 1
5 x2 x5 2 3 0 1 2
6 x3 x6 2 4 1 0 1
7 x3 x7 2 4 0 1 2
8 x4 x8 1 5 1 0 -2 2 1
9 x4 x9 1 5 0 1 -1 1 2
10 x5 x10 1 6 1 0 3 -3 1
11 x5 x11 1 6 0 1 -4 4 2
12 x6 x12 1 5 1 0 5 -5 1
13 x6 x13 1 5 0 1 2 -2 2
14 x7 x14 1 6 1 0 2 -2 1
15 x7 x15 1 6 0 1 6 -6 2
72
În completarea raţionamentelor de mai înainte, ne putem referi încă la
strategiile pure complexe care apar. Făcând produsul cartezian al mulţimilor M
aparţinătoare unor clase informaţionale distincte, având ca elemente mulţimi de
arce ce se aleg simultan ca variante, şi care, toate aparţin jucătorului 1, se obţine
mulţimea strategiilor pure complexe ale jucătorului 1:
{2,3}x {{8,12}, {9,13}} x {{10,14}, {11,15}} =
{{2, {8,12}, {10,14}}, {2, {8,12}, {11,15}}, {2, {9,13}, {10,14}},}
{2, {9,13}, {11,15}}, {3, {8,12}, {10,14}}, {3, {8,12}, {11,15}},
{3, {9,13}, {10,14}}, {3, {9,13}, {11,15}}},
formată din 8 strategii pure complexe. La fel, formând produsul cartezian
corespunzător în cazul jucătorului 2, se obţine mulţimea strategiilor pure complexe
ale acestuia:
{4,5} x {6,7} = {{4,6}, {4,7}, {5,6}, {5,7}},
formată din 4 strategii pure complexe.
Unitatea 2
Obiective:
CONŢINUTUL UNITĂŢII
{2 , {8,12}, {10,14}} 1
{2 , {8,12}, {11,15}} 2
{2 , {9,13}, {10,14}} 3
{2 , {9,13}, {11,15}} 4
1 {3 , {8,12}, {10,14}} 5
{3 , {8,12}, {11,15}} 6
{3 , {9,13}, {10,14}} 7
{3 , {9,13}, {11,15}} 8
{4,6} 1
2 {4,7} 2
{5,6} 3
{5,7} 4
H (g ) = ∑ p(q )H (q ) (1)
q∈G ( x )
unde G(x) este mulţimea tuturor arcelor incidente spre exterior vârfului final x al
arcului g. Vectorul (funcţia) de câştig căutat va fi cel care se va găsi pe arcul
rădăcină al arborescenţei.
75
Tabelul 4
g xj xk i ct p (g ) H 1 (g ) H 2 (g )
1 x0 x1 0 1 1 -2 2
2 x1 x2 1 2 0 -2 2
3 x1 x3 1 2 1 5 -5
4 x2 x4 2 3 1 -2 2
5 x2 x5 2 3 0 -4 4
6 x3 x6 2 4 1 5 -5
7 x3 x7 2 4 0 6 -6
8 x4 x8 1 5 1 -2 2
9 x4 x9 1 5 0 -1 1
10 x5 x10 1 6 0 3 -3
11 x5 x11 1 6 1 -4 4
12 x6 x12 1 5 1 5 -5
13 x6 x13 1 5 0 2 -2
14 x7 x14 1 6 0 2 -2
15 x7 x15 1 6 1 6 -6
76
H (7 ) = p (14)H (14) + p (15)H (15) = 0[2,−2] + 1[6,−6] = [6,−6],
Această ultimă valoare H (1) = [5,−5]. , este valoarea funcţiei de câştig asociată
perechii de strategii pure (6,1) a jocului matriceal, respectiv a perechii de
strategii pure complexe ({3, {8,12}, {11,15}}, {4,6}) a jocului poziţional iniţial dat.
Astfel o dată cu trecerea de la jocul poziţional la jocul matriceal asociat se poate
scrie H(6,1), în loc de H(1) şi sunt restabilite notaţiile din punctul 1.
Tabelul 5
i 1 2 3 4
1 -2 -2 3 3
2 -2 -2 -4 -4
3 -1 -1 3 3
4 -1 -1 -4 -4
5 5 2 5 2
6 5 6 5 6
7 2 2 2 2
8 2 6 2 6
77
2. Graficul problemei pentru perechea de strategii (6,1) poate fi reprezentat
într-o figură.
Arcelor cărora le corespund probabilităţile egale cu 1 vor fi marcate cu linii
duble. Lângă fiecare arc se va trece simbolul g al arcului şi valoarea funcţiei
H (g ) . Calculul valorilor H ( g ) , trecute în coloanele H 1 (g ) şi H 2 ( g ) ale tabelului
4 pot fi urmărite pe figură.
Unitatea 3
Obiective:
CONŢINUTUL UNITĂŢII
78
Teorema 1. Pentru a obţine strategii mixte asociate variantelor, în cazul
unui jucător fixat, se procedează după cum urmează:
Tabelul 6
1 2 3 4 5 6 7
i
1 1 1 1 1 0 0 1 =
2 -2 -2 3 3 -1 1 0 ≤
3 -2 -2 -4 -4 -1 1 0 ≤
4 -1 -1 3 3 -1 1 0 ≤
5 -1 -1 -4 -4 -1 1 0 ≤
6 5 2 5 2 -1 1 0 ≤
7 5 6 5 6 -1 1 0 ≤
8 2 2 2 2 -1 1 0 ≤
9 2 6 2 6 -1 1 0 ≤
10 0 0 0 0 1 -1 0 MIN
Astfel jucătorul 2 va putea aplica strategia pură complexă {4,6} respectiv {5,6} cu
probabilitatea µ1 respectiv µ 2 . Notând cu p probabilitatea pe arce şi în cazul
jucătorului 2, avem pe de o parte p1 (4) = µ1 , p1 (6) = µ1 , iar pe de altă parte
p 2 (5) = µ 2 , p 2 (6 ) = µ 2 , deci p (4 ) = p1 (4 ) = µ1 , p (5) = p 2 (5) = µ 2 ,
p (6) = p1 (6 ) + p 2 (6 ) = µ1 + µ 2 = 1.
s s
P = ∑ λi P i , λi ≥ 0, i = 1, s; ∑λ i = 1,
i =1 i =1
PJ T (a )
∑ λ P J (a )
1 i
T
s s
p (a ) = = i =1
= ∑λ P , λ ' ' '
≥ 0, i = 1, s; ∑λ '
= 1,
∑ PJ T (a ) ∑ PJ (a ) T 1 i i i
i =1 i =1
a∈a ∗ a∈a ∗
unde
λi ∑ Pi J T (a )
a∈a ∗ Pi J T (a )
λ'i = , Pi ' = .
∑ PJ (a ) T
∑ Pi J T (a )
a∈a ∗ a∈a ∗
Se consideră jocul poziţional cu următoarea desfăşurare. Primul pas este făcut de natură: sunt două
2 1
variante, prima se realizează cu probabilitatea , a doua cu probabilitatea . Al doilea pas este făcut de
3 3
jucătorul 1, care, necunoscând ce a realizat natura, alege unul dintre numerele 1,2. Pasul al treilea este
făcut de jucătorul 2, care, necunoscând ce s-a realizat la pasul aleatoriu, dar cunoscând numărul ales de
jucătorul 1 la al doilea pas, alege unul dintre numerele 1,2. Câştigul jucătorului 1, de la al doilea jucător,
este dat prin tabelul:
81
s 1 2 3 4 5 6 7 8
h(s) -1 5 2 -3 4 1 -2 6
unde s este codul situaţiei în ordonare lexicografică, iar h(s) este câştigul corespunzător.
1 x0 x1 0 1 1
2 x1 x2 0 2 2/3
3 x2 x3 1 3
4 x3 x4 2 4 -1 1
5 x3 x5 2 4 5 -5
6 x2 x6 1 3
7 x6 x7 2 5 2 -2
8 x6 x8 2 5 -3 3
9 x1 x9 0 2 1/3
10 x9 x10 1 3
11 x10 x11 2 4 4 -4
12 x10 x12 2 4 1 -1
13 x9 x13 1 3
14 x13 x14 2 5 -2 2
15 x13 x15 2 5 6 -6
3. Reducerea jocului. Corespondenţa între jocul poziţional şi jocul matriceal este stabilită în tabelul
următor.
Urmând calculele se poate scrie următoarea matrice a jocului (referitoare la jucătorul 1):
82
1 2 3 4
2 2 11 11
H =1
3 3 3 3
2 2
2 0 0
3 3
1 {3, 10} 1
{6, 13} 2
2 {{4,11}, {7,14}} 1
{{4,11}, {8,15}} 2
{{5,12}, {7,14}} 3
{{5,12}, {8,15}} 4
4. Rezolvarea jocului. Coloana a treia este dominantă şi se poate elimina. Matricei rămase i se
asociază matricea simplex
i\j 1 2 3 4 5 6
1 1 1 1 0 0 1 =
2 2 2 11 -1 1 0 ≤
3 3 3
3 2 0 0 -1 1 0 ≤
3
4 0 0 0 1 -1 0 MIN
P = [1,0], Q = λ1Q2 + λ2 Q2 ,
Q1 = [1,0,0,0], Q2 = [0,1,0,0],
λ1 ≥ 0, λ 2 ≥ 0, λ1 + λ2 = 1
83
TEME DE CONTROL
1. Jucătorul 1 alege un număr a din mulţimea {x,y}. Jucătorul 2 , fiind informat asupra numărului a,
alege numărul b din aceeaşi mulţime {x,y}. Jucătorul 1, uitând numărul a, şi nefiind informat asupra
numărului b, alege un număr c din mulţimea {x,y}. Câştigul jucătorului 1 este dat prin funcţia M:
M ( y, x, x ) = 5, M ( y, x, y ) = 2, M ( y, y, x ) = 2, M ( y, y, y ) = 6
Bibliografie modul
84
Modulul 3
Obiective:
Rezultate aşteptate:
Unitatea 1
Obiective:
CONŢINUTUL UNITĂŢII
Vom considera acum jocuri de informaţie incompletǎ (jocuri Bayes), adicǎ jocuri
în care cel puţin un jucǎtor nu este sigur (nu cunoaşte) de funcţia de câştig a altui
85
jucǎtor. Un exemplu specific de joc static de informaţie incompletǎ este cel al
vânzǎrii prin licitaţii. Fiecare ofertant cunoaşte evaluarea sa pentru un anumit bun
ce urmeazǎ a fi vândut dar nu ştie evluǎrile celorlalţi ofertanţi.
Definim forma normalǎ de eprezentare a unui joc Bayes static şi a unui echilibru
Bayes – Nash într-un astfel de joc. Întrucât aceste definiţii sunt abstracte şi destul
de complexe vom introduce ideile principale pentru exemplul simplu, anume
competiţia Cournot în informaţie asimetricǎ. Considerǎm un modul Cournot cu
inverse funcţiei cerere datǎ prin P(Q ) = a − Q, unde Q = q1 + q 2 este cantitatea
agregatǎ de pe piaţǎ. Funcţia cost a firmei 1 este C1 (q1 ) = cq1 . Funcţia cost a firmei 2
c L q 2 c H q2
este C 2 (q 2 ) care are distribuţia probabilisticǎ C 2 (q 2 ) : ,
1 − θ θ
unde c L < c H . Mai mult, informaţia este asimetricǎ deoarece firma 2 cunoaşte
funcţia sa de cost şi funcţia de cost a firmei 1, dar firma 1 cunoaşte funcţia sa de
cost şi cunoşte numai cǎ pentru firma 2 costul marginal c are distribuţia
probabilisticǎ
c cH
c: L .
1 − θ θ
Aceastǎ situaţie poate fi atunci când firma 2 vrea sǎ intre cu ceva sortiment nou pe
piaţǎ sau poate tocmai a inventat o nouǎ tehnologie. Toate acestea sunt în comun
cunoscute de cǎtre cele douǎ firme. Firma 1 ştie cǎ firma 2 are o informaţie în plus
(superioarǎ), firma 2 ştie cǎ firma 1 cunoaşte acest lucru şi aşa mai departe.
Natural, firma 2 poate vrea sǎ aleagǎ cantitǎţi diferite (de obicei mai mici) în cazul
când costul sǎu marginal este mai înalt decât atunci când costul este mai scǎzut.
Firma 1, din punctual sǎu de vedere, va anticipa cǎ firma 2 poate împǎrţi (alege)
cantitatea sa la costul sǎu în acest mod.
Fie q 2* (c ) notatǎ cantitatea pe care firm 2 o alege ca funcţie de costul sǎu, adicǎ
86
q * (c ) , daca c = c L
q 2* (c ) = *2 L .
q 2 (c H ) , daca c = c H
Fie q1* notatǎ singura cantitate pe care o allege firma 1. Când costul firmei 2 este
scǎzut, ea va alege q 2* (c L ) sǎ resolve problema
[( )
max a − q1* − q 2 − c L q 2 .
q2
]
[( )
max a − q1* − q 2 − c H q 2 .
q2
]
{ [( ) ] [(
max (1 − θ ) a − q1 − q 2* (c L ) − c q1 + θ a − q1 − q 2* (c H ) − c q1 ,
q1
) ] }
Condiţiile necesare de extrem pentru aceste trei probleme de optimizare sunt (dupǎ
anularea derivatelor de ordinul întâi)
q 2* (c L ) =
1
2
(
a − q1* − c L , ) q 2* (c H ) =
1
2
(
a − q1* − c H )
şi
q1* =
1
2
[
(1 − θ )(a − q 2* (c L ) − c ) + θ (a − q 2* (c H ) − c ) .]
q 2* (c L ) =
1
(a − 2c L + c ) − θ (c H − c L ),
3 6
q 2* (c H ) =
1
(a − 2c H + c ) − 1 − θ (c H − c L ),
3 6
87
q1* =
1
[a − 2c + (1 − θ )c L + θc H ].
3
q i+ =
1
(a − 2ci + c j ).
3
Aceastǎ situaţie apare deoarece firma 2 nu numai cǎ îşi împarte cantitatea sa dupǎ
costurile sale dar la fel rǎspunde la faptul cǎ firma 1 nu poate sǎ o facǎ. Dacǎ
pentru firma 2 costul este înalt, de exemplu, ea produce mai puţin, dar la fel
produce mai mult deoarece ea cunoaşte cǎ firma 1 va produce o cantitate ce
maximizeazǎ profitul ei aşteptat şi astfel este mai micǎ decât cantitatea ce o va
produce dacǎ ea ştie cǎ va fi costul firmei 2 înalt.
jucǎtorii au ales acţiunea a = (a1 , a 2 ,..., a n ) . Într-un joc cu mutǎri (decizii) simultane
de informaţie completǎ o strategie pentru un jucǎtor este, simplu, o acţiune, dar
într-un joc dinamic
88
(cu mutǎri succesive) de informaţie completǎ (finit sau infinit repetat) o strategie
poate fi diferitǎ de o acţiune. O strategie a jucǎtorului este un plan complet de
acţiuni – ea specificǎ o acţiune admisibilǎ pentru jucǎtor în fiecare contingenţǎ în
care jucǎtorul poate fi gǎsit în timp ce acţioneazǎ. Deci, într-un joc dinamic o
strategie este mai complicatǎ. Sǎ pregǎtim descrierea unui joc de informaţie
incompletǎ descriem mai întâi un joc static de informaţie completǎ dupǎ cum
urmeazǎ: (1) jucǎtorii aleg simultan acţiuni (jucǎtorul i alege acţiunea ai din
mulţimea admisibilǎ Ai ) şi apoi (2) câştigul H i (a1 , a 2 ,..., a n ) este primit de jucǎtorul
i.
Primul pas este sǎ prezentǎm ideea cǎ fiecare jucǎtor cunoaşte funcţia sa de câştig
dar poate fi nesigur asupra funcţiilor de câştig ale celorlalţi jucǎtori. Fie funcţiile
posibile de câştig ale jucǎtorului i reprezentate prin H i (a1 , a 2 ,..., a n ; t i ) unde t i este
numit tipul jucǎtorului i şi care aparţine la o mulţime posibilǎ de tipuri (sau spaţiul
tipurilor) Ti . Fiecǎrui tip t i îi corespunde o funcţie de câştig diferitǎ pe care
jucǎtorul i o poate avea.
Dând aceastǎ definiţie a tipului unui jucǎtor a spune cǎ jucǎtorul i cunoaşte funcţia
sa de câştig este echivalent cu a spune cǎ jucǎtorul i cunoaşte tipul sǎu. În
consecinţǎ a spune cǎ jucǎtorul i poate fi nesigur asupra funcţiilor de câştig ale
celorlalţi jucǎtori este echivalent cu a spune cǎ jucǎtorul i poate fi nesigur asupra
tipurilor celorllţi jucǎtori notate prin t −i = (t1 ,..., t i −1 , t i +1 ,..., t n ).
Notǎm T−i mulţimea tuturor valorilor posibile ale lui t −i , şi folosim distribuţia
probabilisticǎ pi (t −i / t i ) sǎ notǎm încrederea jucǎtorului i asupra tipurilor t −i ale
celorlalţi jucǎtori ştiind cǎ tipul jucǎtorului i este t i .
89
Observaţie. În multe aplicţii tipurile jucǎtorilor sunt independente, caz în care
pi (t −i / t i ) nu depinde de t i , aşa cǎ vom putea scrie încrederea jucǎtorului i ca
pi (t −i ) .
Observaţie. Folosim notaţia Γ =< I , {Ai }, {Ti }, {pi }, {H i } i ∈ I > pentru un joc static
Bayesian cu n jucǎtori.
Firma 2 are douǎ funcţii cost posibile şi astfel douǎ posibile profituri sau funcţii de
câştig:
H 2 (q1 , q 2 ; c L ) = [(a − q1 − q 2 ) − c L ]q 2
şi
H 2 (q1 , q 2 ; c H ) = [(a − q1 − q 2 ) − c H ]q 2 .
Astfel, spaţiul tipurilor firmei 1 este T1 = {c} , iar al firmei 2 (spaţiul tipurilor) este
T2 = {c L , c H }.
Observatie. Formularea (desfǎşurarea) unui joc Bayesian static este dupǎ cum
urmeazǎ:
(1) natura alege vectorul tip t = (t1 , t2 , K, tn ) , unde ti este luat din mulţimea de
tipuri posible Ti ;
(2) natura releveazǎ t i la jucǎtorul i dar nu la orice alt jucǎtor;
(3) jucǎtorii aleg simultan acţiuni, jucǎtorul i alege ai din mulţimea posibilǎ
(admisibilǎ) Ai ;
Deoarece natura reveleazǎ tipul jucǎtorului i, dar la nici un alt jucǎtor j în pasul (2),
jucǎtorul j nu cunoaşte istoria completǎ a jocului când acţiunile sunt alese în pasul
(3).
91
probabilitate p(t ). Când natura releveazǎ t i la jucǎtorul i, el poate calcula
încrederea pi (t −i / t i ) folosind regula lui Bayes
p (t− i , ti ) p (t− i , ti )
pi (t− i | ti ) = = .
p (ti ) ∑ p (t− i , ti )
t −i ∈T−i
Unitatea 2
Obiective:
CONŢINUTUL UNITĂŢII
Definiţie. Într-un joc Bayesian static T, o strategie pentru jucǎtorul i este o funcţie
si : Ti → Ai , care fiecǎrui tip t i ∈ Ti i se asociază acţiunea si (t i ) din mulţimea de
Astfel, dacă conceptul nostru de echilibru este să cerem ca strategia firmei 1 să fie
un cel mai bun răspuns la strategia firmei 2, atunci strategia firmei 2 trebuie să fie
o pereche de cantităţi, câte una pentru fiecare tip de cost posibil, altfel firma 1 nu
poate calcula dacă strategia sa este întradevăr un cel mai bun răspuns al firmei 2.
Dând definiţia unei strategii într-un joc Bayesian, ne întoarcem la definiţia unui
punct de echilibru Nash Bayesian. Ideea centrală este ca să fie simplu şi familiar:
fiecare strategie a jucătorului trebuie să fie cu cel mai bun răspuns la strategiile
celorlalţi jucători. Adică, un echilibru Bayesian Nash este simplu un echilibru
Nash într-un joc Bayesian.
Definitia 2.3. Într-un joc static Bayesian Γ strategiile s∗ = ( s1∗ , s2∗ , K , sn∗ )
constituie (in strategii pure) un echilibru Bayesian Nash daca pentru fiecare
jucator i si pentru fiecare i tipul ti ∈ Ti , si (ti ) rezolva problema
max
a i ∈ Ai
∑
t −i ∈T−i
H i ( s1∗ (t1 ), K , si∗−1 (ti −1 ), ai , si∗+1 (ti +1 ), K , sn∗ (tn ); t ) pi (t− i | ti ).
TEME DE CONTROL
Firma 2 are douǎ funcţii cost posibile şi astfel douǎ posibile profituri sau funcţii de
câştig:
H 2 (q1 , q 2 ; c L ) = [(a − q1 − q 2 ) − c L ]q 2
şi
H 2 (q1 , q 2 ; c H ) = [(a − q1 − q 2 ) − c H ]q 2 .
Astfel, spaţiul tipurilor firmei 1 este T1 = {c} , iar al firmei 2 (spaţiul tipurilor) este
T2 = {c L , c H }.
94
o funcţie de câştig diferitǎ, jucǎtorul poate sǎ reprezinte posibilitatea cǎ jucǎtorul
poate sǎ aibǎ mulţimi de acţiuni posibile diferite dupǎ cum urmeazǎ.
Cuprins
TEME DE CONTROL 61
TEME DE CONTROL 84
TEME DE CONTROL 94
95