jocul operational

18
1 Jocul operaţional ca metodă de simulare Noţiuni introductive În toate domeniile de activitate este necesară analiza situațiilor conflictuale, acele situații practice în care sunt prezente două sau mai multe laturi ce urmăresc aspecte opuse și rezultatul final al “întrecerii” depinde de măsurile pe care și le-au luat pe parcurs competitorii. Orice conflict, luat nemijlocit din activitatea practică, este foarte complex și analiza lui matematică presupune construirea unui model simplificat (prin omiterea factorilor mai puțin importanți) și formalizat al conflictului, model care se numește “joc” și care se deosebește de conflictele reale prin faptul că are “reguli” bine definite. Teoria jocurilor este diferită de teoria jocurilor de noroc, chiar dacă terminologia este uneori analogă, în acestea din urmă elemental dominant fiind întâmplarea, iar acțiunile partenerilor nu pot forța această întâmplare în scopul câștigului. Jocurile care fac obiectul acestei teorii sunt acelea în care partenerii au libertatea de a-și alege strategia, adică un plan care conduce la obținerea unui câștig optim. Din acest motiv, aceste jocuri se numesc jocuri strategice și în acest context jocul apare ca un proces în care factorii activi sunt oamenii (jucatorii). John von Neumann şi Oskar Morgenstern în 1943: jocul este: orice interacţiune între diverşi agenţi, guvernată de un set de reguli specifice care stabilesc mutările posibile ale fiecărui participant şi câstigurile pentru fiecare combinaţie de mutări”. Teoria jocurilor utilizează trei ipoteze fundamentale: jucătorii se comportă raţional; fiecare stie că ceilalţi sunt raţionali; toţi jucătorii cunosc regulile jocului. Pentru a înţelege un joc oarecare este necesară mai întâi cunoaşterea regulilor acestuia, deoarece astfel se poate afla care acţiuni sunt permise (posibile) la un anumit moment şi care nu. Apoi este necesar se cunoască cum aleg jucătorii una dintre acţiunile posibile. Problema alegerii acţiunilor (strategiilor) de către jucători este legată de primele două ipoteze amintite anterior. Jucătorul raţional are o anumită ierarhie a preferinţelor, astfel încât este posibilă exprimarea acestora cu ajutorul unor funcţii de utilitate. Se poate observa că ipotezele cu care operează teoria jocurilor sunt similare celor cu care se lucrează în economie şi în alte domenii. Definiţia1. Numim joc cu n jucători o succesiune de decizii şi evenimente aleatoare distribuite probabilistic, simultane sau nu, care respectă o anumită structură a ştigului, impusă de anumite reguli (regulile jocului). Regulile jocului vor indica modul în care se iau deciziile de către jucatori şi ordinea acestora. Un jucător este raţional dacă va căuta să-şi maximizeze satisfacţia (câștigul) în raport cu ceilalţi jucatori. Definiţia 2. Se numeşte strategie a unui jucător, o acţiune posibilă, pe care jucătorul o poate alege în cadrul jocului. Mulţimea strategiilor jocului este dată de mulţimea strategiilor tuturor jucătorilor. Vom nota mulţimea strategiilor jocului astfel:

Upload: paul-tender

Post on 11-Nov-2015

330 views

Category:

Documents


4 download

DESCRIPTION

Joc operational

TRANSCRIPT

  • 1

    Jocul operaional ca metod de simulare

    Noiuni introductive

    n toate domeniile de activitate este necesar analiza situaiilor conflictuale, acele situaii practice n care sunt prezente dou sau mai multe laturi ce urmresc aspecte opuse i rezultatul final al ntrecerii depinde de msurile pe care i le-au luat pe parcurs competitorii. Orice conflict, luat nemijlocit din activitatea practic, este foarte complex i analiza lui matematic presupune construirea unui model simplificat (prin omiterea factorilor mai puin importani) i formalizat al conflictului, model care se numete joc i care se deosebete de conflictele reale prin faptul c are reguli bine definite.

    Teoria jocurilor este diferit de teoria jocurilor de noroc, chiar dac terminologia este uneori analog, n acestea din urm elemental dominant fiind ntmplarea, iar aciunile partenerilor nu pot fora aceast ntmplare n scopul ctigului.

    Jocurile care fac obiectul acestei teorii sunt acelea n care partenerii au libertatea

    de a-i alege strategia, adic un plan care conduce la obinerea unui ctig optim. Din acest motiv, aceste jocuri se numesc jocuri strategice i n acest context jocul apare ca un proces n care factorii activi sunt oamenii (jucatorii).

    John von Neumann i Oskar Morgenstern n 1943: jocul este: orice interaciune ntre diveri ageni, guvernat de un set de reguli specifice care stabilesc mutrile posibile ale fiecrui participant i cstigurile pentru fiecare combinaie de mutri.

    Teoria jocurilor utilizeaz trei ipoteze fundamentale: juctorii se comport raional; fiecare stie c ceilali sunt raionali; toi juctorii cunosc regulile jocului.

    Pentru a nelege un joc oarecare este necesar mai nti cunoaterea regulilor acestuia, deoarece astfel se poate afla care aciuni sunt permise (posibile) la un anumit moment i care nu. Apoi este necesar s se cunoasc cum aleg juctorii una dintre aciunile posibile.

    Problema alegerii aciunilor (strategiilor) de ctre juctori este legat de primele dou ipoteze amintite anterior. Juctorul raional are o anumit ierarhie a preferinelor, astfel nct este posibil exprimarea acestora cu ajutorul unor funcii de utilitate.

    Se poate observa c ipotezele cu care opereaz teoria jocurilor sunt similare celor cu care se lucreaz n economie i n alte domenii.

    Definiia1. Numim joc cu n juctori o succesiune de decizii i evenimente aleatoare distribuite probabilistic, simultane sau nu, care respect o anumit structur a ctigului, impus de anumite reguli (regulile jocului).

    Regulile jocului vor indica modul n care se iau deciziile de ctre jucatori i ordinea acestora.

    Un juctor este raional dac va cuta s-i maximizeze satisfacia (ctigul) n raport cu ceilali jucatori.

    Definiia 2. Se numete strategie a unui juctor, o aciune posibil, pe care juctorul o poate alege n cadrul jocului. Mulimea strategiilor jocului este dat de mulimea strategiilor tuturor juctorilor.

    Vom nota mulimea strategiilor jocului astfel:

  • 2

    S = S1 x S

    2 x ... x S

    n,

    unde n este numrul de juctori. n unele situaii, natura (hazardul) este al (n + 1) -lea juctor.

    Definiia 3. Se numete funcie ctig (de utilitate) a jocului, funcia u = (u1, u

    2,

    ...un), format din funciile ctig ale fiecrui juctor. Notnd funcia ctig a fiecrui

    juctor ui i funciile ctig ale celorlali jucatori u

    -i, funcia ctig a jocului va fi: u : S

    R, u = (ui, u

    -i). Strategiile se mai noteaz uzual cu ai i bj, reprezentnd acelai lucru.

    Definiia 4. Se numete strategie optimal acea strategie care maximizeaz ctigul juctorului i, indiferent de strategiile alese de ceilali juctori.

    Clasificarea jocurilor

    Jocurile pot fi clasificate n raport cu diverse criterii:

    a) n raport cu modul n care comunic jucatorii ntre ei: - jocuri cooperative;

    - jocuri necooperative.

    n jocurile cooperative juctorii comunic liber ntre ei nainte de luarea deciziilor i pot face promisiuni (care vor fi respectate) nainte de alegerea strategiilor, pe cnd n cele

    necooperative acetia nu comunic ntre ei nainte de luarea deciziilor. b) n raport cu desfurarea n timp a jocurilor: - jocuri statice;

    - jocuri dinamice.

    n jocurile statice deciziile juctorilor se iau simultan, dup care jocul ia sfrsit. n jocurile dinamice deciziile juctorilor sunt secveniale, adic evolueaz n timp.

    c) n raport cu natura informaiei: - jocuri n informaie complet; - jocuri n informaie incomplet.

    n primul caz, toi juctorii cunosc numrul celorlali juctori, strategiile fiecruia, funciile ctig ale fiecruia, precum i regulile jocului. n cel de-al doilea caz, cel puin unul dintre juctori nu cunoate una sau mai multe funcii ctig ale celorlali juctori, restul elementelor (numrul celorlali juctori, strategiile fiecruia i regulile jocului) fiind cunoscute.

    d) n cazul jocurilor dinamice, n raport cu tipul informaiei: - jocuri n informaie perfect - jocuri n informaie imperfect

    Jocul dinamic n informaie perfect este jocul dinamic n care fiecare dintre juctori cunoate regulile, numrul juctorilor, strategiile acestora, precum i evoluia n timp a jocului (istoria jocului). Jocul dinamic n informaie imperfect este jocul dinamic n care mcar unul dintre juctori nu cunoate istoria jocului, cunoscnd celelalte elemente.

    e) n raport cu structura ctigurilor: - jocuri de sum nul; - jocuri de sum nenul Jocul de suma nul este acel joc n care suma ctigurilor este zero . Jocul de suma nenul este jocul n care suma ctigurilor este diferit de zero.

  • 3

    f) n raport cu numrul de jucatori: - jocuri cu doi juctori; - jocuri cu mai muli juctori; - jocuri contra naturii (cu un singur jucator rational).

    g) n raport cu cantitatea de informaie pe care o au juctorii despre paii anteriori: - jocuri finite, cnd numrul de pai este finit - jocuri infinite, cnd numrul de pai este infinit.

    n cele ce urmeaz vom considera jocuri cu doi juctori (parteneri). n locul acestora pot fi considerate dou echipe n competiie, juctorii fiecreia dintre acestea fiind perfect corelai n aciuni i strategii. Fiecare dintre ei dispune de un numr finit de aciuni posibile (mutri) incompatibile, strategii i cunoate consecinele adoptrii lor. Fiecare juctor alege o strategie fr a ti care sunt strategiile adoptate de juctorul cu care este n competiie. Conform cu strategia aleas de fiecare juctor se asociaz o plat pentru fiecare cuplu de mutri generndu-se matricea plilor sau matricea jocului. De menionat c plile sunt, dup caz, ctiguri. Funciile corespunztoare se numesc funcii ctig, sau de utilitate (vezi definiia 3).

    Presupunem c numrul de strategii (mutri) al fiecrui juctor este finit.

    Juctorul 1J are m strategii notate maaa ,..., 21 iar J2 are n strategii .,..., nbbb 21 Dac J1

    adopt strategia ai i J2 adopt strategia bj, apare o plat egal cu i ja (sau ctig) pe care

    n mod convenional o ctig juctorul J1 i o pierde juctorul J2. (dac ,0ija n

    realitate J1 pierde i J2 ctig). Toate cele m.n pli ale jocului, precum i strategiile celor doi juctori sunt prezentate n tabela de mai jos, numit tabela plilor:

    J2

    b1 b2 ... bn a1 a11 a12 ... a1n a2 a21 a22 ... a2n

    J1 .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    am am1 am2 ... amn

    Matricea plilor este matricea )( ijaA care are m linii i n coloane. Dup cum se

    vede din matricea jocului am considerat strategiile juctorului J1 liniile matricei plilor, iar strategiile juctorului J2 coloanele matricei plilor. Alegerea de ctre J1 a strategiei ai nseamn alegerea liniei i a matricei A iar alegerea de ctre J2 a strategiei bj nseamn alegerea coloanei j a matricii A.

    n consecin, un joc matricial este caracterizat de tripletul (X, Y, A) unde :

    naaaX ..., ,21 este muimea strategiilor juctorilor J1 ;

  • 4

    nbbbY ,..., 21 este mulimea strategiilor juctorului J2 ;

    njmiaA ij ,,),( 1 1 este matricea plilor.

    Vom nota jocul prin (X, Y, A) i vom spune c un joc este rezolvat dac ambii juctori au ales cte o strategie optim. Perechea de strategii optime se numete soluia jocului.

    Exemple de jocuri.

    Doi juctori j1 i j2 aleg fiecare cte un numr din mulimea {1,2,3} i convin ca plata jocului s fie suma celor dou numere, anume:

    - Ctig j1 dac suma este un numr par; - Ctig j2 dac suma este numr impar.

    Matricea de pli a acestui joc de tip 3x3, ntocmit cu ctigurile lui j1 este:

    6543

    5432

    4321

    321

    Pierderea lui j1, este ctig al lui j2 i am notat-o cu semnul minus pentru a pstra ideea de ctig i pierdere. Juctorii j1 i j2 aleg cte un numr din mulimea {1,2,3} i respectiv mulimea {1,2,3,4}, j2 neavnd nici o informaie despre numrul ales de j1. Dup ce alegerile au fost fcute, j2 pltete lui j1 o sum definit n tabloul urmtor:

    11533

    21102

    1110121

    4321

    Prin urmare, dac j1 alege 1, iar j2 alege 3, atunci j2 pltete lui j1 suma de 10 um, iar dac j1 alege 3, iar j2 alege 2, atunci j1 pltete lui j2 suma de 5 um. Etc.

    Principiul dominrii

    Pe baza regulilor ce guverneaz jocul, se poate stabili o coresponden ntre fiecare pereche ordonat de strategii pure ale celor doi juctori i ctigul atribuit la sfritul jocului unuia dintre ei (egal de obicei cu pierderea celuilalt juctor). n multe cazuri, matricea jocului cuprinde unele strategii care sunt dezavantajoase pentru

    juctori, deci trebuie eliminate. Convenia stabilit este c pentru juctorul j1 sunt avantajoase strategiile cu pli mari, iar pentru j2, cele cu pli mici. De exemplu n jocul cu matricea:

  • 5

    42305

    31014

    10132

    12453

    4

    3

    2

    1

    54321

    a

    a

    a

    a

    bbbbb

    se observ cu convenia anterioar c strategiile b1 i b3 sunt dominate de strategia b4, cu pli mai mici, iar strategia a3 este dominat de strategia a4 cu plati mai mari. Prin eliminarea acestor strategii se obine jocul avnd matricea:

    420

    103

    125

    4

    2

    1

    542

    a

    a

    a

    bbb

    Rezult din exemplul de mai sus necesitatea gsirii strategiilor neavantajoase, pentru reducerea prealabil a matricei iniiale a jocului la o matrice mai simpl. Operaia prin care se ndeprteaz strategiile dezavantajoase poart numele de cercetarea dominrii. Dominarea este strict dac toate elementele unei linii sau coloane sunt respectiv mai mari sau mai mici dect acelea corespunztoare altor linii sau coloane. O strategie ai corespunztoare liniei i ale crei elemente sunt mai mici dect elementele liniei k

    kiij aa ( pentru orice j ) se spune c este dominat de strategia ak sau c strategia ak

    domin strategia ai . Acest lucru se scrie ik aa unde semnul exprim un raport de

    preferin. Dac dominaia nu este strict semnul este dublat i de semnul n care caz unele elemente ale liniei k pot fi egale cu elementele corespunztoare ale liniei i. De exemplu n jocul avnd matricea:

    125

    464

    432

    strategia a1 nu este dominat strict de strategia a2. Asemntor i n matricea:

    411

    652

    652

    unde strategiile a1 i a2 se repet.

    Dac isir aa pentru orice i se spune c strategia br este dominat de strategia

    )( srs bbb sau, prescurtat coloana r este dominat de coloana s. Deci este indicat ca

    juctorul B s renune la strategia br.

    Principiul minimax

    ntocmirea matricei jocurilor este precedat de stabilirea strategiilor de care dispune

  • 6

    fiecare juctor far a se analiza n prealabil calitatea acestora. Numai ntr-o matrice n care fiecare element aij al matricei plilor reprezint plata ce i se cuvine juctorului J1 dac acesta a ales strategia pur ai iar adversarul su J2 a ales strategia pur bj, urmeaz a se stabili comportarea celor doi juctori. n comportarea sa un juctor pornete de la premiza c adversarul su este cel puin tot att de priceput ca i el i face totul pentru a-l mpiedica s-i ating scopul. n teoria jocurilor nu se mizeaz pe incapacitatea adversarului, ci din contr pe calitile raionale ale juctorilor care trebuie s dovedeasc ingeniozitate. Principiul juctorilor este al aversiunii fa de risc; un juctor trebuie s-i aleag comportarea innd seama de aciunea cea mai defavorabil pe care i-o rezerv adversarul.

    Juctorul J1 dorete s acioneze n aa fel nct cel mai mic ctig asigurat pe care l poate obine de la juctorul J2 s fie ct mai mare posibil, fr ca juctorul J2 s-l poat mpiedica s-l obin. Juctorul J2 urmrete s fac pe ct posibil mai mic cea mai mare valoare ce o va da lui J1 fr ca acest juctor s poat obine mai mult indiferent ce ar face. Acest principiu nscut din pruden poart numele de principiul minimax i reprezint ideea care st la baza teoriei jocurilor.

    Jocuri cu sum constant

    Dac juctorul J1 alege strategia pur ai corespunztoare liniei i, trebuie s se atepte c juctorul J2 va rspunde cu aceea din strategiile sale pentru care ctigul lui J1 va fi cel mai mic.

    Aceast strategie a lui J2 corespunde numrului aij avnd n linia i a matricei m x n

    valoarea cea mai mic. Notm acest numr ijj

    i amin , unde j reprezint coloana n

    care figureaz cel mai mic element al liniei i. Deci dac J1 a ales strategia pur ai , el nu

    se ateapta s ctige mai mult dect i (bineneles n ipoteza c J2 alege aciunile sale

    cele mai logice). Dar J1 are la dispoziie m strategii pure, aadar el va cuta s aleag pe

    aceea dintre ele n care ia este cel mai mare. Dac iji

    ii

    aminmaxmax , atunci

    aceast valoare reprezint valoarea inferioar a jocului sau ctigul maxim al juctorului J1, notat cu v. Analog putem raiona i pentru juctorul J2 care urmrete s reduc pe ct posibil ctigul maxim pe care l-ar putea realiza juctorul J1 . Astfel alegndu-i strategia pur bj,

    el este sigur c J1 nu va putea ctiga mai mult dect max aij . Notm cu iji

    j amax

    elementul cu cea mai mare valoare situat n coloana j. Juctorul J2 are la dispoziie n

    strategii pure, aa c va alege coloana n care elementul j este cel mai mic, adic va

    cuta ijij

    jj

    amaxminmin numit valoarea superioar a jocului, notat v .

    S considerm elementul a al matricii plilor situat la intersecia liniei ce conine pe

    cu coloana care l conine pe .

  • 7

    a

    Deoarece elementul a face parte din coloana lui avem evident a i deoarece

    face parte din linia lui avem corespunztor a deci a .

    Cele dou valori i ale jocului exist ntotdeauna pentru orice matrice de pli. Ele permit juctorilor s cunoasc sumele pe care le au asigurate i anume juctorul J1 nu

    poate s ctige mai puin dect iar juctorul J2 nu poate pierde mai mult dect . Strategia ce garanteaz juctorului J1 ctigul egal cu valoarea inferioar a jocului se numete strategie maximin, iar cea corespunztoare lui J2 ce i asigur o pierdere egal cu valoarea superioar a jocului se numete strategie minimax.

    Exist jocuri pentru care adic cele dou valori, inferioar i superioar ale jocului sunt egale, avem deci:

    ijij

    ijji

    aa maxminminmax (1)

    Valoarea comun se numete valoarea jocului notat cu v, elementul matricii n care se realizeaz aceast egalitate se numete punct a iar jocurile pentru care are loc (1) se numesc jocuri cu punct a . Punctului a i corespunde o pereche de strategii minimax. Aceste strategii se numesc optime iar perechea lor determin valoarea jocului care este egal cu elementul corespunztor punctului a, aij din matrice.

    Rezolvarea jocurilor prin metoda grafic.

    Vom ilustra pe un exemplu aceast metod. Fie jocul matricial avnd matricea:

    4211

    2023

    1121

    3

    2

    1

    4321

    1

    2

    a

    a

    a

    bbbbJ

    J

    unde 321 aaa ,, sunt strategiile pure ale juctorului maximizant J1 i 4321 bbbb ,,, sunt

    strategiile pure ale juctorului minimizant J2. Se observ c strategia a1 este dominat de a2 pentru c:

    ),,,( 12 10 22 13)( 12 jaa jj

    i deci J1 renun la strategia dominant a1 fr ca valoarea jocului i strategiile optime s se modifice. Matricea jocului devine:

    4211

    2023

    Pentru juctorul minimizant J2 strategia b1 este dominat de b2 pentru c

    ),()( 11 32 12 ibb ii i strategia b4 este dominat de b3

  • 8

    ),( 42 2043 ii bb deci juctorul J2 renun la strategiile dominate b1 i b4 fr s modifice soluia optim a jocului. Matricea jocului a devenit:

    21

    02A

    Valorile inferioar i superioar ale jocului sunt:

    2

    022

    121

    002

    2

    1

    21

    j

    i

    a

    a

    bb

    Avem 2 si 0 vv . Jocul nu are punct a deoarece vv . n acest caz

    vvv i strategiile optime sunt strategii mixte 2121 [i yyYxxX ,, unde x1 i x2 reprezint frecvenele relative de folosire a strategiilor pure 1a respectiv 2a iar y1 ,y2

    frecvenele relative de folosire a strategiilor pure 1b respectiv 2b .

    Modelul matematic al jocului este:

    I

    vx

    vxx

    xx

    xx

    2

    21

    21

    21

    2

    2

    0

    1

    , II

    vyy

    vy

    yy

    yy

    21

    1

    21

    21

    2

    2

    0

    1

    ,

    Pentru sistemul I, 12 1 xx

    (2)

    (1)

    22

    13

    012

    012

    1

    1

    1

    11

    vx

    vx

    vx

    vxx

    )(

    )(

    Rezolvm grafic sistemul avnd n vedere c J1 este juctor maximizant,

    20 si 01 vx . Poligonul soluiilor posibile este triunghiul ABC. Soluia optim

    corespunde valorii maxime a lui v, deci este dat de punctul B.

    5

    4

    5

    2

    5

    3

    22

    1321

    1

    1vxx

    vx

    vx,,

    B

    A C

    x

    v

    2

    1

    1/3(2)

    (1)

    -1

    0 1

  • 9

    Pentru sistemul II avem: ,12 1 yy

    (2)

    (1)

    23

    02

    012

    02

    1

    1

    11

    1

    vy

    vy

    vyy

    vy

    )(

    n rezolvare se ine seama de faptul c 20 si 01 vy i J2 este juctor

    minimizant. Poligonul soluiilor posibile este triunghiul ABC.

    Soluia optim corespunde valorii minime a lui v, deci punctul:

    23

    02

    1

    1

    vy

    vy

    5

    3

    5

    4

    3

    221 yvy ,,

    Strategiile optime ale jocului iniial cu matricea asociat vor fi:

    0,5

    3,

    5

    2,0 si

    5

    2,

    5

    3,0 ** YX

    unde am inut cont de faptul c strategiile dominante 411 bba ,, sunt folosite de strategiile

    optime cu frecvene egale cu zero. Valoarea optim a jocului este .5

    4* v

    Jocul poate fi rezolvat prin metoda programarii liniare astfel:

    Se imparte fiecare inecuatie a sistemului II la V, se noteaza fiecare raport rezultat y1/V si

    y2/v cu Y1, respective Y2, se observa din asta ca rezulta functia obiectiv [max]g=Y1+Y2

    si gata problema pusa in ecuatie.

    Jocuri cu suma variabil

    Majoritatea jocurilor ce apar n afaceri nu au o sum constant. Jocurile cu sum variabil sunt mai complexe dect cele cu suma fix, i au o soluie mai complicat. Un exemplu este aa-numitul Lets Make a Deal (S facem o nelegere). Juctorul 1, o vedeta de cinema, i juctorul 2, un regizor, ncearc s se pun de acord cu privire la un film. Ei estimeaz c filmul va aduce un profit de 30 milioane $. Profitul ar urma s se mpart n mod egal. Regizorul i vedeta de cinema trebuie s fie amndoi de acord cu afacerea. Dac unul din ei o respinge, jocul se sfreste i filmul nu se va mai realiza. Jocul are dou echilibre. Unul dintre ele (da;da) nseamn c afacerea de 30 milioane $ este ncheiat i fiecare parte obine 15 milioane $. Al doilea echilibru (nu;nu)

    B

    A

    C

    y

    v

    2

    1

    2/3

    (2)(1)

    01

  • 10

    nseamn c afacerea nu s-a incheiat, i ambele pri obin 0 $. Dac vedeta de cinema tie ca studioul va respinge filmul, nu pierde nimic dac i ea l respinge. Cele dou echilibre sunt foarte diferite din punct de vedere al ctigurilor, fapt ce demonstreaz c jocul este unul cu suma variabil. Acest lucru ne oblig s facem diferena ntre echilibru i soluie. Un echilibru este reprezentat de orice pereche de strategii spre care se indic prin sagei din ambele direcii (valoarea jocului). n acest caz, ambii juctori au utilitate maxim i nici unul nu are motiv s schimbe strategia. Dac jocul este unul cu suma variabil, nu toate echilibrele au acelai ctig. Un rezultat trebuie s fie un punct de echilibru pentru a putea fi considerat o posibil soluie. Dac un rezultat nu este un punct de echilibru, atunci unul din juctori va ctiga printr-o schimbare de strategie. ns faptul c un rezultat este un punct de echilibru nu nseamn neaprat c acel rezultat este soluia. Prezentm o condiie suficient pentru a alege dintre echilibrul de valoare superioar i cel de valoare inferioar din jocul Lets Make a Deal. Observm c n ceea ce privete vedeta de cinema opiunea da i va aduce cel puin acelai ctig ca n cazul opiunii nu, pentru orice opiune a regizorului. De exemplu, dac regizorul spune da, atunci vedeta de cinema primete 15 milioane $ dac rspunde da, i 0 $ dac rspunde nu. Rspunsul da poate aduce un ctig mai mare dect rspunsul nu. Dac regizorul spune nu, atunci vedeta de cinema ctig 0$ pentru opiunea da i 0$ pentru opiunea nu. n acest caz problema devine o dilem. Nici unul dintre juctori nu are vreun motiv s spun nu, pentru c opiunea da, domin opiunea nu. Acest lucru ne face s devenim nencreztori n alegerea echilibrului (nu, nu) ca soluie. Aceast nencredere se nate ca urmare a urmtoarelor condiii suficiente: Aplicnd condiia suficient a strategiilor (opiunilor) nedominate n cazul jocului Lets Make a Deal), observm c (nu,nu) nu poate fi o soluie, din moment ce opiunea da domin n cazul ambilor juctori. La fel ca i condiiile suficiente n calcule, condiiile suficiente n teoria jocurilor arat c un anume rezultat nu poate fi o soluie, chiar dac este un echilibru. Ele sunt menite s demonstreze c anumite echilibre nu sunt posibile soluii. Jocul are i un alt echilibru, (da,da) i acest echilibru nu este infirmat de condiia suficient a strategiilor nedominate. De aceea soluia jocului este ca regizorul i vedeta de cinema s spun da afacerii. Astfel am rezolvat un prim joc cu suma variabil.

  • 11

    Jocuri contra naturii, decizii n condiii de risc

    Dac unul dintre juctorii este imprevizibil i pasiv, jocul se numete contra naturii. Matricea jocului (a plilor) este urmtoarea:

    A S1 S2 Sn

    D1

    D2

    .

    .

    Dm

    a11 a12 a1n a21 a22 a2n .

    .

    am1 am2 amn Probabilitile strilor naturii

    P1 P2 Pn

    - aij este profitul n starea Sj cnd decizia este Di, njmi ,1,,1

    - Pj este probabilitatea estimat pentru apariia strii Sj

    n

    j

    jPni1

    1,,1

    utilittiln (exprimat mediu profitul maximizeze s c)

    mediu )(regretul costul minimizeze s b)

    bani)n (exprimat mediu profitul maximizeze S a)

    :fipot Deciziile

    a)

    n

    j

    jiji PaMP1

    este ctigul mediu al decidentului

    Decidentul va alege strategia Di care-i maximizeaz profitul mediu:

    n

    j

    jijmi

    imi

    i xaMPMP1

    ,1,1

    * maxmax

    b) Se va construi o nou matrice (a regretelor) din matricea A a plilor. Fie

    ij

    mii aP

    ,1max

    cea mai mare plat pe care o obine

    decidentul dac starea naturii este Sj i njmiar ijjij ,1,,1

    Matricea ijij

    rR construit astfel se numete matricea regretelor.

    Se alege acea alternativ care minimizeaz regretul mediu, adic minimizeaz pierderile medii.

    n

    j

    n

    j

    jijmi

    jij PrPr1 1

    ,1

    * min .

    Valoarea medie a informaiei perfecte este o msur a diferenei ntre profitul mediu ce s-ar obine n condiii de certitudine i profitul mediu maxim n condiii de risc.

    Profitul mediu de certitudine este

    n

    j

    jj PMC1

    , unde j este elementul maxim pe

    coloana j, iar Pj este probabilitatea de apariie a strii Sj.

  • 12

    Profitul mediu de risc este

    n

    j

    jiji

    PaMP1

    max

    MIP MC MP este regretul mediu minim. Informaie suplimentar:

    nkB

    APaMP

    k

    jij

    mik ,1max

    ,1

    Profitul mediu:

    n

    k

    kk BPMPMS1

    .

    n continuare sunt prezentate cteva exemple de determinare a strategiei optime cu

    ajutorul teoriei jocurilor.

    1. Companiile petroliere Shell i Lukoil intenioneaz s construiasc (independent una de cealalt) o staie de carburani ntr-o intersecie intens circulat ntre trei orae A,B,C, situate la 15 km, 10km respectiv 20 km unul fa de altul. Se tie c 40% dintre solicitanii din zon se aprovizioneaz n prezent din primul ora, 35% din al doilea I 25% din al treilea.

    Se tie deasemenea c prima companie ar controla majoritatea pieei n situaii comparabile. Din cercetrile efectuate n zon de ambele companii s-a ajuns la urmtoarele previziuni identice:

    - dac ambele companii s-ar instala ntr-un ora (sau la distane egale de acesta) prima ar controla 70% din piaa petrolier a acestuia.

    - dac prima companie ar fi mai aproape de un ora dect a doua, ar controla 85% din piaa acestuia iar n caz contrar ar controla doar 40%.

    - Oraul al treilea fiind mai mic nu intr n planurile de afaceri ale primei companii. a) Considernd enunul de mai sus un joc n care juctorii sunt cele dou companii s

    se construiasc matricea jocului i s se stabileasc strategiile optime ale celor doi juctori.

    b) Ce strategii pure se pot nltura prin aplicarea criteriului dominrii? Rezolvare: a) Strategiile pure ale celor doi juctori sunt urmtoarele:

    - strategia a1 prima companie poate construi n oraul A - strategia a2 prima companie poate construi n oraul B - strategia b1 a doua companie poate construi n oraul A - strategia b2 a doua companie poate construi n oraul B - strategia b3 a doua companie poate construi n oraul C

    Presupunem c ncasrile ar fi n aceleai procente cu cele din cercetrile de marketing realizate i c un procent ctigat sau pierdut de una dintre firme este un procent pierdut sau ctigat de cealalt. Rezult c jocul are sum nul. Calculul elementelor matricei jocului se efectueaz astfel: Dac ambele companii construiesc n acelai ora, atunci prima companie va acapara

    70% din piaa ntregii regiuni, deci 70,02211 qq .

    Dac Shell construiete n oraul A, iar Lukoil n oraul B, atunci:

  • 13

    59,01,014,035,025,04,035,040,040,085,012 q .

    Dac Shell construiete n oraul A, iar Lukoil n oraul B,

    atunci: 74,01,03,034,025,04,035,085,04,085,013 q .

    Dup acelai raionament 74,023 q .

    Dac Shell construiete n oraul B iar Lukoil n oraul A, atunci:

    71,025,09,035,085,04,04,021 q .

    Matricea jocului va fi:

    Shell

    Lukoil 321bbb

    1

    2

    1

    a

    a

    74,070,071,0

    74,059,070,0

    70,0

    59,0

    1 74,07,071,0 70,0

    70,0

    Valoarea inferioar a jocului este:

    70,0)max(maxmax issi

    ii

    q .

    Valoarea superioar este:

    70,0)max(minmin issi

    si

    q .

    Cum 7,0 , aceasta va fi valoarea jocului, iar strategiile pure optime sunt:

    2a - Shell s construiasc n oraul B

    2b - Lukoil s construiasc tot n oraul B

    b) Primul juctor poate s nlture strategia 1a pentru c plile corespunztoare sunt mai

    mici sau egale dect plile strategiei )3,2,1( 212 iqqa ii .

    Al doilea juctor poate s nlture strategiile 1b i 3b pentru c 21 ii qq i 23 ii qq

    2,1i , adic 2321 , bbbb .

    Dup eliminarea acestor strategii, matricea jocului rmne format dintr-un singur

    element 70,022 q , care corespunde strategiilor pure 21 ba i ale celor doi juctori.

    Acestea sunt strategiile optimale.

    2. O firm care comercializeaz tehnic de calcul achiziioneaz echipamente de calcul care urmeaz s fie vndute ntr-o anumit perioad de timp. Conform unei statistici bazat pe date privind vnzrile anterioare se estimeaz vnzrile dup repartiia:

    2,04,03,01,0

    2015105

    Comanda minim este de 5 calculatoare, costul unitar fiind 1000 um iar costul de vnzare de 1300 um.

  • 14

    Conform contractului, dup perioada convenit calculatoarele nevndute vor fi returnate productorului contra sumei de 800 um/buc. S se stabileasc numrul optim de calculatoare care pot fi cumprate de ctre firm pentru comercializare.

    Rezolvare

    Problema poate fi scris sub forma unui joc matriceal. Se observ c la fiecare calculator vndut se ctig 300 um i se pierd 200 um pentru fiecare calculator returnat productorului. Matricea jocului este urmtoarea:

    Cererea

    pieei Probabili-

    tatea Cantitatea comandat

    a1:5 a2:10 a3:15 a4:20

    C1:5

    C2:10

    C3:15

    C4:20

    0,1

    0,3

    0,4

    0,2

    1500

    1500

    1500

    1500

    500

    3000

    3000

    3000

    -500

    2000

    4500

    4500

    -1500

    1000

    3500

    6000

    Dac n stabilirea deciziei optime a firmei se ine seama numai de consecinele economice, atunci se pot aplica criteriile maximin, maximax, minimax.

    a) Prin criteriul maximin se stabilete cea mai mare valoare minim din toate actele de decizie, conducnd la o soluie prevenitoare, pentru c se va avea n vedere tot ce este mai ru posibil s se ntmple. Algoritmul const n alegerea minimului fiecrei coloane I dintre acestea se alege maximul:

    a1 a2 a3 a4

    1500 500 -500 -1500

    Rezultatul alegerii este a1, conducnd la cea mai mic pierdere de suportat. b) Prin criteriul maximax, total opus criteriului maximin, se alege strategia cu cea mai

    mare valoare dintre toate actele de decizie, potrivit principiului celui mai bun lucru care se poate ntmpla Se calculeaz maximul fiecrei coloane I dintre aceste elemente se alege maximul:

    a1 a2 a3 a4

    1500 3000 4500 6000

    Rezultatul alegerii este a4, conducnd la cel mai mare ctig posibil (dar cu cel mai mare risc).

    c) Criteriul minimax se bazeaz pe pruden. Se alege maximul fiecrei coloane i dintre acestea se alege minimul.

    a1 a2 a3 a4

    1500 3000 4500 6000

    Cea mai prudent decizie este deci a1.

  • 15

    d) Criteriul lui Savage, reprezint acelai criteriu minimax utilizat pe o matrice a jocului ale crei elemente se numesc pierderi condiionate ale oportunitii (regrete). n acest caz elementele matricei reprezint pentru fiecare strategie diferena dintre ctigul economic al acelei strategii i ctigul economic cel mai bun n cazul n care se verific un anumit eveniment, sau, n cazul n care natura este ntr-o stare dat. De exemplu, s presupunem c are loc evenimentul c1, atunci strategia cea mai bun este a1, ctigul economic fiind de 1500 u.m. Pierderile condiionate de acest eveniment se obin scznd din ctigul cel mai bun fiecare ctig corespunztor fiecrei strategii. Matricea regretelor va fi:

    a1 a2 a3 a4

    C1

    C2

    C3

    C4

    max

    0

    1500

    3000

    4500

    4500

    1000

    0

    1500

    3000

    3000

    2000

    1000

    0

    1500

    2000

    3000

    2000

    1000

    0

    3000

    Pierderea maxim a oportunitii (regretul maxin) se gsete n ultima linie a tabelului iar soluia optim este a3 creia i corespunde valoarea minim a regretelor maxime.

    e) innd seama de faptul c se cunosc probabilitile Pi 4,1i se pot determina

    prevederile medii folosind datele din matricea iniial nmulite cu 1 (pentru a reprezenta pierderi). Dintre ele se alege conform criteriului lui Bayes cea mai mic pierdere medie i ea va reprezenta strategia Bayes a jocului:

    Avem:

    PM1 =15000,1+ 15000,3+ 15000,4+ 15000,2= 1500

    PM2 = 5000,1+ 30000,3+ 30000,4+ 30000,2= 2750

    PM3 = -5000,1+ 20000,3+ 45000,4+ 45000,2= 3250

    PM4 = -15000,1+ 10000,3+ 35000,4+ 60000,2= 2750

    i PM3 = max (PMi), 4,1i

    ceea ce conduce la concluzia c a3 este strategia Bayes. Aplicnd criteriul Bayes pe matricea regretelor avem:

    PM1 = 00,1+15000,3+ 30000,4+ 45000,2= 2500

    PM2 = 10000,1+15000,4+ 30000,2= 1300

    PM3 = 200000,1+10000,3+ 15000,4= 800

    PM4 = 30000,1+20000,3+ 10000,4= 1300

    Fiind vorba de pierderi medii, se alege PM3= min (PMi), 4,1i deci strategia a3

    este strategia Bayes.

    3. O societate extractiv ofer 200.000 dolari unui proprietar de teren pentru dreptul de a cerceta existana hidrocarburilor i exploatarea lor n cazul unor rezultate favorabile ale cercetrii. Exploatarea va aduce un ctig de 800.000 dolari proprietarului, iar costul prospeciunii este de 300.000 dolari, recuperai numai dac se vor descoperi zcminte exploatabile. Dac se descoper resurse exploatabile, proprietarul estimeaz pentru cel ce

  • 16

    le va exploata un profit net de 3 mil. dolari.

    a) S se stabileasc decizia optim a proprietarului de teren n acest caz; b) S se stabileasc decizia optim a proprietarului de teren dac se estimeaz c

    probabilitatea de a gsi hidrocarburi este de 0,6. Rezolvare:

    a) Deciziile proprietarului pot fi:

    a1 acceptarea ofertei; a2 exploatarea pe cont propriu. Strile naturii sunt:

    1 nu exist zcmnt n subsolul terenului;

    2 exist zcmnt. Aplicnd criteriul Bayes-Laplace avem

    1 2

    a1

    a2

    200 1000 -300 3000

    ,8502

    3000300,

    2

    1000200max

    1max

    1

    i

    n

    j

    iji

    qn

    deci decizia optim n baza acestui criteriu este a2.

    b) Matricea ctigurilor proprietarului va fi:

    p() a1 a2

    1

    2

    0,4

    0,6

    200

    1000

    -300

    3000

    PMi 680 1680

    Soluia optim este cea care conduce la un profit mediu maxim.

    )1680,680max(

    )6,030004,03006,010004,0200max()(max

    ;PMii

    Aadar, cunoscnd probabilitile p(1) i p(2) decizia optim este a2 s exploateze pe cont propriu prin criteriul a priori.

    4. n problema anterioar, proprietarul de teren efectueaz sondaje pentru descoperirea zcmntului cu un cost de 50.000 dolari. Se admite c n 30% din cazuri sondajul nu indic existena zcmntului, cu toate c el exist. Cnd zcmntul nu exist testul este exact n 90% din cazuri.

    Folosind aceste date i estimarea iniial potrivit creia probabilitatea existenei zcmntului este 0,6 s se determine decizia optim a proprietarului. Rezolvare:

    Problema se ncadreaz n categoria jocurilor cu experien unic, avnd spaiul rezultatelor Z={z1,z2) cu z1= evenimentul c sondajul indic inexistena zcmntului, iar z2= evenimentul c sondajul indic existena zcmntului. Din enun avem:

  • 17

    P(z1/1)= 0,9; P(z1/2)= 0,3

    P(z2/1)= 0,1; P(z2/2)= 0,7 Sunt necesare probabilitile a posteriori calculate cu formula lui Bayes.

    Avem:

    3

    2

    6,03,04,09,0

    4,09,0

    //

    //

    221111

    11111

    PzPPzP

    PzPzP

    23

    2

    6,07,04,01,0

    4,01,0

    //

    //

    222112

    11221

    PzPPzP

    PzPzP

    Tot din enunul problemei se deduce c matricea ctigurilor proprietarului se

    modific, fiecare element diminundu-se cu 50 din cauza cheltuielilor necesitate de

    operaia de sondaj. Avem deci

    p() a1 a2

    1

    2

    0,4

    0,6

    150

    950

    -350

    2950

    Cu probabiliti a posteriori i cu ctigurile din aceast matrice se pot determina ctigurile medii ale proprietarului pentru fiecare rezultat z1,z2 al experienei, dup formula:

    0

    ,/ fixatZzzpMPMS A

    n cazul evenimetului Z1 ctigurile medii ale proprietarului sunt:

    4173

    1950

    3

    2150// 1221111111 zpqzpqMS

    7503

    12950

    3

    2350// 1222111212 zpqzpqMS

    max (MS1, MS2)= 750 deci decizia optim este a2 dac rezultatul experienei este z1. n cazul evenimentului z2 ctigurile medii ale proprietarului sunt:

    84023

    21950

    23

    2150// 2221211121 zpqzpqMS

  • 18

    266323

    212950

    23

    2350// 1222211222 zpqzpqMS

    max (MS21, MS22) = 2663, adic decizia optim este a2 dac rezultatul experienei este z2. Rezult c se alege strategia de exploatare pe cont propriu a2, n oricare caz.

    5. O firm care deine un lan de magazine de confecii trebuie s comande n primvara fiecrui an confeciile pentru iarna viitoare. Profitul firmei va depinde de numrul de haine ce vor fi comandate i de faptul dac moda va rezista de la data ncheierii contractului i pn la sezonul de iarn. Estimarea ctigurilor (n mii de dolari) efectuate de firm sunt date n tabelul urmtor:

    a1: nu comand

    a2:

    comand puin

    a3:

    comand moderat

    a4:

    comand suficient

    C1: hainele sunt la

    mod C2: hainele sunt

    acceptabile

    C3: hainele nu mai

    sunt la mod

    -50

    0

    80

    -10

    30

    35

    60

    45

    -30

    80

    40

    -45

    S se determine soluia optim de aprovizionare. Rezolvare:

    Folosind criteriul Bayes-Laplace se obine:

    25max3

    454080,

    3

    304560,

    3

    353010,

    3

    80050max

    1max

    1

    25 25; 33; 18, 10;

    n

    i

    ijj

    qn

    deci decizia optim este a3 sau a4.