Лекция 4. › shared › a › aristovaev › student › tab9 › l4... · 2014-09-29 ·...

Лекция 4.Решение матричных игр mxn

102.10.2014

2

4.1 Метод приближенного определения решения матричной игры (метод Робинсона-Брауна)4.2 Сведение матричной игры к задаче линейного программирования

3

Наличие седловой точки

Размерность матрицы 2×2

Упрощение матрицы

Да

Нет

Игра решается в чистых стратегиях

Игра решается в смешанных стратегиях

аналитическим или графическим

методом

Да

Нет

2×2 n×22×m

Нахождение активных стратегий

графическим методом

Нет

Приближенный метод решения или сведение к задаче

линейного программирования

4

Метод Робинсона-Брауна позволяет найти цену иоптимальные стратегии игроков с некоторой степеньюточности. Метод основан на следующих интуитивныхсоображениях:•Два игрока, участвующие в игре, не знают оптимальнойстратегии. Каждый из них решает вести себя так, чтобымаксимально увеличить свой выигрыш, предполагая, чтодругие партии будут похожи на предыдущие.

•Игра будет состоять из последовательности партий. Длякаждой партии этой последовательности можно вычислитьверхнюю и нижнюю границу цены игры, а такжеприближенную оптимальную стратегию для каждогоигрока.

5

α β γА 1 2 3В 4 0 1С 2 3 0

Стратегии 1-го игрока

Стратегии 2-го игрока

6

№ ВыборСтратегии

1-м игроком

Выборстратеги

и 2-м игроком

Суммарныйвыигрыш1-го игрока

А В С

Суммарный выигрыш 2-го

игрока

α β γ

1 А α 1 4 2 1 2 3

7

Партии 1-5

А В С α β γ1 А α 1 4 2 1 2 32 В α 2 8 4 5 2 43 В β 4 8 7 9 2 54 В β 6 8 10 13 2 65 С β 8 8 13 15 5 6

8

А В С α β γ6 С β 10 8 16 17 8 67 С γ 13 9 16 19 11 68 С γ 16 10 16 21 14 69 А γ 19 11 16 22 16 910 А γ 22 12 16 23 18 12

Партии 6-10

9

Партии 10-15

А В С α β γ11 А γ 25 13 16 24 20 1512 А γ 28 14 16 25 22 1813 А γ 31 15 16 26 24 2114 А γ 34 16 16 27 26 2415 А γ 37 17 16 28 28 27

10

Партии 15-20

А В С α β γ16 А 40 18 16 29 30 3017 А 41 22 18 30 32 3318 А 42 26 20 31 34 3619 А 43 30 22 32 36 3920 А 44 34 24 33 38 42

11

По результатам находим строки с максимальными суммарными выигрышами 1-го игрока, обозначим их V1

i , i=1,2,….20:

V1i = {4, 8, 8, 10, 13, 16, 16, 16, 19, 22, 25, 28, 31, 34,

37, 40, 41, 42, 43, 44}.

Cтроки с минимальными суммарными выигрышами 2-го игрока, обозначим их V2

i , i=1,2,….20:V2

i = 33,32,31,30,29,27,24,21,18,15,12,9,6,6,5,2,2,2,1

12

Цена игры V удовлетворяет неравенству:

i

vmin

i

i

1

{mini

,14

34,

13

31,

12

28,

11

25,

10

22,

9

19,

8

16,

7

16,

6

16,

5

13,

4

10,

3

8,

2

8,

1

4

20

44,

19

43,

18

42,

17

41,

16

40,

15

37}=2=

812512

,i

vmin

i

i 1,8125 ≤ V ≤ 2

13

xi xxx

iii

321,,

yi

yyy

iii

321,,

Обозначим для каждой партии i стратегию 1-го игрока,

=

а второго игрока: =

Координаты векторов X и Y представляют собой частоты партий - это правильные неотрицательные дроби, у которых числитель – это количество стратегий А,В,С, α,β,γ соответственно, а знаменатель номер партии.

14

Для 20-ти партий получаем следующие приближенные стратегии для 1-го и 2-го игроков.

0,0,11x ,0,0,1

1

y

0

,2

1

,2

12

x 0,0,12

y

0

,3

2

,3

13

x

0

,3

1

,3

23

y

20

4

,20

3,

20

1320

x

20

10

,20

4

,20

620

y

… … … … … … … …

15

Ответ: 1,8125 ≤ V ≤ 2,

20

4

,20

3,

20

1320

x стратегия 1-го игрока

20

10

,20

4

,20

620

y стратегия 2-го игрока

16

Пусть матрица Аmxn не содержит седловой точки и имеет вид:

nmjmmmm

nijiiii

nj

nj

nj

aaaaA

aaaaA

aaaaA

aaaaA

BBBB

21

21

2222212

2212111

21

Будем считать, что все элементы матрицы А неотрицательны (в противном случае, можно ко всем элементам А добавить некоторое достаточно большое число L, при этом цена игры изменится на эту же величину). Будем считать, что V>0.

(1)

17

nm qqqqpppp ,,,,,, 2121 - оптимальные смешанные стратегии 1-го и 2-го игроков

Пусть 2-й игрок примет свою чистую стратегию , а 1-й игрок - свою оптимальную стратегию р. тогда средний выигрыш 1-го игрока будет удовлетворять неравенствам:

Vpapapapa

Vpapapapa

Vpapapapa

Vpapapapa

mnmininn

mjmijijj

mmii

mmii

2211

2211

22222112

11221111

jB

18

Разделив левую и правую части неравенств (1) на положительную величину V, получим:

njV

pa

V

pa

V

pa

V

pa m

jm

i

jijj ,1,12

2

1

1

Введем обозначения:

mixV

pi

i ,1, (2)

19

Тогда (1) примет вид:

(3)

1

1

1

2211

2222112

1221111

mnmnn

mm

mm

xaxaxa

xaxaxa

xaxaxa

mixi ,1,0

20

Так как V - гарантированный выигрыш, то 1-й игрок стремится его максимизировать. Следовательно

minV

1minxxx m 21

21

Пример. Найти решение игры с платежной матрицей:

α β γА 1 2 3В 4 0 1С 2 3 0

22

310

13

132

124

31

21

31

321

321

,i,x

xx

xx

xxx

условияхпри

minxxx)x(f

,i,xНайти

i

i

310

132

14

132

31

21

31

321

321

,j,y

yy

yy

yyy

условияхпри

maxyyy)y(f

,j,yНайти

j

j

Для первого игрока Для второго игрока

34

Ответ: V=1.85,Стратегия 1-го игрока (0,55; 0,2; 0,25)Стратегия 2-го игрока (0,4; 0,35; 0,25)

Ответ найденный приближенным методом (20 партий):1,81 ≤ V ≤ 2,Стратегия 1-го игрока (0,65; 0,1; 0,25)Стратегия 2-го игрока (0,3; 0,2; 0,5)

Ответ найденный приближенным методом (100 партий):1,828 ≤ V ≤ 1,88,Стратегия 1-го игрока (0,57; 0,26; 0,17)Стратегия 2-го игрока (0,42; 0,34; 0,24)

Лекция 4. › shared › a › aristovaev › student › tab9 › l4... · 2014-09-29 ·...

Documents