Лекция 4. › shared › a › aristovaev › student › tab9 › l4... · 2014-09-29 ·...

34
Лекция 4. Решение матричных игр mxn 1 02.10.2014

Upload: others

Post on 04-Jul-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

Лекция 4.Решение матричных игр mxn

102.10.2014

Page 2: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

2

4.1 Метод приближенного определения решения матричной игры (метод Робинсона-Брауна)4.2 Сведение матричной игры к задаче линейного программирования

Page 3: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

3

Наличие седловой точки

Размерность матрицы 2×2

Упрощение матрицы

Да

Нет

Игра решается в чистых стратегиях

Игра решается в смешанных стратегиях

аналитическим или графическим

методом

Да

Нет

2×2 n×22×m

Нахождение активных стратегий

графическим методом

Нет

Приближенный метод решения или сведение к задаче

линейного программирования

Page 4: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

4

Метод Робинсона-Брауна позволяет найти цену иоптимальные стратегии игроков с некоторой степеньюточности. Метод основан на следующих интуитивныхсоображениях:•Два игрока, участвующие в игре, не знают оптимальнойстратегии. Каждый из них решает вести себя так, чтобымаксимально увеличить свой выигрыш, предполагая, чтодругие партии будут похожи на предыдущие.

•Игра будет состоять из последовательности партий. Длякаждой партии этой последовательности можно вычислитьверхнюю и нижнюю границу цены игры, а такжеприближенную оптимальную стратегию для каждогоигрока.

Page 5: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

5

α β γА 1 2 3В 4 0 1С 2 3 0

Стратегии 1-го игрока

Стратегии 2-го игрока

Page 6: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

6

№ ВыборСтратегии

1-м игроком

Выборстратеги

и 2-м игроком

Суммарныйвыигрыш1-го игрока

А В С

Суммарный выигрыш 2-го

игрока

α β γ

1 А α 1 4 2 1 2 3

Page 7: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

7

Партии 1-5

А В С α β γ1 А α 1 4 2 1 2 32 В α 2 8 4 5 2 43 В β 4 8 7 9 2 54 В β 6 8 10 13 2 65 С β 8 8 13 15 5 6

Page 8: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

8

А В С α β γ6 С β 10 8 16 17 8 67 С γ 13 9 16 19 11 68 С γ 16 10 16 21 14 69 А γ 19 11 16 22 16 910 А γ 22 12 16 23 18 12

Партии 6-10

Page 9: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

9

Партии 10-15

А В С α β γ11 А γ 25 13 16 24 20 1512 А γ 28 14 16 25 22 1813 А γ 31 15 16 26 24 2114 А γ 34 16 16 27 26 2415 А γ 37 17 16 28 28 27

Page 10: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

10

Партии 15-20

А В С α β γ16 А 40 18 16 29 30 3017 А 41 22 18 30 32 3318 А 42 26 20 31 34 3619 А 43 30 22 32 36 3920 А 44 34 24 33 38 42

Page 11: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

11

По результатам находим строки с максимальными суммарными выигрышами 1-го игрока, обозначим их V1

i , i=1,2,….20:

V1i = {4, 8, 8, 10, 13, 16, 16, 16, 19, 22, 25, 28, 31, 34,

37, 40, 41, 42, 43, 44}.

Cтроки с минимальными суммарными выигрышами 2-го игрока, обозначим их V2

i , i=1,2,….20:V2

i = 33,32,31,30,29,27,24,21,18,15,12,9,6,6,5,2,2,2,1

Page 12: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

12

Цена игры V удовлетворяет неравенству:

i

vmin

i

i

1

{mini

,14

34,

13

31,

12

28,

11

25,

10

22,

9

19,

8

16,

7

16,

6

16,

5

13,

4

10,

3

8,

2

8,

1

4

20

44,

19

43,

18

42,

17

41,

16

40,

15

37}=2=

812512

,i

vmin

i

i 1,8125 ≤ V ≤ 2

Page 13: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

13

xi xxx

iii

321,,

yi

yyy

iii

321,,

Обозначим для каждой партии i стратегию 1-го игрока,

=

а второго игрока: =

Координаты векторов X и Y представляют собой частоты партий - это правильные неотрицательные дроби, у которых числитель – это количество стратегий А,В,С, α,β,γ соответственно, а знаменатель номер партии.

Page 14: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

14

Для 20-ти партий получаем следующие приближенные стратегии для 1-го и 2-го игроков.

0,0,11x ,0,0,1

1

y

0

,2

1

,2

12

x 0,0,12

y

0

,3

2

,3

13

x

0

,3

1

,3

23

y

20

4

,20

3,

20

1320

x

20

10

,20

4

,20

620

y

… … … … … … … …

Page 15: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

15

Ответ: 1,8125 ≤ V ≤ 2,

20

4

,20

3,

20

1320

x стратегия 1-го игрока

20

10

,20

4

,20

620

y стратегия 2-го игрока

Page 16: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

16

Пусть матрица Аmxn не содержит седловой точки и имеет вид:

nmjmmmm

nijiiii

nj

nj

nj

aaaaA

aaaaA

aaaaA

aaaaA

BBBB

21

21

2222212

2212111

21

Будем считать, что все элементы матрицы А неотрицательны (в противном случае, можно ко всем элементам А добавить некоторое достаточно большое число L, при этом цена игры изменится на эту же величину). Будем считать, что V>0.

(1)

Page 17: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

17

nm qqqqpppp ,,,,,, 2121 - оптимальные смешанные стратегии 1-го и 2-го игроков

Пусть 2-й игрок примет свою чистую стратегию , а 1-й игрок - свою оптимальную стратегию р. тогда средний выигрыш 1-го игрока будет удовлетворять неравенствам:

Vpapapapa

Vpapapapa

Vpapapapa

Vpapapapa

mnmininn

mjmijijj

mmii

mmii

2211

2211

22222112

11221111

jB

Page 18: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

18

Разделив левую и правую части неравенств (1) на положительную величину V, получим:

njV

pa

V

pa

V

pa

V

pa m

jm

i

jijj ,1,12

2

1

1

Введем обозначения:

mixV

pi

i ,1, (2)

Page 19: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

19

Тогда (1) примет вид:

(3)

1

1

1

2211

2222112

1221111

mnmnn

mm

mm

xaxaxa

xaxaxa

xaxaxa

mixi ,1,0

Page 20: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

20

Так как V - гарантированный выигрыш, то 1-й игрок стремится его максимизировать. Следовательно

minV

1minxxx m 21

Page 21: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

21

Пример. Найти решение игры с платежной матрицей:

α β γА 1 2 3В 4 0 1С 2 3 0

Page 22: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

22

310

13

132

124

31

21

31

321

321

,i,x

xx

xx

xxx

условияхпри

minxxx)x(f

,i,xНайти

i

i

310

132

14

132

31

21

31

321

321

,j,y

yy

yy

yyy

условияхпри

maxyyy)y(f

,j,yНайти

j

j

Для первого игрока Для второго игрока

Page 23: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

23

Page 24: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

24

Page 25: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

25

Page 26: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

26

Page 27: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

27

Page 28: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

28

Page 29: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

29

Page 30: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

30

Page 31: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

31

Page 32: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

32

Page 33: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

33

Page 34: Лекция 4. › SHARED › a › ARISTOVAEV › Student › Tab9 › L4... · 2014-09-29 · Лекция 4. Решение матричных игр mxn 1 02.10.2014. 2 4.1 Метод

34

Ответ: V=1.85,Стратегия 1-го игрока (0,55; 0,2; 0,25)Стратегия 2-го игрока (0,4; 0,35; 0,25)

Ответ найденный приближенным методом (20 партий):1,81 ≤ V ≤ 2,Стратегия 1-го игрока (0,65; 0,1; 0,25)Стратегия 2-го игрока (0,3; 0,2; 0,5)

Ответ найденный приближенным методом (100 партий):1,828 ≤ V ≤ 1,88,Стратегия 1-го игрока (0,57; 0,26; 0,17)Стратегия 2-го игрока (0,42; 0,34; 0,24)