Лекция 4. › shared › a › aristovaev › student › tab9 › l4... · 2014-09-29 ·...
TRANSCRIPT
Лекция 4.Решение матричных игр mxn
102.10.2014
2
4.1 Метод приближенного определения решения матричной игры (метод Робинсона-Брауна)4.2 Сведение матричной игры к задаче линейного программирования
3
Наличие седловой точки
Размерность матрицы 2×2
Упрощение матрицы
Да
Нет
Игра решается в чистых стратегиях
Игра решается в смешанных стратегиях
аналитическим или графическим
методом
Да
Нет
2×2 n×22×m
Нахождение активных стратегий
графическим методом
Нет
Приближенный метод решения или сведение к задаче
линейного программирования
4
Метод Робинсона-Брауна позволяет найти цену иоптимальные стратегии игроков с некоторой степеньюточности. Метод основан на следующих интуитивныхсоображениях:•Два игрока, участвующие в игре, не знают оптимальнойстратегии. Каждый из них решает вести себя так, чтобымаксимально увеличить свой выигрыш, предполагая, чтодругие партии будут похожи на предыдущие.
•Игра будет состоять из последовательности партий. Длякаждой партии этой последовательности можно вычислитьверхнюю и нижнюю границу цены игры, а такжеприближенную оптимальную стратегию для каждогоигрока.
5
α β γА 1 2 3В 4 0 1С 2 3 0
Стратегии 1-го игрока
Стратегии 2-го игрока
6
№ ВыборСтратегии
1-м игроком
Выборстратеги
и 2-м игроком
Суммарныйвыигрыш1-го игрока
А В С
Суммарный выигрыш 2-го
игрока
α β γ
1 А α 1 4 2 1 2 3
7
Партии 1-5
А В С α β γ1 А α 1 4 2 1 2 32 В α 2 8 4 5 2 43 В β 4 8 7 9 2 54 В β 6 8 10 13 2 65 С β 8 8 13 15 5 6
8
А В С α β γ6 С β 10 8 16 17 8 67 С γ 13 9 16 19 11 68 С γ 16 10 16 21 14 69 А γ 19 11 16 22 16 910 А γ 22 12 16 23 18 12
Партии 6-10
9
Партии 10-15
А В С α β γ11 А γ 25 13 16 24 20 1512 А γ 28 14 16 25 22 1813 А γ 31 15 16 26 24 2114 А γ 34 16 16 27 26 2415 А γ 37 17 16 28 28 27
10
Партии 15-20
А В С α β γ16 А 40 18 16 29 30 3017 А 41 22 18 30 32 3318 А 42 26 20 31 34 3619 А 43 30 22 32 36 3920 А 44 34 24 33 38 42
11
По результатам находим строки с максимальными суммарными выигрышами 1-го игрока, обозначим их V1
i , i=1,2,….20:
V1i = {4, 8, 8, 10, 13, 16, 16, 16, 19, 22, 25, 28, 31, 34,
37, 40, 41, 42, 43, 44}.
Cтроки с минимальными суммарными выигрышами 2-го игрока, обозначим их V2
i , i=1,2,….20:V2
i = 33,32,31,30,29,27,24,21,18,15,12,9,6,6,5,2,2,2,1
12
Цена игры V удовлетворяет неравенству:
i
vmin
i
i
1
{mini
,14
34,
13
31,
12
28,
11
25,
10
22,
9
19,
8
16,
7
16,
6
16,
5
13,
4
10,
3
8,
2
8,
1
4
20
44,
19
43,
18
42,
17
41,
16
40,
15
37}=2=
812512
,i
vmin
i
i 1,8125 ≤ V ≤ 2
13
xi xxx
iii
321,,
yi
yyy
iii
321,,
Обозначим для каждой партии i стратегию 1-го игрока,
=
а второго игрока: =
Координаты векторов X и Y представляют собой частоты партий - это правильные неотрицательные дроби, у которых числитель – это количество стратегий А,В,С, α,β,γ соответственно, а знаменатель номер партии.
14
Для 20-ти партий получаем следующие приближенные стратегии для 1-го и 2-го игроков.
0,0,11x ,0,0,1
1
y
0
,2
1
,2
12
x 0,0,12
y
0
,3
2
,3
13
x
0
,3
1
,3
23
y
20
4
,20
3,
20
1320
x
20
10
,20
4
,20
620
y
… … … … … … … …
15
Ответ: 1,8125 ≤ V ≤ 2,
20
4
,20
3,
20
1320
x стратегия 1-го игрока
20
10
,20
4
,20
620
y стратегия 2-го игрока
16
Пусть матрица Аmxn не содержит седловой точки и имеет вид:
nmjmmmm
nijiiii
nj
nj
nj
aaaaA
aaaaA
aaaaA
aaaaA
BBBB
21
21
2222212
2212111
21
Будем считать, что все элементы матрицы А неотрицательны (в противном случае, можно ко всем элементам А добавить некоторое достаточно большое число L, при этом цена игры изменится на эту же величину). Будем считать, что V>0.
(1)
17
nm qqqqpppp ,,,,,, 2121 - оптимальные смешанные стратегии 1-го и 2-го игроков
Пусть 2-й игрок примет свою чистую стратегию , а 1-й игрок - свою оптимальную стратегию р. тогда средний выигрыш 1-го игрока будет удовлетворять неравенствам:
Vpapapapa
Vpapapapa
Vpapapapa
Vpapapapa
mnmininn
mjmijijj
mmii
mmii
2211
2211
22222112
11221111
jB
18
Разделив левую и правую части неравенств (1) на положительную величину V, получим:
njV
pa
V
pa
V
pa
V
pa m
jm
i
jijj ,1,12
2
1
1
Введем обозначения:
mixV
pi
i ,1, (2)
19
Тогда (1) примет вид:
(3)
1
1
1
2211
2222112
1221111
mnmnn
mm
mm
xaxaxa
xaxaxa
xaxaxa
mixi ,1,0
20
Так как V - гарантированный выигрыш, то 1-й игрок стремится его максимизировать. Следовательно
minV
1minxxx m 21
21
Пример. Найти решение игры с платежной матрицей:
α β γА 1 2 3В 4 0 1С 2 3 0
22
310
13
132
124
31
21
31
321
321
,i,x
xx
xx
xxx
условияхпри
minxxx)x(f
,i,xНайти
i
i
310
132
14
132
31
21
31
321
321
,j,y
yy
yy
yyy
условияхпри
maxyyy)y(f
,j,yНайти
j
j
Для первого игрока Для второго игрока
23
24
25
26
27
28
29
30
31
32
33
34
Ответ: V=1.85,Стратегия 1-го игрока (0,55; 0,2; 0,25)Стратегия 2-го игрока (0,4; 0,35; 0,25)
Ответ найденный приближенным методом (20 партий):1,81 ≤ V ≤ 2,Стратегия 1-го игрока (0,65; 0,1; 0,25)Стратегия 2-го игрока (0,3; 0,2; 0,5)
Ответ найденный приближенным методом (100 партий):1,828 ≤ V ≤ 1,88,Стратегия 1-го игрока (0,57; 0,26; 0,17)Стратегия 2-го игрока (0,42; 0,34; 0,24)