теория игр

54
Теория игр А.В. Цыганов, 2010

Upload: oleg-kit

Post on 06-Aug-2015

217 views

Category:

Science


2 download

TRANSCRIPT

Page 1: теория игр

Теория игр

А.В. Цыганов, 2010

Page 2: теория игр

Разумная человеческая деятельность в большинстве случаев состоит в том, что человеку для достижения тех или иных целейприходится принимать решения.

При этом представляется вполне естественным стремлениепринимать оптимальные решения, которые реализуютпоставленные цели в наибольшей степени.

Научные постановки вопроса о выборе оптимальных решений встречались и встречаются в различных дисциплинах. По мере развития и математизации этих дисциплин соответствующие процессы принятия решений формализуются и приобретают характер математических моделей.

Теория математических моделей принятия оптимальныхрешений составляет ныне обширную отрасль науки,называемую исследованием операций.

Page 3: теория игр

Будем говорить о принятии решений опираясь на интуитивноепонятие решения, как способа устранения проблемнойситуации.

Проблемная ситуация предполагает наличие:

• цели;

• ресурсов;

• альтернатив (способов действий);

• свойств окружающей среды.

Проблемная ситуация предполагает неудовлетворенность лица, принимающего решения («целеустремленное состояние»), и необходимость действий для устранения проблемы

Page 4: теория игр

Пример:Проблемная ситуация: мальчик показывает пальчиком на Луну и говорит «Мама, дай!».

1. Снятие ситуации — мамочка популярно объясняет: «Луна — это бяка, возьми-ка лучше яблочко!». Целеустремленное состояние переведено в другое русло и проблемная ситуация снята.

2. Разрешение ситуации - Луна срывается с орбиты и прилетает в руки мальчика (изменение физических законов и свойств окружающей среды). Вряд ли это хорошо кончится для мальчика, да и для всего населения Земли (см. в качестве иллюстрации рассказ Г. Дж. Уэллса «Человек, который творил чудеса»).

3. Решение ситуации. Этот мальчик — Нил Армстронг. Он вырастает, поступает в отряд астронавтов НАСА и в августе 1969 г. первым в истории человечества оказывается на лунной поверхности.

Целеустремленный индивид не изменяет своей цели, а достигает ее в рамках имеющихся ресурсов, альтернатив и физических законов.

Page 5: теория игр

Особое место среди условий, в которых приходится принимать решения, занимают условия конфликта.

Конфликт – это ситуация (положение, стечениеобстоятельств), в которой сталкиваются интересысторон, происходит борьба интересов.

Теория игр — это математическая теория конфликтов.

Игра, по сути дела, - это реализация стратегийоптимального выбора из некоторого определяемогоусловиями (правилами игры) множества возможностей.

Это достаточно сложная теория, так как условиях конфликтапринимающему решения субъекту приходится учитывать своисобственные цели, неизвестные ему решения противника иразличные неизвестные (случайные) обстоятельства.

Page 6: теория игр

В чем отличие проблемной ситуации от

конфликта?

В целевой функции G(x)=G(m,u)

где х — переменные, влияющие на G, причем х = {m, u}, где, в свою очередь, m — управляемые переменные (management); u —неуправляемые (т. е. действия внешней среды).

В конфликте эта функция зависит от интересов разных игроков

Мы считаем поведение игроков рациональным в следующем смысле: когда игра закончена, у игроков возникают некоторые выигрыши.

Единственной целью каждого игрока мы будем считать максимизацию его выигрыша.

Page 7: теория игр

Для теории игр безразлично кто или что скрывается заигроками: одушевленные или неодушевленные объекты,природа, элемент социального или биологического бытия.

Для нее основное то, имеется конфликт и игроки или даже одинигрок, которым она предлагает математически точно рассчитанныедействия в условиях разной степени неопределенности.

Силой, движущей игроков, является надежда на выигрыш.Привлекательность игр состоит в значительной степени внеопределенности результата.

Как только какая-то игра математически обрабатывается, исоздается безошибочный алгоритм действия игрока, так сразу жеона перестает быть игрой, превращаясь в строго определеннуюпоследовательность действий, ведущих или к победе, или к ничьеили к проигрышу.

Page 8: теория игр

Итак - как только имеет место взаимодействие различныхсамостоятельных и рациональных (или частично рациональных)субъектов и возникает конфликт - появляется игра.

Главный вопрос теории игр заключается в предсказанииповедения участников игры: какие ходы сделают шахматисты, чемзавершатся войны и переговоры, какие цены сформируются нарынке и т.д.

Теория игр есть теория математических моделей принятиярешений, она не занимается этими решениями какпсихологическими, волевыми актами; не занимается она ивопросами их фактической реализации.Можно привести десятки, сотни наименований игр, исследователи которых вообще невыделяют хотя бы даже в качестве просто признака признак конфликтности.Многие игры просто играются, как нечто само собой разумеющееся, как само собойданное естественным ходом эволюции.К примеру, детские игры с куклой, со сверстниками, любовные игры молодоженов,брачные игры млекопитающих и птиц. Они играются и играющие не ставят цельюразрешения конфликта, который в этих случаях явно не проявляется.

Page 9: теория игр

Далеко не каждый встречающийся на практике конфликтпротекает по правилам.

Чтобы сделать возможным математический анализ конфликта,нужно представить конфликт в игровой форме, т. е. указатьстратегии (образы действий), возможные для участников, иуточнить, к какому результату приведет игра, если каждый изигроков выберет определенную стратегию.

Таким образом, игра есть конфликт с четко определенными условиями или правилами получения результата (выигрыша), остальные условия могут быть определены не четко.

Стратегией игрока называется система правил, однозначноопределяющих поведение игрока на каждом ходе в зависимостиот ситуации, сложившейся в процессе игры.

Page 10: теория игр

Исторически первым способом учета неопределенности было изобретение вероятностей.

Т.е. в оценке частот тех или иных исходов выпадения игральныхкостей, комбинаций карт, чтобы, реализуя серию из достаточногочисла игр, придерживаться определенных фиксированныхигровых стратегий ради достижения некоторого (пусть даженебольшого) выигрыша.

В отличии от теории вероятности (веса, минимаксныестратегии и т.д.) в н.в. используют нечеткие множества какинструмент построения теории возможностей - (игра в дурака)

Первоначальным замыслом этой теории (fuzzy sets) было построитьфункциональное соответствие между нечеткими описаниями (типа "высокий","теплый" и т.д.) и специальными функциями, выражающими степеньпринадлежности значений измеряемых параметров (длины, температуры,

веса и т.д.) упомянутым нечетким описаниям.

Page 11: теория игр

Основным достижением теории нечетких множеств являетсявведение в обиход т.н. нечетких чисел как нечеткихподмножеств специализированного вида, соответствующихвысказываниям типа

"значение переменной примерно равно а"

С введением нечетких чисел оказалось возможнымпрогнозировать будущие значения параметров, которыеожидаемо меняются в установленном расчетном диапазоне.

Главное то, что набор операций над нечеткими числами,сводится к операциям с обычными числами при заданииопределенного интервала достоверности (уровняпринадлежности).

Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические

алгоритмы и нечеткие системы, Телеком, 2004. — 452 с.

Page 12: теория игр

Пример - ним математическая игра, в которой два

игрока по очереди берут предметы, разложенные на несколько кучек.

За один ход может быть взято любое количество предметов(большее нуля) из одной кучки.

Выигрывает игрок, взявший последний предмет.

В классическом китайском варианте игры число кучек равняетсятрём. Ним — конечная игра с полной информацией.

Игра Ним попала в Европу в XVI веке из Китая. Имя «ним» было дано игреамериканским математиком Чарльзом Бутоном (Chalres Bouton), описавшим в 1901году выигрышную стратегию игры.

Существует несколько вариантов происхождения названия игры:от немецкого глагола Nimm имеющего значение «брать»;от английского глагола WIN («побеждать»), переворачиванием слова;

Page 13: теория игр

Граф игры — это множество точек, соединённых стрелочками (направленными рёбрами).

Точки (вершины графа) – это множество всех игровых ситуаций, которые могут возникнуть в данной игре. Каждая точка (вершина графа) соответствует одной из возможных игровых ситуаций. То, что из точки A ведёт стрелочка в точку B, означает, что из позиции A можно сходить в позицию B.

Page 14: теория игр

Выигрышная стратегия состоит в том, чтобы оставлять после своегохода позицию с ним-суммой, равной нулю.

Ним-сумма позиции — результат сложения размеров всех кучек вдвоичной системе счисления без учёта переноса разрядов, то естьсложение двоичных разрядов чисел в поле вычетов по модулю 2.

Ним-сумма или нимбер является примером функции Шпрага-Гранди.

Рассмотрим пример – три кучки в которых 3, 5 и 7 камней3 = 2 + 15 = 4 + 17 = 4 + 2 + 1

Представим эти числа в виде суммы степеней 2 и остатка.

Совпадающие пары чисел 4,2,1 выкинем – остаток и будет ним-суммой – в нашем случае 1.

Page 15: теория игр

Теория игр и информационные

технологии

или зачем это все надо?

Page 16: теория игр

Интерес к теории игр в IT обусловлен несколькими причинами.

Во-первых, исключительной близостью теории игр и теорииинформации, поскольку игра в любом случае предполагаетпередачу информации (между самими игроками или междуигроками и арбитром).

Во-вторых, многие процессы могут быть легко рассмотрены втерминах теории игр – выбор оптимальной стратегии поискаинформации, раскрутка сайтов, коды коррекции ошибок,искусственный интеллект, компьютерные вирусы, боты,поисковые роботы, базы данных и т.д.

В третьих, в четвертых ………………………………………………..

Например, в криптологии перехват и расшифровка сообщения может рассматриваться как игра между отправителем и перехватчиком.

Page 17: теория игр

Internet Connectivity

Page 18: теория игр

Corporate Partnerships

Page 19: теория игр

International Trade

A mixture of scales; detailed structure

Page 20: теория игр

Определения и примеры

Page 21: теория игр

Математическая теория игр не способна стопроцентно предопределить исход некоторых конфликтов.

Во-первых - неопределенность вызвана значительным числом вариантов,сложностью их ранжирования по признаку истинности. Человеческий ум вограниченный отрезок времени просто не в состоянии равным образомисследовать абсолютно все варианты (к примеру, японская игра ГО, русские имеждународные шашки, британские реверси).

Во-вторых, непрогнозируемое игроками случайное влияние факторов на игру.Эти факторы оказывают решающее воздействие на исход игры и лишь в малойстепени могут быть или вообще не могут быть контролируемыми иопределяемыми играющими Игры, исход которых оказываетсянеопределенным в силу случайных причин, называются азартными(фр. hasard – случай).

В-третьих, неопределенность вызвана отсутствием информации о том, какойименно стратегии придерживается играющий против противник. Неведениеигроков о поведении соперника носит принципиальный характер иопределяется самим правилами игры. Такие игры именуются стратегическими.

Page 22: теория игр

Классификация игр по разным признакам:

число участников –одиночные, парные, с тремя участниками и т.д.;

число стратегий – конечные (каждый игрок располагает конечным множеством ходов) и бесконечные (по крайней мере один игрок располагает бесконечным множеством ходов, к примеру игра биологического вида с природой);

характер отношений игроков – бескоалиционные игры, игроки в которых играют каждый за себя и кооперативные игры, игроки объединяются в коалиции с одинаковыми на время игры интересами;

характер выигрыша – игры с нулевой суммой ( сумма общего выигрыша не меняется, а лишь перераспределяется или сумма выигрышей всех игроков во всех партиях данной игры нулевая) и игры с ненулевой суммой , к примеру лотерея, в которой организатор всегда выигрывает, а другие игроки (покупатели билетов) всегда получают суммарный выигрыш значительно меньший стоимости билетов;

число ходов – одноходовые и многоходовые, последние из которых разделяются на стохастические, дифференциальные;

количество информации – игры с полной информацией (игроки получают всю игровую информацию после очередного хода соперника) и игры с неполной, или с скрытой информацией - шахматы и “дурак”.

Page 23: теория игр

Пример:

Враг собирается напасть на вашу армию, защищающую замок. В замок есть 2 входа и вам необходимо решить, как распре-делить 2 ваших отряда на защиту этих входов используя правила:

1. Если враг направит оба своих отряда на левый (правый) вход и там же встретит 2 ваших отряда, то он потерпит поражение.

2. Если враг направит по отряду на каждый вход и у одногоиз входов не будет вашего отряда, то замок падет.

3. Если враг отправит оба отряда на один вход, а вы решите защищать второй или на защите будет лишь один отряд – замок падет.

Данная игра – парная, конечная, безкоалиционная, с нулевой суммой, одноходовая, с полной информацией.

Page 24: теория игр

Теория игр всегда начинается с построения математической модели конфликта - наиболее важные формы моделей:

1. развернутая (расширенная, экстенсивная, позиционная)

2. стратегическая (нормальная)

3. байесовская форма

Игра в нормальной форме состоит из трех элементов:

множество игроков N (неупорядоченное)

множество стратегий каждого игрока Sm

множество платежных функций (выигрышей) каждого игрока.

Таким образом игру в нормальной форме можно представить в виде n-мерной матрицы (таблицы) элементы которой это n-мерные платежные вектора (выигрыши).

Page 25: теория игр

Случай двух игроков имеющих по две стратегии.

Стратегии первого игрока: U и D. Стратегии второго игрока: L и R.

Если первый игрок выбирает U, а второй игрок выбирает L то соответствующие платежи равны 4 и 3

Сыгранная комбинация стратегий называется исходом игры. В

данном примере исход игры (U, L).

Полученные выигрыши называются ценой игры – это всегда

числа – например в футболе выиграл +3, проиграл 0, ничья – 1.

Page 26: теория игр

Для игры в нормальной форме каждой стратегии можноприписать вероятность ее использования - тогда

Смешанной стратегией для игрока m называется распределениевероятностей на его множестве стратегий Sm.

Элементы множества Sm называются чистыми стратегиями иотождествляются с распределениями вероятностей, при которыхони имеют вероятность 1.

Подразумевается, что каждый игрок выбирает свой ход случайно инезависимо от других с распределением вероятностей, заданнымего смешанной стратегией.

Выигрышем игрока при данном наборе смешанных стратегийназывается математическое ожидание его выигрыша прислучайных независимых ходах всех игроков, распределённых всоответствии с заданными смешанными стратегиями.

Page 27: теория игр

Пример:

Две фирмы производят один и тот же продукт - дуполия Карно

Правила:

Стоимость производства единицы продукта равна c1 и c2

соответственно

Фирма 1 производит q1 продукта, а фирма 2 – q2

Спрос на продукт зависит от его количества на рынке

обратная функция спроса (зависимость цены от количества) есть

p(Q) = a-Q = a- (q1+q2)

В этой игре

1. игроки: фирмы 1 и 2

2. стратегии: выпуск q1 и q2, соответственно

3. платежи: прибыль фирмы k равна π(k)=qk * P(Q)-ck*qk

(Смешанные стратегии - всё то же самое, но издержки фирмы k будут с’k

с вероятностью θk и с’’k с вероятностью 1-θk)

Page 28: теория игр

Игры в экстенсивной форме представляются в видеориентированного дерева (графа), где каждая вершинасоответствует ситуации выбора игроком своей стратегии. Каждомуигроку сопоставлен целый уровень вершин. Платежизаписываются внизу дерева, под каждой листовой вершиной.

Игрок 1 ходит первым и выбирает стратегию F или U. Игрок 2анализирует позицию и решает — выбрать стратегию A или R.

Скорее всего первый игрок выберет U, а второй — A (длякаждого из них это оптимальные стратегии); тогда ониполучат соответственно 8 и 2 очка.

Page 29: теория игр

Традиционным подходом в теории игр является рассмотрение равновесий — устойчивых в каком-то смысле наборов стратегий игроков.

Равновесием по Нэшу называется такой набор стратегий, что никакому игроку невыгодно отклоняться от своей стратегии в этом наборе.

Т.е. ни один участник не может увеличить выигрыш, изменив своё решение в одностороннем порядке, когда другие участники не меняют решения.

1. “Я делаю все, что могу, при том, что ты делаешь”2. “Ты делаешь все, что можешь, при том, что я делаю.”

Равновесия Нэша — одно из основных понятий теории игр. Они отражают устойчивые исходы при неспособности игроков договориться.

Page 30: теория игр

Оптимальность по Паретотакое состояние системы, при котором значение каждогочастного критерия, описывающего состояние системы, неможет быть улучшено без ухудшения положения другихэлементов.

Принцип Парето «Всякое изменение, которое не приноситубытков, а которое некоторым людям приносит пользу (по ихсобственной оценке), является улучшением».

Таким образом признаётся право на все изменения, которые не приносят никому дополнительного вреда.

Ситуация, когда достигнута эффективность по Парето — это ситуация, когда все выгоды от обмена исчерпаны.

Page 31: теория игр

Доминирование — ситуация, при которой одна из стратегийнекоторого игрока дает больший выигрыш, нежели другая, прилюбых действиях его оппонентов.

Доминирующие стратегии

1. “Я делаю все что могу, все равно что ты делаешь.”

2. “Ты делаешь все, что ты можешь, все равно что я делаю.”

Если для одного из игроков существует строго домини-рующая стратегия, он будет ее использовать в любом изравновесий Нэша в игре.

Если все игроки имеют строго доминирующие стратегии, игра имеет единственное равновесие Нэша.

Это равновесие может не быть эффективным по Парето, т.е. неравновесные исходы могут обеспечить всем игрокам больший выигрыш.

Page 32: теория игр

Платежная матрица для рекламной

игры

Фирма A

Рекламировать Не рекламировать

Рекламировать

Нерекламировать

Фирма B

10, 5 15, 0

10, 26, 8

• Наблюдения

A: независимо от B, рекламировать лучше всего

B:независимо от A,рекламировать лучше всего

Page 33: теория игр

Платежная матрица для рекламной

игры

ФирмаA

Рекламировать Не рекламировать

Рекламировать

Нерекламировать

ФирмаB

10, 5 15, 0

10, 26, 8

доминирующая стратегия для A и B –рекламировать

Не беспокоиться о другом игроке

Равновесие в доминирующей стратегии

Page 34: теория игр

Дилемма заключѐнного "Prisoners' Dilemma"

Двое преступников, попались примерно в одно и то же время на сходных преступлениях.

Есть основания полагать, что они действовали по сговору, иполиция, изолировав их друг от друга, предлагает им одну и ту жесделку:

если один свидетельствует против другого, а тот хранит молчание, топервый освобождается за помощь следствию, а второй получаетмаксимальный срок лишения свободы (10 лет).

если оба молчат, их деяние квалифицируется как неоказание помощи

следствию, и они приговариваются к 6 месяцам.

если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года).

Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой.

Page 35: теория игр

Дилемма (конфликт) появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.

Page 36: теория игр

Рассуждения одного из заключённых:

Если партнёр молчит, то лучше его предать и выйти на свободу (иначе — полгода тюрьмы).

Если партнёр свидетельствует, то лучше тоже свидетель-ствовать против него, чтобы получить 2 года (иначе — 10 лет).

Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично другой заключённый приходит к тому же выводу – равновесие Неша по 2 года каждому.

С точки зрения группы (этих двух заключённых) лучше всегосотрудничать друг с другом, хранить молчание и получить пополгода, так как это уменьшит суммарный срок заключения.

Любое другое решение будет менее выгодным. Это очень нагляднодемонстрирует, что в игре с ненулевой суммой Парето-оптимумможет быть противоположным равновесию Нэша.

Page 37: теория игр

Поиграть можно на сайте

http://www.gametheory.net/ - основная ссылка

http://ccl.northwestern.edu/netlogo/models/PDN-PersonIterated

http://banach.lse.ac.uk/form.html

и многих других.

Там же на http://www.gametheory.net/ можно найтиинструменты для представления игр в нормальной иэкстенсивной форме, для нахождения равновесия по Нешу,нахождения доминирующих стратегий и т.д.

Page 38: теория игр

Пример:

Враг собирается напасть на вашу армию, защищающую замок. В замок есть 2 входа и вам необходимо решить, как распре-делить 2 вашихотряда на защиту этих входов используя правила:

1. Если враг направит оба своих отряда на левый (правый) вход и там же встретит 2 ваших отряда, то он потерпит поражение.

2. Если враг направит по отряду на каждый вход и у одногоиз входов не будет вашего отряда, то замок падет.

3. Если враг отправит оба отряда на один вход, а вы решите защищать второй или на защите будет лишь один отряд – замок падет.

Заполните матрицу на

http://www.gametheory.net/Mike/applets/NormalForm/NormalForm.html

и нажмите “solve”

Page 39: теория игр

Генетический алгоритм для Дилеммы Заключенного

Для поиска наиболее оптимального решения поставленной задачичасто используют методы на основе анализа производных.

Однако применение анализа производных часто оказываетсяпопросту неэффективным в случае решения задач оптимизациидля негладких, прерывистых, или стохастических функцией.

Для таких целевых функций используют такие методы, как генетический алгоритм, алгоритм поиска по шаблону и т.д.

Page 40: теория игр

Генетический алгоритм— это алгоритм, который позволяет найтиудовлетворительное решение к аналитически неразрешимымпроблемам через последовательный подбор и комбинированиеискомых параметров с использованием механизмов,напоминающих биологическую эволюцию.

Отличительной особенностью генетического алгоритма являетсяакцент на использование оператора «кроссовера», которыйпроизводит операцию, роль которой аналогична роли скрещиванияв живой природе.

Генетический оператор кроссовера состоит в следующем –состояния (особи) "разрезаются" а затем их части меняются местами.

В двухточечном кроссовере "рассечение" особей происходит двумя сечениями и т.д.

Page 41: теория игр

Состояния задачи с восемью ферзями, соответствующие первымдвум родительским состояниям, и первому потомку.

Затененные столбцы на этапе скрещивания теряются, анезатененные сохраняются

Работа генетического алгоритма начинается с множествасформированных случайным образом состояний, называемыхпопуляцией. Затем происходит селекция - выбираются особи для"производства потомства", затем скрещивание, мутация,генетическая модификация и определение приспособленностиполучившихся особей/особи

Page 42: теория игр

Стратегия “TIT FOR TAT” для повторяющейся диллемы заключенного

Суть стратегии заключается в следующем:

Первым ходом стратегия предлагает сотрудничество;

Повторяет ход, который сделал противник в предыдущем ходе.

Если C – сотрудничество и D – защита, то стратегия первого игрока имеет вид

CDCD сотрудничать, если противник сотрудничал, защищаться – если противник защищался (зуб за зуб — он тебя и ты его).

Поначалу стратегии сотрудничества набирали гораздо меньшеочков (были менее приспособлены), чем стратегии, поощрявшиезащиту. Но после 10-20 поколений этот тренд менялся в обратнуюсторону и стратегии, поощрявшие сотрудничество и наказывавшиезащиту, выживали и в итоге представляли основную популяцию.

Page 43: теория игр

Принцип минимакса

каждый способ действия оценивается по наихудшему для негоисходу и оптимальным является способ, приводящий кнаилучшему из наихудших результатов.

или веди себя так, чтобы получить наибольшую выгоду принаихудших для тебя действиях противника.

Проще понять на примере

Игра «Три пальца» - два игрока А и В одновременно и несговариваясь показывают друг другу один, два или три пальца

если сумма четное число - выигрывает А: он получает столькоочков, сколько всего было пальцев.

если сумма нечетное — выигрывает В, на тех же условиях.

Page 44: теория игр

Предположим, что мы выбрали стратегию А1. Противникразумен - выберет стратегию В2; наш результат будет равен —3,т. е. мы потеряем 3 очка.

Стратегия А2 - на нее разумный противник ответит В3 и мыпотеряем 5 очков.

Третья стратегия — А3 также даст нам выигрыш (—5).

Page 45: теория игр

Нашли минимум каждой строки и из этих минимумов взяли максимальный (-3).

Эта величина называется максимином или нижней ценой игры.

Подумаем теперь за противника - он должен в каждом столбце выписать не минимальное, а максимальное число и из этих максимумов он должен найти минимальный, так называемый минимакс или верхняя цена игры (4).

Page 46: теория игр

Равновесие - если в матрице имеется седловая точка – т.е.элемент, который является минимальным в своей строке иодновременно максимальным в своем столбце. В играх с нулевойсуммой седловая точка является равновесием Нэша.

Например, матрица

имеет одну седловую точку — 4

Матрица

содержит 4 седловых точки — "2" в первом и втором ряду, первом и четвертом столбце.

Page 47: теория игр

Пример – доминирующая стратегия

Фирма1

Не инвестировать ИнвестироватьФирма2

0, 0 -10, 10

20, 10-100, 0

Не инвестировать

Инвестировать

• Наблюдения– Доминирующая

стратегия Фирма2: инвестировать

– Равновесие по Нэшу

• Фирма1: инвестирует

• Фирма2:инвестирует

Page 48: теория игр

Пример - максиминная стратегия

Фирма1

Не инвестировать ИнвестироватьФирма2

0, 0 -10, 10

20, 10-100, 0

Не инвестировать

Инвестировать

• Наблюдения– Если Фирма2 не

инвестирует, Фирма1 испытываетзначительные потери

– Фирма1 должна играть в не инвестицию

• Минимизировать потери до 10 --максиминнаястратегия

Page 49: теория игр

• В случае если обе рациональны и информированы

– обе фирмы инвестируют

– равновесие Нэша

• Если Игрок 2 не рационален или недостаточно

информирован

• Максиминная стратегия Фирмы 1 - не инвестировать

• Максиминная стратегия Фирма 2 - не инвестировать.

• Однако, если 1 знает, что 2 использует максиминную

стратегию, 1 будет инвестировать

Равновесие Нэша

Максиминная стратегия

Page 50: теория игр

Подбрасывание монетки

Игрок A

Орел Решка

Орел

Решка

Игрок B

1, -1 -1, 1

1, -1-1, 1

– Чистая стратегия: нет равновесия Нэша

– Смешанная стратегия: Случайный выбор, при равновесии Нэша

– Будет ли Фирма устанавливать цену, основываясь на случайном выборе допущений?

Page 51: теория игр

В классическом случае, как известно, шансы игроков на выигрыш при достаточно большом числе подбрасываний монеты равные

50:50

Предположим, что в качестве монеты предложено использовать атомное ядро, ориентация спина которого вверх соответствовала бы "решке", а вниз - "орлу”.

Если один из игроков играет с ядром как с обычной монетой,то второй игрок используя квантовую суперпозициюгарантирует себе постоянный выигрыш.

Использование квантовых стратегий полностью снимаетклассическую "Дилемму арестантов«, так как квантовые выборыарестантов оказываются еще и взаимосвязанными("спутанными", entangled).

А это означает, что выбор одного из "спутанных" арестантов будетвоздействовать на выбор другого и наоборот, даже если ониничего не будут знать о выборах друг друга.

Page 52: теория игр

Битва полов (или перекресток или чикен)

Он

Футбол Опера

Футбол

Опера

Она

2,1 0,0

1,20,0

Page 53: теория игр

Битва полов

Он

Футбол Опера

Футбол

Опера

Она

2,1 0,0

1,20,0

• Чистая стратегия– оба смотрят

футбол– оба смотрят

оперу

• Смешанная стратегия

– он выбирает футбол

– она выбирает футбол

Page 54: теория игр

• Дж. фон Нейман, О. Моргенштерн. Теория игр и экономическое поведение

• Дж. Д. Вильямс Совершенный стратег или букварь по теории стратегических игр

• Оуэн, Г. Теория игр , 1971.

• Раскин М. А. Введение в теорию игр // Летняя школа «Современная математика». — Дубна: 2008.

• В.И. Данилов, Лекции по теории игр , 2002.

• Вентцель Е. С. Элементы теории игр. Изд. 2. М., Физматгиз, 1961.

• Game Theory and Computer Science. Spring 2008

• http://www.gametheory.net/