Лекция 5. Рациональные игроки

Задача теории игр. Напомним еще раз, что игра - это игровая форма (или механизм) р : 5дг = XieiV'Sf —> Д дополненная полезностями (выигрыша­ми, payoffs) игроков. Выигрыш игрока г задается функцией щ : А —у К. и считается полезностью Неймана-Моргенштерна (т.е. распространяется на ло­тереи как математическое ожидание); компонируя с /?, можно считать, что щ заданы на S у • и тем самым исключить А. Таким образом, игра - это тройка (iV, (50, Ы).

Основная задача некооперативной теории игр заключается в том, чтобы дать ответ на вопрос - что же произойдет в каждой конкретной игре, как она будет разыграна? Иначе говоря, какую (или какие) стратегию Si £ Si выбе­рет каждый игрок г? При этом (молчаливо или явно) исходят из следующих предположений (предпосылок):

I. Каждый игрок стремится максимизировать свой выигрыш.

П. Каждый из игроков знает игру.

III. Свои стратегии игроки выбирают одновременно и независимо.

IV. Игра играется однократно.

Как легко понять, приведенные (и довольно расплывчатые) требования не определяют однозначно решение игры, но являются лишь некоторыми наво­дящими соображениями для поиска определения. Обсудим эти предположе­ния.

Обсуждение предпосылок.

I. Как уже отмечалось, главная трудность тут состоит в том, что выигрыш игрока г зависит не только от его стратегии, но и от стратегий остальных. Пы­таясь уйти от этой неопределенности, теория игр пытается апеллировать к понятию рациональности. Игрок рационален, если он максимизирует свой ожидаемый выигрыш с учетом всей имеющейся у него информации. Таким образом, первая предпосылка формулируется как предположение о рацио­нальности всех игроков. Но даже если согласиться с этим, остается вопрос -а какая есть информация у игроков. На это отвечает вторая предпосылка.

П. В первую очередь это означает, что каждый из игроков знает свой вы­игрыш щ. Но также выигрыши остальных игроков (u-i). И если первое ка­жется совершенно естественным, то вторая часть вызывает сильное сомнениеи выглядит весьма спорным. Можно допустить, что игрок / знает "физиче­ские" исходы (т.е. элементы А), но откуда он может знать полезность их для других игроков? Даже если допустить, что исходы выражены в денежной форме и что все участники любят деньги, даже в этом случае, как мы знаем, полезность денег может быть нелинейной. Откуда игрок г может знать такие тонкие вещи, как коэффициенты отвращения к риску других игроков? Кроме того, в полезность исхода для одного игрока может входить учет полезности другого (с положительным или отрицательным знаком); это тоже вряд ли кому точно известно, кроме самого игрока. Некоторые попытки устранить эти трудности обсуждаются в лекции про игры с неполной информацией.

Более того, ортодоксальная теория вводит постулат, что знание игры (как и рациональность участников игры) является общим знанием: игрок г не только знает выигрыши всех игроков, но знает также, что остальные знают выигрыши всех, и что все знают, что он знает об этом и т.д. до бесконечности.

III. Смысл этого требования направлен на уточнение пункта П. Принимая свое решение, игрок не знает о выборе стратегий другими игроками. Это не исключает того, что на основе доступной ему информации он может делать умозаключении о вероятности использования другими их стратегий. Однако точной формулировки интеллектуальных способностей я нигде не встречал.

Сюда же естественно включается предпосылка об отсутствии обмена ин­формацией между игроками (доигровых переговоров, сговора, угроз, обязы­вающих соглашений и т.п.)

IV. Смысл этой предпосылки ясен. Игроки встретились, сыграли и навеки разошлись; никакой мести или благодарности (или, как принято в теоретико-игровой терминологии - трансферов). Если игра проводится многократно, это уже другая игра.

Понятие решения. Самое печальное в том, что даже приняв жесткие и совершенно нереалистические предпосылки об общем знании игры, ортодок­сальная теория не преуспела в решении своей основной задачи - определе­нии понятия решения игры. Сомнительно, чтобы это можно сделать вообще. Взамен она предлагает много понятий решения (доминирующие стратегии, осторожные стратегии, исключение доминируемых стратегий и, как венец, равновесие Нэша), оказывающихся полезными в тех или иных ситуациях. Ниже мы будем знакомиться с ними более подробно.

Естественный способ поставить понятие решения игры на твердую почву - это формализовать поведение игроков. Конечно, и после этого можно бу­дет возражать, говоря, что предложенная формализация не учитывает то и то, но это уже другое дело. Таким фундаментом представляется гипотеза о рациональности игроков. Как мы уже говорили, рациональный игрок мак­симизирует свою полезность (ожидаемую) на основе всей имеющейся у него информации. Это определение требует уточнения двух моментов: что же зна­ет игрок (т.е. какая у него информация), и как на основе этой информации формировать ожидаемую полезность.

Необайесовский подход. В соответствии с неоБайесовским подходом (изложенным в конце лекции 3) в задаче игрока (обозначим его г) имеется неопределенность относительно стратегий остальных, то есть относительно множества О = = XjфiSj. Каждая стратегия нашего игрока поро­ждает функцию на О (действие), это ■) : О —> К. Ему нужно выбрать "наилучшую" стратегию. Чтобы сделать это, нашему игроку /. в соответствии с теорией Сэвиджа, нужно приписать "субъективные" вероятности событиям из О. То есть сделать вероятностные "догадки" <т_,- £ Д(5^)- Как только он это сделает, каждая его стратегия .%•; получает "ожидаемую" полезность ^г(^г) = Щ^ъ^сг-ъ) = / щ(si: -)о1а^(-). И игроку остается взять (любую) стра­тегию, дающую максимум Щ.

Тут все понятно, кроме одного - откуда игроку взять свою "догадку" о^(1 Создается впечатление, что мы исходную задачу (о выборе игроком г сво­ей стратегии .%•;) свели к другой, более сложной - угадать, что будут делать противники. Если он (игрок г) такой "догадливый", почему бы ему сразу не угадать, что будет делать он сам?

Тем не менее, такая постановка имеет некоторый смысл. То, что будут делать его противники-партнеры, зависит от их полезностей (ведь они то­же рациональные игроки!). А значит и наша догадка должна основываться на наших знаниях о полезностях противников. Другая важная (кроме полез­ности) составляющая выбора противников - их догадки о выборе других, и поэтому наша догадка должна учитывать наше знание о знании противников.

Мое объяснение неудачи с определением понятия решения игры заключа­ется в том, что одних полезностей мало для того, чтобы сказать, что будет делать игрок. К полезностям нужно добавить еще, что игрок знает (и чего не знает!) о других игроках: об их полезностях, об их знаниях, об их "догад­ливости" и т.п.

Хотя необайесовский подход не позволяет сформулировать в общем слу­чае, что будут делать рациональные игроки, в некоторых частных ситуацияхон работает. Ниже мы обсудим несколько таких ситуаций (осторожные стра­тегии, доминирующие стратегии, принцип исключения доминируемых стра­тегий) . А затем перейдем к самому общему понятию равновесия Нэша, осно­ванному на принципе согласованности догадок с реальным поведением. Если угодно, это принцип совершенного предвидения или рациональных ожиданий, часто используемый в экономике.