Лекция 9. Равновесия Нэша

Рассмотренные до сих пор понятия решения (доминирующие стратегии, осто­рожные стратегии и последовательное исключение доминируемых стратегий) носили в чем-то механический характер. Теперь мы отказываемся от такого прямолинейного подхода, от претензий на предсказание того, что будет де­лать каждый игрок. Вместо этого мы формулируем некоторые желательные свойства решения. После этого решений может оказаться несколько (и тогда возникает вопрос, какое из них осуществится) или ни одного (и тогда данная концепция не работает).

Равновесие Нэша. Рациональный подход к нахождению решения игры предполагает, что каждый игрок / формирует "догадку" в^] о действиях ос­тальных и выбирает в качестве .%•; свой наилучший ответ на эту догадку. Как уже отмечалось, трудность здесь в том, как формировать эту догадку. Все же одно требование согласованности выглядит почти несомненным или, во всяком случае, желательным: догадки должны совпадать с реальным вы­бором в^. В этом случае получается логически стройная картина: я выбираю 5^, потому что это лучший ответ на вашу в^, а ваш ответ наилучший на мою стратегию 5^. Можно сказать также, что равновесие Нэша устойчиво к от­кровению. Выбирая свою стратегию 5^, вы не знаете, что выбрали остальные. Изменится ли ваше решение, если вы узнаете действия остальных?

Определение. Ситуация «д- в игре называется равновесием Нэша, если для любого игрока г и любой его стратегии    £ 5^ выполняется неравенство

Иначе говоря, в* - наилучший ответ на «1,- для каждого игрока /. Это та­кая ситуация, что никому не выгодно отклоняться от нее, если остальные ее придерживаются.

Наилучшие ответы. Здесь стоит сказать о понятии наилучшего ответа.

Определение. Стратегия Si игрока г называется наилучшим ответом на профиль стратегий остальных игроков, если в точке 5^ достигает мак­симум фуНКЦИЯ И^(-,5^).

Множество наилучших ответов, Ащтах^^-, в^)), обозначим Вев^в^). Это подмножество в 5^, непустое при довольно слабых условиях. Соответ­ствия Вев^ : =>- наилучших ответов играют важнейшую роль при анализе поведения игрока г. Например, вдг - равновесие Нэша тогда и только тогда, когда 5^ £ Вев^в-^ для любого г.

Аналогично определяется наилучший ответ на "смешанную" догадку а-\ £ Д(5^). Обычно в этом случае в качестве ответов также привлекают смешан­ные стратегии. Контрольный вопрос: что можно сказать о стратегии Si7 ко­торая является наилучшим ответом на любую 5^ £ Б^{1 А если никогда не является наилучшим ответом?

Обсуждение понятия равновесия. Равновесие Нэша - главная концеп­ция решения в некооперативном случае. Поэтому стоит подробнее обсудить ее смысл и значение. Хотя понятие равновесия Нэша и выглядит вполне ра­зумным, оно уже не столь бесспорно, как равновесие в доминирующих стра­ТО 11И М X

Понятие равновесия Нэша соединяет две гипотезы о поведении игроков. Первая - если ситуация .%• д- неравновесна, то ее нельзя рассматривать как устойчивое состояние. Т.е. если какой-то игрок г видит, что отклонение от 8. принесет ему больший выигрыш (в надежде, что остальные сохранят свои стратегии), то он непременно отклонится, поддастся соблазну. Это согласует­ся с гипотезой рациональности (даже диктуется ею). Однако игрок не может не понимать, что его отклонение может вызвать непредсказуемую цепь от­ветных реакций остальных игроков, конечные последствия которой трудно оценить.

Вот пример. Два участника, каждый называет целое неотрицательное число. Если оба назвали одно и то же число, каждый получает по 100 руб. Если разные, то тот, кто на­звал большее, получает 101 руб., а другой - 0. Разумно каждому назвать нуль, но это не равновесие.

Такое отклонение (улучшающее по сравнению со статус кво в*) оправданно только в том случае, если есть уверенность, что остальные действительно сохранят неизменными свои стратегии. А в общем случае нужна какая-то модель реакции остальных.

Вторая гипотеза - если каждый игрок видит, что отклонения от в* не дают

ему улучшения, то он сохранит эту стратегию в*, как бы нелепа она ни была.

В дальнейшем мы еще встретим много нелепых, дурацких равновесий.

Вот пкрвый такой пример. Пусть три участника по правилу большинства выбирают из двух альтернатив .г н //. н для всех х лучше у. Предположим, что все назвали //1. Тогданикто индивидуально не может улучшить исход у, так что формально это равновесие. Но трудно представить, как такая ситуация может возникнуть.

Значение равновесий Нэша можно суммировать так. Пусть теория (или советник) предписывает каждому игроку некую стратегию, и все они знают это предписание и следуют ему; тогда либо это должно быть равновесием Нэша, либо кто-то ведет себя иррационально.

Мы не утверждаем, что любое равновесие Нэша годится как предсказа­ние исхода (тем более, что могут быть несколько равновесий). Равновесность по Нэшу - это лишь необходимое условие "правильного" ответа, предсказа­ния. Теоретико-игровики предприняли много усилий, чтобы среди равнове­сий Нэша оставить только разумные. Эта программа называется очищением (refinement), или утоньчением, и мы позже обсудим более детально эти во­просы.

Сценарии. Рассмотрим теперь вопрос о том, как игроки могли бы прийти к равновесию Нэша. И здесь нет полной ясности. Не удается дать разумного объяснения, оставаясь полностью на некооперативной точке зрения. Поэто­му некоторые теоретики считают равновесие Нэша полукооперативным по­нятием. Ниже мы предлагаем несколько сценариев появления равновесия по Нэшу.

Первый. Игра разыгрывается многократно, и из прошлого опыта игроки начинают представлять, как будут играть партнеры, выбирают наилучшие ответы, и (в конце концов) попадают (?) в ситуацию равновесия, в которой и остаются. К этому же можно отнести и процедуру нащупывания Курно. Од­нако предположение, что игра разыгрывается многократно, сильно меняет всю картину. Формально, мы попадаем в новую игру. Об этом будет расска­зано в лекции о повторяющихся играх.

Второй сценарий. Участники фиктивно разыгрывают игру, им разрешено в определенном порядке менять свои стратегии. Когда положение стабилизи­ровалось, т.е. мы попали в устойчивое состояние, игра разыгрывается реаль­но. Устойчивое состояние - это равновесие Нэша (может, не любое). Возра­жения как выше. В обоих этих сценариях игроку не нужно знать полезности других игроков.

Третий сценарий. Каждый игрок сам анализирует игру и находит ситуа­цию равновесия. Этот сценарий почти идеален, если равновесие единственно. Но при нескольких неравноценных равновесиях возникает вопрос, как выби­рать среди них. Например, в игре


 

п

Г2

 

3,3

0,1

52

1,0

2,2

(похожей на встречу в Нью-Йорке) есть два равновесия (в1,£1) и (в2,£2). На какое из них ориентироваться игроку 1? Казалось бы, первое равновесие лучше для обоих игроков, и естественно было бы остановиться на нем. Но первый игрок (как и второй) может рассуждать так. Допустим: я выберу б1 в расчете на сообразительность второго. А вдруг он поступит иначе и выберет VII Тогда я получу только 0. Если же я выберу вторую строчку, то гарантированно получу 1. Так что не факт, что будет выбрано первое равновесие.

Но даже если равновесие единственно, снова не факт, что игроки выберут его. Рассмотрим игру

3,5

4,8

3,-1000

5,-1000

6,8

3,10

В ней единственное равновесие (в2,£3). Но чтобы решиться на £3, второй игрок должен быть очень сильно уверен, что 1-й использует в2, что он не отклонится от в2 даже в результате случайной ошибки. (Кстати, первому в этой ситуации абсолютно все равно, что использовать - в1 или в2.) Более надежной является стратегия VI. с гарантией дающая 2-му выигрыш 8.

Четвертый сценарий. Игроки перед игрой затевают переговоры и прихо­дят к некоторому (необязывающему) соглашению вдг. Если это соглашение .%• д- является равновесием Нэша, то есть основания ожидать, что они будут следовать этому соглашению. Однако тут тоже надо формализовать процесс переговоров и заключения соглашения, это новая игра. Мы обсудим этот и следующий сценарий в лекции об играх с сообщениями.

Пятый, обещающий, сценарий тесно связан с четвертым. Игроки обраща­ются к посреднику (или аналитику), который анализирует игру и предлагает всем следовать некоторому профилю стратегий .%-д- (который он громко объ­являет всем). В принципе каждый может отказаться и выбрать другую стра­тегию. Однако если посредник предлагает равновесие Нэша, то всем выгод­но следовать указанию. Конечно, и тут возникают свои вопросы. Например, какое равновесие предложить посреднику, если их много? Или - уверен ли игрок, что его партнер услышал указание посредника?

Еще замечания. Первое - равновесие может быть неэффективным. Вто­рое - может быть много равновесий.

Пример к первому утверждению дает Дилемма заключенных. Мы уже обсуждали его. Это пример того, как рациональное преследование своих ин­тересов может вести к плохому исходу для всех.

Пример с несколькими равновесиями - семейный спор и т.п.