Лекция 3. Теория ожидаемой полезности

Вернемся теперь к вопросу, поднятому в начале лекции 2. Насколько оправ­дано использование средних (ожидаемых) значений при оценке полезности лотереи?

Теория Неймана-Моргенштерна. Эта теория говорит о том, как устро­ены предпочтения на симплексе лотерей А(Х), удовлетворяющие некоторым "естественным" условиям.

Будем называть предпочтением на произвольном множестве X бинарное отношение Ь ("не хуже") на этом множестве, которое является слабым поряд­ком (т.е. полное и транзитивное). Типичные предпочтения задаются функци­ями полезности; если имеется функция II : X —у К. на нашем множестве, то можно положить х <и у -Ф4> и(х) < II(у). И обратно, "практически всегда" любое предпочтение имеет такой вид.

Обратимся к лотереям на множестве X. Предположим, что у нашего аген­та имеется функция полезности и : X —у Ш. Ожидаемой полезностью ло­тереи 7г £ А(Х) называется математическое ожидание и, т.е. число

и(тг) = тт(х)и(х).

х

Такая (аффинная) функция II на А(Х) позволяет сравнивать лотереи. Теоре­ма Неймана-Моргенштерна об ожидаемой полезности утверждает обратное: если предпочтение на А(Х) удовлетворяет некоторым простым аксиомам, то оно имеет приведенный выше вид, т.е. является ожидаемой полезностью для некоторой функции и : X —у К. Более того, функция и определена од­нозначно с точностью до (монотонного) аффинного преобразования. Такая функция и называется полезностью Неймана-Моргенштерна.

Теорема об ожидаемой полезности.

Пусть Ь - бинарное отношение на А(Х). Сформулируем некоторые тре­бования (условия, аксиомы) на это бинарное отношение (где р, д, г - лотереи на X):

1. У - слабый порядок.

2 (аксиома замещения, или независимости). Если р У д, то для любой лотереи г и любого а (между 0 и 1) выполняется ар+ (1 — а)г У ад+ (1 — а)г.

3 (непрерывность). Отношение ^ замкнуто (или: нижние и верхние "кону­са" < замкнуты).

Ясно, что ожидаемая полезность удовлетворяет этим аксиомам. Верно и обратное:

Теорема (Нейман-Моргенштерн). Пусть X - конечное множество, и предпочтение У на А(Х) удовлетворяет аксиомам 1, 2 и 3. Тогда суще­ствует функция и на X, такая что предпочтение У задается ожидаемой полезностью = ^2х<1{х)и(х). При этом функция и определена с точ­ностью до положительного аффинного преобразования.

В чем суть ожидаемой полезности II? В том, что это линейная (или точнее - аффинная) функция на А(Х). Тогда ее "кривые безразличия" параллельны. Но именно это и дает аксиома замещения, мотор этой теоремы.

Мы наметим доказательство теоремы, оставляя детали слушателям. Обо­значим через х* максимальный элемент множества X относительно Ь (пони­мая X как подмножество А(Х)). В силу конечности X он существует. Как видно из следующей леммы, он будет максимальным не только на X, но и на всем А(Х).

Лемма. Если р У г/ и р У г. то р У любой смеси q и г.

Действительно, ад + (1 — а)г ■< ар + (1 — а)г ■< ар + (1 — а)р = р. □ Аналогично существует минимальный элемент х*.

Возможны два случая. Первый - когда х* ~ х* (отношение "безразличия" ~ означает, что выполняется одновременно ^ а У ). В этом случае все лоте­реи эквивалентны, и в качестве функции полезности и можно взять любую постоянную функцию на X. Второй, и основной случай, когда х* У х*. Тут

 

Умы поступим так: альтернативе х* припишем полезность 1, а х* - полезность 0. Полезности остальных лотерей будем определять с помощью аксиомы 3.

Возьмем любую лотерею р £ А(Х) и на отрезке [ж*, х*] отметим те точки, которые У р. и которые ^ р. Это два замкнутых отрезка (замкнутых в силу аксиомы 3), первый содержит ж*, второй - х*. Конечно, они пересекаются, причем по одной точке (доказать!). Иначе говоря, существует (однозначно определенное) число и(р) между 0 и 1, такое что

р ~ 11(р)х* + (1 — и(р))х*.

Ясно, что Л представляет предпочтение ^.

Мы утверждаем теперь, что так определенная функция II на А(Х) ком­мутирует с образованием вероятностных смесей, т.е. что

II(ар + (1 - а)д) = а11(р) + (1 - а)£/(д).

Проверим это. По определению,

р ~ и(р)х* + (1 - и(р))х* ид~ С/(д)ж* + (1 - С/(д))ж*

По аксиоме замещения получаем, что ар + (1 — а)д эквивалентна лотерее

а(и(р)х* + (1 - С/(р))0 + (1 - а)(С/(д)ж* + (1 - 11(д))х*),

которая равна (аЛ(р) + (1 — а)С/(д))ж* + (а(1 — и(р)) + (1 — а)(1 — £/(д)))ж*. Остается заметить, что а(1 — и(р)) + (1 — а)(1 — С/(д)) = 1 — (аЛ(р) + (1 — а)и(Ч)).

Теперь уже видно, что если лотерея р равна ^2хр(х) <8> ж, т.е. является смесью чистых альтернатив х с весами р(х), то С/(р) = *£2хр(%)и(х). Т.е. функция С/ является ожидаемой полезностью.

Утверждение про единственность II довольно легкое. Грубо говоря, един­ственное место, где был произвол в построении - это когда мы приписали 1 альтернативе ж* и 0 альтернативе х*. Назначение других чисел даст моно­тонное аффинное изменение функции и. □

Полезность денег. Одно из стандартных применений теории ожидаемой полезно­сти относится к деньгам. Хотя во многих случаях полезность можно отождествлять с деньгами, при более тонких и реалистичных рассмотрениях полезность денег нелинейна. Наиболее яркий довод в пользу нелинейности дает т.н. Петербургский парадокс.

Представим себе лотерею (правда, бесконечную)

Приз

2

4

8

 

 

Вероятность

1/2

1/4

1/8

 

1/2к

 

Математичнское ожидание этой лотереи равно

2 • 1/2 + 4-1/4 +... = 1 + 1 + ...

т.е. бесконечности. Значит ли это, что вы готовы пожертвовать любым богатством, чтобы купить билет для участия в такой лотерее? Заметим, что вероятность получить выигрыш более 1000 руб. меньше одной тысячной. Мало людей согласятся много заплатить за такую лотерею, и дело как раз в том, что полезность денег нелинейная. Так, если и(.г) = х1^2, то полезность этой лотереи равна

у/2 • 1/2 + ^4 • 1/4 + ... = 1/у/2 +        + ... = 1/^2(1 - 1/^2) ~ 2.44

Денежный эквивалент этой лотереи равен (2.44)2 ~ 5.95.

Довольно естественно считать, что полезность 11-М в случае денежных лотерей обла­дает свойством монотонности. А если, как это часто бывает, имеется еще и отвращение к риску, то и вогнута. Отвращение к риску означает, что среднее (барицентр) лотереи пред­почтительнее самой лотереи. Впрочем, тем не менее, многие люди участвуют в лотереях, что свидетельствует о нарушении для них этой аксиомы.

Численной мерой отвращения к риску (или вогнутости функции 11-М и) в точке х слу­жит число к(и,х) = —и"(х)/и'(х). Оно называется коэффициентом абсолютного отвраще­ния к риску в точке х. Функция и восстанавливается по к(и, •) с точностью до аффинного преобразования.

Индивид называется нейтральным к риску, если его полезность и линейна, т.е. если ко­эффициент отвращения к риску тождественно равен 0. В этом случае полезность лотереи р равна его ожиданию Ер.

Подробнее об отвращении к риску, стохастическом доминировании, страховании и т.п. мы рекомендуем книгу МасКолея и др.

Теория Сэвиджа. Она относится к более суровой неопределенности, когда нет объ­ективных вероятностей (в этом случае говорят иногда о лошадиных скачках). Сэвидж предложил систему аксиом, которая объясняет поведение индивида двумя вещами: функ­цией полезности и на исходах X и субъективной вероятностью 7Г на множестве состояний природы О; индивид при этом максимизирует ожидаемое (по 7г) значение и. Смысл этого подхода в том, что (субъективные) вероятности событий извлекаются из предпочтений индивида.

Скажем кратко об этом. Примитивные понятия: множество X чистых исходов, множе­ство А(Х) лотерейных исходов, О - конечное множество состояний природы. Действие -это отображение / : О —у Д(А^); множество их обозначается С. На С задано предпочтение

которое удовлетворяет тем же аксиомам: слабый порядок, независимость и непрерыв­ность. Тогда :< представляется обобщенной ожидаемой полезностью вида Х]шеП ^Д/О^))-Фактически это уже было доказано.

Новое появляется, если мы потребуем, чтобы полезности иш не зависели от состояния природы ш. Например, этого можно добиться, добавив к уже упомянутым трем аксио­мам аксиому монотонности. Чтобы ее сформулировать, заметим, что постоянные лотереи позволяют индуцировать на симплекс А(Х) предпочтение ^ с множества С, которое изо­бражается той же буквой.

4. Аксиома монотонности. Пусть / ир - два действия, и для любого ш £ О /(ш) У д(оо), тогда / Уд.

Как легко понять, в этом случае предпочтения на А (.V). индуцированные функциями не зависят от ш. Из единственности полезности 11-М следует, что иш = 7т(ш)11 + а(ш), и 7т(ш) > 0. Нормируя 7Г, можно считать, что      7т(ш) = 1, т.е. является требуемой вероятно­стью на О. Полезность на £ в этом случае представляется функцией / н> [п и(/(ш))(1тг(ш).