Книга Теория игр в комиксах - читать онлайн бесплатно, автор Тувана Пастин. Cтраница 3
bannerbanner
Вы не авторизовались
Войти
Зарегистрироваться
Теория игр в комиксах
Теория игр в комиксах
Добавить В библиотекуАвторизуйтесь, чтобы добавить
Оценить:

Рейтинг: 3

Добавить отзывДобавить цитату

Теория игр в комиксах

В игре «Камень, ножницы, бумага» возможно только одно равновесие: каждый игрок выбирает смешанную стратегию, при которой он называет каждый из трех возможных вариантов («камень», «ножницы» или «бумага») с одинаковой вероятностью.

Джек делает случайный выбор, и у каждого варианта одинаковая вероятность. Это значит, что у Сьюзан нет никаких предпочтений относительно ее возможных выборов. Если Сьюзан выберет «ножницы», то вероятность ее выигрыша – один к трем (это случится, если Джек выберет «бумагу»); также это будет значить, что в этой ситуации вероятность ее проигрыша составит одну треть (если Джек выберет «камень»), и одну вероятность ничьей будет равно одной трети (если Джек также выберет «ножницы»). Но и любой другой выбор, помимо «ножниц», гарантирует Сьюзан те же выигрыши.



Такое же рассуждение рационально и для Джека. До тех пор пока существует одинаковая вероятность того, что Сьюзан выберет каждый из возможных вариантов, Джек будет получать те же выигрыши за выбор любого из трех вариантов. Поэтому он предпочитает делать случайный выбор.

Игра «Валютная спекуляция»

Равновесие Нэша в смешанных стратегиях может применяться в самых различных областях. Оно отражает неожиданность в играх, где участники должны быть непредсказуемы. К примеру, оно может наглядно продемонстрировать, как работают спекулятивные атаки, которые обычно достаточно внезапны и неожиданны.

16 сентября 1992 года, в день, известный как «Черная среда», произошла внезапнаяспекулятивная атака – инвесторы массово продавали британские фунты стерлингов, ожидая девальвации (резкое падение стоимости фунта стерлингов по сравнению с другими валютами). Тогда стоимость фунта относительно других валют ЕС была зафиксирована Банком Англии. В тот день Банк Англии купил 4 миллиарда фунтов стерлингов, чтобы предотвратить обесценивание валюты.

Однако на следующий день Банк Англии, который больше не мог противостоять силе рынка, допустил падение стоимости фунта более чем на 10 %. Спекулянты, за день до этого продавшие фунты и купившие немецкие марки, получили огромную выгоду, а Банк Англии понес колоссальные убытки. Тогда один из крупнейших спекулянтов, американский финансист венгерского происхожденияДжордж Сорос (род. в 1930 г.) стал известен как «человек, который разорил Банк Англии».



Но почему же произошла «Черная среда»? Почему Банк Англии не обесценил фунт стерлинга на день раньше, чтобы предотвратить убытки?

Для инвестора лучше всего быть непредсказуемым, чтобы нельзя было спрогнозировать, когда выгоднее всего начать спекулятивную атаку. Если бы центральный банк мог предсказать атаку, он бы заранее обесценил валюту, чтобы избежать убытков. И тогда спекулянты не успели бы воспользоваться девальвацией.



В игре «Валютная спекуляция» нет равновесия Нэша в чистых стратегиях. Точно так же как и в «Камень, ножницы, бумага», единственным равновесием остается равновесие в смешанных стратегиях. Спекулянты наугад выбирают время атаки, с тем чтобы центральный банк не мог предсказать точную дату спекулятивной атаки. Именно поэтому Банк Англии был не в состоянии предотвратить события «Черной среды».


Игра «Кто первый струсит»

Равновесие Нэша в смешанных стратегиях может интуитивно казаться более выгодным в ситуациях, когда не существует равновесия Нэша в чистых стратегиях, потому что игроки решают вести себя непредсказуемо. Равновесие Нэша в смешанных стратегиях также интересно исследовать в положениях с множеством равновесий Нэша в чистых стратегиях, при которых каждый игрок предпочитает отличный от чужого равновесный исход.

Классическим примером этого является игра «Кто первый струсит»: два подростка едут в автомобилях навстречу друг другу. Они хотят проверить себя на смелость и определить, кто сможет дольше ехать в прямом направлении. Здесь имеется равновесие Нэша в чистых стратегиях, при котором один подросток продолжает ехать прямо, а другой сворачивает в сторону, а также есть другое равновесие, при котором они меняются ролями. Естественно, для каждого юноши предпочтителен исход, при котором он оказывается смельчаком, а другой – трусом.



Игра «Кто первый струсит» интересна оттого, что, если ни один из водителей не свернет, аварии будет не миновать. Тем не менее авария не является возможным равновесным исходом, если мы рассматриваем лишь равновесие Нэша в чистых стратегиях. Очевидно, если один водитель продолжает ехать по прямой, наилучшим ответом другого будет свернуть в сторону и избежать столкновения.

Чтобы передать увлекательность этой игры, нам необходимо рассмотреть равновесие Нэша в смешанных стратегиях, когда оба игрока наугад выбирают свою линию поведения. В равновесии Нэша в смешанных стратегиях лобовое столкновение – один из возможных исходов.


«Игра навылет»

«Игра навылет» – это пример применения «Кто первый струсит» в экономике. Эта игра наглядно иллюстрирует, как можно найти равновесные вероятности в равновесии Нэша в смешанных стратегиях.

В Смолвилле два продуктовых магазина: Kalemart и Radish. Недавно население этого города сильно уменьшилось. Теперь Смолвилль слишком мал, чтобы оба магазина могли продолжить успешно работать. Тем не менее один магазин сможет вести выгодную торговлю, только если второй закроется. Соответственно, каждый владелец предпочел бы наслаждаться продуктовой монополией в Смолвилле, пока другой покидает рынок.



Эта матрица демонстрирует, какими будут прибыль и убытки Kalemart и Radish при каждом возможном исходе. Если и Kalemart (К), и Radish (R) продолжат работать в городе, то оба магазина понесут убытки (К – 20, R – 50). Эти условные цифры используются для примерной демонстрации более реальных сумм, типа 20 000 фунтов стерлингов и 50 000 фунтов стерлингов. Если оба магазина закроются, то оба не получат никакой прибыли.

Если Kalemart продолжит работать, а Radish закроется, то Kalemart получит выигрыш в размере 80 (К:80), а выигрыш Radish составит 0 (R:0). Если Radish останется в Смолвилле и получит монополию, то он получит выигрыш в размере 100 (R:100), а выигрыш Kalemart будет равен 0 (К:0).



Неудивительно, что компании конфликтуют из-за их положения в Смолвилле, ведь каждая предпочла бы быть единственной в городе. Равновесие Нэша в смешанных стратегиях отражает этот конфликт. Ни один из магазинов не желает сдаваться, точно так же как ни один из подростков не хотел проиграть спор в «Кто первый струсит». И точно так же как в «Кто первый струсит», где любой юноша имел возможность показать свою смелость, в «Игре навылет» каждый магазин продолжает работать с некоторой вероятностью, но без абсолютной уверенности.



Чтобы решить вопрос вероятностей в равновесии Нэша в смешанных стратегиях, необходимо понять, что управление магазина будет принимать случайное решение, только если оно индифферентно к последующей судьбе этого магазина. А индифферентным управление магазина может быть, только если ожидаемая прибыль от работы равна ожидаемой прибыли от прекращения работы.

Если ожидаемая прибыль от одного действия выше, чем от другого, то управление магазина предпочло бы первое действие, и этот выбор был бы сделан с уверенностью. В равновесии случайный выбор и, соответственно, неуверенность в действиях имеют место, только если управление магазина индифферентно, то есть если ожидаемая прибыль от обоих действий равна.



Если Radish «вылетит», его ожидаемая прибыль составит 0 вне зависимости от действий Kalemart:

С другой стороны, если Radish продолжит работать, его ожидаемая прибыль будет зависеть от вероятности того, что Kalemart останется в Смолвилле. Пусть k будет означать вероятность работы Kalemart.

Если k = 0, то нет никакой вероятности, что Kalemart продолжит работу. А если k = ½, то существует 50 %-ная вероятность, что Kalemart будет работать. Если k = 1, то Kalemart точно продолжает работу в Смолвилле. (1 – k) означает вероятность прекращения работы Kalemart.

Если Radish продолжит работать, он понесет убытки, равные –50, при условии, что Kalemart также продолжает работать, что произойдет с вероятностью k. Radish получит 100, если Kalemart «вылетит», что произойдет с вероятностью (1 – k). Таким образом, для Radish:



«Рэдишу» безразлично, продолжать работу или закрываться, только если его ожидаемая прибыль от этих альтернатив равна:



Чтобы найти равновесную вероятность того, что Kalemart продолжит работать, разрешим эту задачу относительно k и получим, что k= ⅔.



Равновесная вероятность того, что Radish продолжит работать, равно ⅘. Это можно рассчитать, пытаясь найти такую вероятность, с которой Kalemart будет безразлично – работать или закрываться.

Если Kalemart продолжает работать, он понесет убытки в размере –20, при условии, что Radish работает, что произойдет с вероятностью ⅘. Kalemart получит прибыль в размере 80, если Radish «вылетит», что произойдет с вероятностью ⅕. Для Kalemart в равновесной ситуации ожидаемая прибыль от прекращения работы (равная нулю) равна ожидаемой прибыли от работы.



В равновесной ситуации Kalemart продолжил бы работу с вероятностью ⅔, а Radish остался бы с вероятностью ⅘, поэтому мы можем рассчитать вероятность каждого возможного исхода.

Вероятность того, что оба магазина закроются, равна 1/15, то есть мы умножаем вероятность того, что Kalemart закроется, на вероятность прекращения работы Radish: (1/3)*(1/5)=1/15.

Вероятность того, что оба магазина продолжат работу, равна 8/15, то есть мы умножаем вероятность того, что Kalemart продолжит работать, на вероятность работы Radish: (2/3)*(4/5)=8/15. В этом случае оба магазина несут убытки. Этот исход похож на один из возможных исходов в «Кто первый струсит», где оба подростка демонстрируют свою смелость и погибают в аварии.



Вероятность того, что Kalemart в конце концов останется единственным магазином в городе, или того, что Radish создаст продуктовую монополию, можно рассчитать этим же способом.

Также возможно смоделировать другую версию «Игры навылет», в которой оба игрока продолжают работать, у них есть возможность закрыть магазин попозже. В этом случае их конфликт продлится еще дольше, а их убытки будут расти. Это явление известно под названиемвойна на истощение. Этот термин был заимствован из военного лексикона. В подобных играх могут происходить затяжные, изматывающие конфликты, даже если выигрыш на самом деле совсем незначителен по сравнению со всеми потерями и убытками.


«За» и «против» смешанных стратегий

Из всех тем в теории игр равновесие Нэша в смешанных стратегиях, наверное, вызывает наибольшие разногласия. Сторонники смешанных стратегий подчеркивают, что многие игры, например «Камень, ножницы, бумага» или «Валютная спекуляция», не имеют равновесия Нэша в чистых стратегиях, но в них наблюдается очень интересное равновесие Нэша в смешанных стратегиях. Они также утверждают, что даже в таких играх, как «Кто первый струсит» или «Игра навылет», в которых есть равновесие Нэша в чистых стратегиях, это равновесие зачастую является полностью интуитивным, так как оно выявляет неуверенность игроков.

Тем не менее оппоненты смешанных стратегий заявляют, что случайный выбор не является разумным человеческим поведением. Неужели люди принимают решения наугад? И в связи с тем, что при равновесии участники индифферентны, что мотивирует их выбирать как раз те вероятности, которые подталкивают других игроков к индифферентности?



Одним из защитников смешанных стратегий был американо-венгерский экономистЯнош Харсаньи (1920–2000), который ввел понятие «очищение». В 1994 году он разделил Нобелевскую премию по экономике с Джоном Нэшем и немецким экономистом Рейнхардом Зельтеном (род. в 1930 г.).

Янош Харсаньи утверждал, что даже если игроки выбирают чистые стратегии, если присутствует даже малейшее сомнение в выигрышах друг друга, со стороны будет казаться, что они делают случайные выборы.



Знаменитое «очищение» Яноша Харсаньи доказывает, что если игроки почти, но не полностью уверены в выигрышах других участников, то отдельному игроку может показаться, что вероятность выбора другим игроком определенной линии поведения точно равна той вероятности, с которой мы имеем дело в равновесиях Нэша в смешанных стратегиях без неуверенности о чужих выигрышах.

Это значит, что равновесие Нэша в смешанных стратегиях относительно, даже если вы не верите, что людям свойственно принимать решения наугад.


«Уклонение от уплаты налогов»

Одним из примеров равновесия Нэша в смешанных стратегиях являются игроки, которые случайным образом выбирают свои возможные действия. Еще одним примером можно назвать некоторую неуверенность о выигрышах других игроков. Игра под названием «Уклонение от уплаты налогов», в которой взаимодействуют налогоплательщики и налоговая служба, может служить третьим примером.

Представьте ситуацию: женщина, владелица предприятия, должна заполнить налоговую декларацию. Для простоты допустим, что у нее есть два варианта: действовать согласно букве закона или уклоняться от уплаты налогов. Предположим, что с нравственной точки зрения уклонение от уплаты налогов нормально.



Налоговая служба, естественно, может поймать «уклониста», но аудит – это дорогостоящая процедура. Однако в аудите нет нужды, если налогоплательщик не уклоняется от уплаты налогов.

В этой игре нет равновесия Нэша в чистых стратегиях.

Налогоплательщик, несомненно, будет действовать в рамках закона, если точно знает, что его будут проверять. Тут не может быть равновесия Нэша: если налогоплательщик точно будет уплачивать налоги, государству нет нужды проводить аудит.

Налогоплательщик, несомненно, будет избегать уплаты налогов, если уверен, что аудит проводить не будут. Очевидно, что эта ситуация также неравновесна: если налогоплательщик уклоняется, то налоговой службе лучше провести аудит.

Единственное равновесие в этой ситуации – в смешанных стратегиях: налогоплательщики делают случайный выбор между законной деятельностью и уклонением, а налоговая служба наугад выбирает, стоит проводить аудит или нет.



Если в игру «Уклонение от уплаты налогов» играют многие граждане, то значительной альтернативной интерпретацией равновесия Нэша в смешанных стратегиях будет то, что каждый отдельный гражданин выбирает чистую стратегию: он либо «подчиняется закону», либо «уклоняется». Однако равновесие Нэша в смешанных стратегиях формирует вероятность, которая образует часть граждан, выбирающих чистую стратегию «подчиняться закону», и часть граждан, выбирающих чистую стратегию «уклоняться». Налоговому инспектору известно соотношение уклонистов и законопослушных налогоплательщиков, однако он не знает, кто из граждан к какой группе относится.


Повторяющееся взаимодействие

В 1883 году французский экономистЖозеф Луи Франсуа Бертран (1822–1900) изучал ценовую конкуренцию между несколькими фирмами, продававшими одну и ту же продукцию. Те стимулы, с которыми сталкиваются эти фирмы, схожи со стимулами заключенных в «Дилемме заключенных».



Бертран предсказал, что в равновесии фирмы будут продавать товар по более низкой цене, чем соперник, что похоже на исход {признание, признание} в «Дилемме заключенных». Несмотря на это предсказание, на рынках с небольшим количеством компаний часто можно заметить цены, основанные на сговоре. Большинство западных демократий обладают так называемым «антитрестовским» законодательством для предотвращения подобного сговора (кооперации нескольких фирм) и содействия конкуренции.

Чтобы понять, как игроки сговариваются в ситуациях вроде «Дилеммы заключенных», нам необходимо уйти отоднократных игр (в которых участники играют один раз и затем игра кончается) и начать размышлять о более реалистичных сценариях повторяющегося взаимодействия, при котором участники играют в одну игру снова и снова.



Заметили бы мы равновесную кооперацию в «Дилемме заключенных», если бы игроки снова и снова взаимодействовали?

Представьте, что оба игрока знают, что они будут играть в «Дилемму заключенных» не один раз, а два. Чтобы найти равновесие в игре с повторяющимся взаимодействием, нам сначала необходимо предсказать равновесие, которое сформируется в последнем туре. А затем мы размышляли бы о том, каким будет равновесие в первом туре. Такая схема размышления называетсяобратной индукцией.


В конце игры

Во время второго раунда игроки понимают, что это последний раунд, поэтому нет больше необходимости пытаться изменить потенциальный исход. Соответственно, последний тур игры представляет собой однократную «Дилемму заключенных»: все сотрудничество отменяется.

Игроки могут рассудить, что во втором туре никто не будет сотрудничать вне зависимости от событий первого раунда. Таким образом, с точки зрения игрока первый тур игры также ничем не отличается от однократной «Дилеммы заключенных». Так что в равновесной ситуации ни на одной стадии игры никто не будет сотрудничать.

В действительности, даже если «Дилемму заключенных» повторять на протяжении многих раундов, мы никогда бы не увидели кооперации ни на одном из уровней, до тех пор пока у игры есть определенный финальный тур, так как обратная индукция разбирает игру с последнего раунда.


Что, если определенного последнего тура нет?

Роберт Джон Ауманн, израильский математик (род. в 1930 г.), в 2005 году разделивший Нобелевскую премию по экономике с Томасом Шеллингом, занимался изучением кооперации как равновесного исхода в случае, когда у игры бесконечный горизонт, то есть игра может повторяться вечно. При таком горизонте обратная индукция не разбирает кооперацию с последнего тура, ведь определенного последнего тура и не существует.

Первым условием для того, чтобы кооперация стала равновесным исходом, является обязательное наличие в стратегиях игроков элемента наказания за «плохое» поведение в прошлом (то есть за некооперативное поведение). Игроки могут вести себя кооперативно, чтобы избежать наказания в будущем.



В «Дилемме заключенных» с бесконечным горизонтом, то есть когда в игру играют непрерывно, вечно, можно рассмотреть так называемуюстратегию вечной кары: сначала игрок действует кооперативно (в зависимости от игры это может оказаться преступник, хранящий молчание, соседка, моющая посуду, или компания, устанавливающая высокую цену по сговору). В последующих турах игрок сотрудничает, только если другой игрок до этого всегда вел себя кооперативно. Однако первый игрок перестает сотрудничать (заключенный признается, соседка перестает мыть посуду, а компания устанавливает более низкую цену), если другой игрок когда-либо в прошлом вел себя некооперативно.



Оба участника, выбирающие стратегию вечной кары, могут формировать равновесие Нэша в повторяющейся игре вроде «Дилеммы заключенных», если они достаточно терпеливы (если они способны не польститься на большой выигрыш сегодня, чтобы получить кооперативный выигрыш в будущем). В этом случае наказание за отступничество может удержать игроков от некооперативного поведения.

Тем не менее, если игроки нетерпеливы, они навряд ли смогут устоять и не предать другого игрока, несмотря на последующее наказание. Понимая это, соперник изначально не станет вступать в кооперацию. Таким образом, сотрудничество с нетерпеливыми игроками не может быть равновесным.



Когда участники терпеливы (из-за угрозы наказания, которое становится сдерживающим средством), угроза должна быть убедительной. Стратегия вечной кары может оказаться не убедительной, если наказывающий участник также не получает большого выигрыша из-за этого наказания. Соответственно, если сговор проваливается, у обоих игроков появляется стимулпересмотреть отношения, не обращать внимания на отклонения и просто начать сговор заново. Однако если игроки ожидают, что им удастся быстро пересмотреть их отношения, то их сговор изначально нельзя назвать устойчивым.



Тем не менее если участники ожидают, что пересмотр займет определенное время, то угроза может возыметь сдерживающее действие, и в конце концов будет сформирован равновесный исход, основанный на сговоре.

Даже если игра не повторяется вечно при условии, что игроки не уверены, когда она кончится, сотрудничество можно поддерживать в равновесии до тех пор, пока они верят, что игра, скорее всего, продолжится в следующем раунде. Тогда появляется вероятность того, что отступление от договоренности будет наказано, а значит, кооперация вне опасности.

Тем не менее, если игра, вероятнее всего, кончится в следующем туре, то игрок будет действовать с выгодой для себя и отступит от договоренности, чтобы в этом туре получить больший выигрыш. Понимая это, и его соперник не будет действовать кооперативно. Сговора в этой ситуации не будет.


Эксперимент с «Дилеммой заключенных»

Одним из отцов-основателей экспериментальной экономики былРейнхард Зельтен, который в 1994 году разделил Нобелевскую премию по экономике с Джоном Нэшем и Яношем Харсаньи. Зельтен провел эксперимент, в ходе которого участники играли в версию повторяющейся «Дилеммы заключенных» на настоящие деньги. Игроки не знали, сколько раз будет повторяться игра, но знали, что рано или поздно эксперимент подойдет к концу.

Результаты этого эксперимента полностью соответствовали теории игр. Кооперативные исходы наблюдались чаще всего, если игроки чувствовали, что конец игры наступит не скоро. Однако когда время истекало и конец игры приближался, игроки начинали отступать от договоренностей и взаимное сотрудничество рушилось.


Эволюционная теория игр

В большинстве случаев теория игр означает понимание людей, компаний или государств как субъектов, принимающих рациональные решения. Затем она рассматривает решения, которые они принимают во время взаимодействия с теми, кто также принимает рациональные решения.