Книга Теория игр в комиксах - читать онлайн бесплатно, автор Тувана Пастин. Cтраница 5
bannerbanner
Вы не авторизовались
Войти
Зарегистрироваться
Теория игр в комиксах
Теория игр в комиксах
Добавить В библиотекуАвторизуйтесь, чтобы добавить
Оценить:

Рейтинг: 5

Добавить отзывДобавить цитату

Теория игр в комиксах


Ядерное сдерживание

Со времен Второй мировой войны две величайшие ядерные державы – США и Россия – практиковали ядерное сдерживание, основанное на взаимной угрозе применения ядерного оружия. Суть в том, что если она из сторон нападет, другая сможет отомстить волной поражающего ядерного взрыва и тем самым сотрет с лица земли агрессора. Соответственно – понятно, почему ни одна из сторон не нападает.

До сих пор в мире не было ни одной глобальной ядерной войны, так что можно сказать, что эта политика удачна. Однако некоторые ученые считают, что желаемое равновесие может не оказаться совершенным по под-играм. Оно может основываться на недостоверных угрозах, и тогда в будущем нас могут ожидать серьезные проблемы.



Стратегия взаимной угрозы применения ядерного оружия основана на идее о том, что если вражеские ракеты окажутся на территории чужого государства, то правительство этого государства обязательно отомстит, уничтожив агрессора. Тем не менее месть не меняет ситуацию в стране, являющейся целью ракет: ее судьба уже предрешена поступающими ракетами.



Можно почти гарантировать, что глава атакованного государства захочет отомстить. Тогда ответный удар будет наилучшим выбором в этой под-игре, когда принимается решение о контратаке. Если так и произойдет и неприятелю об этом будет известно, то желаемое равновесие, при котором изначально не было никакой ракетной атаки, является совершенным по под-играм. Ядерной войны не будет.




Тем не менее человек, который решает, мстить или не мстить, может не хотеть жертвовать миллионами граждан. В конце концов, когда ракеты противника в воздухе, местью уже никого не спасти. Таким образом, в под-игре ответного удара человек с четкими нравственными устоями решит не совершать контратаки.

В этом случае угроза мести недостоверна. Желаемое равновесие, при котором изначально никто ни на кого не нападает, не является совершенным по под-играм. Нет никакой причины не запускать ракеты, если атакованное государство не будет наносить ответный удар.



Если правительство страны имеет четкие моральные устои и не желает убивать миллионы ни в чем не виновных людей, то как избежать нападения на свою страну?

Возможным решением может статьделегирование решения об ответном ударе тому, кто может быть мотивирован мстить или должен следовать установленной процедуре. Так государство сможет гарантировать достоверность угрозы ответного удара.



Сделать угрозу ответного удара достоверной можно, передав нескольким отдельным людям возможность начать контратаку, это так называемоенаращивание. Таким образом, если неприятель начнет задумывать атаку, он должен определить вероятность того, что хотя бы один из этих людей мотивирован мстить. Чем больше людей, у которых есть возможность начать ответный удар, тем выше вероятность, что это правда произойдет. Если ответный удар может произойти, то атаки не будет с самого начала.



На практике и делегирование, и наращивание используются ради большей достоверности угрозы ответного удара. Соответственно, благодаря им в равновесии, совершенном по под-играм, атак и не происходит.

У Голливуда есть третий вариант решения этой проблемы: принятие решения о нанесении контратаки можно передать машинам, что означает полную гарантию контратаки. В кино эта роль отдана «Машине Судного дня» в фильме «Доктор Стрейнджлав, или Как я перестал бояться и полюбил бомбу», интеллектуальной системе WOPR в «Военных играх» и суперкомпьютеру «Скайнет» в «Терминаторе».

Неизвестно, насколько такой подход применяется в реальности. Тем не менее, как говорится в фильме «Доктор Стрейнджлав, или Как я перестал бояться и полюбил бомбу», «Машина Судного дня» может пригодиться лишь как сдерживающий элемент, если потенциальный противник знает о ее существовании. А если появляется необходимость в ее применении, значит, она уже не оправдала себя. Соответственно, незачем держать в секрете такое устройство. Наоборот, нужно стараться дать всем о нем знать. Таким образом, мы можем быть уверены, что сверхдержавы еще не дошли до подобных средств.


Информационные проблемы

В играх расширенной формы, которые мы обсуждали недавно, игроки полностью осознают игровое дерево. Тем не менее часто так случается, что игроки владеют лишьнеполной информацией: им не известны все возможные стратегии противника или его выигрыши. Игроки могут быть не уверены в человеке, с которым играют, или могут не понимать его мотивации.



Бывают и такие ситуации, в которых игроки владеютнесовершенной информацией о игровом дереве: предыдущие действия игроков могут быть ненаблюдаемы или несовершенно наблюдаемы. Это означает, что игроки не могут быть уверены насчет того, на какой точке принятия решения они сейчас находятся.



Каждому человеку порой приходится принимать решения, основываясь на неполной или несовершенной информации, а иногда эти два типа могут накладываться друг на друга. Это имеет важное значение при стратегическом взаимодействии между игроками, особенно если одна из сторон осведомлена лучше другой.

Асимметричная информация

Американские экономистыДжордж Акерлоф (род. в 1940 г.), Майкл Спенс (род. в 1943 г.) и Джозеф Стиглиц (род. в 1943 г.) в 2001 году были награждены Нобелевской премией за анализ рынков с асимметричной информацией: один игрок обладает более полной информацией, чем другие.

К примеру, водитель, желающий купить страховку, владеет частной информацией о его собственных водительских привычках. Страховая компания обладает неполной информацией: работникам не известны его водительские привычки, поэтому она не знает, какие выигрыши она получит от продажи страховки этому водителю.

Менеджер в компании может обладать несовершенной информацией о привычках своих подчиненных. Если работник не сможет успешно выполнить определенную задачу, то менеджер не будет знать, стоит ли ему винить в неудаче починенного или тут все дело в слишком сложной задаче.


Асимметричная информация и безработица

Макроэкономисты, исследующие экономику как целое, ее шаблоны и эффекты, часто рассматривают проблему постояннойбезработицы, ситуации, при которой люди стремятся работать, но не могут найти работу.

Постоянная безработица представляет собой головоломку для стандартного экономического анализа: если существует безработица, значит, на каждую вакансию есть слишком много претендентов. В этом случае фирмы могут предложить людям низкую зарплату, и при этом все равно всем не хватит работы. При низкой зарплате прием на работу также дешевеет, поэтому фирмы имеют возможность нанимать больше работников. Похоже, зарплата должна рано или поздно настолько понизиться, что количество людей, желающих работать, будет равно количеству рабочих мест.



Нобелевский лауреат Джозеф Стиглиц и американский экономистКарл Шапиро (род. в 1955 г.) доказали, что одной из причин постоянной безработицы в экономике является скрытое действие на рабочем месте – там, где действия работников неполностью наблюдаемы.

Представим работника с фиксированной зарплатой. Он может прикладывать все свои усилия, а может лениться и уклоняться от работы. Его усилия нельзя полностью наблюдать. Начальник уволит подчиненного, который увиливает от своих обязанностей, но начальник не может полностью контролировать работника, поэтому у него далеко не всегда получится поймать ленивого подчиненного.



Когда работник решает, будет он увиливать от работы или нет, он сравнивает выгоду от своей лени с ее ценой. Выгода – это более приятно проведенный день в офисе. Цена – это возможность того, что его поймают, вместе с ценностью того, что он потеряет, если его уволят.

Если безработица отсутствует и фирма может предложить такие же регулирующие рынок зарплаты, как и другие фирмы, то работник попытается уклониться от работы.



Чтобы побудить работников усердно работать, фирме необходимо сделать так, чтобы у работников было что терять, если их поймают за халтурой. Можно предложить подчиненным более высокие зарплаты, чем в других компаниях. Высокаяэффективная ставка заработной платы может мотивировать работников прилагать все свои усилия.



Однако эффективная ставка зарплаты может создавать и трудности: все фирмы начинают предлагать своим работникам бо́льшие суммы, чтобы мотивировать их на усердную работу. Но если каждая фирма установит более высокую зарплату, то зарплата повысится на всем рынке. Все больше людей будут хотеть зарабатывать еще больше, количество рабочих мест не будет увеличиваться, а результатом этого опять станет безработица.

В этом случае работники будут мотивированы усердно трудиться, чтобы не потерять работу, потому что поиск нового места займет долгое время.


Подробнее об асимметричной информации

Часто так случается, что люди не уверены в человеке, с которым они взаимодействуют. Такие игры называются играми с неполной информацией, в которых игроки не знают наверняка, каков характер противника, и, соответственно, не уверены насчет выигрышей в каждом из возможных исходов игры.

Такую ситуацию можно представить, воспринимая противника как субъекта определенного типа. Каждый тип ассоциируется с разными выигрышами при каждом возможном исходе игры. Обычно игрок знает, к какому типа принадлежит, но другому игроку это неизвестно. Соответственно, мы наблюдаем асимметричную информацию.


Сообщение о качестве продукции

Рядовому потребителю может быть непросто оценить качество продукта перед покупкой. Однако компания-производитель хорошо понимает, долговечный это продукт или нет. Она знает, к какому типу принадлежит этот продукт (высокое качество или низкое качество), но покупатель не может угадать.

Потребителям необходимо научиться разбираться, какие компании продают товары высокого качества, а какие нет. Естественно, любая компания будет утверждать, что их компания отличается высочайшим качеством, вне зависимости от истины. Так что прямые заявления компании не имеют никакой ценности.



Работая с некоторыми видами товаров, компании могут отказываться от асимметричной информации и предлагать бесплатные образцы на пробу клиентам. Однако такое возможно для определенных видов продуктов.

Если у компании нет возможности предоставить достоверную прямую информацию о качестве продукта, то производителям товаров высокого качества приходится искать способсообщить покупателям о достойном качестве продукции. Чтобы эта схема сработала, компании необходимо представить это сообщение в виде какого-либо наблюдаемого действия, на которое способен производитель товара высокого качества в отличие от производителя некачественной продукции.


Гарантия как средство сообщения

Даже если потребитель не планирует сохранять чек на покупку, наличие гарантии на товар может убедить его приобрести этот товар, потому что оно сообщает ему о высоком качестве продукции.

Потребитель может рассудить, что только компания, выпускающая надежную продукцию, может позволить себе выдавать долгосрочную гарантию, так как количество покупателей, которым она пригодится, будет невелико.

Компания, предлагающая низкокачественные товары, понимает, что количество обращений недовольных клиентов было бы слишком высоко, поэтому долгосрочная гарантия была бы для них слишком дорога.



Вразделяющем равновесии принятие решения о предоставлении гарантии зависит от типа производимого продукта (высокое или низкое качество). Производитель высококачественного товара решит давать гарантию, а фирма, продающая продукцию низкого качества, не станет. Определившись с гарантией, первая компания сможет с помощью самоотбора провести грань между собой и производителем низкокачественной продукции. Так посредством линии поведения два различных типа разделяются.


Реклама как средство сообщения

Реклама также может служить средством сообщения о качестве продукта, если компания производит товар, который обычно покупают повторно, вроде шампуня. Это связано с тем, что доходы от инвестиций в рекламу могут разниться в зависимости от качества продукта.

До первой покупки потребители, как правило, не могут судить о качестве того или иного продукта. Однако после первого использования они могут оценить его свойства. Если компания торгует низкокачественным товаром, то новые клиенты, купившие этот продукт под воздействием рекламы, больше его не приобретут. Они поймут, что это продукт низкого качества. Однако если фирма производит товар высокого качества, новые покупатели станут постоянными клиентами.



Реклама может быть средством сообщения о качестве продукта из-за простого анализа затрат и выгод. Затраты на рекламу всегда одинаковы, вне зависимости от качества рекламируемого продукта. Однако выгода от рекламы для производителя высококачественного товара будет намного выше, так как новые покупатели станут постоянными клиентами. Таким образом, вложив одинаковые суммы в рекламу, компания, продающая низкокачественные товары, будет довольствоваться лишь одноразовыми покупками. Соответственно, активная реклама может быть выгодна лишь для производителей высококачественной продукции.

Потребители, замечающие дорогую рекламную кампанию, могут понять, что фирма вкладывала бы деньги в рекламу, только если бы была уверена, что взамен получит множество постоянных клиентов. Так что можно сказать, что потребители используют рекламу как сообщение о высоком качестве товара.


Религиозный ритуал как средство сообщения

Англо-израильский экономистДжилат Леви (род. в 1970 г.) вместе с израильским экономистом Ронни Рэзин (род. в 1969 г.) доказали, что соблюдение религиозного ритуала может сообщать об искренней религиозной вере человека. Многие верующие люди поддерживают связь между духовной верой и поведением в обществе. Члены религиозных сообществ зачастую ведут себя более кооперативно друг с другом, чем с неверующими людьми. Отсюда вытекает материальная и духовная выгода в принадлежности к такому сообществу.

Но такая система может функционировать, только если члены этого сообщества понимают, что их взаимодействие основывается на их общей вере. Принадлежность к сообществу может давать некоторую материальную выгоду, поэтому иногда у неверующих людей возникает стимул притвориться верующими.



Принятие решений в группе

До сих пор мы рассматривали ситуации, в которых каждый игрок принимает решение самостоятельно.

Однако часто так случается, что решения принимает группа игроков. Отдельный игрок может внести свой вклад в принятие решения, однако не все члены группы могут быть согласны с оптимальной тактикой поведения. Когда каждый игрок не может выбрать предпочтительный для него вариант, согласиться на одном оптимальном ответе может быть не просто.

Исследование группового поведения представляет некоторую трудность для теории игр, так как группа как целое может казаться иррациональной, даже если каждый член этой группы рационален.



У рациональных людей, принимающих решения,переходные предпочтения. Это значит, что если он предпочитает альтернативу А альтернативе Б и предпочитает альтернативу Б альтернативе В, то он должен будет предпочесть альтернативу А альтернативе В (символ «>» означает «предпочтительнее»):

А > Б и Б > В, значит, А > В

Тем не менее, когда все члены группы рациональны, групповые предпочтения могут бытьнепереходными.

То есть для групп А > Б и Б > В не обязательно означает, что А > В.



Мы можем наблюдать непереходные групповые предпочтения в действии в примере с городом, во владении которого находится свободный участок земли. Существует три возможных варианта действий. На нем можно разбить парк, построить центр по переработке мусора или школу.

Городской совет должен решить судьбу этого земельного участка. В совете три человека. Каждый член совета имеет свой первый выбор.




Совет проводит голосование, теперь они решают между двумя вариантами за один раз. Предположим, что каждый член совета голосует за вариант, который он действительно предпочитает, то есть мы наблюдаемискреннее голосование.



Двое проголосовали за школу, один – за парк. Как группа они предпочитают школу парку, значит, они точно не будут разбивать парк:

Школа > Парк

Остается лишь выбрать между центром по переработке мусора и школой.



За постройку центра по переработке мусора проголосовали двое, а за школу один член совета:

Центр по переработке мусора > Школа

Значит, решено. Совет решил, что школа лучше парка, а центр по переработке мусора лучше школы.



В ходе выбора между центром по переработке мусора и парком мистер Питерс голосовал за парк (его первый выбор), мисс Рейнольдс – за центр (ее первый выбор), а мистер Сингх – за парк, так как центр был для него худшим выбором. Совет решил, что парк лучше центра по переработке мусора (два голоса против одного):

Парк > Центр по переработке мусора

Каждый член совета имеет переходные предпочтения и голосует искренне. Однако при совместных действиях предпочтения совета становятся непереходными, то есть вне зависимости от итогового выбора группы члены группы всегда будут считать, что другой вариант лучше.



Американский экономистКеннет Эрроу (род. в 1921 г.) в 1972 году был награжден Нобелевской премией по экономике за его теорему невозможности Эрроу. Согласно ей, в группах, которыми не управляет диктатор, всегда будет вероятность того, что предпочтения станут непереходными, при которых мы будем отвергать выбор, который мог бы быть оптимален для всех, или при которых незначительные детали влияют на наш выбор. Этих проблем не избежать при групповом принятии решений.



Теорема невозможности Эрроу объясняет, почему люди на совещаниях комитетов и на парламентских собраниях часто ведут себя так странно. К примеру, на комитетских совещаниях члены комитета часто поднимают одну и ту же тему.



Существует много способов организовать групповое принятие решений. Возможна как автократия, при которой один человек принимает все решения в зависимости от его предпочтений, так и классическая демократия, при которой все члены групп обладают правом голоса при принятии решения. Помимо этих крайностей имеются и другие возможные системы.

В теореме невозможности Эрроу доказывается, что при любой системе, кроме автократии, в процессе принятия групповых решений всегда будет сохраняться вероятность непоследовательного поведения группы.


С чего все начиналось…

Теорию игр начали воспринимать как самостоятельный научный метод в 1940-х годах, однако ее центральные вопросы взаимодействия и конфликта стары как мир.

К примеру, английский философТомас Гоббс (1588–1679) в своем произведении «Левиафан» пишет:



Его утверждение по природе своей гармонично со всей теорией игр: без сильного правительства, которое бы способствовало заключению соглашений, кооперация провалилась бы, потому что каждый игрок волновался бы об аморальности соперника, что также привело бы к жестокости.



Примеры размышлений в духе теории игр можно найти еще в текстах Платона, который передавал воспоминание Сократа о битве при Делии (424 г. до н. э.).


…и что будет дальше

Развитие теории игр как научной дисциплины предоставило нам возможность в мельчайших деталях исследовать конфликт и кооперацию.

Теперь мы можем ответить на вопросы, на которые было почти невозможно дать ответ раньше.



Из-за математической основы и способов представления большинства явлений теории игр новичкам бывает сложно разобраться в сути и овладеть необходимым инструментарием. Поэтому в настоящей книге мы старательно избегали усложнения и концентрировались на основных идеях теории игр.

Мы рассмотрели примеры, в которых игроки имеют ограниченное количество выборов. Однако часто игрокам приходится выбирать из бесконечного множества вариантов. В таких ситуациях логика теории игр точно такая же, но представляется в более математической манере.

К примеру, мы можем представить компанию, которая решает, стоит вкладывать деньги в рекламу или нет. В этой ситуации компания сделает выбор в пользу варианта, который принесет более крупный выигрыш. Этот выбор бинарен: инвестировать в рекламу или нет. В действительности чаще всего нужно выбрать как раз, сколько денег вложить, какого уровня будет эта реклама.



Когда будете применять инструменты, о которых вы узнали из настоящей книги, то рано или поздно столкнетесь с необходимостью более глубоких знаний. Или, возможно, вам будет интересно расширить свое понимание теории игр. Советуем вам обратиться к этой книге:



В этой книге примеры тяготеют к экономике, но инструменты теории игр будут полезны в любой области науки.