Давайте теперь вернемся к нашему примеру с «Орлянкой».
Петя в этой игре играет смешанную стратегию
1/2 «Орла» +1/2 «Решки».
А Вася — смешанную стратегию 2/3 «Орла» + 1/3 «Решки».
Давайте представим, что в общем случае Вася играет некоторую смешанную стратегию:
с вероятностью α он играет стратегию «Орел» и с вероятностью 1-α — «Решку».
А Петя с вероятностью β играет стратегию «Орел» и с вероятностью 1-β — «Решку».
Давайте определим платежи, которые получают ребята в общем случае.
Для того чтобы посчитать такой платеж, который получит Вася, мы считаем,
с какой вероятностью игра закончится в любом
из четырех состояний, и затем умножаем
эти вероятности на соответствующие платежи, которые получает Вася.
После этого складываем полученные результаты
и получаем ожидаемый платеж Васи.
Так, с вероятностью α умножить на β игра закончится в профиле (Орел, Орел),
поэтому этот вклад этого профиля в эту
общую сумму математического ожидания платежа Васи
будет αβ умножить на платеж, который получает Вася в профиле (Орел, Орел).
С вероятностью 1-α умножить на β Вася получает платеж,
который он получает в профиле (Решка, Орел).
С вероятностью α умножить на 1-β Вася получает платеж,
который он получает в профиле (Орел, Решка).
И, наконец, с вероятностью 1-α умножить на 1-β Вася получает платеж,
который он получил бы, если бы оба сыграли чистую стратегию «Решка».
Мы знаем платежи, которые получает Вася в каждом из этих четырех профилей,
составленных из чистых стратегий,
поэтому можем подставить эти платежи и посчитать ожидаемый платеж Васи.
Точно так же мы можем посчитать и ожидаемый платеж Пети.
Напомню, что раньше мы посчитали эти ожидаемые платежи для одного конкретного
профиля и вычислили, что и Петя, и Вася получают ожидаемый платеж,
равный нулю, если Вася играет стратегию 2/3 «Орла» + 1/3 «Решки»,
а Петя играет стратегию 1/2 «Орла» + 1/2 «Решки».
Теперь, собственно, к теории игр.
Давайте зададимся вопросом: а правильно ли
играет Вася в ответ на такую стратегию Пети?
Может ли он отклониться и сыграть какую-то другую смешанную стратегию так,
чтобы постараться увеличить свой платеж?
Зафиксировали стратегию Пети.
Петя играет стратегию 1/2 «Орла» + 1/2 «Решки».
И пытаемся найти такую стратегию Васи, которая принесла бы ему больший платеж,
чем он получает сейчас, то есть платеж больше нуля.
Получится ли у нас это сделать?
Давайте сначала представим, что Вася решил сыграть какую-то другую стратегию, ну,
например, с вероятностью 2/3 он напишет «Решку», а с вероятностью 1/3 — «Орел».
Петя по-прежнему играет ту же самую стратегию.
Тогда точно так же, как и раньше, считаем,
с какой вероятностью игра закончится в том или ином профиле стратегий,
считаем вероятности, с которыми ребята напишут одинаковые слова, вероятности,
с которыми ребята напишут разные слова, и теперь считаем ожидаемый платеж,
который получает Вася в этом новом профиле стратегий.
Этот ожидаемый платеж снова оказывается равен нулю,
потому что теперь с вероятностью 1/2 мальчики напишут одинаковые слова,
с вероятностью 1/2 — снова напишут разные слова, ну,
и в этом случае ожидаемый платеж Васи равен нулю.
Случайность ли это?
Нет. На самом деле, если Петя играет стратегию
1/2 «Орла» + 1/2 «Решки», то любая смешанная
стратегия Васи будет приносить ему одинаковый ожидаемый платеж, равный нулю.
Это происходит из-за того, что обе чистые стратегии Васи
приносят ему одинаковый ожидаемый выигрыш в ответ на стратегию Пети,
в которой он с вероятностью 1/2 играет чистую стратегию «Орел» и
с вероятностью 1/2 играет чистую стратегию «Решка».
Дело в том, что мы можем посчитать,
какой ожидаемый платеж Васи приносит чистая стратегия «Орел»
в ответ на эту стратегию Пети. С вероятностью 1/2
Вася получает единицу, с вероятностью 1/2 Вася получает -1,
поэтому ожидаемый платеж Васи равен нулю.
Точно так же считаем ожидаемый платеж Васи, если он сыграет чистую стратегию «Решка»
против Петиной стратегии 1/2 «Орла» + 1/2 «Решки».
Точно так же этот ожидаемый платеж равен нулю, потому что снова с вероятностью 1/2
Вася выиграет, а с вероятностью 1/2 — проиграет.
И теперь, с какими бы весами Вася ни смешал эти две
свои стратегии: стратегию «Орел» и стратегию «Решка»,
поскольку каждая из этих стратегий приносит Васе ожидаемый платеж,
равный нулю, то и любая смесь этих двух стратегий
будет приносить тоже ожидаемый платеж, равный нулю.
Теперь давайте зафиксируем смешанную стратегию Васи.
Вася играет стратегию 1/3 «Орла» + 2/3 «Решки».
Давайте представим себя на месте Пети.
Может ли Петя улучшить свою стратегию?
Может ли он отклониться от стратегии, в которой он смешивал с равными весами
чистую стратегию «Орел» и чистую стратегию «Решка»,
отклониться таким образом, чтобы увеличить свой ожидаемый платеж?
А вот Петя отклониться с выгодой для себя может.
Например, если Петя сыграет чистую стратегию «Орел»,
то его ожидаемый платеж будет больше нуля.
Действительно, с вероятностью 1/3 будет сыгран профиль (Орел, Орел) —
Петя проиграет один рубль,
с вероятностью 2/3 будет сыгран профиль (Решка, Орел) —
Петя выиграет один рубль, и тогда ожидаемый платеж
Пети равен 1/3, больше нуля.
Значит, у Пети есть стратегия, которая позволит
ему получить больше, чем стратегия, в которой
он смешивал чистую стратегию «Орел» и чистую стратегию «Решка» с равными весами.
Все дело в том, что Пете невыгодно смешивать
с положительными весами обе свои чистые стратегии.
Они приносят разный ожидаемый платеж.
Стратегия «Орел» приносит Пете больше,
чем стратегия «Решка» в ответ на стратегию Васи, в которой Вася
с вероятностью 1/3 играет стратегию «Орел», а с вероятностью 2/3 играет «Решку».
Это важное наблюдение.
Игроку имеет смысл смешивать свои чистые
стратегии с ненулевыми весами только, возможно, в том случае,
если каждая из этих чистых стратегий, которые входят в смесь,
приносит одинаковый и максимальный ожидаемый
платеж в ответ на зафиксированные стратегии остальных игроков.
Если есть какая-то одна стратегия,
которая приносит большой ожидаемый платеж, и другая стратегия,
которая приносит маленький ожидаемый платеж в ответ на зафиксированный
набор стратегий всех остальных игроков, то игроку не имеет
никакого смысла смешивать свою хорошую стратегию и плохую стратегию,
потому что уж лучше с вероятностью 1 сыграть ту чистую стратегию,
которая приносит максимальный ожидаемый платеж.
Таким образом, смешивать стратегии имеет смысл только в том случае,
если каждая из чистых стратегий, входящих в смесь, приносит
одинаковый ожидаемый платеж.