Решение игр в смешанных стратегиях аналитическим методом. Игра 2х2
Если в платежной матрице игры не обнаруживается седловая точка, то из этого следует что игра имеет решение, но не в чистых, а смешанных стратегиях. При этом оптимальная стратегия S*А=<P*1,P*2> S*B=<Q*1,Q*2> P1,P2 – вероятности использования своих первой или второй чистой стратегий Qi – вероятность применения игроком B своих чистых стратегий B1 или В2 Пусть платежная матрица такой игры задана: P=
Где аij – элемент матрицы, определяющий выигрыш (проигрыш) игрока А(В) в случае если игрок А примет свою стратегию iую, в ответ на которую игрок В применяет свою jую чистую стратегию. Эта игра является парной, т.к. учавствуют только 2 игрока А и В. И в то же время игрой 2х2, т.к. у А всего две стратегии и у В тоже 2е стратегии. В теории игр принято считать, что стратегия игрока А указывается по строка платежной матрицы, а стратегии игрока В по столбцам. Решение такой задачи начинается с проверки наличия в платежной матрице седловой точки. Если таковая существует, то решение игры однозначно и выражается в одной из чистых стратегий игроков А и В. В этом случае всегда выигрыш одного игрока равен проигрышу другого игрока цена игры находится на пересечении строки соответствующей нижней цене игры и столбца соответствующего верхней цене игры. Если в платежной матрице не обнаруживается седловая точка, то оптимальной стратегией игрока А будет стратегия а1 или а2 применяющиеся соответственно с вероятностями P*1 P*2. Тогда выигрыш игрока А будет определяться V=a11*P1+a21*P2
Такая запись соответствует применением игроком B стратегии В1. Если игрок В примет стратегию В2, то цена выигрыша игрока А будет определяться вторым столбцом матрицы V=a12*P1+a22*P2 Учитывая, что стратегий всего 2е как у А так и у В и что никаких других вариантов не существует следовательно события применения той или другой стратегии составляют полную группу событий. Для того чтобы получить искомые значения Р*1, P*2 Система уравнений V=a11*P1+a21*P2 <- B1 V=a12*P1+a22*P2 <-B2 P1+P2=1
P2=(a11-a12)/ (a11+a22-a12-a21) P1=1-P2
V=(a22*a11-a12*a21)/ (a11+a22-a12-a21) Рассуждая аналогично и применяя теорему об активных стратегиях можно точно так же рассчитать оптимальные значения Q*1 и Q*2, но по столбцам Q*1=(a22-a12)/(a11+a22-a12-a21) Q2=1-Q1
Задача Поиск Игрок А имеет возможность спрятаться в одном из убежищ I или II. Игрок В отыскивает игрока в одном из убежищ I или II Если игрок В отыскал игрока А, то игрок А выплачивает игроку В штраф в одну денежную единицу. Если же игрок В не отыскал игрока А, то игрок В выплачивает одну денежную единицу. Требуется получить решение игры. Решение:
Стратегия а1 – игрок А спрятался в убежище 1 Стратегия а2 – игрок А спрятался в убежище 2 Стратегия b1 –игрок В ищет в убежище 1 Стратегия b2 – игрок В ищет в убежище 2 Тогда если игрок А принял стратегия А1 и игрок В принял стратегию В1, то игрок В обнаруживает игрока А в убежище 1 и игрок А должен выплатить игроку В штраф в 1 денежную едиицу. Значит элемент платежной матрица а11 равен -1. Если А ->a2 and B->b2 значит а22=-1 Если A->a1 and B->b2 значит a12=1 P=
Седловой точки не имеет альфа=-1, бетта=1
Таким образом оптимальная стратегия игрока А выбирать убежище 1 или 2 с вероятностью 0,5, а оптимальная стратегия В искать или в первом или во втором 0,5 Р1=(a22-a21)/(a11+a22-a12-a21) P2=1-P1=0.5
|