Студопедия — Решение игр в смешанных стратегиях аналитическим методом. Игра 2х2
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Решение игр в смешанных стратегиях аналитическим методом. Игра 2х2






Если в платежной матрице игры не обнаруживается седловая точка, то из этого следует что игра имеет решение, но не в чистых, а смешанных стратегиях. При этом оптимальная стратегия S*А=<P*1,P*2>

S*B=<Q*1,Q*2>

P1,P2 – вероятности использования своих первой или второй чистой стратегий

Qi – вероятность применения игроком B своих чистых стратегий B1 или В2

Пусть платежная матрица такой игры задана:

P=

  В1 В2
A1 a11 a12
A2 a21 a22

Где аij – элемент матрицы, определяющий выигрыш (проигрыш) игрока А(В) в случае если игрок А примет свою стратегию iую, в ответ на которую игрок В применяет свою jую чистую стратегию. Эта игра является парной, т.к. учавствуют только 2 игрока А и В.

И в то же время игрой 2х2, т.к. у А всего две стратегии и у В тоже 2е стратегии.

В теории игр принято считать, что стратегия игрока А указывается по строка платежной матрицы, а стратегии игрока В по столбцам.

Решение такой задачи начинается с проверки наличия в платежной матрице седловой точки. Если таковая существует, то решение игры однозначно и выражается в одной из чистых стратегий игроков А и В. В этом случае всегда выигрыш одного игрока равен проигрышу другого игрока цена игры находится на пересечении строки соответствующей нижней цене игры и столбца соответствующего верхней цене игры.

Если в платежной матрице не обнаруживается седловая точка, то оптимальной стратегией игрока А будет стратегия а1 или а2 применяющиеся соответственно с вероятностями P*1 P*2.

Тогда выигрыш игрока А будет определяться V=a11*P1+a21*P2

A1 A2
P*1 P*2

Такая запись соответствует применением игроком B стратегии В1.

Если игрок В примет стратегию В2, то цена выигрыша игрока А будет определяться вторым столбцом матрицы V=a12*P1+a22*P2

Учитывая, что стратегий всего 2е как у А так и у В и что никаких других вариантов не существует следовательно события применения той или другой стратегии составляют полную группу событий.

Для того чтобы получить искомые значения Р*1, P*2

Система уравнений

V=a11*P1+a21*P2 <- B1

V=a12*P1+a22*P2 <-B2

P1+P2=1

 

P2=(a11-a12)/ (a11+a22-a12-a21)

P1=1-P2

 

V=(a22*a11-a12*a21)/ (a11+a22-a12-a21)

Рассуждая аналогично и применяя теорему об активных стратегиях можно точно так же рассчитать оптимальные значения Q*1 и Q*2, но по столбцам

Q*1=(a22-a12)/(a11+a22-a12-a21)

Q2=1-Q1

 

Задача

Поиск

Игрок А имеет возможность спрятаться в одном из убежищ I или II.

Игрок В отыскивает игрока в одном из убежищ I или II

Если игрок В отыскал игрока А, то игрок А выплачивает игроку В штраф в одну денежную единицу. Если же игрок В не отыскал игрока А, то игрок В выплачивает одну денежную единицу.

Требуется получить решение игры.

Решение:

  1. Сформулируем стратегии игроков.

Стратегия а1 – игрок А спрятался в убежище 1

Стратегия а2 – игрок А спрятался в убежище 2

Стратегия b1 –игрок В ищет в убежище 1

Стратегия b2 – игрок В ищет в убежище 2

Тогда если игрок А принял стратегия А1 и игрок В принял стратегию В1, то игрок В обнаруживает игрока А в убежище 1 и игрок А должен выплатить игроку В штраф в 1 денежную едиицу. Значит элемент платежной матрица а11 равен -1.

Если А ->a2 and B->b2 значит а22=-1

Если A->a1 and B->b2 значит a12=1

P=

 

-1  
  -1

Седловой точки не имеет альфа=-1, бетта=1

 

Таким образом оптимальная стратегия игрока А выбирать убежище 1 или 2 с вероятностью 0,5, а оптимальная стратегия В искать или в первом или во втором 0,5

Р1=(a22-a21)/(a11+a22-a12-a21)

P2=1-P1=0.5

 







Дата добавления: 2015-08-17; просмотров: 1222. Нарушение авторских прав; Мы поможем в написании вашей работы!



Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Факторы, влияющие на степень электролитической диссоциации Степень диссоциации зависит от природы электролита и растворителя, концентрации раствора, температуры, присутствия одноименного иона и других факторов...

Йодометрия. Характеристика метода Метод йодометрии основан на ОВ-реакциях, связанных с превращением I2 в ионы I- и обратно...

Броматометрия и бромометрия Броматометрический метод основан на окислении вос­становителей броматом калия в кислой среде...

ОСНОВНЫЕ ТИПЫ МОЗГА ПОЗВОНОЧНЫХ Ихтиопсидный тип мозга характерен для низших позвоночных - рыб и амфибий...

Принципы, критерии и методы оценки и аттестации персонала   Аттестация персонала является одной их важнейших функций управления персоналом...

Пункты решения командира взвода на организацию боя. уяснение полученной задачи; оценка обстановки; принятие решения; проведение рекогносцировки; отдача боевого приказа; организация взаимодействия...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия