Решение игр в смешанных стратегиях аналитическим методом. Игра 2х2

⇐ Предыдущая 11 12 13 14 151617 18 19 20 Следующая ⇒

Если в платежной матрице игры не обнаруживается седловая точка, то из этого следует что игра имеет решение, но не в чистых, а смешанных стратегиях. При этом оптимальная стратегия S*_А=<P*₁,P*₂>

S*_B=<Q*₁,Q*₂>

P1,P2 – вероятности использования своих первой или второй чистой стратегий

Qi – вероятность применения игроком B своих чистых стратегий B1 или В2

Пусть платежная матрица такой игры задана:

	В1	В2
A1	a11	a12
A2	a21	a22

Где аij – элемент матрицы, определяющий выигрыш (проигрыш) игрока А(В) в случае если игрок А примет свою стратегию iую, в ответ на которую игрок В применяет свою jую чистую стратегию. Эта игра является парной, т.к. учавствуют только 2 игрока А и В.

И в то же время игрой 2х2, т.к. у А всего две стратегии и у В тоже 2е стратегии.

В теории игр принято считать, что стратегия игрока А указывается по строка платежной матрицы, а стратегии игрока В по столбцам.

Решение такой задачи начинается с проверки наличия в платежной матрице седловой точки. Если таковая существует, то решение игры однозначно и выражается в одной из чистых стратегий игроков А и В. В этом случае всегда выигрыш одного игрока равен проигрышу другого игрока цена игры находится на пересечении строки соответствующей нижней цене игры и столбца соответствующего верхней цене игры.

Если в платежной матрице не обнаруживается седловая точка, то оптимальной стратегией игрока А будет стратегия а1 или а2 применяющиеся соответственно с вероятностями P*₁P*₂.

Тогда выигрыш игрока А будет определяться V=a11*P1+a21*P2

A1	A2
P*₁	P*₂

Такая запись соответствует применением игроком B стратегии В1.

Если игрок В примет стратегию В2, то цена выигрыша игрока А будет определяться вторым столбцом матрицы V=a12*P1+a22*P2

Учитывая, что стратегий всего 2е как у А так и у В и что никаких других вариантов не существует следовательно события применения той или другой стратегии составляют полную группу событий.

Для того чтобы получить искомые значения Р*₁, P*₂

Система уравнений

V=a11*P1+a21*P2 <- B1

V=a12*P1+a22*P2 <-B2

P1+P2=1

P2=(a11-a12)/ (a11+a22-a12-a21)

P1=1-P2

V=(a22*a11-a12*a21)/ (a11+a22-a12-a21)

Рассуждая аналогично и применяя теорему об активных стратегиях можно точно так же рассчитать оптимальные значения Q*₁ и Q*_2,но по столбцам

Q*1=(a22-a12)/(a11+a22-a12-a21)

Q2=1-Q1

Задача

Поиск

Игрок А имеет возможность спрятаться в одном из убежищ I или II.

Игрок В отыскивает игрока в одном из убежищ I или II

Если игрок В отыскал игрока А, то игрок А выплачивает игроку В штраф в одну денежную единицу. Если же игрок В не отыскал игрока А, то игрок В выплачивает одну денежную единицу.

Требуется получить решение игры.

Решение:

Сформулируем стратегии игроков.

Стратегия а1 – игрок А спрятался в убежище 1

Стратегия а2 – игрок А спрятался в убежище 2

Стратегия b1 –игрок В ищет в убежище 1

Стратегия b2 – игрок В ищет в убежище 2

Тогда если игрок А принял стратегия А1 и игрок В принял стратегию В1, то игрок В обнаруживает игрока А в убежище 1 и игрок А должен выплатить игроку В штраф в 1 денежную едиицу. Значит элемент платежной матрица а11 равен -1.

Если А ->a2 and B->b2 значит а22=-1

Если A->a1 and B->b2 значит a12=1

-1
	-1

Седловой точки не имеет альфа=-1, бетта=1

Таким образом оптимальная стратегия игрока А выбирать убежище 1 или 2 с вероятностью 0,5, а оптимальная стратегия В искать или в первом или во втором 0,5

Р1=(a22-a21)/(a11+a22-a12-a21)

P2=1-P1=0.5

⇐ Предыдущая 11 12 13 14 151617 18 19 20 Следующая ⇒

Дата добавления: 2015-08-17; просмотров: 1294. Нарушение авторских прав; Мы поможем в написании вашей работы!

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Травматическая окклюзия и ее клинические признаки При пародонтите и парадонтозе резистентность тканей пародонта падает...

Подкожное введение сывороток по методу Безредки. С целью предупреждения развития анафилактического шока и других аллергических реакций при введении иммунных сывороток используют метод Безредки для определения реакции больного на введение сыворотки...

Принципы и методы управления в таможенных органах Под принципами управления понимаются идеи, правила, основные положения и нормы поведения, которыми руководствуются общие, частные и организационно-технологические принципы...

Виды нарушений опорно-двигательного аппарата у детей В общеупотребительном значении нарушение опорно-двигательного аппарата (ОДА) идентифицируется с нарушениями двигательных функций и определенными органическими поражениями (дефектами)...

Особенности массовой коммуникации Развитие средств связи и информации привело к возникновению явления массовой коммуникации...

Тема: Изучение приспособленности организмов к среде обитания Цель:выяснить механизм образования приспособлений к среде обитания и их относительный характер, сделать вывод о том, что приспособленность – результат действия естественного отбора...

Studopedia.info - Студопедия - 2014-2026 год . (0.01 сек.) русская версия | украинская версия