Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Решение игр в смешанных стратегиях аналитическим методом. Игра 2х2





Если в платежной матрице игры не обнаруживается седловая точка, то из этого следует что игра имеет решение, но не в чистых, а смешанных стратегиях. При этом оптимальная стратегия S*А=<P*1,P*2>

S*B=<Q*1,Q*2>

P1,P2 – вероятности использования своих первой или второй чистой стратегий

Qi – вероятность применения игроком B своих чистых стратегий B1 или В2

Пусть платежная матрица такой игры задана:

P=

  В1 В2
A1 a11 a12
A2 a21 a22

Где аij – элемент матрицы, определяющий выигрыш (проигрыш) игрока А(В) в случае если игрок А примет свою стратегию iую, в ответ на которую игрок В применяет свою jую чистую стратегию. Эта игра является парной, т.к. учавствуют только 2 игрока А и В.

И в то же время игрой 2х2, т.к. у А всего две стратегии и у В тоже 2е стратегии.

В теории игр принято считать, что стратегия игрока А указывается по строка платежной матрицы, а стратегии игрока В по столбцам.

Решение такой задачи начинается с проверки наличия в платежной матрице седловой точки. Если таковая существует, то решение игры однозначно и выражается в одной из чистых стратегий игроков А и В. В этом случае всегда выигрыш одного игрока равен проигрышу другого игрока цена игры находится на пересечении строки соответствующей нижней цене игры и столбца соответствующего верхней цене игры.

Если в платежной матрице не обнаруживается седловая точка, то оптимальной стратегией игрока А будет стратегия а1 или а2 применяющиеся соответственно с вероятностями P*1 P*2.

Тогда выигрыш игрока А будет определяться V=a11*P1+a21*P2

A1 A2
P*1 P*2

Такая запись соответствует применением игроком B стратегии В1.

Если игрок В примет стратегию В2, то цена выигрыша игрока А будет определяться вторым столбцом матрицы V=a12*P1+a22*P2

Учитывая, что стратегий всего 2е как у А так и у В и что никаких других вариантов не существует следовательно события применения той или другой стратегии составляют полную группу событий.

Для того чтобы получить искомые значения Р*1, P*2

Система уравнений

V=a11*P1+a21*P2 <- B1

V=a12*P1+a22*P2 <-B2

P1+P2=1

 

P2=(a11-a12)/ (a11+a22-a12-a21)

P1=1-P2

 

V=(a22*a11-a12*a21)/ (a11+a22-a12-a21)

Рассуждая аналогично и применяя теорему об активных стратегиях можно точно так же рассчитать оптимальные значения Q*1 и Q*2, но по столбцам

Q*1=(a22-a12)/(a11+a22-a12-a21)

Q2=1-Q1

 

Задача

Поиск

Игрок А имеет возможность спрятаться в одном из убежищ I или II.

Игрок В отыскивает игрока в одном из убежищ I или II

Если игрок В отыскал игрока А, то игрок А выплачивает игроку В штраф в одну денежную единицу. Если же игрок В не отыскал игрока А, то игрок В выплачивает одну денежную единицу.

Требуется получить решение игры.

Решение:

  1. Сформулируем стратегии игроков.

Стратегия а1 – игрок А спрятался в убежище 1

Стратегия а2 – игрок А спрятался в убежище 2

Стратегия b1 –игрок В ищет в убежище 1

Стратегия b2 – игрок В ищет в убежище 2

Тогда если игрок А принял стратегия А1 и игрок В принял стратегию В1, то игрок В обнаруживает игрока А в убежище 1 и игрок А должен выплатить игроку В штраф в 1 денежную едиицу. Значит элемент платежной матрица а11 равен -1.

Если А ->a2 and B->b2 значит а22=-1

Если A->a1 and B->b2 значит a12=1

P=

 

-1  
  -1

Седловой точки не имеет альфа=-1, бетта=1

 

Таким образом оптимальная стратегия игрока А выбирать убежище 1 или 2 с вероятностью 0,5, а оптимальная стратегия В искать или в первом или во втором 0,5

Р1=(a22-a21)/(a11+a22-a12-a21)

P2=1-P1=0.5

 







Дата добавления: 2015-08-17; просмотров: 1294. Нарушение авторских прав; Мы поможем в написании вашей работы!




Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...


Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...


Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Демографияда "Демографиялық жарылыс" дегеніміз не? Демография (грекше демос — халық) — халықтың құрылымын...

Субъективные признаки контрабанды огнестрельного оружия или его основных частей   Переходя к рассмотрению субъективной стороны контрабанды, остановимся на теоретическом понятии субъективной стороны состава преступления...

ЛЕЧЕБНО-ПРОФИЛАКТИЧЕСКОЙ ПОМОЩИ НАСЕЛЕНИЮ В УСЛОВИЯХ ОМС 001. Основными путями развития поликлинической помощи взрослому населению в новых экономических условиях являются все...

Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Краткая психологическая характеристика возрастных периодов.Первый критический период развития ребенка — период новорожденности Психоаналитики говорят, что это первая травма, которую переживает ребенок, и она настолько сильна, что вся последую­щая жизнь проходит под знаком этой травмы...

РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...

Studopedia.info - Студопедия - 2014-2025 год . (0.01 сек.) русская версия | украинская версия