Студопедия — Геометрический способ решения антагонистических игр
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Геометрический способ решения антагонистических игр






 

Геометрический способ решения игр с нулевой суммой применяется к играм, где хотя бы у одного игрока только две стратегии. Иногда возможно упростить игры, применяя следующие принципы:

1. Игрок А стремится увеличить свой выигрыш, поэтому он не будет использовать стратегии, которые заведомо дают ему меньшие суммы;

2. Игрок В стремится уменьшить свой проигрыш, поэтому он не будет использовать стратегии, которые заведомо отнимают большие суммы.

 

Рассмотрим платежную матрицу

 

         
5 4 3 2 3
5 6 6    
2 3 3 2 4

 

Упростим матрицу, вычеркивая заведомо невыгодные стратегии игроков.

 

Путем упрощения, ее можно свести к матрице (2 * 2)

 

ВJ АJ В1 В2
A1    
A2    

 

р1 - вероятность применения игроком А стратегии A1;

р2 - вероятность применения игроком А стратегии A2.

Так как р1+ р2=1, то р2=1- р1. Тогда получим:

 

Чистые стратегии игрока В Ожидаемые выигрыши игрока А
В1 4 р1+3 р2= (4-3)р1+3=р1+3
В2 2 р1+5 р2=(2-5)р1+5=-3р1+5

 

На оси Ох разместим точки р1=0 и р1=1, через которые проведем прямые, перпендикулярны оси Ох. Подставляя р1=0 и р1=1 в выражение р1+3, найдем значения, которые отложим на соответствующих перпендикулярных прямых. Соединив эти точки, получим прямую.

Аналогично рассмотрим выражение -3р1+5.

 

Оптимальная стратегия первого игрока найдется из равенства выражений

р1+3 и -3р1+5: р1= р2=0,5. SA = (0,5; 0; 0,5; 0), при этом цена игры равна 3,5.

Для второго игрока оптимальная стратегия ищется аналогично.

Если же игра не сводится путем упрощения к 2 x n или m x 2, то составляется математическая модель и задача решается симплекс-методом.

4.3 Игры с «природой».

Для того чтобы можно сделать вывод о том какую именно стратегию выбирать игроку, необходимо использовать критерии Вальда, Гурвица, Сэвиджа, Лапласа, Байеса.

 

1. Критерий Вальда. Рекомендуется применять максиминную стратегию. Она достигается из условия max min αij и совпадает с нижней ценой игры.

i j

Критерий является пессимистическим, считается, что природа будет действовать наихудшим для человека образом, агрессивно, делать все, чтобы помешать нам достигнуть успеха.

 

Рассмотрим задачу.

Ежедневный спрос на булочки в продовольственном магазине может принимать следующие значения

         
         

Если булочка не продана днем, то она м.б. реализована за 15 центов к концу дня. Свежие булочки продаются по 49 центов за штуку. Затраты магазина на одну булочку 25 центов.

Используя игровой подход, определить, какое число булочек надо заказывать ежедневно.

 

 

Составим платежную матрицу. Сначала вычислим прибыль (49-25=24) и убыток (15-25=-10).

           
  100*24 100*24 100*24 100*24 100*24
  100*24-50*10 150*24 150*24 150*24 150*24
  100*24-100*10 150*24-50*10 200*24 200*24 200*24
  100*24-150*10 150*24-100*10 200*24-50*10 250*24 250*24
  100*24-200*10 150*24-150*10 200*24-100*10 250*24-50*10 300*24

 

Платежная матрица примет вид

           
           
           
           
           
           

 

Вычислим критерий Вальда - максиминный. Он отражает принцип гарантированного результата:

Олицетворяет позицию крайнего пессимизма: надо ориентироваться всегда на худшие условия, зная наверняка, что хуже этого не будет. Этот перестраховочный подход для того, кто очень боится проиграть.

Оптимальной считается стратегия, при которой гарантируется выигрыш в любом случае, не меньший, чем нижняя цена игры с природой:

 

Н = max min αij

i j

Подсчитать min по строкам и выбрать ту стратегию, при которой минимум строки максимален.

А1  
А2  
А3  
А4  
А5  

Критерий Вальда рекомендует выбирать стратегию А1.

 

2. Критерий Гурвица (оптимизма - пессимизма). Критерий рекомендует при выборе решения не руководствоваться ни крайним пессимизмом (всегда рассчитывай на худшее), ни крайним легкомысленным оптимизмом (авось кривая выведет). Критерий рекомендует стратегию, определяемую по формуле

H = Max {γmin aij + (1- γ)max aij}

i j j

где γ - степень оптимизма - изменяется в диапазоне [0, 1].

Критерий придерживается некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилучшего поведения природы. При γ = 1 критерий превращается в критерий Вальда, при γ = 0 - в критерий максимума. На γ оказывает влияние степень ответственности лица, принимающего решение по выбору стратегии. Чем хуже последствия ошибочных решений, больше желания застраховаться, тем γ ближе к единице.

Рассмотрим платежную матрицу.

Параметр Гурвица возьмем равным 0,6.

  min Max γmin aij + (1- γ)max aij
А1     2400*0.6+0.4*2400=2400
А2     1900*0.6+3600*0.4=2580
А3     1400*0.6+4800*0.4=2760
А4     900*0.6+6000*0.4=2940
А5     400*0.6+7200*0.4=3120

 

Критерий Гурвица рекомендует стратегию А5.

 

3. Критерий Сэвиджа. Суть критерия состоит в выборе такой стратегии, чтобы не допустить чрезмерно высоких потерь, к которым она может привести. Находится матрица рисков, элементы которой показывают, какой убыток понесет человек (фирма), если для каждого состояния природы он не выберет наилучшей стратегии.

 

Элементы матрицы рисков находится по формуле (rij):

rij = maxaij - aij

где maxaij - максимальный элемент в столбце исходной матрицы.

Оптимальная стратегия находится из выражения

H = Min {max(max aij - aij)}

 

Составим матрицу риска, (max aij - aij).

 

Выберем максимальный элемент в столбце и вычитаем из него остальные элементы столбца, получим max(max aij - aij).

            Мax
А1            
А2            
А3            
А4            
А5            

 

Из максимальных значений последнего столбца выбираем минимальную величину, получим Min {max(max aij - aij)}.

Критерий Сэвиджа рекомендует стратегию А4.

 

4. Критерий Лапласа. Этот критерий основывается на принципе недостаточного обоснования. Поскольку вероятности состояния не известны, необходимая информация для вывода, что эти вероятности различны, отсутствует. Поэтому можно предположить, что они равны. Выбор стратегии осуществляется по формуле

H = Max {1/n·∑ aij}

где 1/n вероятность реализации одного из состояний р = 1/n.

А1 (2400+2400+2400+2400+2400)/5=2400
А2 (1900+3600+3600+3600+3600)/5=3260
А3 (1400+3100+4800+4800+4800)/5=3780
А4 (900+2600+4300+6000+6000)/5=3960
А5 (400+2100+3800+5500+7200)/5=3800

 

Критерий Лапласа рекомендует нам стратегию А4.

Таким образом, рассмотрев одну платежную матрицу, мы получили, что критерии Лапласа и Сэвиджа рекомендует стратегию А4. То есть необходимый заказ булочек составит 250 единиц ежедневно.

5. Критерий Байеса. Принятие решения в условиях риска.

Если в рассмотренных выше критериях, необходимая информация о вероятностях какого-либо состояния отсутствовала, то критерий Байеса действует в условиях не полной информации, т.е. в условиях риска (имеется информация о вероятностях применения стратегий второй стороной). Эти вероятности называются априорными вероятностями.

Выбор стратегии осуществляется по формуле

H = Max {∑pi aij}

Ежедневный спрос на булочки в продовольственном магазине задается следующим распределением вероятностей

         
         
0,2 0,25 0,3 0,15 0,1

 

Поставив значение aij и pi в формулу, получим:

 

А1 2400*0,2+2400*0,25+2400*0,3+2400*0,15+2400*0,1=2400
А2 1900*0,2+3600*0,25+3600*0,3+3600*0,15+3600*0,1=3260
А3 1400*0,2+3100*0,25+4800*0,3+4800*0,15+4800*0,1=3695
А4 900*0,2+2600*0,25+4300*0,3+6000*0,15+6000*0,1=3620
А5 400*0,2+2100*0,25+3800*0,3+5500*0,15+7200*0,1=3290

Критерий Байеса рекомендует стратегию А3

В условиях полной неопределенности теория не дает однозначных принципов выбора того или иного критерия.

Оптимальные стратегии, выбранные по различным критериям, различны.

Таким образом, окончательный вывод зависит от предпочтений человека, который принимает решение.

ПРИМЕР №1

 

Найти оптимальные стратегии 1-го игрока, исходя из различных критериев, в игре с полной неопределенностью относительно второго игрока, заданной платежной матрицей:

 

а11 а12 а13 а14 5 10 18 25

а21 а22 а23 а24 8 7 8 23

А = а31 а32 а33 а34 ; А = 21 18 12 21

а41 а42 а43 а44 20 22 19 15

 







Дата добавления: 2015-10-19; просмотров: 667. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Конституционно-правовые нормы, их особенности и виды Характеристика отрасли права немыслима без уяснения особенностей составляющих ее норм...

Толкование Конституции Российской Федерации: виды, способы, юридическое значение Толкование права – это специальный вид юридической деятельности по раскрытию смыслового содержания правовых норм, необходимый в процессе как законотворчества, так и реализации права...

Значення творчості Г.Сковороди для розвитку української культури Важливий внесок в історію всієї духовної культури українського народу та її барокової літературно-філософської традиції зробив, зокрема, Григорій Савич Сковорода (1722—1794 pp...

Ганглиоблокаторы. Классификация. Механизм действия. Фармакодинамика. Применение.Побочные эфффекты Никотинчувствительные холинорецепторы (н-холинорецепторы) в основном локализованы на постсинаптических мембранах в синапсах скелетной мускулатуры...

Шов первичный, первично отсроченный, вторичный (показания) В зависимости от времени и условий наложения выделяют швы: 1) первичные...

Предпосылки, условия и движущие силы психического развития Предпосылки –это факторы. Факторы психического развития –это ведущие детерминанты развития чел. К ним относят: среду...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия