Студопедия — Игра двух лиц с нулевой суммой. Bi Ai B1 B2 B3 … Bn A1 α11 α12 α13 … α1n A2 α21
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Игра двух лиц с нулевой суммой. Bi Ai B1 B2 B3 … Bn A1 α11 α12 α13 … α1n A2 α21






Методы теории игр наиболее развиты для конечной одноходовой игры двух лиц с нулевой суммой (т.е. сумма выигрышей игроков равна 0). Такие игры еще называют антагонистическими.

Пусть и – участники игры. Саму игру опишем с помощью так называемой платежной матрицы (матрицы игры) порядка . Строки этой матрицы – это чистые стратегии игрока , а столбцы – чистые стратегии игрока .

Предполагается, что каждому игроку известны все элементы платежной матрицы.

Элемент определяет результат игры, а именно выигрыш игрока при выборе игроками и стратегий и соответственно.

В этом случае достаточно исследовать только платежную матрицу игрока .

В данной игре игрок стремится выбрать такую строку матрицы, чтобы максимизировать свой выигрыш, а игрок - такой столбец матрицы, чтобы минимизировать свой проигрыш.

 

Bi   Ai B1 B2 B3 Bn
A1 α 11 α 12 α 13 α 1n
A2 α 21 α 12 α 13 α 2n
Am α m1 α m2 α m3 α mn

Задачей теории игр является нахождение решения игры, т.е. определение для каждого игрока его оптимальной стратегии и цены игры.

Оптимальной называется стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или максимально возможный средний проигрыш) независимо от поведения противника.

Ценой игры называется выигрыш (проигрыш), соответствующий оптимальным стратегиям игроков.

В теории игр наилучшим принято считать поведение игроков, при котором каждый игрок предполагает, что его противник не глупее (принцип разумности).

Если игрок А выбрал стратегию i, то его выигрыш составит

Отсюда максимальный гарантированный выигрыш

.

Стратегия, соответствующая называется максиминной стратегией, а - нижней ценой игры или максимином.

Игрок В, рассуждая аналогично может среди всех своих стратегий выбрать ту, которая обеспечит ему минимальный гарантированный проигрыш.

Стратегия, соответствующая называется минимаксной стратегией, а величина - верхней ценой игры или минимаксом.

Если игрок А будет придерживаться максимаксной стратегии, то он получает выигрыш не меньше максиминного значения, т.е.

Если игрок В придерживается минимаксной стратегии, то его проигрыш будет не больше минимального значения, т.е.

В общем случае отношения между нижней и верхней ценой игры устанавливаются неравенством

Существуют игры, для которых . Элемент платежной матрицы, отвечающей этим стратегиям называется седловой точкой. Ей отвечает цена игры :

Если , то игра выгодна игроку А.

При игра выгодна игроку В.

Если , то игра выгодна обоим игрокам и называется безобидной или справедливой.

 







Дата добавления: 2014-11-10; просмотров: 686. Нарушение авторских прав; Мы поможем в написании вашей работы!



Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Вопрос 1. Коллективные средства защиты: вентиляция, освещение, защита от шума и вибрации Коллективные средства защиты: вентиляция, освещение, защита от шума и вибрации К коллективным средствам защиты относятся: вентиляция, отопление, освещение, защита от шума и вибрации...

Задержки и неисправности пистолета Макарова 1.Что может произойти при стрельбе из пистолета, если загрязнятся пазы на рамке...

Вопрос. Отличие деятельности человека от поведения животных главные отличия деятельности человека от активности животных сводятся к следующему: 1...

Законы Генри, Дальтона, Сеченова. Применение этих законов при лечении кессонной болезни, лечении в барокамере и исследовании электролитного состава крови Закон Генри: Количество газа, растворенного при данной температуре в определенном объеме жидкости, при равновесии прямо пропорциональны давлению газа...

Ганглиоблокаторы. Классификация. Механизм действия. Фармакодинамика. Применение.Побочные эфффекты Никотинчувствительные холинорецепторы (н-холинорецепторы) в основном локализованы на постсинаптических мембранах в синапсах скелетной мускулатуры...

Шов первичный, первично отсроченный, вторичный (показания) В зависимости от времени и условий наложения выделяют швы: 1) первичные...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия