Игра двух лиц с нулевой суммой

⇐ Предыдущая 1 2 3 4 567 8 9 10 Следующая ⇒

Методы теории игр наиболее развиты для конечной одноходовой игры двух лиц с нулевой суммой (т.е. сумма выигрышей игроков равна 0). Такие игры еще называют антагонистическими.

Пусть и – участники игры. Саму игру опишем с помощью, так называемой платежной матрицы (матрицы игры) порядка . Строки этой матрицы – это чистые стратегии игрока , а столбцы – чистые стратегии игрока /

Предполагается, что каждому игроку известны все элементы платежной матрицы.

Элемент определяет результат игры, а именно выигрыш игрока при выборе игроками и стратегий и соответственно.

В этом случае достаточно исследовать только платежную матрицу игрока .

В данной игре игрок стремится выбрать такую строку матрицы, чтобы максимизировать свой выигрыш, а игрок - такой столбец матрицы, чтобы минимизировать свой проигрыш.

Bj Ai	B₁	B₂	B₃	…	B_n
A₁	α ₁₁	α ₁₂	α ₁₃	…	α _1n
A₂	α ₂₁	α ₁₂	α ₁₃	…	α _2n
…	…	…	…	…	…
A_m	α _m1	α _m2	α _m3	…	α _mn

Рис. 4.1

Задачей теории игр является нахождение решения игры, т.е. определение для каждого игрока его оптимальной стратегии и цены игры.

Оптимальной называется стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или максимально возможный средний проигрыш) независимо от поведения противника.

Ценой игры называется выигрыш (проигрыш), соответствующий оптимальным стратегиям игроков.

В теории игр наилучшим принято считать поведение игроков, при котором каждый игрок предполагает, что его противник не глупее ( принцип разумности ).

Если игрок А выбрал стратегию i, то его выигрыш составит

Отсюда максимальный гарантированный выигрыш

Стратегия, соответствующая называется максимильной стратегией, а - нижней ценой игры или максимином.

Игрок В, рассуждая аналогично может среди всех своих стратегий выбрать ту, которая обеспечит ему минимальный гарантированный проигрыш.

Стратегия, соответствующая называется минимаксной стратегией, а величина - верхней ценой игры или минимаксом.

Если игрок А будет придерживаться максимаксной стратегии, то он получает выигрыш не меньше максиминного значения, т.е.

Если игрок В придерживается минимаксной стратегии, то его проигрыш буде т не больше минимального значения, т.е.

В общем случае отношения между нижней и верхней ценой игры устанавливаются неравенством

Существуют игры, для которых . Элемент платежной матрицы, отвечающей этим стратегиям называется Седловой точкой. Ей отвечает цена игры :

Если , то игра выгодна игроку А.

При игра выгодна игроку В.

Если , то игра выгодна обоим игрокам и называется безобидной или справедливой.

Игра 2-х лиц без Седловой точки. Смешанные стратегии:

Одна из возможностей расширения стратегий игроков – разнообразить способ выбора своей стратегии, например, «случайно».

Как мы уже отмечали, в отсутствии Седловой точки, игрок А, применяя свою максиминную стратегию, выиграет не менее , а игрок В, применяя свою минимаксную стратегию, проигрывает не более , где . Применение чистых стратегий в каждой партии такой игры не дает возможность игрокам увеличить выигрыш , чем уменьшить проигрыш . Для того, чтобы это было возможным необходимо применять не одну, а несколько чистых стратегий, чередуя их случайным образом с какими-то частотами. Такая стратегия получила название смешанной (ее элементами являются чистые стратегии).

Смешанная стратегия имеет смысл при условии, что игра состоит из более чем одной партии.

Обозначим смешанные стратегии игроков А и В через

и , где

- вероятность (частота) применения игроком А чистой стратегии , - вероятность (частота) принятия игроком В чистой стратегии .

Причем и .

Чистые стратегии игроков А и В, для которых вероятности и отличны от 0 называются активными.

Теорема (основная теорема теории игр) (теорема минимакса).

Любая конечная игра двух лиц с нулевой суммой имеет, по крайней мере, одно решение (т.е. пару оптимальных стратегий, в общем случае смешанных) и соответствующую цену.

Решение игры, не имеющей Седловой точки может осуществляться различными методами. Рассмотрим наиболее важные из них.

Графическое решение игр вида и :

Этот метод применим только к играм, в которых хотя бы один игрок имеет только две стратегии.

Рассмотрим следующую игру (без Седловой точки)

Ожидаемые выигрыши игрока А, соответствующие чистым стратегиям игрока В, представлены в таблице

В А			…
			…
			…

Отсюда видно, что ожидаемый выигрыш игрока А линейно зависит от . В соответствии с критерием минимакса игрок А должен выбирать так:

Чистые стратегии игрока В	Ожидаемые выигрыши игрока А


…	…
N

Пример:

В_j А_i

В₁

В₂

В₃

А₁ доминирующая одинаковые

В₄

А₁

А₂

А₃

А₄

Замечания: Стратегии, для которых есть доминирующие и дублирующие стратегии можно отбрасывать.

В_j А_i	В₁	В₂	В₃	В₄
А₁
А₄

В₃ доминирующая

В_j А_i	В₁	В₂	В₄
А₁
А₄
				2

- цена игры

Чистая стратегия Игрок В

Ожидаемый выигрыш игрока А

-6х₁ + 8

z₁

-2х₁ + 6

z₂

5х₁ + 1

z₃

Чистая стратегия Игрока А

Ожидаемый выигрыш Игрока В

-4у₁+6

7у₁+1

⇐ Предыдущая 1 2 3 4 567 8 9 10 Следующая ⇒

Дата добавления: 2014-11-10; просмотров: 1349. Нарушение авторских прав; Мы поможем в написании вашей работы!

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при которых тело находится под действием заданной системы сил...

Примеры задач для самостоятельного решения. 1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P 1.Спрос и предложение на обеды в студенческой столовой описываются уравнениями: QD = 2400 – 100P; QS = 1000 + 250P...

Дизартрии у детей Выделение клинических форм дизартрии у детей является в большой степени условным, так как у них крайне редко бывают локальные поражения мозга, с которыми связаны четко определенные синдромы двигательных нарушений...

Педагогическая структура процесса социализации Характеризуя социализацию как педагогический процессе, следует рассмотреть ее основные компоненты: цель, содержание, средства, функции субъекта и объекта...

Субъективные признаки контрабанды огнестрельного оружия или его основных частей Переходя к рассмотрению субъективной стороны контрабанды, остановимся на теоретическом понятии субъективной стороны состава преступления...

ЛЕЧЕБНО-ПРОФИЛАКТИЧЕСКОЙ ПОМОЩИ НАСЕЛЕНИЮ В УСЛОВИЯХ ОМС 001. Основными путями развития поликлинической помощи взрослому населению в новых экономических условиях являются все...

МЕТОДИКА ИЗУЧЕНИЯ МОРФЕМНОГО СОСТАВА СЛОВА В НАЧАЛЬНЫХ КЛАССАХ В практике речевого общения широко известен следующий факт: как взрослые...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия