Решение матричных игр в чистых стратегиях

⇐ Предыдущая 20 21 22 23 242526 27 28 29 Следующая ⇒

Рассмотрим матричную игру двух игроков с нулевой суммой. Пусть первый игрок имеет m стратегий i = 1, 2,..., m, второй имеет n стратегий j = 1, 2,..., n. Каждой паре стратегий (i, j) поставлено в соответствие некоторое число а_ij, выражающее выигрыш игрока 1 за счёт игрока 2, если первый игрок примет свою i- ю стратегию, а второй игрок – свою j - ю стратегию.

Допустим, что каждый из игроков делает один ход: игрок 1 выбирает свою i -ю стратегию (i= ), а игрок 2 – свою j -ю стратегию (j = ). После выполнения ходов игрок 1 получает выигрыш а_ij за счёт игрока 2 (если а_ij< 0, то это значит, что игрок 1 платит второму сумму | а_ij |). На этом игра заканчивается.

Каждая стратегия игрока i= ; j = часто называется чистой стратегией.

Если рассмотреть матрицу

А = (4.1)

то проведение каждой партии матричной игры с матрицей А сводится к выбору игроком 1 i -й строки, а игроком 2 j -го столбца и получения игроком 1 (за счёт игрока 2) выигрыша а_ij.

Главным в исследовании игр является понятие оптимальных стратегий игроков. В это понятие интуитивно вкладывается такой смысл: стратегия игрока является оптимальной, если применение этой стратегии обеспечивает ему наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок 1 исследует матрицу выигрышей А следующим образом: для каждого значения i, (i = ), определяется минимальное значение выигрыша в зависимости от применяемых стратегий игрока 2

а_ij, (i = ) (4.2)

т.е. определяется минимальный выигрыш для игрока 1 при условии, что он примет свою i -ю чистую стратегию, затем из этих минимальных выигрышей отыскивается такая стратегия i = i_о, при которой этот минимальный выигрыш будет максимальным, т.е. находится

а_ij= = (4.3).

Определение 4.1. Число , определённое по формуле (4.3) называется нижней чистой ценой игры и показывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2.

Игрок 2 при оптимальном своём поведении должен стремится по возможности за счёт своих стратегий максимально уменьшить выигрыш игрока 1. Поэтому для игрока 2 отыскивается

а_ij (4.4)

т.е. определяется max выигрыш игрока 1, при условии, что игрок 2 применит свою j -ю чистую стратегию, затем игрок 2 отыскивает такую свою j = j₁ стратегию, при которой игрок 1 получит min выигрыш, т.е. находит

a_ij = = (4.5).

Определение 4.2. Число , определяемое по формуле (4.5), называется чистой верхней ценой игры и показывает, какой максимальный выигрыш за счёт своих стратегий может себе гарантировать игрок 1.

Другими словами, применяя свои чистые стратегии игрок 1 может обеспечить себе выигрыш не меньше , а игрок 2 за счёт применения своих чистых стратегий может не допустить выигрыш игрока 1 больше, чем .

Определение 4.3.. Если в игре с матрицей А = , то говорят, что эта игра имеет седловую точку в чистых стратегиях и чистую цену игры

u = =

Определении 4.4. Седловая точка – это пара чистых стратегий (i_о, j_о) соответственно игроков 1 и 2, при которых достигается равенство = .

В это понятие вложен следующий смысл: если один из игроков придерживается стратегии, соответствующей седловой точке, то другой игрок не сможет поступить лучше, чем придерживаться стратегии, соответствующей седловой точке. Математически это можно записать и иначе:

(4.6)

где i, j – любые чистые стратегии соответственно игроков 1 и 2; (i_о, j_о) – стратегии, образующие седловую точку.

Таким образом, исходя из (4.6), седловой элемент является минимальным в i_о-й строке и максимальным в j_о- м столбце в матрице А. Отыскание седловой точки матрицы А происходит следующим образом: в матрице А последовательно в каждой строке находят минимальный элемент и проверяют, является ли этот элемент максимальным в своём столбце. Если да, то он и есть седловой элемент, а пара стратегий, ему соответствующая, образует седловую точку. Пара чистых стратегий (i_о, j_о) игроков 1 и 2, образующая седловую точку и седловой элемент называется решением игры. При этом i_о и j_о называются оптимальными чистыми стратегиями соответственно игроков 1 и 2.

Пример 1

Седловой точкой является пара (i_о = 3; j_о = 1), при которой u = = = 2.

Заметим, что хотя выигрыш в ситуации (3; 3) также равен 2 = = , она не является седловой точкой, т.к. этот выигрыш не является максимальным среди выигрышей третьего столбца.

Пример 2

Из анализа матрицы выигрышей видно, что , т.е. данная матрица не имеет седловой точки. Если игрок 1 выбирает свою чистую максиминную стратегию i = 2, то игрок 2, выбрав свою минимаксную j = 2, проиграет только 20. В этом случае игроку 1 выгодно выбрать стратегию i = 1, т.е. отклониться от своей чистой максиминной стратегии и выиграть 30. Тогда игроку 2 будет выгодно выбрать стратегию j = 1, т.е. отклониться от своей чистой минимаксной стратегии и проиграть 10. В свою очередь игрок 1 должен выбрать свою 2-ю стратегию, чтобы выиграть 40, а игрок 2 ответит выбором 2-й стратегии и т.д.

⇐ Предыдущая 20 21 22 23 242526 27 28 29 Следующая ⇒

Дата добавления: 2014-12-06; просмотров: 654. Нарушение авторских прав; Мы поможем в написании вашей работы!

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Травматическая окклюзия и ее клинические признаки При пародонтите и парадонтозе резистентность тканей пародонта падает...

Подкожное введение сывороток по методу Безредки. С целью предупреждения развития анафилактического шока и других аллергических реакций при введении иммунных сывороток используют метод Безредки для определения реакции больного на введение сыворотки...

Принципы и методы управления в таможенных органах Под принципами управления понимаются идеи, правила, основные положения и нормы поведения, которыми руководствуются общие, частные и организационно-технологические принципы...

Различие эмпиризма и рационализма Родоначальником эмпиризма стал английский философ Ф. Бэкон. Основной тезис эмпиризма гласит: в разуме нет ничего такого...

Индекс гингивита (PMA) (Schour, Massler, 1948) Для оценки тяжести гингивита (а в последующем и регистрации динамики процесса) используют папиллярно-маргинально-альвеолярный индекс (РМА)...

Методика исследования периферических лимфатических узлов. Исследование периферических лимфатических узлов производится с помощью осмотра и пальпации...

Studopedia.info - Студопедия - 2014-2025 год . (0.012 сек.) русская версия | украинская версия