Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Решение матричных игр 2 x n и m x 2 графоаналитическим методом





 

Наибольшее распространение в технических приложениях имеют парные стратегические бескоалиционные конечные некооперативные игры. Модель проблемной ситуации в этом случае имеет вид:

< U, V, W1, W2, R1, R2 >,

где U - множество стратегий оперирующей стороны (конструктора);

V - множество стратегий оппонирующей стороны (технолог и природа);

W1 и W2 - показатели качества игроков;

R1 и R2 - системы предпочтения игроков.

Системы предпочтения игроков, в свою очередь, основываются на двух ведущих принципах рационального поведения: принципе наибольшего гарантированного результата и принципе равновесия.

Первый основан на том, что рациональным выбором одного из игроков должен считаться такой, при котором он рассчитывает на самую неблагоприятную для него реакцию со стороны другого игрока.

Второй принцип гласит, что рациональным выбором любого игрока считается такая стратегия u$ (или v$), для которой ситуация (u$, v$) обоюдовыгодна, т.е. любое отклонение от данной ситуации игры не является выгодным ни для одного из игроков.

По характеру выигрышей игры делятся на:

· игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю)

· игры с ненулевой суммой.

Матричная игра – это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 (первого игрока) в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 2 (второго игрока), столбец – номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).

Для матричных игр доказано, что любая из них имеет решение, и оно может быть легко найдено путём сведения игры к задаче линейного программирования.

Матричная игра двух игроков с нулевой суммой может рассматриваться как следующая абстрактная игра двух игроков.

Первый игрок имеет m стратегий i = 1, 2,..., m, второй имеет n стратегий j = 1, 2,..., n. Каждой паре стратегий (i, j) поставлено в соответствие число аij, выражающее выигрыш игрока 1 за счёт игрока 2, если первый игрок примет свою i-ю стратегию, а 2 – свою j-ю стратегию.

  B1 B2 …. Bn
A1 a11 a12 …. a1n
A2 a21 a22 …. a2n
…… ……. …….. ….. ……
Am am1 am2 …. amn

 

Каждый из игроков делает один ход: игрок 1 выбирает свою i-ю стратегию (i= ), 2 – свою j-ю стратегию (j= ), после чего игрок 1 получает выигрыш аij за счёт игрока 2 (если аij< 0, то это значит, что игрок 1 платит второму сумму | аij|). На этом игра заканчивается.

Каждая стратегия игрока i= ; j = часто называется чистой стратегией.

Если рассмотреть матрицу A:

  B1 B2 …. Bj ….. Bn
A1 a11 a12 …. a1j …. a1n
A2 a21 a22 …. a2j …. a2n
…… ……. …….. ….. …. …. ……
Ai ai1 ai2 …. aij …. ain
…..     …. …. ….  
Am am1 am2 …. amj ….. amn

 

то проведение каждой партии матричной игры с матрицей А сводится к выбору игроком 1 i-й строки, а игроком 2 j-го столбца и получения игроком 1 (за счёт игрока 2) выигрыша аij.

Главным в исследовании игр является понятие оптимальных стратегий игроков. В это понятие интуитивно вкладывается такой смысл: стратегия игрока является оптимальной, если применение этой стратегии обеспечивает ему наибольший гарантированный выигрыш при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок 1 исследует матрицу выигрышей А следующим образом: для каждого значения i (i = ) определяется минимальное значение выигрыша в зависимости от применяемых стратегий игрока 2

т.е. определяется минимальный выигрыш для игрока 1 при условии, что он примет свою i-ю чистую стратегию, затем из этих минимальных выигрышей отыскивается такая стратегия i = iо, при которой этот минимальный выигрыш будет максимальным, т.е. находится

(1)

Определение. Число , определённое по формуле (1) называется нижней чистой ценой игры и показывает, какой минимальный выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2.

Игрок 2 при оптимальном своём поведении должен стремится по возможности за счёт своих стратегий максимально уменьшить выигрыш игрока 1. Поэтому для игрока 2 отыскивается

т.е. определяется max выигрыш игрока 1, при условии, что игрок 2 применит свою j-ю чистую стратегию, затем игрок 2 отыскивает такую свою j = j1 стратегию, при которой игрок 1 получит min выигрыш, т.е. находит

(2)

Определение. Число , определяемое по формуле (2), называется чистой верхней ценой игры и показывает, какой максимальный выигрыш за счёт своих стратегий может себе гарантировать игрок 1.

Другими словами, применяя свои чистые стратегии игрок 1 может обеспечить себе выигрыш не меньше , а игрок 2 за счёт применения своих чистых стратегий может не допустить выигрыш игрока 1 больше, чем .

Определение. Если в игре с матрицей А , то говорят, что эта игра имеет седловую точку в чистых стратегиях и чистую цену игры:

Седловая точка – это пара чистых стратегий (iо, jо) соответственно игроков 1 и 2, при которых достигается равенство . В это понятие вложен следующий смысл: если один из игроков придерживается стратегии, соответствующей седловой точке, то другой игрок не сможет поступить лучше, чем придерживаться стратегии, соответствующей седловой точке.

В общем случае игра 2 2 определяется матрицей A:

  B1 B2
A1 a11 a12
A2 a21 a22

 

(3)

Прежде всего необходимо проверить, есть ли у данной игры седловая точка.

Если да, то игра имеет решение в чистых стратегиях, причём оптимальными стратегиями игроков 1 и 2 соответственно будут чистая максиминная и чистая минимаксная стратегии. Если же игра с матрицей выигрышей А не имеет чистых стратегий, то оба игрока имеют только такие оптимальные стратегии, которые используют все свои чистые стратегии с положительными вероятностями.

Пусть Х = (p, 1-p) – оптимальная стратегия игрока 1, где p – можно рассматривать как частоту (вероятность) использования стратегии A1 первым игроком, a (1- p) – частота (вероятность) использования стратегии А2 первым игроком. Так как игрок 2 имеет смешанную оптимальную стратегию, то:

(4)

Отсюда следует, что при u ¹ 0 столбцы матрицы А не могут быть пропорциональны с коэффициентом пропорциональности, отличным от единицы. Если же коэффициент пропорциональности равен единице, то матрица А принимает вид

(5)

и игрок 1 имеет чистую оптимальную стратегию (он выбирает с вероятностью 1 ту из строк, элементы которой не меньше соответствующих элементов другой), что противоречит предположению. Следовательно, если u ¹ 0 и игроки имеют только смешанные оптимальные стратегии, то определитель матрицы А отличен от нуля. Из этого следует, что последняя система уравнений имеет единственное решение. Решая её, находим:

(6)

Тогда подставив, (6) в (4) можно получить выражение для цены игры:

(7)

Аналогичные рассуждения приводят нас к тому, что оптимальная стратегия игрока 2 (второго игрока) Y = (q, 1- q), где q – можно рассматривать как частоту (вероятность) использования стратегии B1 вторым игроком, а (1- q) – частота (вероятность) использования стратегии B2 вторым игроком. Тогда имеем:

(8)

 

Откуда

(9)

 

Поясним графический метод решения матричных игр на примерах.


 

 







Дата добавления: 2014-11-10; просмотров: 2120. Нарушение авторских прав; Мы поможем в написании вашей работы!




Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...


Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...


Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...


ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Основные разделы работы участкового врача-педиатра Ведущей фигурой в организации внебольничной помощи детям является участковый врач-педиатр детской городской поликлиники...

Ученые, внесшие большой вклад в развитие науки биологии Краткая история развития биологии. Чарльз Дарвин (1809 -1882)- основной труд « О происхождении видов путем естественного отбора или Сохранение благоприятствующих пород в борьбе за жизнь»...

Этапы трансляции и их характеристика Трансляция (от лат. translatio — перевод) — процесс синтеза белка из аминокислот на матрице информационной (матричной) РНК (иРНК...

Гидравлический расчёт трубопроводов Пример 3.4. Вентиляционная труба d=0,1м (100 мм) имеет длину l=100 м. Определить давление, которое должен развивать вентилятор, если расход воздуха, подаваемый по трубе, . Давление на выходе . Местных сопротивлений по пути не имеется. Температура...

Огоньки» в основной период В основной период смены могут проводиться три вида «огоньков»: «огонек-анализ», тематический «огонек» и «конфликтный» огонек...

Упражнение Джеффа. Это список вопросов или утверждений, отвечая на которые участник может раскрыть свой внутренний мир перед другими участниками и узнать о других участниках больше...

Studopedia.info - Студопедия - 2014-2024 год . (0.007 сек.) русская версия | украинская версия