Основные понятия. Игры в чистых стратегиях
Во многих экономических задачах часто возникают ситуации, когда две или более сторон разрешают одну и ту же проблему, но преследуют различные цели, их интересы противоположны. Подобные ситуации называются конфликтными. Примерами таких ситуаций служат отношения между продавцом и покупателем, адвокатом и прокурором, кредитором и дебитором, истцом и ответчиком и т.д.
Математические методы анализа конфликтных ситуаций объединяются под названием теории игр, сама конфликтная ситуация носит название игры, а стороны, участвующие в конфликте, называются игроками. Исход игры называется выигрышем (или проигрышем) игроков. Если в игре участвуют только два игрока, то игра называется парной. Будем рассматривать в дальнейшем только парные игры. Если выигрыш одного игрока равен проигрышу другого, то игра называется антагонистической.
Рассмотрим следующую модель. Игрок А желает принять решение, на результат которого влияет другой игрок В, цели которого противоположны А. Игрок В анализирует все возможные варианты А и принимает такое решение, которое приводит к наименьшему выигрышу А (соответственно максимальному своему выигрышу).
Пусть игрок А может выбрать в качестве действий одну из п альтернатив (вариантов) своих возможных действий: А 1, А 2,…, Аn. Эти альтернативы в теории игр принято называть стратегиями. Аналогично, игрок В может принять одну из m своих стратегий В 1, В 2,…, Вm. Предположим, что известны выигрыши (проигрыши) игрока А при любой выбранной им стратегии Аi и любом ответе ему игроком В – стратегии Вj. Пусть этот результат выражен числом аij (которое может быть и отрицательным в случае проигрыша А). Величины аij образуют матрицу:
| В 1
| В 2
| …
| Вm
|
А 1
| a 11
| a 12
| …
| a 1 m
|
А 2
| a 21
| a 21
| …
| a 2 m
|
…
|
|
| …
|
|
Аn
| an 1
| an 2
| …
| anm
|
Эта матрица называется платежной или матрицей игры.
Рассмотрим игру со стороны А. Он, выбирая свою стратегию Аi, понимает, что В ответит ему такой стратегией Вj, чтобы выигрыш А был минимальным. Поэтому, из всех наихудших вариантов (минимальных элементов каждой строки платежной матрицы) , игроку А выгодно выбрать стратегию, соответствующую максимальному из этих элементов:
.
Величина a называется нижнейценой игры или максимином. Это гарантированный выигрыш игрока А. С другой стороны, игрок В выбирая свою стратегию В j понимает, что игрок А ответит такой стратегией Аi, чтобы его выигрыш был максимален. Поэтому из наилучших вариантов для А (максимальных элементов каждого столбца) игроку В рационально выбрать свою стратегию, соответствующую минимальному из этих чисел:
.
Величина β называется верхней ценой игры или минимаксом. Это максимальный проигрыш игрока В. Реальный результат решения конфликтной ситуации, называемый ценой игры n, заключен между верхней и нижней ценой: . В случае, если верхняя и нижняя цены совпадают , то игра имеет решение в чистых стратегиях, то есть можно точно определить стратегии , которые выгодны для обоих сторон. Если одна сторона отойдет от своей оптимальной стратегии, то ее выигрыш от этого только уменьшится.
Пример: Дебитор А желает выбрать один из четырех условий займа: А 1, А 2, А 3, А 4. Кредитор может на любой вариант займа ответить вариантом предоставления кредита В 1, В 2, В 3, В 4, В 5. Процентные ставки для дебитора при любом варианте кредитора представлены платежной матрицей:
| В 1
| В 2
| В 3
| В 4
| В 5
|
А 1
|
|
|
|
|
|
А 2
|
|
|
|
|
|
А 3
|
|
|
|
|
|
А 4
|
|
|
|
|
|
Находим минимальные элементы каждой строки платежной матрицы α I и из них находим максимальное значение. Из максимальных элементов каждого столбца β j выбираем минимальный.
| В 1
| В 2
| В 3
| В 4
| В 5
| α i
|
А 1
|
|
|
|
|
| 1
|
А 2
|
|
|
|
|
| 5
|
А 3
|
|
|
|
|
| 2
|
А 4
|
|
|
|
|
| 2
|
β j
| 9
| 7
| 8
| 5
| 8
|
|
Видно, что верхние и нижние цены игры совпадают , следовательно для обоих игроков выгодны стратегии и процентная ставка, равная 5. При принятии игроками иной стратегии, отличной от оптимальной, этот игрок только проиграет.