Студопедия — Биматричные игры
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Биматричные игры






 

А. Игры с природой в условиях риска

 

Для игр с природой в условиях риска характерно то, что вероятности состояний природы известны:

 

 

Пусть - среднее значение (математическое ожидание) выигрыша, которое игрок (ЛПР) стремится максимизировать:

 

 

Тогда в качестве оптимальной стратегии выбирается та из стратегий , которая соответствует максимальному среднему значению выигрыша (так называемый критерий оптимизации ожидаемого значения):

 

Рассмотрим следующую задачу.

 

Пример 1. Предприятие готовится к выпуску новых видов продукции. При этом возможны четыре решения , каждому из которых соответствует определенный вид выпуска продукции или их сочетание. Результаты принятых решений существенно зависят от степени обеспеченности производства материальными ресурсами, которая может быть трех видов: П1, П2, П3. Вероятности реализации каждой обстановки равны Каждому сочетанию решений и обстановки П j (j = 1,2,3) соответствует определенный выигрыш – эффективность выпуска новых видов продукции. Всевозможные выигрыши представлены платежной матрицей

 

  П1 П2 П3
A1 0,25 0,35 0,40
A2 0,70 0,20 0,30
A3 0,35 0,85 0,20
А4 0,80 0,10 0,35

 

Так как вероятности состояний природы известны, то данная ситуация является задачей принятия решений в условиях риска. Решите задачу, используя критерий оптимизации ожидаемого среднего значения. Определите оптимальную стратегию предприятия.

 

Б. Игры с природой в условиях неопределенности

 

Для решения задач данного типа наиболее часто используются критерии Вальда, Сэвиджа и Гурвица.

 

Критерий Вальда базируется на принципе наибольшей осторожности и использует выбор наилучших из наихудших стратегий. При выборе оптимальной стратегии используется максиминный критерий. Иначе говоря, в качестве оптимальной рекомендуется выбирать ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш

Критерий Сэвиджа использует матрицу рисков. Критерий Сэвиджа рекомендует выбирать ту стратегию, при которой в наихудших условиях величина риска принимает наименьшее значение:

 

 

Критерий Гурвица устанавливает баланс между случаями крайнего пессимизма и крайнего оптимизма путем введения некоторых весовых коэффициентов и , где При этом предполагается, что природа может находиться в самом невыгодном для ЛПР состоянии с вероятностью и в самом выгодном – с вероятностью . Он может быть выражен в виде соотношения (*)

 

Рассмотрим пример, иллюстрирующий применение этих критериев.

 

Пример 2.

 

Торговое предприятие планирует продажу сезонных товаров с учетом возможных вариантов поведения покупательского спроса ().

Предприятием разработано три стратегии продажи товаров (). Требуется найти оптимальное поведение торгового предприятия, пользуясь критериями Вальда, Гурвица (при ) и Сэвиджа, если данные о товарообороте, зависящем от стратегий предприятия и покупательского спроса, могут быть представлены в виде следующей платежной матрицы.

 

Платежная матрица примера 2

 

 
А1        
А2        
А3        

 

Решение

Введем данные на рабочий лист в соответствии с Рис. 1 (а, б)

Рассмотрим вначале поиск оптимальных стратегий по критериям Вальда и Гурвица.

 

Критерий Вальда. В диапазон ячеек введите выражение для расчета разности между текущим и максимальным выигрышами. В ячейку G3 введите логическую функцию IF(G3<0;"";"A1") и скопируйте ее (с очевидными изменениями) в необходимый диапазон - это позволит автоматизировать поиск оптимальной стратегии.

 

Критерий Гурвица. Обозначим первое слагаемое в выражении (*) через S1, а второе – через S2, введем необходимые формулы для расчета этих составляющих и посчитаем их сумму (столбец H). В ячейках I13:I15 посчитаем разность между текущим и максимальным (ячейка H16) значениями выигрыша, а в диапазон J13:J15 по аналогии с предыдущим случаем введем логические функции IF. При используемом нами значении l=0,4 вы получите определенный результат. Измените значение вероятности, например, возьмите l=0,5. Изменилась ли при этом рекомендуемая стратегия?

 

 

Рис. 1 (а). Данные для решения примера 2 (критерии Вальда и Гурвица).

 

 

Критерий Сэвиджа. Введите данные в соответствии с Рис. 1 (б).

Рассчитайте и разместите в указанном диапазоне ячеек матрицу рисков.

 

Рис. 1(б). Данные для решения примера 2 (критерий Сэвиджа).

 

Проведя аналогично предыдущим примерам поиск оптимальной стратегии, сравните полученные при использовании разных критериев результаты.

 

Биматричные игры

Теоретико-игро­вая модель (короче, игра) является моделью принятия решения в условиях конфликта. Этот конфликт обусловлен тем, что исход определяется совместными действиями нескольких сторон, пресле­дующих различные цели.

В теоретико-игровых моделях принято стороны, принимающие решения, называть игроками, а выбираемые ими действия – стратегиями. Если число игроков равно двум и исходы оцениваются численно (каждый игрок дает свою оценку исходу), то получается так называемая биматричная игра; ее удобно задавать таблицей вида табл.6.1, в первый столбец которой выписаны страте­гии игрока 1, а в первую строку – стратегии игрока 2.

Таблица 6.1. Биматричная игра

  y1 yj ym
x1 (a11,b11) (a1j,b1j) (a1v,b1m)
   
xi (ai1,bi1)   (aij,bij)   (aim,bim)
   
xn (an1,bn1)   (anj,bnj)   (anm,bnm)

Каждый игрок независимо от другого производит выбор своей стратегии. Если игрок 1 выбрал стратегию xi, а игрок 2 – стратегию yj; то получающийся при этом исход оценивается пер­вым игроком числом aij,, а вторым – числом bij; эти числа, называемые соответственно выигрышем игрока 1 и игрока 2, запи­саны в табл.6.1 на пересечении i-й строки и j-го столбца. Всякую пару стратегий (xi, yj) принято называть ситуацией в игре.

Пример 6-1 (два барана). К нерегулируемому перекрести; едут на высокой скорости под прямым углом друг к другу два автомобиля (рис.5.1). У каждого во­дителя есть две стратегии: 1) снизить скорость до безопасной (безопасная стратегия) и 2) ехать на высокой скорости (рискованная стратегия).

Рис.6.1. Ситуация на дороге
Ситуация, в которой оба водителя выбирают безопасные стратегии, приводит к благополучному исходу, оцениваемому для каждого водителя в 1; если оба водителя выбирают рискованную стратегию, то происходит столкновение, последствия которого оцениваются для каждого из них отрицательным числом —9. Если один из них уступит, снизив скорость, в то время как другой продолжает ехать на высокой скорости, то такой исход оценивается числом 0 для снизивше­го скорость (за «потерю престижа»), а для другого водителя – числом 3 (за «повы­шение престижа»). Получаем в итоге биматричную игру размерности 2´2, в ко­торой водители выступают в качестве игроков, Б и Р — безопасная и риско­ванная стратегии игроков (табл. 6.2).

Таблица 6.2. Биматричная игра «два барана»

  Б Р
Б (1,1) (0,3)
Р (3,0) (-9,-9)






Дата добавления: 2015-08-17; просмотров: 2053. Нарушение авторских прав; Мы поможем в написании вашей работы!



Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Определение трудоемкости работ и затрат машинного времени На основании ведомости объемов работ по объекту и норм времени ГЭСН составляется ведомость подсчёта трудоёмкости, затрат машинного времени, потребности в конструкциях, изделиях и материалах (табл...

Гидравлический расчёт трубопроводов Пример 3.4. Вентиляционная труба d=0,1м (100 мм) имеет длину l=100 м. Определить давление, которое должен развивать вентилятор, если расход воздуха, подаваемый по трубе, . Давление на выходе . Местных сопротивлений по пути не имеется. Температура...

Огоньки» в основной период В основной период смены могут проводиться три вида «огоньков»: «огонек-анализ», тематический «огонек» и «конфликтный» огонек...

Неисправности автосцепки, с которыми запрещается постановка вагонов в поезд. Причины саморасцепов ЗАПРЕЩАЕТСЯ: постановка в поезда и следование в них вагонов, у которых автосцепное устройство имеет хотя бы одну из следующих неисправностей: - трещину в корпусе автосцепки, излом деталей механизма...

Понятие метода в психологии. Классификация методов психологии и их характеристика Метод – это путь, способ познания, посредством которого познается предмет науки (С...

ЛЕКАРСТВЕННЫЕ ФОРМЫ ДЛЯ ИНЪЕКЦИЙ К лекарственным формам для инъекций относятся водные, спиртовые и масляные растворы, суспензии, эмульсии, ново­галеновые препараты, жидкие органопрепараты и жидкие экс­тракты, а также порошки и таблетки для имплантации...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия