Студопедия — Биматричные игры
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Биматричные игры






 

А. Игры с природой в условиях риска

 

Для игр с природой в условиях риска характерно то, что вероятности состояний природы известны:

 

 

Пусть - среднее значение (математическое ожидание) выигрыша, которое игрок (ЛПР) стремится максимизировать:

 

 

Тогда в качестве оптимальной стратегии выбирается та из стратегий , которая соответствует максимальному среднему значению выигрыша (так называемый критерий оптимизации ожидаемого значения):

 

Рассмотрим следующую задачу.

 

Пример 1. Предприятие готовится к выпуску новых видов продукции. При этом возможны четыре решения , каждому из которых соответствует определенный вид выпуска продукции или их сочетание. Результаты принятых решений существенно зависят от степени обеспеченности производства материальными ресурсами, которая может быть трех видов: П1, П2, П3. Вероятности реализации каждой обстановки равны Каждому сочетанию решений и обстановки П j (j = 1,2,3) соответствует определенный выигрыш – эффективность выпуска новых видов продукции. Всевозможные выигрыши представлены платежной матрицей

 

  П1 П2 П3
A1 0,25 0,35 0,40
A2 0,70 0,20 0,30
A3 0,35 0,85 0,20
А4 0,80 0,10 0,35

 

Так как вероятности состояний природы известны, то данная ситуация является задачей принятия решений в условиях риска. Решите задачу, используя критерий оптимизации ожидаемого среднего значения. Определите оптимальную стратегию предприятия.

 

Б. Игры с природой в условиях неопределенности

 

Для решения задач данного типа наиболее часто используются критерии Вальда, Сэвиджа и Гурвица.

 

Критерий Вальда базируется на принципе наибольшей осторожности и использует выбор наилучших из наихудших стратегий. При выборе оптимальной стратегии используется максиминный критерий. Иначе говоря, в качестве оптимальной рекомендуется выбирать ту стратегию, которая гарантирует в наихудших условиях максимальный выигрыш

Критерий Сэвиджа использует матрицу рисков. Критерий Сэвиджа рекомендует выбирать ту стратегию, при которой в наихудших условиях величина риска принимает наименьшее значение:

 

 

Критерий Гурвица устанавливает баланс между случаями крайнего пессимизма и крайнего оптимизма путем введения некоторых весовых коэффициентов и , где При этом предполагается, что природа может находиться в самом невыгодном для ЛПР состоянии с вероятностью и в самом выгодном – с вероятностью . Он может быть выражен в виде соотношения (*)

 

Рассмотрим пример, иллюстрирующий применение этих критериев.

 

Пример 2.

 

Торговое предприятие планирует продажу сезонных товаров с учетом возможных вариантов поведения покупательского спроса ().

Предприятием разработано три стратегии продажи товаров (). Требуется найти оптимальное поведение торгового предприятия, пользуясь критериями Вальда, Гурвица (при ) и Сэвиджа, если данные о товарообороте, зависящем от стратегий предприятия и покупательского спроса, могут быть представлены в виде следующей платежной матрицы.

 

Платежная матрица примера 2

 

 
А1        
А2        
А3        

 

Решение

Введем данные на рабочий лист в соответствии с Рис. 1 (а, б)

Рассмотрим вначале поиск оптимальных стратегий по критериям Вальда и Гурвица.

 

Критерий Вальда. В диапазон ячеек введите выражение для расчета разности между текущим и максимальным выигрышами. В ячейку G3 введите логическую функцию IF(G3<0;"";"A1") и скопируйте ее (с очевидными изменениями) в необходимый диапазон - это позволит автоматизировать поиск оптимальной стратегии.

 

Критерий Гурвица. Обозначим первое слагаемое в выражении (*) через S1, а второе – через S2, введем необходимые формулы для расчета этих составляющих и посчитаем их сумму (столбец H). В ячейках I13:I15 посчитаем разность между текущим и максимальным (ячейка H16) значениями выигрыша, а в диапазон J13:J15 по аналогии с предыдущим случаем введем логические функции IF. При используемом нами значении l=0,4 вы получите определенный результат. Измените значение вероятности, например, возьмите l=0,5. Изменилась ли при этом рекомендуемая стратегия?

 

 

Рис. 1 (а). Данные для решения примера 2 (критерии Вальда и Гурвица).

 

 

Критерий Сэвиджа. Введите данные в соответствии с Рис. 1 (б).

Рассчитайте и разместите в указанном диапазоне ячеек матрицу рисков.

 

Рис. 1(б). Данные для решения примера 2 (критерий Сэвиджа).

 

Проведя аналогично предыдущим примерам поиск оптимальной стратегии, сравните полученные при использовании разных критериев результаты.

 

Биматричные игры

Теоретико-игро­вая модель (короче, игра) является моделью принятия решения в условиях конфликта. Этот конфликт обусловлен тем, что исход определяется совместными действиями нескольких сторон, пресле­дующих различные цели.

В теоретико-игровых моделях принято стороны, принимающие решения, называть игроками, а выбираемые ими действия – стратегиями. Если число игроков равно двум и исходы оцениваются численно (каждый игрок дает свою оценку исходу), то получается так называемая биматричная игра; ее удобно задавать таблицей вида табл.6.1, в первый столбец которой выписаны страте­гии игрока 1, а в первую строку – стратегии игрока 2.

Таблица 6.1. Биматричная игра

  y1 yj ym
x1 (a11,b11) (a1j,b1j) (a1v,b1m)
   
xi (ai1,bi1)   (aij,bij)   (aim,bim)
   
xn (an1,bn1)   (anj,bnj)   (anm,bnm)

Каждый игрок независимо от другого производит выбор своей стратегии. Если игрок 1 выбрал стратегию xi, а игрок 2 – стратегию yj; то получающийся при этом исход оценивается пер­вым игроком числом aij,, а вторым – числом bij; эти числа, называемые соответственно выигрышем игрока 1 и игрока 2, запи­саны в табл.6.1 на пересечении i-й строки и j-го столбца. Всякую пару стратегий (xi, yj) принято называть ситуацией в игре.

Пример 6-1 (два барана). К нерегулируемому перекрести; едут на высокой скорости под прямым углом друг к другу два автомобиля (рис.5.1). У каждого во­дителя есть две стратегии: 1) снизить скорость до безопасной (безопасная стратегия) и 2) ехать на высокой скорости (рискованная стратегия).

Рис.6.1. Ситуация на дороге
Ситуация, в которой оба водителя выбирают безопасные стратегии, приводит к благополучному исходу, оцениваемому для каждого водителя в 1; если оба водителя выбирают рискованную стратегию, то происходит столкновение, последствия которого оцениваются для каждого из них отрицательным числом —9. Если один из них уступит, снизив скорость, в то время как другой продолжает ехать на высокой скорости, то такой исход оценивается числом 0 для снизивше­го скорость (за «потерю престижа»), а для другого водителя – числом 3 (за «повы­шение престижа»). Получаем в итоге биматричную игру размерности 2´2, в ко­торой водители выступают в качестве игроков, Б и Р — безопасная и риско­ванная стратегии игроков (табл. 6.2).

Таблица 6.2. Биматричная игра «два барана»

  Б Р
Б (1,1) (0,3)
Р (3,0) (-9,-9)






Дата добавления: 2015-08-17; просмотров: 2056. Нарушение авторских прав; Мы поможем в написании вашей работы!



Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Прием и регистрация больных Пути госпитализации больных в стационар могут быть различны. В цен­тральное приемное отделение больные могут быть доставлены: 1) машиной скорой медицинской помощи в случае возникновения остро­го или обострения хронического заболевания...

ПУНКЦИЯ И КАТЕТЕРИЗАЦИЯ ПОДКЛЮЧИЧНОЙ ВЕНЫ   Пункцию и катетеризацию подключичной вены обычно производит хирург или анестезиолог, иногда — специально обученный терапевт...

Ситуация 26. ПРОВЕРЕНО МИНЗДРАВОМ   Станислав Свердлов закончил российско-американский факультет менеджмента Томского государственного университета...

РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...

Решение Постоянные издержки (FC) не зависят от изменения объёма производства, существуют постоянно...

ТРАНСПОРТНАЯ ИММОБИЛИЗАЦИЯ   Под транспортной иммобилизацией понимают мероприятия, направленные на обеспечение покоя в поврежденном участке тела и близлежащих к нему суставах на период перевозки пострадавшего в лечебное учреждение...

Studopedia.info - Студопедия - 2014-2024 год . (0.008 сек.) русская версия | украинская версия