Студопедия — Лабораторная работа № 7. Динамические игры с совершенной информацией
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Лабораторная работа № 7. Динамические игры с совершенной информацией






Итак, рассмотрим динамическую игру под названием «Террорист».

Игра «Террорист».

В самолет, который должен лететь изМайами в Нью-Йорк, сел террорист. Террорист требует, чтобы пилот летел на Кубу, угрожая в противном случае взорвать самолет. Предположим, что террорист не может определить, куда действительно летит самолет. Первый ход в этой игре тогда делает пилот. Он может лететь либо на Кубу, либо в Нью-Йорк. Если пилот посадит самолет на Кубе, то еговыигрыш составит -1, а выигрыш террориста составит 1. Если же самолет сядет в Нью-Йорке, то делает свойход террорист. Он может либо взорвать бомбу, либо не взрывать. Если бомба взорвется, то выигрыши обоих игроков составят -100, в противном случае выигрыш пилота составит 1, а выигрыш террориста составит -1.

Данную игру удобно представить в виде диаграммы, изображающей дерево игры.

 
 

 


Решение игры можно найти, в предположении, что игроки рациональны и что рациональность и структура игры являются общеизвестными фактами При этом естественно воспользоваться методом обратной индукции.

В соответствии с этим методом игру «разматывают» с конца. Рассмотрим последнюю вершину игры, в которой один из игроков делает выбор. В данном случае нам надо спрогнозировать, как поступит террорист, оказавшись в Нью-Йорке. От решения террориста в этой ситуации (вершине) зависит исход игры, поскольку пилот уже сделал свой ход, и не может «взять обратно». Если террорист рационален, то он примет решение не взрывать бомбу, поскольку -1 больше 100. Таким образом, действия террориста можно однозначно предсказать.

Поскольку, как мы предположили, рациональность террориста является общим знанием, то пилот может «просчитать» действия террориста и, тем самым, будет знать, что случиться, если он прилетит в Нью-Йорк.

Чтобы было более понятно, какой выбор стоит перед пилотом, удобно частично «свернуть» дерево игры, учитывая то, что действия террориста в Нью-Йорке известны.

 
 

 

 


В этой игре действия пилота несложно предсказать — он полетит в Нью-Йорк, поскольку предпочитает выигрыш 1 выигрышу -1. Таким образом, исход игры однозначен: пилот посадит самолет в Нью-Йорке, а террорист не станет взрывать бомбу.

Исход игры определяется траекторией, отмеченной на нашем дереве более темным цветом.

 

Задание.

В следующих играх найдите решение, используя обратную индукцию.

1. Двое играют в следующую игру. Каждый из кучки, состоящей из 6 камней, берет по очереди 1 или 2 камня. Проигрывает тот, кто взял последний камень.

2. Рассмотрите ту же игру, но для 7 камней. Какой можно сделать вывод относительно выигрыша того или иного игрока в зависимости от количества камней?

3. Муж и жена выбирают, провести вечер дома или у друзей, причем друзья у них разные. Выигрыши заданы следующей матрицей,

Муж







Дата добавления: 2014-12-06; просмотров: 722. Нарушение авторских прав; Мы поможем в написании вашей работы!



Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

Случайной величины Плотностью распределения вероятностей непрерывной случайной величины Х называют функцию f(x) – первую производную от функции распределения F(x): Понятие плотность распределения вероятностей случайной величины Х для дискретной величины неприменима...

Схема рефлекторной дуги условного слюноотделительного рефлекса При неоднократном сочетании действия предупреждающего сигнала и безусловного пищевого раздражителя формируются...

Уравнение волны. Уравнение плоской гармонической волны. Волновое уравнение. Уравнение сферической волны Уравнением упругой волны называют функцию , которая определяет смещение любой частицы среды с координатами относительно своего положения равновесия в произвольный момент времени t...

Индекс гингивита (PMA) (Schour, Massler, 1948) Для оценки тяжести гингивита (а в последующем и ре­гистрации динамики процесса) используют папиллярно-маргинально-альвеолярный индекс (РМА)...

Методика исследования периферических лимфатических узлов. Исследование периферических лимфатических узлов производится с помощью осмотра и пальпации...

Роль органов чувств в ориентировке слепых Процесс ориентации протекает на основе совместной, интегративной деятельности сохранных анализаторов, каждый из которых при определенных объективных условиях может выступать как ведущий...

Studopedia.info - Студопедия - 2014-2024 год . (0.013 сек.) русская версия | украинская версия