Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Теорема о минимаксе





Основной теоремой в теории игр с нулевой суммой является теорема о минимаксе, согласно которой любая конечная игра имеет решение, если допускается использование смешанных стратегий.

Обозначим через

матрицу-столбец, состоящую из вероятностей xi, выбора i-й стра­тегии игрока А, и через

соответственно матрицу-столбец (вектор) вероятностей появления стратегий игрока B. В приведенных формулах

Теперь можно ставить вопрос об оптимальном выборе стратегии.

В этом случае векторы х и у называются смешанными стратегиями игроков А и В соответственно. Если в векторе х или у (или обоих вместе) все составляющие равны нулю, за исключением одной, то такую стратегию называют чистой. Чистая стратегия может быть оптимальной только при наличии седловой точки. В противном случае следует говорить об оптимальных смешанных стратегиях. При наличии смешанных стратегий следует оперировать не платежами, а средним значением (математическим ожиданием) платежей. Допустим, что игрок А выбирает чистую стратегию i, а игрок В – смешанную стратегию у. Тогда средний платеж игроку А равен:

.

Величина ui представляет собой i-ю составляющую вектора-столбца u:

.

Если игрок В применяет чистую стратегию j, а игрок А – сме­шанную стратегию х, то средний платеж игроку А равен:

Величина lj представляет собой j-ю составляющую матрицы-строки lt:

.

Если игроки А и В применяют смешанные стратегии х и у соответственно, то средний платеж игроку А

.

Основная теорема теории игр, теорема о минимаксе, утверждает, что максимин среднего платежа равен минимаксу среднего платежа, т.е.

.

Из этого равенства следует, что существует такая пара стратегий , что

для всех x и y.

В этом случае пара векторов (х*, у*) называется решением игры, оптимальными стратегиями, a v – ценой игры, т. е. всегда сущест­вует решение игры в классе чистых или смешанных стратегий.

В оптимальную смешанную стратегию не обязательно входят все чистые стратегии. Поэтому для тех чистых стратегий, которые входят в оптимальную смешанную стратегию, вводят специальный термин – активные стратегии. С активными стратегиями связано очень важное положение. Оказывается, что оптимальная смешан­ная стратегия, примененная против любой активной стратегии, дает цену игры. И, наоборот, любая активная стратегия, применен­ная против оптимальной смешанной стратегии, также дает цену игры. Это значит, что если один из игроков применяет оптимальную смешанную стратегию, то выигрыш (платеж) остается неизменным и равным цене игры v, независимо от стратегии другого игрока, если тот применяет одну из своих активных стратегий, их оптималь­ную и неоптимальную комбинацию (т. е. не выходит из класса ак­тивных стратегий).

Это очень важное положение широко исполь­зуется при определении решений игр. При этом необходимо прежде всего определить активные стратегии свои и противника. Далее, приравняв средние платежи при активных стратегиях противника и смешанных из активных своих стратегий цене игры, получим систему алгебраических уравнений, решив которые, можно найти свою оптимальную смешанную стратегию.







Дата добавления: 2015-08-17; просмотров: 2612. Нарушение авторских прав; Мы поможем в написании вашей работы!




Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...


Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...


Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Предпосылки, условия и движущие силы психического развития Предпосылки –это факторы. Факторы психического развития –это ведущие детерминанты развития чел. К ним относят: среду...

Анализ микросреды предприятия Анализ микросреды направлен на анализ состояния тех со­ставляющих внешней среды, с которыми предприятие нахо­дится в непосредственном взаимодействии...

Типы конфликтных личностей (Дж. Скотт) Дж. Г. Скотт опирается на типологию Р. М. Брансом, но дополняет её. Они убеждены в своей абсолютной правоте и хотят, чтобы...

Механизм действия гормонов а) Цитозольный механизм действия гормонов. По цитозольному механизму действуют гормоны 1 группы...

Алгоритм выполнения манипуляции Приемы наружного акушерского исследования. Приемы Леопольда – Левицкого. Цель...

ИГРЫ НА ТАКТИЛЬНОЕ ВЗАИМОДЕЙСТВИЕ Методические рекомендации по проведению игр на тактильное взаимодействие...

Studopedia.info - Студопедия - 2014-2025 год . (0.009 сек.) русская версия | украинская версия