Студопедия — Теорема о минимаксе
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Теорема о минимаксе






Основной теоремой в теории игр с нулевой суммой является теорема о минимаксе, согласно которой любая конечная игра имеет решение, если допускается использование смешанных стратегий.

Обозначим через

матрицу-столбец, состоящую из вероятностей xi, выбора i-й стра­тегии игрока А, и через

соответственно матрицу-столбец (вектор) вероятностей появления стратегий игрока B. В приведенных формулах

Теперь можно ставить вопрос об оптимальном выборе стратегии.

В этом случае векторы х и у называются смешанными стратегиями игроков А и В соответственно. Если в векторе х или у (или обоих вместе) все составляющие равны нулю, за исключением одной, то такую стратегию называют чистой. Чистая стратегия может быть оптимальной только при наличии седловой точки. В противном случае следует говорить об оптимальных смешанных стратегиях. При наличии смешанных стратегий следует оперировать не платежами, а средним значением (математическим ожиданием) платежей. Допустим, что игрок А выбирает чистую стратегию i, а игрок В – смешанную стратегию у. Тогда средний платеж игроку А равен:

.

Величина ui представляет собой i-ю составляющую вектора-столбца u:

.

Если игрок В применяет чистую стратегию j, а игрок А – сме­шанную стратегию х, то средний платеж игроку А равен:

Величина lj представляет собой j-ю составляющую матрицы-строки lt:

.

Если игроки А и В применяют смешанные стратегии х и у соответственно, то средний платеж игроку А

.

Основная теорема теории игр, теорема о минимаксе, утверждает, что максимин среднего платежа равен минимаксу среднего платежа, т.е.

.

Из этого равенства следует, что существует такая пара стратегий , что

для всех x и y.

В этом случае пара векторов (х*, у*) называется решением игры, оптимальными стратегиями, a v – ценой игры, т. е. всегда сущест­вует решение игры в классе чистых или смешанных стратегий.

В оптимальную смешанную стратегию не обязательно входят все чистые стратегии. Поэтому для тех чистых стратегий, которые входят в оптимальную смешанную стратегию, вводят специальный термин – активные стратегии. С активными стратегиями связано очень важное положение. Оказывается, что оптимальная смешан­ная стратегия, примененная против любой активной стратегии, дает цену игры. И, наоборот, любая активная стратегия, применен­ная против оптимальной смешанной стратегии, также дает цену игры. Это значит, что если один из игроков применяет оптимальную смешанную стратегию, то выигрыш (платеж) остается неизменным и равным цене игры v, независимо от стратегии другого игрока, если тот применяет одну из своих активных стратегий, их оптималь­ную и неоптимальную комбинацию (т. е. не выходит из класса ак­тивных стратегий).

Это очень важное положение широко исполь­зуется при определении решений игр. При этом необходимо прежде всего определить активные стратегии свои и противника. Далее, приравняв средние платежи при активных стратегиях противника и смешанных из активных своих стратегий цене игры, получим систему алгебраических уравнений, решив которые, можно найти свою оптимальную смешанную стратегию.







Дата добавления: 2015-08-17; просмотров: 2554. Нарушение авторских прав; Мы поможем в написании вашей работы!



Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

Основные структурные физиотерапевтические подразделения Физиотерапевтическое подразделение является одним из структурных подразделений лечебно-профилактического учреждения, которое предназначено для оказания физиотерапевтической помощи...

Почему важны муниципальные выборы? Туристическая фирма оставляет за собой право, в случае причин непреодолимого характера, вносить некоторые изменения в программу тура без уменьшения общего объема и качества услуг, в том числе предоставлять замену отеля на равнозначный...

Тема 2: Анатомо-топографическое строение полостей зубов верхней и нижней челюстей. Полость зуба — это сложная система разветвлений, имеющая разнообразную конфигурацию...

В эволюции растений и животных. Цель: выявить ароморфозы и идиоадаптации у растений Цель: выявить ароморфозы и идиоадаптации у растений. Оборудование: гербарные растения, чучела хордовых (рыб, земноводных, птиц, пресмыкающихся, млекопитающих), коллекции насекомых, влажные препараты паразитических червей, мох, хвощ, папоротник...

Типовые примеры и методы их решения. Пример 2.5.1. На вклад начисляются сложные проценты: а) ежегодно; б) ежеквартально; в) ежемесячно Пример 2.5.1. На вклад начисляются сложные проценты: а) ежегодно; б) ежеквартально; в) ежемесячно. Какова должна быть годовая номинальная процентная ставка...

Выработка навыка зеркального письма (динамический стереотип) Цель работы: Проследить особенности образования любого навыка (динамического стереотипа) на примере выработки навыка зеркального письма...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия