Студопедия — Стратегия равноценных ответных действий
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Стратегия равноценных ответных действий






 

В начале 1980-х годов политолог Мичиганского университета Роберт Аксельрод предложил специалистам по теории игр со всего мира разработать стратегии решения дилеммы заключенных в виде компьютерных программ. Они были распределены по парам, каждая из которых разыгрывала дилемму заключенных 150 раз. На основании набранных очков составили рейтинг программ, принимавших участие в турнире.

Победителем стал профессор математики университета в Торонто Анатолий Рапопорт. Его выигрышная стратегия оказалась одной из самых простых: «око за око, зуб за зуб». Для Роберта Аксельрода этот результат явился большой неожиданностью, поэтому он решил провести еще один турнир, увеличив число участников. Рапопорт и в этот раз подал программу, основанную на той же стратегии, – и снова победил.

Стратегия равноценных ответных действий – один из вариантов правила поведения «поступайте с другими так, как они поступают с вами»[85]. Если говорить более точно, эта стратегия подразумевает сотрудничество на первом этапе, после чего повторяются действия, которые предпринял соперник на предыдущем этапе.

По мнению Роберта Аксельрода, стратегия равноценных ответных действий опирается на четыре принципа, которые должны присутствовать в любой эффективной стратегии для повторяющейся дилеммы заключенных: понятность, доброжелательность, возмездие и прощение. Стратегия равноценных ответных действий очень проста и понятна: сопернику нет необходимости долго размышлять над вашим следующим ходом или просчитывать его. В основе такой стратегии лежит доброжелательность: она никогда не инициирует обман. В этой стратегии есть элемент возмездия: она не оставляет обман безнаказанным. Кроме того, эта стратегия стимулирует прощение: участники игры не держат зла друг на друга слишком долго и готовы возобновить сотрудничество.

Одна из самых впечатляющих характеристик стратегии равноценных ответных действий состоит в том, что она показала лучшие результаты по итогам всего турнира, хотя и не победила (и не могла победить) ни одну из конкурирующих стратегий в прямом противостоянии с ними. В лучшем случае эта стратегия может только сравнять счет с соперником. Следовательно, если бы Аксельрод оценивал каждую игру по принципу «победитель получает все», стратегия равноценных ответных действий имела бы на своем счету только проигрыши и ничьи, а значит, не добилась бы победы по итогам всего турнира[86].

Однако Аксельрод оценивал парные игры между компьютерными программами не по принципу «победитель получает все»: в его турнирах учитывался такой фактор, как готовность к сотрудничеству. Большое преимущество этой стратегии заключается в том, что она сближает соперников. В худшем случае эта стратегия может потерпеть поражение из-за одного предательства, но дальше – только ничья.

Стратегия равноценных ответных действий стала победителем этих соревнований именно потому, что стимулировала сотрудничество, не допуская при этом эксплуатации. Другие стратегии были либо слишком ориентированными на доверие и открытыми для эксплуатации, либо слишком агрессивными и побуждающими игроков выбивать друг друга из игры.

И все-таки мы считаем, что стратегия равноценных ответных действий – ошибочная. Малейший промах или неправильное толкование результатов приводят к полному провалу стратегии. Этот недостаток не был столь очевидным в искусственной среде соревнования между компьютерными программами, поскольку там просто исключались ошибки и неправильное толкование. Однако в случае применения этой стратегии в реальном мире ошибки и заблуждения неизбежны, а результат может оказаться катастрофическим.

Проблема стратегии равноценных ответных действий состоит в том, что обе стороны противостояния повторяют ошибки и заблуждения друг друга. Одна сторона наказывает другую за предательство, и это вызывает цепную реакцию. Соперник отвечает на наказание ответным ударом, который влечет за собой очередное наказание. В таком противостоянии может и не наступить момент, когда одна из сторон приняла бы наказание без ответного удара.

Предположим, Флад и Дрешер разыгрывают стратегию равноценных ответных действий. Поначалу ни один из них не идет на предательство, поэтому какое-то время все складывается хорошо. Затем, скажем, в 11-м раунде игры Флад по ошибке выбирает стратегию «предать» или останавливается на стратегии «сотрудничать», но Дрешер по ошибке считает, что Флад выбрал предательство. В любом случае Дрешер выберет в 12-м раунде ход «предать», но Флад выберет стратегию «сотрудничать», поскольку Дрешер выбрал сотрудничество в 11-м раунде. В 13-м раунде они поменяются ролями. Ситуация, когда один из игроков выберет сотрудничество, а другой – предательство, будет повторяться снова и снова до тех пор, пока очередная ошибка или заблуждение не восстановят сотрудничество между соперниками или не заставят каждого из них выбрать предательство.

Такие циклы или ответные удары часто наблюдаются во время реальных конфликтов между израильтянами и арабами на Ближнем Востоке, или между католиками и протестантами в Северной Ирландии, или между индусами и мусульманами в Индии. На границе между штатами Западная Вирджиния и Кентукки шла памятная вражда между Хэтфилдами и Маккоями. В художественной литературе тоже можно найти яркие примеры того, как такие действия могут привести к непрекращающемуся циклу ответных ударов, как в случае вражды между Грэнджерфордами и Шепердсонами в романе Марка Твена.

 

Да из-за чего же вышла ссора, Бак? Из-за земли?

– Я не знаю. Может быть.

– Ну а кто же первый стрелял? Грэнджерфорд или Шепердсон?

– Господи, ну почем я знаю! Ведь это так давно было.

– И никто не знает?

– Нет, папа, я думаю, знает, и еще кое-кто из стариков знает; они только не знают, из-за чего в самый первый раз началась ссора[87].

 

Стратегия равноценных ответных действий не предполагает возможности остановить этот порочный круг. Она слишком ориентирована на возмездие и недостаточно стимулирует прощение. В следующих версиях соревнований, которые устраивал Роберт Аксельрод, предусматривалась возможность ошибок и заблуждений; в итоге другие, более бескорыстные, стратегии показали свое превосходство над стратегией равноценных ответных действий[88].

Здесь мы можем научиться чему-то даже у обезьян. В ходе одного эксперимента с хохлатыми тамаринами одной из обезьян давали возможность потянуть рычаг, чтобы другая могла достать пищу. Однако для того, чтобы потянуть рычаг, следовало приложить усилие. Теоретически каждой обезьяне было бы выгоднее ничего не делать, пока партнер тянет рычаг. Но тамарины научились сотрудничать, чтобы избежать возмездия. Их сотрудничество сохранялось до тех пор, пока одна из обезьян два раза подряд не совершила предательство. Эта стратегия представляет собой разновидность стратегии «зуб за зуб», а именно – «два зуба за зуб»[89].

 







Дата добавления: 2015-10-01; просмотров: 895. Нарушение авторских прав; Мы поможем в написании вашей работы!



Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Индекс гингивита (PMA) (Schour, Massler, 1948) Для оценки тяжести гингивита (а в последующем и ре­гистрации динамики процесса) используют папиллярно-маргинально-альвеолярный индекс (РМА)...

Методика исследования периферических лимфатических узлов. Исследование периферических лимфатических узлов производится с помощью осмотра и пальпации...

Роль органов чувств в ориентировке слепых Процесс ориентации протекает на основе совместной, интегративной деятельности сохранных анализаторов, каждый из которых при определенных объективных условиях может выступать как ведущий...

В теории государства и права выделяют два пути возникновения государства: восточный и западный Восточный путь возникновения государства представляет собой плавный переход, перерастание первобытного общества в государство...

Закон Гука при растяжении и сжатии   Напряжения и деформации при растяжении и сжатии связаны между собой зависимостью, которая называется законом Гука, по имени установившего этот закон английского физика Роберта Гука в 1678 году...

Характерные черты официально-делового стиля Наиболее характерными чертами официально-делового стиля являются: • лаконичность...

Studopedia.info - Студопедия - 2014-2024 год . (0.009 сек.) русская версия | украинская версия