Дилемма заключенных

Автор работы: Пользователь скрыл имя, 07 Декабря 2013 в 12:20, реферат

Описание работы

Базовую модель «Дилемма заключенного» предложили в 1950 году американские математики Меррил Флад и Мелвин Дрешер, работавшие на исследовательскую корпорацию RAND. Эта игра была нужна для прогнозирования гонки ядерных вооружений — в роли заключенных выступали СССР и США. С тех пор игра стала очень популярна среди математиков, философов и психологов.

Файлы: 1 файл

ТЕОРИЯ ИГР диалемма заключенных.docx

— 957.48 Кб (Скачать файл)

Реферат  по дисциплине «Теория игр»

на тему: «Дилемма заключенного»

 

 

 

 

ДИЛЕММА ЗАКЛЮЧЕННОГО

 

 

Базовую модель «Дилемма заключенного» предложили в 1950 году американские математики Меррил Флад и Мелвин Дрешер, работавшие на исследовательскую корпорацию RAND. Эта игра была нужна для прогнозирования гонки ядерных вооружений — в роли заключенных выступали СССР и США. С тех пор игра стала очень популярна среди математиков, философов и психологов. Уходя с военно-криминальной обложки, можно обнаружить и много других примеров. Ту же гонку вооружений сейчас очень напоминают рекламные кампании. Постоянное соревнование в количестве рекламного контента неуклонно увеличивает расходы фирм. Соответственно, от прекращения гонки выиграли бы все стороны. Но если кто-то вероломно нарушит перемирие, он выиграет войну за потребителя, а остальные проиграют.

В США даже проводились соревнования между командами университетов  на лучшую запрограммированную стратегию  игры в «Дилемму заключенного», где  победа присуждалась за минимальный  срок заключения по итогам нескольких раундов допросов. Победила программа, основанная на принципе «око за око»: она поступала с каждым своим напарником в точности так, как с ней поступили ходом ранее. Но это все-таки математика, человеческая жизнь куда сложнее.

В реальности вы вряд ли будете грабить  банки. А российские следователи  не станут предлагать такие сделки. Это модель, притча, метафора человеческих отношений. [1]

Рассмотрим подробнее определение  «Дилеммы заключённого». Это фундаментальная проблема в теории игр, согласно которой игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других.

В дилемме заключённого предательство  строго доминирует над сотрудничеством, поэтому единственное возможное  равновесие — предательство обоих  участников. Проще говоря, не важно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку  в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.

Ведя себя по отдельности рационально, вместе участники приходят к нерациональному  решению: если оба предадут, они получат  в сумме меньший выигрыш, чем если бы сотрудничали (единственное равновесие в этой игре не ведёт к Парето-оптимальному решению). В этом и заключается дилемма.

В повторяющейся дилемме заключённого игра происходит периодически, и каждый игрок может «наказать» другого  за несотрудничество ранее. В такой игре сотрудничество может стать равновесием, а стимул предать может перевешиваться угрозой наказания (с ростом числа итераций равновесие Нэша стремится к Парето-оптимуму).

Классическая формулировка дилеммы  заключённого такова:

Двое преступников, А и Б, попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Если оба молчат, их деяние проходит по более лёгкой статье, и каждый из них приговаривается к 0,5 года. Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт? [2]

Игру можно представить в  виде следующей таблицы (см. рис. 1.1):

 

Рисунок 1.1 - «Дилемма заключённого» в нормальной форме

 

Дилемма появляется, если предположить, что оба заботятся только о  минимизации собственного срока  заключения.

Представим рассуждения одного из заключённых. Если партнёр молчит, то лучше его предать и выйти  на свободу (иначе — полгода тюрьмы). Если партнёр свидетельствует, то лучше  тоже свидетельствовать против него, чтобы получить 2 года (иначе — 10 лет). Стратегия «свидетельствовать»  строго доминирует над стратегией «молчать». Аналогично другой заключённый приходит к тому же выводу. [2]

С точки зрения группы (этих двух заключённых) лучше всего сотрудничать друг с  другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. Любое  другое решение будет менее выгодным. Это очень наглядно демонстрирует, что в игре с ненулевой суммой Парето-оптимум может быть противоположным  равновесию Нэша.

И еще более странная закономерность: если проводить эксперимент, разрешая обоим подозреваемым свободно общаться между собой, результат остается таким же. Оба человека, даже выработав  совместную стратегию поведения, в  конце концов совершают предательство. Проблема заключается в том, что люди не способны полностью доверять друг другу. [3]

Можно раскрыть скелет игры далее, абстрагировавшись  от подтекста заключённых. Обобщённая форма игры часто используется в  экспериментальной экономике. Следующие  правила дают типичную реализацию игры:

В игре — два игрока и банкир. Каждый игрок держит 2 карты: на одной  написано «сотрудничать», на другой —  «предать» (это стандартная терминология игры). Каждый игрок кладёт одну карту перед банкиром лицом вниз (то есть никто не знает чужого решения, хотя знание чужого решения не

влияет  на анализ доминирования). Банкир открывает  карты и выдаёт выигрыш.

Если оба выбрали «сотрудничать», оба получают C. Если один выбрал «предать», другой «сотрудничать» — первый получает D, второй с. Если оба выбрали «предать» — оба получают d (см. рис. 1.2).

 

 

Рисунок 1.2 - Каноническая матрица выигрышей «Дилеммы заключённого»

 

 

Значения переменных C, D, c, d могут  быть любого знака (в примере выше все меньше либо равны 0). Обязательно  должно соблюдаться неравенство D > C > d > c, чтобы игра представляла собой «Дилемму заключённого».

Если игра повторяется, то есть играется больше 1 раза подряд, общий выигрыш  от сотрудничества должен быть больше суммарного выигрыша в ситуации, когда  один предаёт, а другой — нет, то есть 2C > D + c.

Эти правила были установлены Дугласом Хофштадтером и образуют каноническое описание типичной дилеммы заключённого. [2]

 

 

 

 

 

 

СПИСОК  ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

 

 

1.  «Дилемма заключенного»: стучать или молчать? [Электронный ресурс] – Режим доступа: http://www.ht.ru/cms/component/content/article/

2. Дилемма заключённого. [Электронный ресурс] – Режим доступа: http://ru.wikipedia.org

3. Дилемма заключённого. [Электронный ресурс] – Режим доступа: http://www.privatezona.ru/


Информация о работе Дилемма заключенных