Автор работы: Пользователь скрыл имя, 20 Ноября 2013 в 22:51, доклад
Дилемма заключённого- фундаментальная проблема в теории игр, согласно которой игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других. Суть проблемы была сформулирована Мерилом Фладом и Мелвином Дрешером в 1950 году. Название дилемме дал математик Альберт Такер.
В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие - предательство обоих участников.
Фундаментальная проблема в теории игр
Рассмотрим фундаментальную
Дилемма заключённого- фундаментальная проблема в теории игр, согласно которой игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах. Предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других. Суть проблемы была сформулирована Мерилом Фладом и Мелвином Дрешером в 1950 году. Название дилемме дал математик Альберт Такер.
В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие - предательство обоих участников. Проще говоря, неважно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.
Ведя себя по отдельности рационально, вместе участники приходят к нерациональному решению: если оба предадут, они получат в сумме меньший выигрыш, чем если бы сотрудничали (единственное равновесие в этой игре не ведёт к Парето-оптимальномурешению, т.е. решению, которое не может быть улучшено без ухудшения положения других элементов.). В этом и заключается дилемма.
В повторяющейся дилемме
Классическая дилемма заключённого
Во всех судебных системах кара за бандитизм (совершение преступлений в составе организованной группы) намного тяжелее, чем за те же преступления, совершённые в одиночку (отсюда альтернативное название - «дилемма бандита»).
Классическая формулировка дилеммы заключённого такова:
Двое преступников, А и Б, попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет)(20 лет). Если оба молчат, их деяние проходит по более лёгкой статье, и они приговариваются к 6 месяцам(1 год). Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года)(5 лет). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?
Игру можно представить в виде следующей таблицы:
Заключённый Б хранит молчание |
Заключённый Б даёт показания | |
Заключённый А хранит молчание |
Оба получают полгода(5 лет). |
А получает 10 лет(20 лет), |
Заключённый А даёт показания |
А освобождается, |
Оба получают 2 года тюрьмы(1 год) |
«Дилемма заключённого» в нормальной форме. |
Дилемма появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.
Представим рассуждения одного из заключённых. Если партнёр молчит, то лучше его предать и выйти на свободу (иначе - полгода тюрьмы). Если партнёр свидетельствует, то лучше тоже свидетельствовать против него, чтобы получить 2 года (иначе - 10 лет). Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично другой заключённый приходит к тому же выводу.
С точки зрения группы (этих двух заключённых) лучше всего сотрудничать друг с другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным.
Обобщённая форма
Можно раскрыть скелет игры далее, абстрагировавшись от подтекста заключённых. Обобщённая форма игры часто используется в экспериментальной экономике. Следующие правила дают типичную реализацию игры.
Сотрудничать |
Предать | |
Сотрудничать |
C, C |
c, D |
Предать |
D, c |
d, d |
Каноническая матрица выигрышей |
В игре - два игрока и банкир. Каждый игрок держит 2 карты: на одной написано «сотрудничать», на другой - «предать» (это стандартная терминология игры). Каждый игрок кладёт одну карту перед банкиром лицом вниз (то есть никто не знает чужого решения, хотя знание чужого решения не влияет на анализ доминирования). Банкир открывает карты и выдаёт выигрыш.
Если оба выбрали «
Значения переменных C, D, c, d могут быть любого знака (в примере выше все меньше либо равны 0). Обязательно должно соблюдаться неравенство D > C > d > c, чтобы игра представляла собой «Дилемму заключённого» (ДЗ).
Если игра повторяется, то есть играется больше 1 раза подряд, общий выигрыш от сотрудничества должен быть больше суммарного выигрыша в ситуации, когда один предаёт, а другой - нет, то есть 2C > D + c.
Эти правила были установлены Дугласом Хофштадтером и образуют каноническое описание типичной дилеммы заключённого.
Похожая, но другая игра
Хофштадтер предположил, что люди проще понимают задачи, как задача дилемма заключенного, если она представлена в виде отдельной игры или процесса торговли. Один из примеров - «обмен закрытыми сумками»:
Два человека встречаются и обмениваются закрытыми сумками, понимая, что одна из них содержит деньги, другая - товар. Каждый игрок может уважать сделку и положить в сумку то, о чём договорились, либо обмануть партнёра, дав пустую сумку.
В этой игре обман всегда будет наилучшим решением, означая также, что рациональные игроки никогда не будут играть в неё, и что рынок обмена закрытыми сумками будет отсутствовать.
Применение теории игр для принятия стратегических управленческих решений
В качестве примеров можно назвать решения по поводу проведения принципиальной ценовой политики, вступления на новые рынки, кооперации и создания совместных предприятий, определения лидеров и исполнителей в области инноваций, вертикальной интеграции и т.д. Положения теории игр в принципе можно использовать для всех видов решений, если на их принятие влияют другие действующие лица. Этими лицами, или игроками, необязательно должны быть рыночные конкуренты; в их роли могут выступать субпоставщики, ведущие клиенты, сотрудники организаций, а также коллеги по работе.
Инструментарий теории игр
особенно целесообразно
Квадранты· 1 и 2 характеризую
Аналогичный вывод следует, хотя и по другой причине, и для ситуации, отражаемой квадрантом 3. Здесь реакция конкурентов могла бы изрядно воздействовать на фирму, но поскольку ее собственные действия не могут сильно повлиять на платежи конкурента, то и не следует опасаться его реакции. В качестве примера можно привести решения о вхождении в рыночную нишу: при определенных обстоятельствах у крупных конкурентов нет оснований реагировать на подобное решение небольшой фирмы.
Лишь ситуация, показанная в квадранте 4 (возможность ответных шагов рыночных партнеров), требует использования положений теории игр. Однако здесь отражены лишь необходимые, но недостаточные условия, чтобы оправдать применение базы теории игр для борьбы с конкурентами. Бывают ситуации, когда одна стратегия безусловно доминирует над всеми другими независимо от того, какие действия предпримет конкурент. Если взять, например, рынок лекарственных препаратов, то для фирмы часто бывает важно первой заявить новый товар на рынке: прибыль "первопроходца" оказывается столь значительной, что всем другим "игрокам" остается только быстрее активизировать инновационную деятельность.
Тривиальным с позиций теории
игр примером "доминирующей стратегии"
является решение относительно·
Та же самая игровая ситуация может быть представлена и в нормальной форме (рис.4).·
Здесь обозначены два состояния - "вступление/дружественная реакция" и "невступление/ агрессивная реакция". Очевидно, что второе равновесие несостоятельно. Из развернутой формы следует, что для уже закрепившейся на рынке компании нецелесообразно реагировать агрессивно на появление нового конкурента: при агрессивном поведении теперешний монополист получает 1(платеж), а при дружественном - 3. Компания-аутсайдер к тому же знает, что для монополиста не рационально начинать действия по ее вытеснению, и поэтому она принимает решение о вступлении на рынок. Грозившие потери в размере (-1) компания-аутсайдер не понесет.
Подобное рациональное равновесие характерно для "частично усовершенствованной" игры, которая заведомо исключает абсурдные ходы. Такие равновесные состояния на практике в принципе довольно просто найти. Равновесные конфигурации могут быть выявлены с помощью специального алгоритма из области исследования операций для любой конечной игры. Игрок, принимающий решение, поступает следующим образом: вначале делается выбор "лучшего" хода на последнем этапе игры, затем выбирается "лучший" ход на предшествующем этапе с учетом выбора на последнем этапе и так далее, до тех пор пока не будет достигнут начальный узел дерева игры.
Какую пользу могут извлечь компании из анализа на базе теории игр? Известен, например, случай столкновения интересов компаний IВМ и Telex. В связи с объявлением о подготовительных планах последней к вступлению на рынок состоялось "кризисное" совещание руководства IВМ, на котором были проанализированы мероприятия, направленные на то, чтобы заставить нового конкурента отказаться от намерения проникнуть на новый рынок. Компании Telex, видимо, стало известно об этих мероприятиях. Анализ на базе теории игр показал, что угрозы IВМ из-за высоких затрат безосновательны. Это свидетельствует, что компаниям полезно в обдумывать возможные реакции партнеров по игре. Изолированные хозяйственные расчеты, даже опирающиеся на теорию принятия решений, часто носят, как в изложенной ситуации, ограниченный характер. Так, компания-аутсайдер могла бы и выбрать ход "невступление", если бы предварительный анализ убедил ее в том, что проникновение на рынок вызовет агрессивную реакцию монополиста. В этом случае в соответствии с критерием ожидаемой стоимости разумно выбрать ход "невступление" при вероятности агрессивного ответа 0,5.
Следующий пример связан с соперничеством компаний в области· технологического лидерства. Исходной является ситуация, когда предприятие 1 ранее обладало технологическим превосходством, но в настоящее время располагает меньшими финансовыми ресурсами для научных исследований и разработок (НИР), чем его конкурент. Оба предприятия должны решить вопрос, попытаться ли с помощью крупных капиталовложений добиться доминирующего положения на мировом рынке в соответствующей технологической области. Если оба конкурента вложат в дело крупные средства, то перспективы на успех у предприятия 1 будут лучше, хотя оно и понесет большие финансовые расходы (как и предприятие 2). На рис. 5 эта ситуация представлена платежами с отрицательными значениями.
Для предприятия 1 лучше всего было бы, если бы предприятие 2 отказалось от конкуренции. Его выгода в таком случае составила бы 3 (платежа). С большой вероятностью предприятие2 выиграло бы соперничество, когда предприятие 1 приняло бы урезанную программу инвестиций, а предприятие 2 - более широкую. Это положение отражено в правом верхнем квадранте матрицы.
Анализ ситуации показывает, что равновесие наступает при высоких затратах на НИР предприятия 2 и низких предприятия 1. При любом другом раскладе у одного из конкурентов появляется резон отклониться от стратегической комбинации: так, для предприятия 1предпочтителен сокращенный бюджет, если предприятие 2 откажется от участия в соперничестве; в то же время предприятию 2 известно, что при низких затратах конкурента ему выгодно инвестировать в НИР.
Предприятие, имеющее технологическое преимущество, может прибегнуть к анализу ситуации на базе теории игр, чтобы в конечном счете добиться оптимального для себя результата. С помощью определенного сигнала оно должно показать, что готово осуществить крупные затраты на НИР. Если такой сигнал не поступил, то для предприятия 2 ясно, что предприятие1 выбирает вариант низких затрат.
О достоверности сигнала должны
свидетельствовать
С точки зрения теории игр подобные
обязательства равнозначны
К числу известных областей применения методов теории игр следует отнести также·ценовую стратегию, создание совместных предприятий, расчет времени разработки новой продукции.
Данная теория является базой подготовки рекомендаций для организационного строительства и проектирования систем стимулирования. Она полезна также дляформирования и развития внутрифирменных культур.
Важный вклад в использование теории игр вносят экспериментальные работы. Многие теоретические выкладки отрабатываются в лабораторных условиях, а полученные результаты служат импульсом для практиков. Теоретически было выяснено, при каких условиях двум эгоистически настроенным партнерам целесообразно сотрудничать и добиваться лучших для себя результатов.