Автор работы: Пользователь скрыл имя, 03 Декабря 2012 в 21:46, курс лекций
Рассмотрим игру, в которой участвуют два игрока, причем каждый из игроков имеет конечное число стратегий. Обозначим для удобства одного из игроков через А, в другого — через В.
Предположим, что игрок А имеет m стратегий — А1, А2, ..., Аm, а игрок В имеет n стратегий В1, В2, ..., Вn.
Пусть игрок А выбрал стратегию Ai, а игрок В стратегию Вk. Будем считать, что выбор игроками стратегий Ai и Вk однозначно определяет исход игры — выигрыш аik игрока А и выигрыш bik игрока В, причем эти выигрыши связаны равенством
Часть I МАТРИЧНЫЕ ИГРЫ 59
1. Равновесная ситуация 60
2. Смешанные стратегии 65
Основные определения 65
Основная теорема матричных игр 68
Основные свойства оптимальных смешанных стратегий 68
3. Методы решения матричных игр 69
Итерационный метод решения матричных игр 77
Сведение матричной игры к задаче линейного программирования 79
4. Примеры задач, сводимых к матричным играм 81
Несколько слов в заключение 84
6. О классификации игр 85
Часть II ПОЗИЦИОННЫЕ ИГРЫ 86
1. Структура позиционной игры 86
2. Нормализация позиционной игры 88
3. Позиционные игры с полной информацией 97
Несколько слов в заключение 100
3.6 Принятие решений и теория игр. Примеры. 101
3.6.1. Оптимальное решение игры двух лиц с нулевой суммой 102
Упражнения 3.6,а 103
3.6.2. Решение матричных игр в смешанных стратегиях 105
Упражнения 3.6,b 107
Упражнений 3.6,с 110
3.7. Заключение 111
Литература 112
Комплексные задачи 112
ГРАФИЧЕСКОЕ РЕШЕНИЕ ИГР. Рассмотрим игру 2 x n, в которой игрок А имеет две стратегии.
Игра предполагает, что игрок А смешивает стратегии А1 и А2 с соответствующими вероятностями x1 и 1 –х1, 0 ≤ x1 ≤ 1. Игрок В смешивает стратегии В1, В2,..., Вn с вероятностями у1, у2, ...,уп, где yj ≥ 0,j = 1, 2,..., и, y1 + у2 + …+ уn = 1. В этом случае ожидаемый выигрыш игрока А, соответствующий j-й чистой стратегии игрока В, вычисляется в виде
Следовательно, игрок А ищет величину х1, которая максимизирует минимум ожидаемых выигрышей
Пример 3.6-3
Рассмотрим следующую игру 2x4, в которой платежи выплачиваются игроку А.
B1 |
B2 |
B3 |
B4 | |
A1 |
2 |
2 |
3 |
–1 |
A2 |
4 |
3 |
2 |
6 |
Игра не .имеет решения в чистых стратегиях, и, следовательно, стратегии должны быть смешанными. Ожидаемые выигрыши игрока А, соответствующие чистым стратегиям игрока В, приведены в следующей таблице.
Чистые стратегии игрока В |
Ожидаемые выигрыши игрока А |
1 |
–2x1 + 4 |
2 |
–x1 + 3 |
3 |
x1 + 2 |
4 |
–7x1 + 6 |
На рис. 14.6 изображены четыре прямые линии, соответствующие чистым стратегиям игрока В. Чтобы определить наилучший результат из наихудших, построения нижняя огибающая четырех указанных прямых (изображенная на рисунке толстыми линейными сегментами), которая представляет минимальный (наихудший) выигрыш для игрока А независимо от того, что делает игрок В. Максимум (наилучшее) нижней огибающей соответствует максиминному решению в точке х1* = 0.5. Эта точка определяется пересечением прямых 3 и 4. Следовательно, оптимальным решением для игрока А является смешивание стратегий A1 и A2 вероятностями 0.5 и 0.5 соответственно. Соответствующая цена игры v определяется подстановкой х1 = 0.5 уравнение либо прямой 3, либо 4, что приводит к следующему.
рис. 14.6
Оптимальная смешанная стратегия игрока В определяется двумя стратегиями, которые определяют нижнюю огибающую графика. Это значит, что игрок В может смешивать стратегии B3 и В4, в этом случае у1 = y2 = 0 и у4 = 1 – у3. Следовательно, ожидаемые платежи игрока В, соответствующие чистым стратегиям игрока А, имеют следующий вид.
Чистые стратегии игрока В |
Ожидаемые выигрыши игрока А |
1 |
4ό3 – 1 |
2 |
–4ò3 + 6 |
Наилучшее решение из наихудших для игрока В представляет собой точку минимума верхней огибающей заданных двух прямых (построение прямых и определение верхней огибающей будет для Вас поучительным). Эта процедура эквивалентна решению уравнения
Его решением будет у3 = 7/8, что определяет цену игры v = 4 х (7/8) – 1 = 5/2.
Таким образом, решением игры для игрока А является смешивание стратегий А1 и А2 равными вероятностями 0.5 и 0.5, а для игрока В – смешивание стратегий В3 и В4 с вероятностями 7/8 и 1/8. (В действительности игра имеет альтернативное решение для игрока В, так как максиминная точка на рис. 14.6 определяется более чем двумя прямыми. Любая выпуклая линейная комбинация этих альтернативных решений также является решением задачи.)
Для игры, в которой игрок А имеет m стратегий, а игрок В – только две, решение находится аналогично. Главное отличие состоит в том, что здесь строятся графики функций, представляющих ожидаемые платежи второго игрока, соответствующие чистым стратегиям игрока А. В результате ведется поиск минимаксной точки верхней огибающей построенных прямых.
1. Решите графически игру с
подбрасыванием монет из
2. Робин часто путешествует
3. Решите графически следующие игры, в которых платежи выплачиваются игроку А.
а)
B1 |
B2 |
B3 | |
A1 |
1 |
–3 |
7 |
A2 |
2 |
4 |
–6 |
b)
B1 |
B2 | |
A1 |
5 |
8 |
A2 |
6 |
5 |
A3 |
5 |
7 |
4. Дана следующая игра двух лиц с нулевой суммой.
B1 |
B2 |
B3 | |
A1 |
5.0 |
50.0 |
50.0 |
A2 |
1.0 |
1.0 |
0.1 |
A3 |
10.0 |
1.0 |
10.0 |
a) Проверьте, что смешанные стратегии с вероятностями (1/6, 0, 5/6) для игрока А и с вероятностями (49/54, 5/54, 0) для игрока В являются оптимальными, и определите цену игры.
b) Покажите, что цена игры равна
решение матричных игр методами линейного программирования. Теория игр находится в тесной связи с линейным программированием, так как любую конечную игру двух лиц с нулевой суммой можно представить в виде задачи линейного программирования и наоборот. Дж. Данциг [2] отмечает, что когда в 1947 году создатель теории игр Дж. фон Нейман впервые ознакомился с симплекс-методом, он сразу установил эта взаимосвязь и обратил особое внимание на концепцию двойственности в линейном программировании. Этот раздел иллюстрирует решение матричных игр методами линейного программирования.
Оптимальные значения вероятностей хi, i = 1, 2,..., m, игрока А могут быть определены путем решения следующей максиминной задачи.
Чтобы сформулировать эту задачу в виде задачи линейного программирования, положим
Отсюда вытекает, что
Следовательно, задача игрока А может быть записана в виде
Максимизировать z = v
при ограничениях
Отметим последнее условие, что цена игры v может быть как положительной, так и отрицательной.
Оптимальные стратегии у1, у2, ...,уn игрока В определяются путем решения задачи
Используя процедуру, аналогичную приведенной выше для игрока А, приходим к выводу, что задача для игрока В сводится к следующему.
Минимизировать w = v
при ограничениях
Две полученные задачи оптимизируют одну и ту же (не ограниченную в знаке) переменную v, которая является ценой игры. Причиной этого является то, что задача игрока В является двойственной к задаче игрока А (вам предлагается доказать это утверждение в упр. 3.5,с(6), используя определение двойственности). Это означает, что оптимальное решение одной из задач автоматически определяет оптимальное решение другой.
Пример 3.6-4
Решим следующую матричную игру методами линейного программирования.
B1 |
B2 |
B3 |
Минимумы строк | |
A1 |
3 |
–1 |
–3 |
–3 |
A2 |
–2 |
4 |
–1 |
–2 |
A3 |
–5 |
–6 |
2 |
–6 |
Максимумы столбцов |
3 |
4 |
2 |
Значение цены игры v находится между –2 и 2.
Задача линейного
Максимизировать z = v
при ограничениях
Оптимальным решением, полученным
с помощью программы TORA, является
x1 = 0.3945, х2 = 0.3119, х3 = 0.2936 и v = – 0.9083.
Соответствующими
Задача линейного
Минимизировать z = v
при ограничениях
Оптимальным решением, полученным с
помощью программы TORA, является
у1 = 0.3211, у2 = 0.0826, уз = 0.5963 и v = –0.9083. Соответствующими двойственными
переменными являются х1 = –0.3945, х2 = –0.3119, х3 = –0.2936. Двойственные переменные
отрицательны, ибо, подобно разобранной
выше задаче для игрока А, в этом случае задача минимизации
линейного программирования имеет ограничения–неравенства
вида "≤". Приведение ограничений
к виду "≥" исправит ситуацию со знаками.
1. Покажите в задаче из примера
3.6-4, что если ограничения–
2. На загородном пикнике две
команды, по два человека в
каждой, играют в прятки. Есть
четыре места, где можно