Автор работы: Пользователь скрыл имя, 03 Декабря 2012 в 21:46, курс лекций
Рассмотрим игру, в которой участвуют два игрока, причем каждый из игроков имеет конечное число стратегий. Обозначим для удобства одного из игроков через А, в другого — через В.
Предположим, что игрок А имеет m стратегий — А1, А2, ..., Аm, а игрок В имеет n стратегий В1, В2, ..., Вn.
Пусть игрок А выбрал стратегию Ai, а игрок В стратегию Вk. Будем считать, что выбор игроками стратегий Ai и Вk однозначно определяет исход игры — выигрыш аik игрока А и выигрыш bik игрока В, причем эти выигрыши связаны равенством
Часть I МАТРИЧНЫЕ ИГРЫ 59
1. Равновесная ситуация 60
2. Смешанные стратегии 65
Основные определения 65
Основная теорема матричных игр 68
Основные свойства оптимальных смешанных стратегий 68
3. Методы решения матричных игр 69
Итерационный метод решения матричных игр 77
Сведение матричной игры к задаче линейного программирования 79
4. Примеры задач, сводимых к матричным играм 81
Несколько слов в заключение 84
6. О классификации игр 85
Часть II ПОЗИЦИОННЫЕ ИГРЫ 86
1. Структура позиционной игры 86
2. Нормализация позиционной игры 88
3. Позиционные игры с полной информацией 97
Несколько слов в заключение 100
3.6 Принятие решений и теория игр. Примеры. 101
3.6.1. Оптимальное решение игры двух лиц с нулевой суммой 102
Упражнения 3.6,а 103
3.6.2. Решение матричных игр в смешанных стратегиях 105
Упражнения 3.6,b 107
Упражнений 3.6,с 110
3.7. Заключение 111
Литература 112
Комплексные задачи 112
B1 |
B2 |
… |
Bn | |
A1 |
a11 |
a12 |
… |
a1n |
A2 |
a21 |
a22 |
… |
a2n |
. . . |
. . . |
. . . |
. . . |
. . . |
Am |
am1 |
am2 |
… |
amn |
Такое представление матричной игры означает, что если игрок А использует стратегию i, а игрок В — стратегию j, то платеж игроку А составляет аij и, следовательно, игроку В — – аij.
Поскольку игры берут свое начало в конфликте интересов, оптимальным решением игры является одна или несколько таких стратегий для каждого из игроков, при этом любое отклонение от данных стратегий не улучшает плату тому или другому игроку. Эти решения могут быть в виде единственной чистой стратегии или нескольких стратегий, которые являются смешанными в соответствии с заданными вероятностями. Рассматриваемые ниже примеры демонстрируют перечисленные случаи.
Пример 3.6-1
Две компании А и В продают два вида лекарств против гриппа; Компания А рекламирует продукцию на радио (A1), телевидении (А2) и в газетах (А3) – Компания В, в дополнение к использованию радио (B1), телевидения (В2) и газет (В3), рассылает также по почте брошюры (B4). В зависимости от умения и интенсивности проведения рекламной кампании, каждая из компаний может привлечь на свою сторону часть клиентов конкурирующей компании. Приведенная ниже матрица характеризует процент клиентов, привлеченных или потерянных компанией А.
B1 |
B2 |
B3 |
B4 |
Минимумы строк | |
A1 |
8 |
–2 |
9 |
–3 |
–3 |
A2 |
6 |
5 |
6 |
8 |
5← Максимин |
A3 |
–2 |
4 |
–9 |
5 |
–9 |
Максимумы столбцов |
8 |
5 |
9 |
8 |
|
Минимакс |
Решение игры основано на обеспечении наилучшего результата из наихудших для каждого игрока. Если компания А выбирает стратегию А1, то, независимо от того, что предпринимает компания В, наихудшим результатом является потеря компанией А 3% рынка в пользу компании В. Это определяется минимумом элементов первой строки матрицы платежей. Аналогично при выборе стратегии А2 наихудшим исходом для компании А является увеличение рынка на 5% за cчет компании В. Наконец, наихудшим исходом при выборе стратегии А3 является потеря компанией А 9% рынка в пользу компании В. Эти результаты содержатся в столбце "Минимумы строк". Чтобы достичь наилучшего результата из наихудших, компания А выбирает стратегию А2, так как она соответствует наибольшему элементу столбца "Минимумы строк".
Рассмотрим теперь стратегии компании В. Так как элементы матрицы являются платежами компании А, критерий наилучшего результата из наихудших для компании В соответствует выбору минимаксного значения. В результате приходим к выводу, что выбором компании В является стратегия В2.
Оптимальным решением игры является выбор стратегий А2 и В2, т.е. обеим компаниям следует проводить рекламу на телевидении. При этом выигрыш будет в пользу компании А, так как ее рынок увеличится на 5%. В этом случае говорят, что цена игры равна 5% и что компании А и В используют стратегии, соответствующие седловой точке.
Решение, соответствующее седловой точке, гарантирует, что ни одной компании нет смысла пытаться выбрать другую стратегию. Действительно, если компания В переходит к другой стратегий (Bl, B3 или В4), то компания А может сохранить свой выбор стратегии А2, что приведет к большей потере рынка компанией В (6% или 8%). По тем же причинам компании А нет резона использовать другую стратегию, ибо если она применит, например, стратегию А3, то компания В может использовать свою стратегию В3 и увеличить свой рынок на 9%. Аналогичные выводы имеют место, если компания А будет использовать стратегию А1.
Оптимальное решение игры, соответствующее седловой точке, не обязательными должно характеризоваться чистыми стратегиями. Вместо этого оптимальное решение может требовать смешивания случайным образом двух или более стратегий, как это сделано в следующем примере.
Пример 3.6-2
Два игрока А и В играют в игру, основанную на подбрасывании монеты. Игроки одновременно и независимо друг от друга выбирают герб (Г) или решку (Р). Если результаты двух подбрасываний монеты совпадают (т.е. ГГ или РР), то игрок А получает один доллар от игрока В. Иначе игрок А платит один доллар игроку В.
Следующая матрица платежей игроку А показывает величины минимальных элементов строк и максимальных элементов столбцов, соответствующих стратегиям обоих игроков.
Максиминная и минимаксная величины (цены) для этой игры равны – 1 доллар и 1 доллар соответственно. Так как эти величины не равны между собой, игра не имеет решения в чистых стратегиях; В частности, если игрок А использует стратегию АГ, игрок В выберет стратегию ВР, чтобы получить от игрока А один доллар. Если это случится, игрок А может перейти к стратегии АР, чтобы изменить исход игры и получить один доллар от игрока В. Постоянное искушение каждого игрока перейти к другой стратегии указывает на то, что решение в виде чистой стратегии неприемлемо. Вместо этого оба игрока должны использовать надлежащую случайную комбинацию своих стратегий. В рассматриваемом примере оптимальное значение цены игры находится где-то между максиминной и минимаксной ценами для этой игры:
максиминная (нижняя) цена ≤ цена игры ≤ минимаксная (верхняя) цена.
Следовательно, в данном случае цена игры должна лежать в интервале [–1,1], измеряемом в долларах.
1. Определите решение,
а)
B1 |
B2 |
B3 |
B4 | |
A1 |
8 |
6 |
2 |
8 |
A2 |
8 |
9 |
4 |
5 |
A3 |
7 |
5 |
3 |
5 |
b)
B1 |
B2 |
B3 |
B4 | |
A1 |
4 |
–4 |
–5 |
6 |
A2 |
–3 |
–4 |
–9 |
–2 |
A3 |
6 |
7 |
–8 |
–9 |
A4 |
7 |
3 |
–9 |
5 |
2. В следующих играх заданы платежи игроку А. Укажите область значений для параметров р и q, при которых пара (2, 2) будет седловой точкой в каждой игре.
а)
B1 |
B2 |
B3 | |
A1 |
1 |
q |
6 |
A2 |
p |
5 |
10 |
A3 |
6 |
2 |
3 |
b)
B1 |
B2 |
B3 | |
A1 |
2 |
4 |
5 |
A2 |
10 |
7 |
q |
A3 |
4 |
p |
6 |
3. Укажите область, которой
а)
B1 |
B2 |
B3 |
B4 | |
A1 |
1 |
9 |
6 |
0 |
A2 |
2 |
3 |
8 |
4 |
A3 |
–5 |
–2 |
10 |
–3 |
A4 |
7 |
4 |
–2 |
–5 |
b)
B1 |
B2 |
B3 |
B4 | |
A1 |
–1 |
9 |
6 |
8 |
A2 |
–2 |
10 |
4 |
6 |
A3 |
5 |
3 |
0 |
7 |
A4 |
7 |
–2 |
8 |
4 |
c)
B1 |
B2 |
B3 | |
A1 |
3 |
6 |
1 |
A2 |
5 |
2 |
3 |
A3 |
4 |
2 |
–5 |
d)
B1 |
B2 |
B3 |
B4 | |
A1 |
3 |
7 |
1 |
3 |
A2 |
4 |
8 |
0 |
–6 |
A3 |
6 |
–9 |
–2 |
4 |
4. Две фирмы производят
два конкурирующих товара. Каждый
товар в настоящее время
а) Сформулируйте задачу в виде игры двух лиц с нулевой суммой и выберите подходящие средства рекламы для каждой фирмы.
b) Укажите интервал значений,
которому принадлежит цена
5. Пусть aij – (i, j)-й элемент платежной матрицы с m стратегиями игрока A и n стратегиями игрока В. Элементы платежной матрицы представляют собой платежи игроку А. Докажите, что
Решение матричных игр в смешанных стратегиях может быть найдено либо графически, либо методами линейного программирования. Графический метод применим для решения игр, в которых хоть один игрок имеет две чистые стратегии. Этот метод интересен в том плане, что графически объясняет понятие седловой точки. Методами линейного программирования может быть решена любая игра двух лиц с нулевой суммой.