Методы и модели игры

Автор работы: Пользователь скрыл имя, 03 Декабря 2012 в 21:46, курс лекций

Описание работы

Рассмотрим игру, в которой участвуют два игрока, причем каждый из игроков имеет конечное число стратегий. Обозначим для удобства одного из игроков через А, в другого — через В.
Предположим, что игрок А имеет m стратегий — А1, А2, ..., Аm, а игрок В имеет n стратегий В1, В2, ..., Вn.
Пусть игрок А выбрал стратегию Ai, а игрок В стратегию Вk. Будем считать, что выбор игроками стратегий Ai и Вk однозначно определяет исход игры — выигрыш аik игрока А и выигрыш bik игрока В, причем эти выигрыши связаны равенством

Содержание работы

Часть I МАТРИЧНЫЕ ИГРЫ 59
1. Равновесная ситуация 60
2. Смешанные стратегии 65
Основные определения 65
Основная теорема матричных игр 68
Основные свойства оптимальных смешанных стратегий 68
3. Методы решения матричных игр 69
Итерационный метод решения матричных игр 77
Сведение матричной игры к задаче линейного программирования 79
4. Примеры задач, сводимых к матричным играм 81
Несколько слов в заключение 84
6. О классификации игр 85
Часть II ПОЗИЦИОННЫЕ ИГРЫ 86
1. Структура позиционной игры 86
2. Нормализация позиционной игры 88
3. Позиционные игры с полной информацией 97
Несколько слов в заключение 100
3.6 Принятие решений и теория игр. Примеры. 101
3.6.1. Оптимальное решение игры двух лиц с нулевой суммой 102
Упражнения 3.6,а 103
3.6.2. Решение матричных игр в смешанных стратегиях 105
Упражнения 3.6,b 107
Упражнений 3.6,с 110
3.7. Заключение 111
Литература 112
Комплексные задачи 112

Файлы: 1 файл

методы и модели игры 32.doc

— 1,021.50 Кб (Скачать файл)

Часть I МАТРИЧНЫЕ ИГРЫ

Рассмотрим игру, в которой участвуют два игрока, причем каждый из игроков имеет конечное число стратегий. Обозначим для удобства одного из игроков через А, в другого — через В.

Предположим, что игрок А имеет m стратегий — А1, А2, ..., Аm, а игрок В имеет n стратегий В1, В2, ..., Вn.

Пусть игрок А выбрал стратегию Ai, а игрок В стратегию Вk. Будем считать, что выбор игроками стратегий Ai и Вk однозначно определяет исход игры — выигрыш аik игрока А и выигрыш bik игрока В, причем эти выигрыши связаны равенством

(отрицательный выигрыш на бытовом  языке обычно называют проигрышем).

Последнее условие показывает, что  в рассматриваемых обстоятельствах  выигрыш одного из игроков равен  выигрышу другого, взятому с противоположным  знаком. Поэтому при анализе такой игры можно рассматривать выигрыши только одного из игроков. Пусть это будут, например, выигрыши игрока А.

Если нам известны значения аik выигрыша при каждой паре стратегий (в каждой ситуации) { Ai, Вk }, i = 1, 2,..., m, k = 1, 2,..., n, то их удобно записывать или в виде прямоугольной таблицы, строки которой соответствуют стратегиям игрока А, а столбцы – стратегиям игрока В:

 

В1

В1

Вn

А1

a11

a11

 

a11

А2

a11

a11

 

a11

         

Аm

am1

a11

 

amn


 

или в виде матрицы

Полученная матрица имеет размер m x n и называется матрицей игры, или платежной матрицей (отсюда и название игры — матричная).

Рассматриваемую игру часто называют игрой m x n или m x n игрой.

Замечание. Матричные игры относятся к разряду так называемых антагонистических игр, то есть игр, в которых интересы игроков прямо противоположны.

Пример 1. Каждый из двух игроков А и В одновременно и независимо друг от друга записывает на листе бумаги любое целое число. Если выписанные числа имеют одинаковую четность, то игрок А получает от игрока В 1 рубль, а если разную, то наоборот – игрок А платит 1 рубль игроку В.

У игрока А две стратегии: А1 – записать четное число и А2 – записать нечетное число. У игрока В такие же две стратегии: В1 – записать четное число и В2 – записать нечетное число. Выбор игроками соответственно стратегий Аi и Вk однозначно определяет исход игры – выигрыш игрока А.

Матрица этой 2x2 игры имеет  следующий вид

(здесь строки соответствуют  стратегиям игрока А, а столбцы — стратегиям игрока В).

 

1. Равновесная  ситуация

Рассмотрим следующий пример.

Пример 2. Два игрока А и В, не глядя друг на друга, кладут на стол по картонному кружку красного (г), зеленого (g) или синего (b) цветов, сравнивают цвета кружков и расплачиваются друг с другом так, как покапано в матрице игры

(напомним, что у этой 3 х 3-матрицы  строки соответствуют стратегиям  игрока А, а столбцы - стратегиям игрока В).

Считая, что эта 3 х 3 игра повторяется  многократно, попробуем определить оптимальные стратегии каждого из игроков.

Начнем с последовательного  анализа стратегий игрока А, не забывая о том, что, выбирая стратегию игрока А, должно принимать в расчет, что его противник В может ответить на нее той из своих стратегий, при которой выигрыш игрока А будет минимальным.

Так, на стратегию А, он ответит стратегией Вr, (минимальный выигрыш равен -2, что на самом деле означает проигрыш игрока А, равный 2), на стратегию Аg – cстратегией  Bg или Вb (минимальный выигрыш игрока А равен 1), а на стратегию Ab – стратегией Bg (минимальный выигрыш игрока А равен -3).

Запишем эти минимальные выигрыши в правом столбце таблицы:

 

Br

Bg

Bb

 

Ar

-2

2

-1

-2

Ag

2

1

1

1

Ab

3

-3

1

-3


maxmin. Неудивительно, что игрок А останавливает свой выбор на стратегии Аg, при которой его минимальный выигрыш максимален (из трех чисел -2, 1 и -3 максимальным является 1):

 

Br

Bg

Bb

 

Ar

-2

2

-1

-2

Ag

2

1

1

1

Ab

3

-3

1

-3


 

maxmin = 1.


Если игрок А будет придерживаться этой стратегии, то ему гарантирован выигрыш, не меньший 1, при любом поведении противника в игре.

Аналогичные рассуждения можно  провести и за игрока В. Так как игрок В заинтересован в том, чтобы обратить выигрыш игрока А в минимум, то ему нужно проанализировать каждую свою стратегию с точки зрения максимального выигрыша игрока А.

Выбирая свою стратегию, игрок В должен учитывать, что при этом стратегией его противника А может оказаться та, при которой выигрыш игрока А будет максимальным. Так, на стратегию Вr он ответит стратегией Ab (максимальный выигрыш игрока А равен 3), на стратегию Bg – стратегией Ar (максимальный выигрыш игрока А равен 2), а на стратегию Bb – стратегией Аg или Ab (максимальный выигрыш игрока А равен 1). Эти максимальные выигрыши записаны в нижней строке таблицы

 

Br

Bg

Bb

 

Ar

-2

2

-1

-2

Ag

2

1

1

1

Ab

3

-3

1

-3

 

3

2

1

 

minmax. Неудивительно, вели игрок В остановит свой выбор на стратегии Bb, при которой максимальный выигрыш игрока А минимален (из трех чисел 3, 2 и 1 минимальным является 1):

 

Br

Bg

Bb

 

Ar

-2

2

-1

-2

Ag

2

1

1

1

Ab

3

-3

1

-3

 

3

2

1

 

 

minmax = 1.


Если игрок В будет придерживаться этой стратегии, то при любом поведении противника он проиграет не больше 1.

В рассматриваемой игре числа maxmin и minmax совпали:

maxmin = minmax = 1

(соответствующие элементы в  таблице

 

Br

Bg

Bb

Ar

-2

2

-1

Ag

2

1

1

Ab

3

-3

1


выделены жирным шрифтом).

 

Выделенные стратегии Ag и Bb являются оптимальными стратегиями игроков А и В,

Ag = Aopt, Bb = Bopt


в следующем смысле:

 

при многократном повторении игры отказ от выбранной  стратегии любым из игроков уменьшает его шансы на выигрыш (увеличивает шансы на проигрыш).

 

В самом деле, если игрок А будет придерживаться не стратегии Aopt, а выберет иную стратегию, например, Аr, то вряд ли стоит рассчитывать на то, что игрок В этого не заметит. Конечно, заметит и не преминет воспользоваться своим наблюдением. Ясно, что в этом случае он отдаст предпочтение стратегии Вr. А на выбор Ab игрок В ответит, например, так – Bg. В результате отказа от стратегии Ag, выигрыш игрока А уменьшится.

Если же от стратегии Bopt отказывается игрок В, выбирая, например, стратегию Вr, то игрок А 
может ответить на это стратегией Ab и, тем самым, увеличить свой выигрыш. В случае стратегии Bg ответ игрока А – Аr .

Тем самым, ситуация { Ag, Вb } оказывается равновесной.

 

Еще раз подчеркнем, что элементами матрицы игры являются числа, описывающие выигрыш игрока А. Более точно, выигрыш соответствует положительному элементу платежной матрицы, а отрицательный указывает на проигрыш игрока А.

Матрица выплат игроку В получается из матрицы игры заменой каждого ее элемента на противоположный по знаку.

Рассмотрим теперь произвольную матричную  игру

 

(строки заданной m x n-матрицы соответствуют стратегиям игрока А, а столбцы -  стратегиям игрока В) и опишем общий алгоритм, посредством которого можно определить, есть ли в этой игре ситуация равновесия или ее нет.

 

В теории игр  предполагается, что оба игрока действуют  разумно, то естъ стремятся к получению  максимального выигрыша, считая, что соперник действует наилучшим (для себя) образом.

 

Действия игрока А

1-й шаг. В каждой строке матрицы А ищется минимальный элемент

, i = 1, 2, … , m.

Полученные числа

α1, α2, … , αm

приписываются к заданной таблице  в виде правого добавочного столбца

a11

a12

a1n

α1

a21

a22

a2n

α2

am1

am2

amn

αm


 

Пояснение. Выбирая стратегию Аi, игрок А вправе рассчитывать на то, что в результате разумных действий противника (игрока В) он выиграет не меньше чем аi.

2-й шаг. Среди чисел

α1, α2, … , αm

выбирается максимальное число

или, подробнее,

Специально отметим, что  выбранное число α является одним из элементов заданной матрицы А.

Пояснение. Действуя наиболее осторожно и рассчитывая на наиболее разумное поведение противника, игрок А должен остановиться на той стратегии Ai, для которой число аi, является максимальным.

Если игрок А будет придерживаться стратегии, Выбранной описанным выше способом, то при любом поведении игрока В игроку А гарантирован выигрыш, не меньший α.

Число α называется нижней ценой игры.

Принцип построения стратегии игрока А, основанный на максимизации минимальных выигрышей, называется принципом максимина, а выбираемая в соответствии с этим принципом стратегия Аi0 — максиминной стратегией игрока А.

 

Действия игрока В

1 шаг. В каждом столбце матрицы А ищется максимальный элемент

, k = 1, 2, … , n.

Полученные числа

β1, β2, … , βn

приписываются к заданной таблице  в виде нижней добавочной строки

a11

a12

a1n

α1

a11

a22

a2n

α2

a11

am2

amn

αm

β1

β2

βn

 

Информация о работе Методы и модели игры