Методы и модели игры

Автор работы: Пользователь скрыл имя, 03 Декабря 2012 в 21:46, курс лекций

Описание работы

Рассмотрим игру, в которой участвуют два игрока, причем каждый из игроков имеет конечное число стратегий. Обозначим для удобства одного из игроков через А, в другого — через В.
Предположим, что игрок А имеет m стратегий — А1, А2, ..., Аm, а игрок В имеет n стратегий В1, В2, ..., Вn.
Пусть игрок А выбрал стратегию Ai, а игрок В стратегию Вk. Будем считать, что выбор игроками стратегий Ai и Вk однозначно определяет исход игры — выигрыш аik игрока А и выигрыш bik игрока В, причем эти выигрыши связаны равенством

Содержание работы

Часть I МАТРИЧНЫЕ ИГРЫ 59
1. Равновесная ситуация 60
2. Смешанные стратегии 65
Основные определения 65
Основная теорема матричных игр 68
Основные свойства оптимальных смешанных стратегий 68
3. Методы решения матричных игр 69
Итерационный метод решения матричных игр 77
Сведение матричной игры к задаче линейного программирования 79
4. Примеры задач, сводимых к матричным играм 81
Несколько слов в заключение 84
6. О классификации игр 85
Часть II ПОЗИЦИОННЫЕ ИГРЫ 86
1. Структура позиционной игры 86
2. Нормализация позиционной игры 88
3. Позиционные игры с полной информацией 97
Несколько слов в заключение 100
3.6 Принятие решений и теория игр. Примеры. 101
3.6.1. Оптимальное решение игры двух лиц с нулевой суммой 102
Упражнения 3.6,а 103
3.6.2. Решение матричных игр в смешанных стратегиях 105
Упражнения 3.6,b 107
Упражнений 3.6,с 110
3.7. Заключение 111
Литература 112
Комплексные задачи 112

Файлы: 1 файл

методы и модели игры 32.doc

— 1,021.50 Кб (Скачать файл)

или

.

 

Пример 16.

1-й ход делает игрок А: он выбирает число х из множества двух чисел {1, 2}.

2-й ход делает игрок В: не зная о выборе игрока А на 1-м ходе, он выбирает число у из множества двух чисел {1, 2}.

3-й ход делает игрок А: он выбирает число z из множества двух чисел {1, 2}, не зная ни значения х, ни значения у.

После этого игроки расплачиваются по правилу, указанному в примере 15.

Графическое представление этой игры показано на рис. 6.

Рис. 6

 

Ясно, что у игрока А те же четыре стратегии, что и в примере 15:

A1 – [1, 1], A2 – [1, 2], A3 – [2, 1], A4 – [2, 2].

У игрока В всего две стратегии:

B1 – выбрать y = 1, B2 – выбрать y = 2

В этом случае (весьма слабой информированности  игроков) таблица выигрышей игрока A и соответствующая матрица строятся совсем просто. Имеем

   

В1

В2

   

y = 1

y = 2

А1

(1, 1)

W(1, 1, 1)

W(1, 1, 1)

А2

(1, 2)

W(1, 1, 2)

W(1, 2, 2)

А3

(2, 1)

W(2, 1, 1)

W(2, 2, 1)

А4

(2, 2)

W(2, 1, 2)

W(2, 2, 2)


Оптимальные смешанные стратегии  игроков и цена игры соответственно равны:

В следующем примере информационные множества выглядят немного иначе.

Пример 17.

1-й ход делает игрок А: он выбирает число х из множества двух чисел {1, 2}.

2-й ход делает игрок В: не зная о выборе игрока А на 1-м ходе, он выбирает число у из множества двух чисел {1, 2}.

3-й ход делает игрок А: он выбирает число z из множества двух чисел {1, 2}, зная выбор у игрока В на 2-м ходе, но не помня собственного выбора х на 1-м ходе.

После этого игроки расплачиваются по правилу, указанному в примере 15.

Графическое представление этой игры показано на рис. 7.

Рис. 7

 

Поскольку игроку В неизвестен выбор игрока А на 1-м ходе, то, выполняя свой ход, он не знает, в какой именно из двух возможных позиций он находится. Поэтому у игрока В всего две стратегии:

B1 – выбрать y = 1, B2 – выбрать y = 2

При описании стратегий игрока А нужно исходит из того, что к 3-му ходу игрок А утратил сведения о собственном выборе на 1-м ходе, но ему известен выбор игрока В на 2-м ходе. Поэтому выбор числа z игроку А следует связать с известным ему к 3-му xоду значением у. Удобнее всего это сделать по аналогии с расчетом стратегий игрока В в примерах 13 и 15, т. е. при помощи упорядоченной пары

[z1, z2]

Здесь z1 (z1 = 1, 2) — альтернатива, выбираемая игроком А при условии, что игрок В выбрал первую альтернативу, у = 1, a z2 (z2 — 1, 2) — альтернатива, выбираемая игроком А при условии, что игрок В выбрал вторую альтернативу, у = 2.

Чистую стратегию игрока А в данной игре можно записать так

(x, [z1, z2]).

Здесь х (х = 1, 2) — альтернатива, которую игрок А выбирает на 1-м ходе, z1 (z1 = 1, 2) — альтернатива, которую игрок А выбирает на 3-м ходе, если на 2-м ходе игрок В выбрал выбрал первую альтернативу (у = 1) и z2 (z2 — 1, 2) — альтернатива, которую игрок А выбирает на 3-м ходе, если на 2-м ходе игрок В выбрал вторую альтернативу (у = 2).

Например, выбор игроком А стратегии (2, [2, 1]) означает, что на 1-м ходе игрок А выбирает x = 2, а на 3-м z = 2, если игрок В выбрал у = 1, и z = 1, если игрок В выбрал у = 2.

Тем самым, у игрока А восемь чистых стратегий:

A1 — (1, [1, 1]),  A2 — (1, [1, 2]), A3 — (1, [2, 1]), A4 — (1, [2, 2]),

A5 — (2, [1, 1]),  A6 — (2, [1, 2]), A7 — (2, [2, 1]), A8 — (2, [2, 2]),

Покажем теперь, как в зависимости от применяемых стратегий определяются элементы таблицы выигрышей игрока А.

Пусть, например, игрок А выбрал стратегию A3 — (1, [2, 1]), а игрок В — стратегию В2 — (2). Тогда x = 1, у = 2, а из [2, 1] вытекает, что z = 1. Отсюда

W(x, y, z) = W(1, 2, 1) = 1.

По этой же схеме вычисляются  и остальные элементы таблицы.

В результате получаем

 

 

   

В1

В2

   

(1)

(2)

А1

(1, [1, 1])

W(1, 1, 1)

W(1, 2, 1)

А2

(1, [1, 2])

W(1, 1, 1)

W(1, 2, 2)

А3

(1, [2, 1])

W(1, 1, 2)

W(1, 2, 1)

А4

(1, [2, 2])

W(1, 1, 2)

W(1, 2, 2)

А5

(2, [1, 1])

W(2, 1, 1)

W(2, 2, 1)

А6

(2, [1, 2])

W(2, 1, 1)

W(2, 2, 2)

А7

(2, [2, 1])

W(2, 1, 2)

W(2, 2, 1)

А8

(2, [2, 2])

W(2, 1, 2)

W(2, 2, 2)


 Оптимальные смешанны* стратегии  игроков и цена игры соответственно  равны:

Рассмотрим позиционную игру со случайным ходом.

Пример 18.

1-й ход производится случайно: игрок О выбирает число х, равное 1, с вероятностью 0,5 и равное 2 с такой же вероятностью.

2-й ход делает игрок А: он выбирает число у из множества двух чисел {1, 2}, не зная результатов случайного выбора на 1-м ходе.

3-й ход делает игрок В: он выбирает число z из множества двух чисел {1, 2}, зная о том, какое именно число х случайно выбрано игроком О на 1-м ходе и не зная выбора у игрока А на 2-м ходе.

После этого игроки расплачиваются, используя функцию W(x, y, z), ту же. что и в предыдущих примерах.

Графическое представление этой игры показано на рис.8.

Рис. 8

Опишем стратегии игроков

Поскольку игроку А исход случайного испытания неизвестен, то он имеет всего две стратегии:

А1 – (1), А2 – (2),

При построении своих стратегий  игроку В естественно воспользоваться имеющейся у него информацией о результате 1-го хода. Это позволит ему описать свою стратегию упорядоченной парой

[z1, z2].

Здесь z1 (z1 = 1, 2) — альтернатива, выбираемая игроком В при условии, что х = 1, a z2 (z2 = 1, 2) — альтернатива, выбираемая игроком В при условии, что х = 2. Тем самым, у игрока В четыре стратегии:

В1 — [1, 1], В2 — [1, 2], В3 — [2, 1], В4 — [2, 2].

Покажем теперь, как определяются элементы таблицы выигрышей игрока А.

Пусть, например, игрок А выбрал стратегию А1 — (1), а игрок В — стратегию В3 — [2, 1].

Различаются два случая

1) х = 1       и      2) х = 2.

Если х = 1, то стратегия В3 указывает игроку В3 его Выборг z = 2. А так как у = 1, то в результате имеем

W(x, y, z) = W(1, 1, 2) = 4.

Если х = 2, то стратегия В3 указывает игроку В его выбор z = 1. А так как у = 1, то в результате

W(x, y, z) = W(2, 1, 1) = 3.

Поскольку первая и вторая альтернативы на 1-м ходе выбираются с вероятностями 0,5 и 0,5, то и вышеуказанные выигрыши появляются с теми же вероятностями и, следовательно, средний выигрыш игрока А при этих стратегиях определяется так

4 x 0,5 + 3 x 0,5 = 3,5.

Аналогичным образом рассчитывая  остальные средние выигрыши, получаем при х = 1

   

В1

В2

В3

В4

   

[1, 1]

[1, 2]

[2, 1]

[2, 2]

А1

(1)

W(1, 1, 1)

W(1, 1, 1)

W(1, 1, 2)

W(1, 1, 2)

А2

(2)

W(1, 2, 1)

W(1, 2, 1)

W(1, 2, 2)

W(1, 2, 2)


или

,

при х = 2

   

В1

В2

В3

В4

   

[1, 1]

[1, 2]

[2, 1]

[2, 2]

А1

(1)

W(2, 1, 1)

W(2, 1, 1)

W(2, 1, 2)

W(2, 1, 2)

А2

(2)

W(2, 2, 1)

W(2, 2, 2)

W(2, 2, 2)

W(2, 1, 1)


или

.

Искомая матрица игры имеет следующий  вид

.

Наконец, рассмотрим пример позиционной  игры со случайным разыгрыванием права первого хода.

 

Пример 19.

1-й ход делает игрок О, выбирая число х, равное 1 с вероятностью 2/3 и равное 2 с вероятностью 1/3.

Если х = 1, то на 2-м ходе игрок А выбирает число у из множества двух чисел {1, 2}, зная результат случайного выбора на 1-м ходе, а на 3-й ходе игрок В выбирает число z из множества двух чисел {1, 2}, зная х, но не зная у.

Если x = 2, то на 2-м ходе игрок В выбирает число у из множества двух чисел {1, 2}, зная результат случайного выбора на 1-м ходе, а на 3-м ходе игрок А выбирает число z из множества двух чисел {1, 2}, зная х, но не зная у.

После этого игроки расплачиваются, используя функцию W(x, y, z), ту же, что и в предыдущих примерах.

Графическое представление этой игры показано на рис. 9.

Рис. 9

 

Чистую стратегию игрока А в данной игре можно описать упорядоченной парой

где у (у = 1, 2) — выбор игрока А на 2-м ходе, если на 1-м ходе выбрано х = 1, а z (z = 1, 2) — выбор игрока А на 3-м ходе, если на 1-м ходе выбрано х = 2.

Например, стратегия |1, 2| означает, что на 2-м хода игрок А выбирает у = 1, а на 3-м ходе — z = 2.

Тем самым, у игрока А четыре стратегии:

А1 — |1, 1|, А 2 — |1, 2|, А 3 — |2, 1|, А 4 — |2, 2|.

У игрока В те же четыре стратегии:

В1 — |1, 1|, В2 — |1, 2|, В3 — |2, 1|, В4 — |2, 2|.

Покажем теперь, как находятся элементы матрицы выигрышей игрока А.

Пусть, например, игрок А применяет стратегию А2 — |1, 2|, а игрок В — стратегию В3 — |2, 1|.

Различаются два случая

1) х = 1       и      2) х = 2.

По условию при х = 1 игрок А имеет возможность сделать только 2-й ход (выбрать у), а игрок В — только 3-й (выбрать 2). При х = 2 их возможности меняются местами: игроку В предоставлено право 2-го хода (выбрать у), а игроку А — 3-го (выбрать z). .

Если х = 1, то стратегия А2 указывает игроку А при 2-м ходе взять у = 1, а стратегия В3 указывает игроку В при 3-м ходе взять z = 1. В результате

W(x, y, z) = W(1, 1, 1) = -2.

Если х = 2, то стратегия B3 указывает игроку В при 2-м ходе взять у = 2, а стратегия А2 указывает игроку А при 3-м ходе взять z = 2. В результате

W(x, y, z) = W(2, 2, 2) = 5.

Поскольку первая и вторая альтернативы на 1-м ходе выбираются соответственно с вероятностями 2/3 и 1/3, то и найденные  выигрыши появляются с теми же вероятностями. Следовательно, математическое ожидание выигрыша игрока А при таких стратегиях рассчитывается так

.

Итак,

при х = 1

   

В1

В2

В3

В4

   

|1, 1|

|1, 2|

|2, 1|

|2, 2|

А1

|1, 1|

W(1, 1, 1)

W(1, 1, 2)

W(1, 1, 1)

W(1, 1, 2)

А2

|1, 2|

W(1, 1, 1)

W(1, 1, 2)

W(1, 1, 1)

W(1, 1, 2)

А3

|2, 1|

W(1, 2, 1)

W(1, 2, 2)

W(1, 2, 1)

W(1, 2, 2)

А4

|2, 2|

W(1, 2, 1)

W(1, 2, 2)

W(1, 2, 1)

W(1, 2, 2)


или

,

при х = 2

 

   

В1

В2

В3

В4

   

|1, 1|

|1, 2|

|2, 1|

|2, 2|

А1

|1, 1|

W(2, 1, 1)

W(2, 1, 1)

W(2, 2, 1)

W(2, 2, 1)

А2

|1, 2|

W(2, 1, 2)

W(2, 1, 2)

W(2, 2, 2)

W(2, 2, 2)

А3

|2, 1|

W(2, 1, 1)

W(2, 1, 1)

W(2, 2, 1)

W(2, 2, 1)

А4

|2, 2|

W(2, 1, 2)

W(2, 1, 2)

W(2, 2, 2)

W(2, 2, 2)

Информация о работе Методы и модели игры