Автор работы: Пользователь скрыл имя, 20 Ноября 2013 в 10:45, задача
Работа содержит решение задач по дисциплине "Теория игр"
а) Решить игру с природой по критерию Гурвица, α=0,4;
б) Решить игру с природой по критерию Лапласа;
в) Решить игру с природой по критерию Сэвиджа;
г) Решить игру с природой по критерию Вальда.
1)
а) Решить игру с природой по критерию Гурвица, α=0,4;
б) Решить игру с природой по критерию Лапласа;
в) Решить игру с природой по критерию Сэвиджа;
г) Решить игру с природой по критерию Вальда.
а) Согласно критерию Гурвица, гипотеза о поведении среды состоит в том, что наихудший вариант реализуется с вероятностью , а наилучший – с вероятностью . Тогда оценкой стратегии является число , а оптимальная стратегия находится из условия
Таким образом, можно записать:
Тогда оптимальная стратегия
б)
Таким образом, можно записать:
Тогда оптимальная стратегия
В) Критерий Сэвиджа.
Находим матрицу рисков.
Риск – мера несоответствия между разными возможными результатами принятия определенных стратегий. Максимальный выигрыш в j-м столбце bj = max(aij) характеризует благоприятность состояния природы.
1. Рассчитываем 1-й столбец матрицы рисков.
r11 = 9 - 9 = 0; r21 = 9 - 2 = 7; r31 = 9 - 1 = 8;
2. Рассчитываем 2-й столбец матрицы рисков.
r12 = 8 - (-3) = 11; r22 = 8 - 5 = 3; r32 = 8 - 8 = 0;
3. Рассчитываем 3-й столбец матрицы рисков.
r13 = 9 - 4 = 5; r23 = 9 - 9 = 0; r33 = 9 - 6 = 3;
Результаты вычислений оформим в виде таблицы.
Ai |
П1 |
П2 |
П3 |
max(aij) |
A1 |
0 |
11 |
5 |
11 |
A2 |
7 |
3 |
0 |
7 |
A3 |
8 |
0 |
3 |
8 |
Выбираем из (11; 7; 8) минимальный элемент min=7
Вывод: выбираем стратегию N=2.
г) Критерий Вальда.
По критерию Вальда за оптимальную принимается чистая стратегия, которая в наихудших условиях гарантирует максимальный выигрыш, т.е.
a = max(min aij)
Критерий Вальда ориентирует статистику на самые неблагоприятные состояния природы, т.е. этот критерий выражает пессимистическую оценку ситуации.
Ai |
П1 |
П2 |
П3 |
min(aij) |
A1 |
9 |
-3 |
4 |
-3 |
A2 |
2 |
5 |
9 |
2 |
A3 |
1 |
8 |
6 |
1 |
Выбираем из (-3; 2; 1) максимальный элемент max=2
Вывод: выбираем стратегию N=2.
В1 |
В2 |
В3 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 | ||||||
А1 |
1 |
0 |
8 |
* |
0 |
1 |
2 |
3 |
3 |
11 |
19 |
27 |
35* |
35 |
43* |
43 |
43 |
43 |
43 |
51 |
59 |
67* |
67* |
67 | ||||
А2 |
6 |
4 |
2 |
4 |
10* |
16* |
22* |
26* |
28* |
30* |
32* |
34 |
38* |
40 |
44* |
48* |
52* |
56* |
58* |
60* |
62 |
66 |
70* | |||||
А3 |
0 |
5 |
3 |
5* |
5 |
5 |
5 |
10 |
13 |
16 |
19 |
22 |
27 |
30 |
35 |
40 |
45 |
50 |
53 |
56 |
59 |
64 |
69 | |||||
1 |
0* |
8 | ||||||||||||||||||||||||||
1* |
5 |
11 | ||||||||||||||||||||||||||
7* |
9 |
13 | ||||||||||||||||||||||||||
13* |
13 |
15 | ||||||||||||||||||||||||||
19 |
17* |
17 | ||||||||||||||||||||||||||
25 |
21 |
19* | ||||||||||||||||||||||||||
31 |
25 |
21* | ||||||||||||||||||||||||||
37 |
29 |
23* | ||||||||||||||||||||||||||
42 |
33 |
25* | ||||||||||||||||||||||||||
43 |
33* |
33 | ||||||||||||||||||||||||||
49 |
37 |
35* | ||||||||||||||||||||||||||
50 |
37* |
43 | ||||||||||||||||||||||||||
56 |
41* |
45 | ||||||||||||||||||||||||||
62 |
45* |
47 | ||||||||||||||||||||||||||
68 |
49* |
49 | ||||||||||||||||||||||||||
74 |
53 |
51* | ||||||||||||||||||||||||||
80 |
57 |
53* | ||||||||||||||||||||||||||
86 |
61 |
55* | ||||||||||||||||||||||||||
87 |
61* |
63 | ||||||||||||||||||||||||||
88 |
61* |
71 |
В рассматриваемой задаче сделано 20 шагов. За эти двадцать шагов игрок А применил свою первую стратегию (количество звездочек в суммарных выигрышах, соответствующей первой стратегии) 4 раза; вторую - 15 раз; третью - 1 раз. Игрок В применил стратегию В1 три раза; вторую - 9 раз; третью - 8 раз. Следовательно, приближенные оценки оптимальных стратегий, полученные за 20 итераций, равны:
Приближенную
цену игры определим как
Запишем соответствующую
задачу математического
Шаг 0 |
|||||||||
Базис |
БП |
x 1 |
x 2 |
x 3 |
x 4 |
x 5 |
x 6 |
x 7 |
x 8 |
x5 |
1 |
1 |
2 |
3 |
0 |
1 |
0 |
0 |
0 |
x6 |
1 |
2 |
8 |
6 |
1 |
0 |
1 |
0 |
0 |
x7 |
1 |
5 |
7 |
4 |
6 |
0 |
0 |
1 |
0 |
x8 |
1 |
3 |
2 |
1 |
6 |
0 |
0 |
0 |
1 |
ИС |
0 |
-1 |
-1 |
-1 |
-1 |
0 |
0 |
0 |
0 |
Шаг 1 |
|||||||||
Базис |
БП |
x 1 |
x 2 |
x 3 |
x 4 |
x 5 |
x 6 |
x 7 |
x 8 |
x5 |
4/5 |
0 |
3/5 |
11/5 |
-6/5 |
1 |
0 |
-1/5 |
0 |
x6 |
3/5 |
0 |
26/5 |
22/5 |
-7/5 |
0 |
1 |
-2/5 |
0 |
x1 |
1/5 |
1 |
7/5 |
4/5 |
6/5 |
0 |
0 |
1/5 |
0 |
x8 |
2/5 |
0 |
-11/5 |
-7/5 |
12/5 |
0 |
0 |
-3/5 |
1 |
ИС |
1/5 |
0 |
2/5 |
-1/5 |
1/5 |
0 |
0 |
1/5 |
0 |
Шаг 2 |
|||||||||
Базис |
БП |
x 1 |
x 2 |
x 3 |
x 4 |
x 5 |
x 6 |
x 7 |
x 8 |
x5 |
1/2 |
0 |
-2 |
0 |
-1/2 |
1 |
-1/2 |
0 |
0 |
x3 |
3/22 |
0 |
13/11 |
1 |
-7/22 |
0 |
5/22 |
-1/11 |
0 |
x1 |
1/11 |
1 |
5/11 |
0 |
16/11 |
0 |
-2/11 |
3/11 |
0 |
x8 |
13/22 |
0 |
-6/11 |
0 |
43/22 |
0 |
7/22 |
-8/11 |
1 |
ИС |
5/22 |
0 |
7/11 |
0 |
3/22 |
0 |
1/22 |
2/11 |
0 |
Таким образом, цена игры равна 22/5, стратегии игроков:
4) Решить игру графически.
9 5
5- нижняя цена игры
5- верхняя цена игры
5 = 5
Данная платежная матрица имеет седловую точку – элемент а22, который является минимальным в своей строке и максимальным в своем столбце. Поэтому цена игры равна 5, а стратегии игроков p2=1, q2=1, все остальные компоненты равны нулю.
α – нижняя цена игры
β – верхняя цена игры
min |
max | ||||
1 |
-3 |
4 |
1 |
||
2 |
5 |
9 |
2 |
2 | |
0 |
-5 |
6 |
-5 |
||
1 |
3 |
2 |
1 |
||
max |
2 |
5 |
9 |
||
min |
2 |
Данная платежная матрица имеет седловую точку – элемент а21, который является минимальным в своей строке и максимальным в своем столбце. Поэтому цена игры (и верхняя, и нижняя) равна 2, а стратегии игроков p2=1, q1=1, все остальные компоненты равны нулю.