Решение матричных игр в чистых стратегиях

Автор работы: Пользователь скрыл имя, 28 Марта 2013 в 21:38, курсовая работа

Описание работы

Определение. "Игра (в математике) - это идеализированная математическая модель коллективного поведения: несколько игроков влияют на исход игры, причем их интересы различны". [7].
Регулярное действие, выполняемое игроком во время игры, называется ходом. Совокупность ходов игрока, совершаемых им для достижения цели игры, называется стратегией.

Файлы: 1 файл

игровые модели в экономике.doc

— 451.00 Кб (Скачать файл)

 

1. Существует ли в  данной задаче ситуация равновесия  при выборе технологий производства продукции обоими предприятиями?

2. Существуют ли технологии, которые предприятия заведомо  не будут выбирать вследствие невыгодности?

3. Сколько продукции  будет реализовано в ситуации  равновесия? Какое предприятие окажется  в выигрышном положении? Дайте  краткую экономическую интерпретацию  результатов решения задачи.

Решение задачи необходимо провести с помощью программы, разработанной при выполнении практической части занятий 1 и 2.

 

Контрольные вопросы к теме 1


 

1. Дайте определение  игры.

2. Дайте определение  хода и стратегии.

3. По каким принципам  производится классификация игр?

4. Как подразделяются игры по числу игроков?

5. Как подразделяются  игры в зависимости от количества  стратегий?

6. Как подразделяются  игры по характеру взаимодействия  между игроками?

7. Как подразделяются  игры по виду выигрышей?

8. Как подразделяются  игры по виду функции выигрышей?

9. Как записать игру  с нулевой суммой в виде  платёжной матрицы?

10. Что такое нижняя  и верхняя цена игры?

11. Что такое оптимальная  чистая стратегия? При каких  условиях существует оптимальная  чистая стратегия?

12. Как уменьшить размерность  платёжной матрицы?

13. Приведите примеры  решения матричных игр в задачах  реальной экономики.

Тема 2 Смешанные стратегии в  матричных играх

Занятие 4

 

 

Теоретическая часть


Понятие о матричных играх со смешанным расширением

 

Исследование в матричных  играх начинается с нахождения её чистой цены. Если матричная игра имеет решение в чистых стратегиях, то нахождением чистой цены заканчивается исследование игры. Если же в игре нет решения в чистых стратегиях, то можно найти нижнюю и верхнюю цены этой игры, которые указывают, что игрок 1 не должен надеяться на выигрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры. Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии. Этот результат достигается путём применения чистых стратегий случайно, с определённой вероятностью.

Определение. Смешанной стратегией игрока называется полный набор чистых стратегий, применённых в соответствии с установленным распределением вероятностей. Матричная игра, решаемая с использованием смешанных стратегий, называется игрой со смешанным расширением.

Стратегии, применённые  с вероятностью, отличной от нуля, называются активными стратегиями.

Доказано [1, 2, 4, 7, 8, 11],  что для всех игр со смешанным  расширением существует оптимальная смешанная стратегия, значение выигрыша при выборе которой находится в интервале между нижней и верхней ценой игры:

Vн  £ V £ Vв .

При этом условии величина V называется ценой игры.

Кроме того, доказано, что, если один из игроков придерживается своей оптимальной смешанной  стратегии, то выигрыш остаётся неизменным и равным цене игры V, независимо от того, каких стратегий придерживается другой игрок, если только он не выходит за пределы своих активных стратегий. Поэтому, для достижения наибольшего гарантированного выигрыша второму игроку также необходимо придерживаться своей оптимальной смешанной стратегии.

Решение матричных игр со смешанным  расширением методами линейного программирования

 

Решение матричной игры со смешанным расширением – это  определение оптимальных смешанных стратегий,  то есть нахождение таких значений вероятностей выбора чистых стратегий для обоих игроков, при которых они достигают наибольшего выигрыша.

Для матричной игры, платёжная  матрица которой показана на рис. 1.1,  Vн ¹ Vв , определим такие значения вероятностей выбора стратегий для игрока 1 (p1, p2 ,…, pm) и для игрока 2 (q1, q2 ,…, qn), при которых игроки достигали бы своего максимально гарантированного выигрыша.

Если один из игроков  придерживается своей оптимальной  стратегии, то, по условию задачи, его выигрыш не может быть меньше цены игры V. Поэтому данная задача может быть представлена для игроков в виде следующих систем линейных неравенств:

Для первого игрока:


 

Для второго игрока:

Чтобы определить значение V, разделим обе части каждого из уравнений на V. Величину pi/V обозначим через xi, а qj/V – через yj.

Для игрока 1 получим следующую  систему неравенств, из которой найдём значение 1/v:

Для игрока 1 необходимо найти максимальную цену игры (V). Следовательно,  значение 1/V должно стремиться к минимуму.

Целевая функция задачи будет иметь следующий вид:

min Z = min 1/V = min (x1 + x2 + … + xm)

Для игрока 2 получим следующую  систему неравенств, из которой найдём значение 1/v:


Для игрока 2 необходимо найти минимальную  цену игры (V). Следовательно,  значение 1/V должно стремиться к максимуму.

Целевая функция задачи будет иметь  следующий вид:

max Z = max 1/V = max (y1 + y2 + … + yn)

Все переменные в данных системах линейных неравенств должны быть неотрицательными: xi = pi/V, а yi = qj/V. Значения pi  и qj не могут быть отрицательными, так как являются значениями вероятностей выбора стратегий игроков. Поэтому необходимо, чтобы значение цены игры V не было отрицательным. Цена игры вычисляется на основе коэффициентов выигрышей платёжной матрицы. Поэтому, для того, чтобы гарантировать условие неотрицательности для всех переменных, необходимо, чтобы все коэффициенты матрицы были неотрицательными. Этого можно добиться, прибавив перед началом решения задачи к каждому коэффициенту матрицы число K, соответствующее модулю наименьшего отрицательного коэффициента матрицы. Тогда  в ходе решения задачи будет определена не цена игры, а величина V* = V + K.

Для решения задач  линейного программирования используется симплекс-метод.  [1, 5].

В результате решения  определяются значения целевых функций (для обоих игроков эти значения совпадают), а также значения переменных xi и yj .

Величина V* определяется по формуле: V* = 1/z

Значения вероятностей выбора стратегий определяются: для  игрока 1: Pi = xi×V*:  для игрока 2: qi = yi×V*.

Для определения цены игры  V из величины V* необходимо вычесть число K.

 

 

Практическая часть


 

Задание 4.1

 

В матрице:

 

B1

B2

A1

1

-3

A2

-2

4


определить оптимальные смешанные  стратегии для обоих игроков  и цену игры.

 

Задание 4.2

 

Усовершенствуйте программу, разработанную при выполнении задания 2.2 так, чтобы она обеспечивала формулировку задач линейного программирования для каждого игрока в матричных играх со смешанным расширением. Системы линейных неравенств и целевые функции задач должны быть выведены на экран компьютера или в файл в виде текста.

Занятие 5

 

 

Теоретическая часть


Пример решения матричной игры  со смешанным расширением

 

Рассмотрим пример решения  матричной игры со смешанным расширением.  Платёжную матрицу игры составим на основе исходных данных задачи, решённой при выполнении занятия 3, заменив лишь значения долей продукции предприятия 1, приобретаемой населением в зависимости от соотношений цен (табл. 2.1).

 

Таблица 2.1.

Доля продукции предприятия 1, приобретаемой населением в зависимости от соотношения цен на продукцию

Цена реализации 1 ед. продукции, д.е.

Доля продукции предприятия 1, купленной населением

Предп. 1

Предп. 2

10

10

0,31

10

6

0,33

10

2

0,18

6

10

0,7

6

6

0,3

6

2

0,2

2

10

0,9

2

6

0,85

2

2

0,69


 

Применив к исходным данным задачи формулу (1) определения  разницы прибыли от производства продукции (занятие 3), получим следующую платёжную матрицу (рис. 2.1)

 

 

B1

B2

B3

minj

A1

0,17

0,62

0,24

0.17

A2

3

-1,5

-0,8

-1.5

A3

0,75

0,5

0,175

0,175

maxi

3

0.62

0.24

 

 

Рис. 2.1. Платёжная матрица в игре «Борьба двух предприятий за рынок продукции региона».

 

В данной матрице (рис. 2.1) нет доминируемых или дублирующих стратегий. Нижняя цена игры равна 0,175, а верхняя цена игры равна 0,24. Нижняя цена игры не равна верхней. Поэтому решения в чистых стратегиях не существует и для каждого из игроков необходимо найти оптимальную смешанную стратегию.

Решение задачи

 

1. В данной матрице  имеются отрицательные коэффициенты. Для соблюдения условия неотрицательности  в задачах линейного программирования прибавим к каждому коэффициенту матрицы модуль минимального отрицательного коэффициента. В данной задаче к каждому коэффициенту матрицы необходимо прибавить число 1,5 – значение модуля наименьшего отрицательного элемента матрицы. Получим платёжную матрицу, преобразованную для выполнения условия неотрицательности (рис. 2.2)

 

B1

B2

B3

A1

1,67

2,12

1,74

A2

4,5

0

0,7

A3

2,25

2

1,675


Рис. 2.2. Платёжная матрица, преобразованная для выполнения условия неотрицательности

 

2. Опишем задачу линейного программирования  для каждого  игрока в виде системы линейных неравенств:

Для игрока 1:

1,67×x1 + 4,5×x2 + 2,25×x3 ³ 1

2,12×x1 + 0×x2 + 2×x3 ³ 1

1,74×x1 + 0,7×x2 + 1,675×x3 ³ 1

x1³ 0; x2³ 0; x3³ 0

min Z = x1 + x2 + x3


Для игрока 2:

1,67×y1 + 2,12×y2 + 1,74×y3 £ 1

4,5×y1 + 0×y2 + 0,7×y3 £ 1

2,25×y1 + 2×y2 + 1,675×y3 £ 1

y1³ 0; y2³ 0; y3³ 0

max Z = y1 + y2 + y3


3. Решим обе задачи с использованием симплекс-метода, применяя программный комплекс "Линейная оптимизация". [5].

В результате решения задачи получим  следующие значения целевой функции и переменных:

Z = 0,5771

V* = 1/0,5771 = 1,7328

x1 = 0,5144; x2 = 0; x3 = 0,0626

y1 = 0,0582; y3 = 0,5189

4. Для определения  значений вероятностей выбора  стратегий игроков 1 и 2 умножим значения  переменных на V*. P1 = x1×V* = 0,8914, p2 =0,  p3 = x3×V* = 0,1083: q1 = y1×V* = 0,1008, q2 = 0, q3 = y3×V* = 0,8991.

5. Определим значение  цены игры. Для этого из величины V* вычтем 1,5 (значение модуля наименьшего отрицательного элемента).

V = 1,7328 - 1,5  = 0,2328

Таким образом, в данной игре выиграет предприятие 1 (значение  V > 0). Для достижения своей оптимальной стратегии (получения максимального математического ожидания гарантированного выигрыша) предприятие 1 должно выбирать технологию 1 с вероятностью 0,8914, а технологию 3 – с вероятностью 0,1083. Предприятие 2, соответственно, должно выбирать технологию 1 с вероятностью 0,1008, а технологию 3 – с вероятностью 0,8991. Значение математического ожидания выигрыша предприятия 1 составит 0,2328 тыс. д.е.

Информация о работе Решение матричных игр в чистых стратегиях