Методы решения матричных игр

Автор работы: Пользователь скрыл имя, 09 Апреля 2014 в 19:56, курсовая работа

Описание работы

Математическая теория игр способна не только указать оптимальный путь к решению некоторых проблем, но и прогнозировать их исход. Матричные игры серьёзно изучаются специалистами, так как они довольно просты и к ним могут быть сведены игры общего вида. Поэтому теория матричных игр хорошо развита, существуют различные методы поиска решения игр.

Файлы: 1 файл

матричные игры.doc

— 894.50 Кб (Скачать файл)

Для определения β1 (верхней цены игры) найдем максимальные значения элементов в столбцах матрицы. По столбцам имеем: 4, 5, 6, 5. Следовательно, β1 =4.

β1=max{4;5;6;5}=4

Для матрицы B составляем аналогично   α2 и β2:

α2= max{5;4;4} и β2=min{0;0;-1;3}

Таким образом, α2 = β2=v - цена игры. Решение данной игры состоит в выборе игроком А стратегии A2, при этом выигрыш составит не меньше 4, а для игрока B стратегия B2, позволяющая ограничить проигрыш числом 3.

Игровые системы, содержащие  седловую точку, имеют заранее известное решение, т.к. каждый из игроков применяет свою оптимальную стратегию. Решение игры, матрицы которой не содержат седловой точки (т.е. α< β), довольно затруднительно. Каждый из игроков, применяя минимаксную стратегию, хочет обеспечить себе выигрыш (не превышающий α) и проигрыш (не меньше β). Для каждого из игроков характерен вопрос о максимизации выигрыша и минимизации проигрыша. Поэтому поиски данного решения состоят в том, что игроки применяют несколько стратегий, причем их выбор осуществляется случайным образом, т.е. смешенной стратегией.

1.2 Смешанные стратегии в матричных играх

Исследование в матричных играх начинается с нахождения её седловой точки в чистых стратегиях. Если матричная игра имеет седловую точку в чистых стратегиях, то нахождением этой седловой точки заканчивается исследованием игры. Если же в игре нет седловой точки в чистых стратегиях, то можно найти нижнюю и верхнюю чистые цены этой игры, которые указывают, что игрок 1 не должен надеяться на выигрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры. Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии. Этот результат достигается путём применения чистых стратегий случайно, с определённой вероятностью.

Смешанной стратегией игрока называется полный набор вероятностей применения его чистых стратегий.

Таким образом, если игрок 1 имеет m чистых стратегий 1,2,..,m, то его смешанная стратегия x – это набор чисел x = (x1, .., xm) удовлетворяющих соотношениям:

xi >= 0 (i = 1,m),

= 1

Аналогично для игрока 2, который имеет n чистых стратегий, смешанная стратегия y – это набор чисел y = (y1, ..., yn):

yj >= 0, (j = 1,n),

= 1

Чистая стратегия есть частный случай смешанной стратегии. Если в смешанной стратегии какая-либо i-я чистая стратегия применяется с вероятностью 1, то все остальные чистые стратегии не применяются. И эта   i-я чистая стратегия является частным случаем смешанной стратегии. Для соблюдения секретности каждый игрок применяет свои стратегии независимо от выбора другого игрока.

Первый игрок имеет целью за счёт изменения своих смешанных стратегий х максимально увеличить свой средний выигрыш Е (А, х, y), а второй – за счёт своих смешанных стратегий стремится сделать Е (А, х, y) минимальным, т.е. для решения игры необходимо найти такие х и y, при которых достигается верхняя цена игры:


α = min max Е (А, х, y)

 

Аналогичной должна быть ситуация и для игрока 2, т.е. нижняя цена игры должна быть:

α = max min Е (А, х, y)


 

Подобно играм, имеющим седловые точки в чистых стратегиях, вводится следующее определение: оптимальными смешанными стратегиями игроков 1 и 2 называются такие наборы хо, уо соответственно, которые удовлетворяют равенству:

Е (А, х, y) max min = Е (А, х, y) = Е (А, хо, уо)


 

Величина Е (А, хо ,уо) называется ценой игры и обозначается через v.

Имеется и другое определение оптимальных смешанных стратегий: хо, уо называются оптимальными смешанными стратегиями соответственно игроков 1 и 2, если они образуют седловую точку:

Е (А, х, уо)<= Е (А, хо, уо)<= Е (А, хо, у)

Оптимальные смешанные стратегии и цена игры называются решением матричной игры.

1.3 Свойства решений матричных игр

Обозначим через G (Х,Y,А) игру двух лиц с нулевой суммой, в которой игрок 1 выбирает стратегию х є Х, игрок 2 – y є V, после чего игрок 1 получает выигрыш А = А (х, y) за счёт игрока 2.

Стратегия х1 игрока 1 доминирует (строго доминирует) над стратегией х2, если

А (х^1, y)>= А (х^2, y)(А (х^1, y) > А (х^2, y)), y є V

Стратегия y1 игрока 2 доминирует (строго доминирует) над стратегией y2, если

А (х, y^1)<= А (х, y^2)(А (х, y^1) < А (х, y^2)), х є Х

При этом стратегии х2 и y2 называются доминируемыми (строго доминируемыми).

Спектром смешанной стратегии игрока в конечной антагонистической игре называется множество всех его чистых стратегий, вероятность которых согласно этой стратегии положительна.

Свойство 1. Если чистая стратегия одного из игроков содержится в спектре некоторой его оптимальной стратегии, то выигрыш этого игрока в ситуации, образованной данной чистой стратегией и любой оптимальной стратегией другого игрока, равен значению конечной антагонистической игры.

Свойство 2. Ни одна строго доминируемая чистая стратегия игрока не содержится в спектре его оптимальной стратегии.

Игра G' = (Х',Y',А') называется подыгрой игры G (Х,Y,А), если Х'c Х, V'c V, а матрица А' является подматрицей матрицы А. Матрица А' при этом строится следующим образом. В матрице А остаются строки и столбцы, соответствующие стратегиям Х' и V', а остальные “вычеркиваются”. Всё то что “останется” после этого в матрице А и будет матрицей А'.

Свойство 3. Пусть G = (Х,Y,А) – конечная антагонистическая игра, G' = (Х \ х',Y,А) – подыгра игры G, а х' – чистая стратегия игрока 1 в игре G, доминируемая некоторой стратегией, спектр которой не содержит х'. Тогда всякое решение (хо, yо, v) игры G' является решением игры G.

Свойство 4. Пусть G = (Х,Y,А) – конечная антагонистическая игра, G' = (Х,Y \ y',А) – подыгра игры G, а y' – чистая стратегия игрока 2 в игре G, доминируемая некоторой стратегией, спектр которой не содержит y'. Тогда всякое решение игры G' является решением G.

Свойство 5. Если для чистой стратегии х' игрока 1 выполнены условия свойства 3, а для чистой стратегии y' игрока 2 выполнены условия свойства 4, то всякое решение игры G' = (Х \ х',Y \ y',А) является решением игры G = (Х,Y,А).

Свойство 6. Тройка (хо, yо, v) является решением игры G = (Х,Y,А) тогда и только тогда, когда (хо, yо, кv +а) является решением игры G(Х,Y,кА+а), где а – любое вещественное число, к > 0.

Свойство 7. Для того, чтобы хо =(x01 ,…,x0i ,…,x0m ) была оптимальной смешанной стратегией матричной игры с матрицей А и ценой игры v, необходимо и достаточно выполнение следующих неравенств

 

Аналогично для игрока 2: чтобы yо = (y01,…,y0j,…,y0n..,) была оптимальной смешанной стратегией игрока 2 необходимо и достаточно выполнение следующих неравенств:

 

Из последнего свойства: чтобы установить, является ли предполагаемые (х, y) и v решением матричной игры, достаточно проверить, удовлетворяют ли они неравенствам (*) и (**). С другой стороны, найдя неотрицательные решения неравенств (*) и (**) совместно со следующими уравнениями получим решение матричной игры.

 

Таким образом, решение матричной игры сводится к нахождению неотрицательных параметров решений линейных неравенств (*) (**) и линейных уравнений (***). Однако это требует большого объёма вычислений, которое растёт с увеличением числа чистых стратегий игроков. (Например, для матрицы 3 3 имеем систему из 6 неравенств и 2 уравнений). Поэтому в первую очередь следует, по возможности используя свойства 2 и 3, уменьшить число чистых стратегий игроков. Затем следует во всех случаях проверить выполнение неравенства

  min aij= min max aij


Если оно выполняется, то игроки имеют чистые оптимальные стратегии (игрок 1 – чистую максиминную, а игрок 2 – чистую минимаксную). В противном случае хотя бы у одного игрока оптимальные стратегии будут смешанные.

Основные этапы нахождения решения игры 2×n или m×2:

  1. Строят прямые, соответствующие стратегиям первого (второго) игрока.
  2. Определяют нижнюю (верхнюю) границу выигрыша.
  3. Находят две стратегии второго (первого) игрока, которым соответствуют две прямые, пересекающиеся в точке с максимальной (минимальной) ординатой.
  4. Определяют цену игры и оптимальные стратегии.

Пример 1. Рассмотрим игру, заданную платёжной матрицей.


 

 

 

На плоскости xОy (Рисунок 1) введём систему координат и на оси Оx отложим отрезок единичной длины А1, А2, каждой точке которого поставим в соответствие некоторую смешанную стратегию игрока 1 (x, 1 - x). В частности, точке А1 (0;0) отвечает стратегия А1, точке А2 (1;0) – стратегия А2 и т.д.


 

 

 

 

 

 

 

Рисунок 1

В точкаx А1 и А2 восстановим перпендикуляр и на полученных прямых будем откладывать выигрыш игроков. На первом перпендикуляре (в данном случае он совпадает с осью 0y) отложим выигрыш игрока 1 при стратегии А1, а на втором – при стратегии А2. Если игрок 1 применит стратегию А1, то выиграет при стратегии В1 игрока 2 – 2, при стратегии В2 – 3, а при стратегии В3 – 11. Числам 2, 3, 11 на оси 0x соответствуют точки В1, В2 и В3.

Если же игрок 1 применит стратегию А2, то его выигрыш при стратегии В1 равен 7, при В2 – 5, а при В3 – 2. Эти числа определяют точки В'1, В2', В3' на перпендикуляре, восстановленном в точке А2.Соединяя между собой точки В1 и В'1, В2 и В'2, В3 и В'3 получим три прямые, расстояние до которых от оси 0x определяет средний выигрыш при любом сочетании соответствующих стратегий. Например, расстояние от любой точки отрезка В1В'1 до оси 0x определяет средний выигрыш v1 при любом сочетании стратегий А1 А2 (с частотами x и 1–x) и стратегией В1 игрока 2. Это расстояние равно

2x1 + 6(1 - x2) = v1

Таким образом, ординаты точек, принадлежащих ломанной В1 M N В'3 определяют минимальный выигрыш игрока 1 при применении им любых смешанных стратегий. Эта минимальная величина является максимальной в точке N; следовательно, этой точке соответствует оптимальная стратегия Х* = (x, 1-x), а её ордината равна цене игры v. Координаты точки N находим как точку пересечения прямых В2 B'2 и В3 B'3.

Соответствующие два уравнения имеют вид

  => x=      ,  v=


Следовательно, Х = (3/11;9/11), при цене игры v =49/11. Таким образом, можем найти оптимальную стратегию при помощи матрицы

Оптимальные стратегии для игрока 2 можно найти из системы:


                                  => y=    

 

Следовательно, Y = (0;9/11;2/11).

Пример 2. Найти решение игры, заданной матрицей


 

 

 

 

 

 

 

Рисунок 2

Решение. Матрица имеет размерность 2 x 4. Строим прямые, соответствующие стратегиям игрока 1(Рисунок 2). Ломанная А1 K А'4 соответствует верхней границе выигрыша игрока 1, а отрезок N K –цене игры. Решение игры таково

V = (3/8;5/8); Х = (7/8; 0; 0; 1/8); v =43/8.

 

 

2 ГРАФИЧЕСКИЙ СПОСОБ РЕШЕНИЯ ИГРЫ

Одно из транспортных предприятий, с учётом трёх возможных вариантов поведения конкурента (стратегии ) разработало две стратегии своей деятельности: . Прибыль предприятия в ситуации, когда оно выбирает свою стратегию , а конкурент – стратегию приведена в платёжной матрице:

.

Показать, что данная платёжная матрица не имеет cедловой точки, найти решение игры, используя геометрическую интерпретацию.

Решение:

.

Найдём нижнюю и верхнюю цены игры:

.

Так как (6 8), то матричная не имеет седловой точки или решения в чистых стратегиях. Цена игры при этом . Решение данной игры надо искать в смешанных стратегиях.

Применим графический способ.

Пусть вероятности использования чистых игроком А: и . А вероятности использования чистых стратегий игроком В: .

Рисунок 3

Построим график нижней огибающей решения. Предварительно запишем уравнения прямых:

Построим эти прямые в системе координат wOp (Рисунок 3).

Получили нижнюю огибающую решения – ломанную АМВ. Точка М является точкой максимума – она является точкой пересечения прямых и . Найдём её координаты:

Таким образом, оптимальная стратегия игрока А:

 

Цена игры

v=

Определим смешанные стратегии для игрока В. Для этого составим следующую систему:


Таким образом, оптимальная стратегия для игрока В:

Ответ: цена игры v=6,5.

 

 

Заключение

На практике часто приходится сталкиваться с задачами, в которых необходимо принимать решения в условиях неопределённости, т. е. возникают ситуации, в которых две (или более) стороны преследуют различные цели, а результаты любого действия каждой из сторон зависят от мероприятий партнёра. Такие ситуации, возникающие при игре в шахматы, шашки, домино и т. д., относятся к конфликтным: результат каждого хода игрока зависит от ответного хода противника, цель игры – выигрыш одного из партнёров. В экономике конфликтные ситуации встречаются очень часто и имеют многообразный характер. К ним относятся взаимоотношения между поставщиком и потребителем, покупателем и продавцом, банком и клиентом. Во всех этих примерах конфликтная ситуация порождается различием интересов партнёров и стремлением каждого из них принимать оптимальные решения, которые реализуют поставленные цели в наибольшей степени.

Информация о работе Методы решения матричных игр