Автор работы: Пользователь скрыл имя, 28 Марта 2013 в 21:38, курсовая работа
Определение. "Игра (в математике) - это идеализированная математическая модель коллективного поведения: несколько игроков влияют на исход игры, причем их интересы различны". [7].
Регулярное действие, выполняемое игроком во время игры, называется ходом. Совокупность ходов игрока, совершаемых им для достижения цели игры, называется стратегией.
1. Существует ли в
данной задаче ситуация
2. Существуют ли технологии, которые предприятия заведомо не будут выбирать вследствие невыгодности?
3. Сколько продукции
будет реализовано в ситуации
равновесия? Какое предприятие окажется
в выигрышном положении? Дайте
краткую экономическую
Решение задачи необходимо провести с помощью программы, разработанной при выполнении практической части занятий 1 и 2.
Контрольные вопросы к теме 1 |
1. Дайте определение игры.
2. Дайте определение хода и стратегии.
3. По каким принципам производится классификация игр?
4. Как подразделяются игры по числу игроков?
5. Как подразделяются
игры в зависимости от
6. Как подразделяются
игры по характеру
7. Как подразделяются игры по виду выигрышей?
8. Как подразделяются игры по виду функции выигрышей?
9. Как записать игру с нулевой суммой в виде платёжной матрицы?
10. Что такое нижняя и верхняя цена игры?
11. Что такое оптимальная
чистая стратегия? При каких
условиях существует
12. Как уменьшить размерность платёжной матрицы?
13. Приведите примеры
решения матричных игр в
Теоретическая часть |
Исследование в матричных играх начинается с нахождения её чистой цены. Если матричная игра имеет решение в чистых стратегиях, то нахождением чистой цены заканчивается исследование игры. Если же в игре нет решения в чистых стратегиях, то можно найти нижнюю и верхнюю цены этой игры, которые указывают, что игрок 1 не должен надеяться на выигрыш больший, чем верхняя цена игры, и может быть уверен в получении выигрыша не меньше нижней цены игры. Улучшение решений матричных игр следует искать в использовании секретности применения чистых стратегий и возможности многократного повторения игр в виде партии. Этот результат достигается путём применения чистых стратегий случайно, с определённой вероятностью.
Определение. Смешанной стратегией игрока называется полный набор чистых стратегий, применённых в соответствии с установленным распределением вероятностей. Матричная игра, решаемая с использованием смешанных стратегий, называется игрой со смешанным расширением.
Стратегии, применённые с вероятностью, отличной от нуля, называются активными стратегиями.
Vн £ V £ Vв .
При этом условии величина V называется ценой игры.
Кроме того, доказано, что, если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остаётся неизменным и равным цене игры V, независимо от того, каких стратегий придерживается другой игрок, если только он не выходит за пределы своих активных стратегий. Поэтому, для достижения наибольшего гарантированного выигрыша второму игроку также необходимо придерживаться своей оптимальной смешанной стратегии.
Решение матричной игры со смешанным расширением – это определение оптимальных смешанных стратегий, то есть нахождение таких значений вероятностей выбора чистых стратегий для обоих игроков, при которых они достигают наибольшего выигрыша.
Для матричной игры, платёжная матрица которой показана на рис. 1.1, Vн ¹ Vв , определим такие значения вероятностей выбора стратегий для игрока 1 (p1, p2 ,…, pm) и для игрока 2 (q1, q2 ,…, qn), при которых игроки достигали бы своего максимально гарантированного выигрыша.
Если один из игроков придерживается своей оптимальной стратегии, то, по условию задачи, его выигрыш не может быть меньше цены игры V. Поэтому данная задача может быть представлена для игроков в виде следующих систем линейных неравенств:
Для первого игрока:
Для второго игрока:
Чтобы определить значение V, разделим обе части каждого из уравнений на V. Величину pi/V обозначим через xi, а qj/V – через yj.
Для игрока 1 получим следующую систему неравенств, из которой найдём значение 1/v:
Для игрока 1 необходимо найти максимальную цену игры (V). Следовательно, значение 1/V должно стремиться к минимуму.
Целевая функция задачи будет иметь следующий вид:
min Z = min 1/V = min (x1 + x2 + … + xm)
Для игрока 2 получим следующую систему неравенств, из которой найдём значение 1/v:
Для игрока 2 необходимо найти минимальную цену игры (V). Следовательно, значение 1/V должно стремиться к максимуму.
Целевая функция задачи будет иметь следующий вид:
max Z = max 1/V = max (y1 + y2 + … + yn)
Все переменные в данных системах линейных неравенств должны быть неотрицательными: xi = pi/V, а yi = qj/V. Значения pi и qj не могут быть отрицательными, так как являются значениями вероятностей выбора стратегий игроков. Поэтому необходимо, чтобы значение цены игры V не было отрицательным. Цена игры вычисляется на основе коэффициентов выигрышей платёжной матрицы. Поэтому, для того, чтобы гарантировать условие неотрицательности для всех переменных, необходимо, чтобы все коэффициенты матрицы были неотрицательными. Этого можно добиться, прибавив перед началом решения задачи к каждому коэффициенту матрицы число K, соответствующее модулю наименьшего отрицательного коэффициента матрицы. Тогда в ходе решения задачи будет определена не цена игры, а величина V* = V + K.
Для решения задач линейного программирования используется симплекс-метод. [1, 5].
В результате решения
определяются значения целевых функций
(для обоих игроков эти
Величина V* определяется по формуле: V* = 1/z
Значения вероятностей выбора стратегий определяются: для игрока 1: Pi = xi×V*: для игрока 2: qi = yi×V*.
Для определения цены игры V из величины V* необходимо вычесть число K.
Практическая часть |
Задание 4.1
В матрице:
B1 |
B2 | |
A1 |
1 |
-3 |
A2 |
-2 |
4 |
определить оптимальные
Задание 4.2
Усовершенствуйте программу, разработанную при выполнении задания 2.2 так, чтобы она обеспечивала формулировку задач линейного программирования для каждого игрока в матричных играх со смешанным расширением. Системы линейных неравенств и целевые функции задач должны быть выведены на экран компьютера или в файл в виде текста.
Теоретическая часть |
Рассмотрим пример решения матричной игры со смешанным расширением. Платёжную матрицу игры составим на основе исходных данных задачи, решённой при выполнении занятия 3, заменив лишь значения долей продукции предприятия 1, приобретаемой населением в зависимости от соотношений цен (табл. 2.1).
Таблица 2.1.
Доля продукции предприятия 1, приобретаемой населением в зависимости от соотношения цен на продукцию
Цена реализации 1 ед. продукции, д.е. |
Доля продукции предприятия 1, купленной населением | |
Предп. 1 |
Предп. 2 | |
10 |
10 |
0,31 |
10 |
6 |
0,33 |
10 |
2 |
0,18 |
6 |
10 |
0,7 |
6 |
6 |
0,3 |
6 |
2 |
0,2 |
2 |
10 |
0,9 |
2 |
6 |
0,85 |
2 |
2 |
0,69 |
Применив к исходным данным задачи формулу (1) определения разницы прибыли от производства продукции (занятие 3), получим следующую платёжную матрицу (рис. 2.1)
B1 |
B2 |
B3 |
minj | |
A1 |
0,17 |
0,62 |
0,24 |
0.17 |
A2 |
3 |
-1,5 |
-0,8 |
-1.5 |
A3 |
0,75 |
0,5 |
0,175 |
0,175 |
maxi |
3 |
0.62 |
0.24 |
Рис. 2.1. Платёжная матрица в игре «Борьба двух предприятий за рынок продукции региона».
В данной матрице (рис. 2.1) нет доминируемых или дублирующих стратегий. Нижняя цена игры равна 0,175, а верхняя цена игры равна 0,24. Нижняя цена игры не равна верхней. Поэтому решения в чистых стратегиях не существует и для каждого из игроков необходимо найти оптимальную смешанную стратегию.
Решение задачи
1. В данной матрице
имеются отрицательные
B1 |
B2 |
B3 | |
A1 |
1,67 |
2,12 |
1,74 |
A2 |
4,5 |
0 |
0,7 |
A3 |
2,25 |
2 |
1,675 |
Рис. 2.2. Платёжная матрица, преобразованная для выполнения условия неотрицательности
2. Опишем задачу линейного
Для игрока 1:
1,67×x1 + 4,5×x2 + 2,25×x3 ³ 1
2,12×x1 + 0×x2 + 2×x3 ³ 1
1,74×x1 + 0,7×x2 + 1,675×x3 ³ 1
x1³ 0; x2³ 0; x3³ 0
min Z = x1 + x2 + x3
Для игрока 2:
1,67×y1 + 2,12×y2 + 1,74×y3 £ 1
4,5×y1 + 0×y2 + 0,7×y3 £ 1
2,25×y1 + 2×y2 + 1,675×y3 £ 1
y1³ 0; y2³ 0; y3³ 0
max Z = y1 + y2 + y3
3. Решим обе задачи с использованием симплекс-метода, применяя программный комплекс "Линейная оптимизация". [5].
В результате решения задачи получим следующие значения целевой функции и переменных:
Z = 0,5771
V* = 1/0,5771 = 1,7328
x1 = 0,5144; x2 = 0; x3 = 0,0626
y1 = 0,0582; y3 = 0,5189
4. Для определения значений вероятностей выбора стратегий игроков 1 и 2 умножим значения переменных на V*. P1 = x1×V* = 0,8914, p2 =0, p3 = x3×V* = 0,1083: q1 = y1×V* = 0,1008, q2 = 0, q3 = y3×V* = 0,8991.
5. Определим значение цены игры. Для этого из величины V* вычтем 1,5 (значение модуля наименьшего отрицательного элемента).
V = 1,7328 - 1,5 = 0,2328
Таким образом, в данной игре выиграет предприятие 1 (значение V > 0). Для достижения своей оптимальной стратегии (получения максимального математического ожидания гарантированного выигрыша) предприятие 1 должно выбирать технологию 1 с вероятностью 0,8914, а технологию 3 – с вероятностью 0,1083. Предприятие 2, соответственно, должно выбирать технологию 1 с вероятностью 0,1008, а технологию 3 – с вероятностью 0,8991. Значение математического ожидания выигрыша предприятия 1 составит 0,2328 тыс. д.е.
Информация о работе Решение матричных игр в чистых стратегиях