Автор работы: Пользователь скрыл имя, 28 Марта 2013 в 21:38, курсовая работа
Определение. "Игра (в математике) - это идеализированная математическая модель коллективного поведения: несколько игроков влияют на исход игры, причем их интересы различны". [7].
Регулярное действие, выполняемое игроком во время игры, называется ходом. Совокупность ходов игрока, совершаемых им для достижения цели игры, называется стратегией.
Теоретическая часть |
Определение. "Игра (в математике) - это идеализированная математическая модель коллективного поведения: несколько игроков влияют на исход игры, причем их интересы различны". [7].
Регулярное действие, выполняемое игроком во время игры, называется ходом. Совокупность ходов игрока, совершаемых им для достижения цели игры, называется стратегией.
Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д. [2, 7, 8].
В зависимости от количества игроков различают игры двух и n игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения.
По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий, игра называется бесконечной.
По характеру взаимодействия игры делятся на бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции; коалиционные (кооперативные) – могут вступать в коалиции.
В кооперативных играх коалиции заранее определены.
По характеру выигрышей игры делятся на: игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой суммой.
По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые и др.
Матричная игра – это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 1, столбец – номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).
Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования.
Биматричная игра – это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)
Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной. Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения.
Если функция выигрышей является выпуклой, то такая игра называется выпуклой. Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко.
В общем виде матричная игра может быть записана следующей платёжной матрицей [1, 2, 7] (рис. 1.1.),
B1 |
B2 |
… |
Bn | |
A1 |
A11 |
A12 |
... |
A1n |
A2 |
A21 |
A22 |
... |
A2n |
… |
... |
... |
... |
... |
Am |
am1 |
am2 |
... |
amn |
Рис. 1.1. Общий вид платёжной матрицы матричной игры
где Ai – названия стратегий игрока 1, Bj – названия стратегий игрока 2, aij – значения выигрышей игрока 1 при выборе им i – й стратегии, а игроком 2 – j – й стратегии. Поскольку данная игра является игрой с нулевой суммой, значение выигрыша для игрока 2 является величиной, противоположенной по знаку значению выигрыша игрока 1.
Каждый из игроков стремится максимизировать свой выигрыш с учётом поведения противодействующего ему игрока. Поэтому для игрока 1 необходимо определить минимальные значения выигрышей в каждой из стратегий, а затем найти максимум из этих значений, то есть определить величину
Vн = maxi minj aij ,
или найти минимальные значения по каждой из строк платёжной матрицы, а затем определить максимальное из этих значений. Величина Vн называется максимином матрицы или нижней ценой игры.
Величина выигрыша игрока 1 равна, по определению матричной игры, величине проигрыша игрока 2. Поэтому для игрока 2 необходимо определить значение
Vв = minj maxi aij .
Или найти максимальные значения по каждому из столбцов платёжной матрицы, а затем определить минимальное из этих значений. Величина Vв называется минимаксом матрицы или верхней ценой игры.
В случае, если значения Vн и Vв не совпадают, при сохранении правил игры (коэффициентов aij ) в длительной перспективе, выбор стратегий каждым из игроков оказывается неустойчивым. Устойчивость он приобретает лишь при равенстве Vн = Vв = V. В этом случае говорят, что игра имеет решение в чистых стратегиях, а стратегии, в которых достигается V - оптимальными чистыми стратегиями. Величина V называется чистой ценой игры. [8].
Например, в матрице (рис. 1.2)
B1 |
B2 |
B3 |
B4 |
Minj | |
A1 |
7 |
6 |
5 |
4 |
4 |
A2 |
1 |
8 |
2 |
3 |
1 |
A3 |
8 |
1 |
3 |
2 |
1 |
Maxi |
8 |
8 |
5 |
4 |
Рис. 1.2. Платёжная матрица, в которой существует решение в чистых стратегиях
существует решение в чистых стратегиях. При этом для игрока 1 оптимальной чистой стратегией будет стратегия A1, а для игрока 2 – стратегия B4.
В матрице (рис. 1.3)
B1 |
B2 |
B3 |
B4 |
Minj | |
A1 |
7 |
6 |
5 |
2 |
2 |
A2 |
1 |
8 |
2 |
3 |
1 |
A3 |
8 |
1 |
3 |
2 |
1 |
Maxi |
8 |
8 |
5 |
3 |
Рис. 1.3. Платёжная матрица, в которой не существует решения в чистых стратегиях
решения в чистых стратегиях не существует, так как нижняя цена игры достигается в стратегии A1 и её значение равно 2, в то время как верхняя цена игры достигается в стратегии B4 и её значение равно 3.
Практическая часть |
Задание 1. 1
Пусть задана следующая игра с участием двух игроков:
Первый игрок загадывает любое целое число от 1 до 3. Второй игрок должен отгадать это число. Если второй игрок указывает число правильно, он получает выигрыш, равный значению этого числа. В противном случае этот выигрыш получает первый игрок.
1. Определите число стратегий игроков и составьте платёжную матрицу задачи.
2. Определите нижнюю и верхнюю цену игры. Установите, существует ли в данной игре решение в чистых стратегиях.
Задание 1.2
Разработайте компьютерную программу, выполняющую следующие действия:
1. Ввод платёжной матрицы (по вариантам, предложенным преподавателем);
2. Определение нижней
и верхней цены игры и вывод
их значений, а также названий
стратегий, в которых достигают
3. Определение наличия
или отсутствия оптимальной
Теоретическая часть |
Порядок платёжной матрицы (количество строк и столбцов) может быть уменьшен за счёт исключения доминируемых и дублирующих стратегий.
Стратегия K* называется доминируемой стратегией K**, если при любом варианте поведения противодействующего игрока выполняется соотношение
Ak* < Ak**,
где Ak* и Ak** - значения выигрышей при выборе игроком, соответственно, стратегий K* и K**.
В случае, если выполняется соотношение
Ak* = Ak**,
стратегия K* называется дублирующей по отношению к стратегии K**.
Например, в матрице (рис. 1.4)
B1 |
B2 |
B3 |
B4 |
B5 |
B6 | |
A1 |
1 |
2 |
3 |
4 |
4 |
7 |
A2 |
7 |
6 |
5 |
4 |
4 |
8 |
A3 |
1 |
8 |
2 |
3 |
3 |
6 |
A4 |
8 |
1 |
3 |
2 |
2 |
5 |
Рис. 1.4. Платёжная матрица с доминируемыми и дублирующими стратегиями
стратегия A1 является доминируемой по отношению к стратегии A2, стратегия B6 является доминируемой по отношению к стратегиям B3, B4 и B5, а стратегия B5 является дублирующей по отношению к стратегии B4. Данные стратегии не будут выбраны игроками, так как являются заведомо проигрышными и удаление этих стратегий из платёжной матрицы не повлияет на определение нижней и верхней цены игры, описанной данной матрицей.
Множество недоминируемых стратегий, полученных после уменьшения размерности платёжной матрицы, называется ещё множеством Парето (по имени итальянского экономиста Вильфредо Парето, занимавшегося исследованиями в данной области) [7].
Практическая часть |
Задание 2.1.
Определите, имеет ли платёжная матрица (рис. 1.5),
B1 |
B2 |
B3 |
B4 | |
A1 |
1 |
2 |
N+1 |
N+2 |
A2 |
4 |
Log2N |
N2 |
3 |
A3 |
6 |
1 |
3 |
N |
A4 |
1 |
2 |
3 |
4 |
Рис. 1.5. Платёжная матрица
где N – порядковый номер Вашей фамилии в списке студентов группы:
а) доминируемые или дублирующие стратегии;
б) решение в чистых стратегиях.
Задание 2.2
Усовершенствуйте компьютерную программу, созданную при выполнении задания 1.2 так, чтобы она обеспечивала исключение доминируемых и дублирующих стратегий.
Теоретическая часть |
Рассмотрим пример решения матричной игры в чистых стратегиях, в условиях реальной экономики, в ситуации борьбы двух предприятий за рынок продукции региона.
Задача
Два предприятия производят продукцию и поставляют её на рынок региона. Они являются единственными поставщиками продукции в регион, поэтому полностью определяют рынок данной продукции в регионе.
Информация о работе Решение матричных игр в чистых стратегиях