Автор работы: Пользователь скрыл имя, 28 Марта 2013 в 21:38, курсовая работа
Определение. "Игра (в математике) - это идеализированная математическая модель коллективного поведения: несколько игроков влияют на исход игры, причем их интересы различны". [7].
Регулярное действие, выполняемое игроком во время игры, называется ходом. Совокупность ходов игрока, совершаемых им для достижения цели игры, называется стратегией.
Практическая часть |
Задание 5.1
Решить задачу из занятия 3 изменив исходные данные
Таблица 2.2
Затраты на единицу продукции, произведенной на предприятиях региона (д.е.).
Технология |
Цена реализации единицы продукции, д.е. |
Полная себестоимость единицы продукции, д.е. | |
Предприятие 1 |
Предприятие 2 | ||
I |
10 |
5 |
8 |
II |
8 |
4-0.1*N |
6 |
III |
6 |
3+0.1*N |
4-0.2*N |
IV |
4 |
2 |
2 |
V |
2 |
1,5-0.1*N |
1+0.1*N |
где N – порядковый номер Вашей фамилии в списке студентов группы.
Функция спроса на продукцию:
Y = 8 – (0.3+0,1×(N-1)) ×X
Таблица 2.3
Доля продукции предприятия 1, приобретаемой населением в зависимости от соотношения цен на продукцию
Цена реализации 1 ед. продукции, д.е. |
Доля продукции предприятия 1, купленной населением | |
Предп. 1 |
Предп. 2 | |
10 |
10 |
0,31+0.1*(N-1) |
10 |
8 |
0,33 |
10 |
6 |
0,25 |
10 |
4 |
0,2 |
10 |
2 |
0,18 |
8 |
10 |
0,4 |
8 |
8 |
0,35 |
8 |
6 |
0,32 |
8 |
4 |
0,28 |
8 |
2 |
0,25 |
6 |
10 |
0,52 |
6 |
8 |
0,48 |
6 |
6 |
0,4 |
6 |
4 |
0,35 |
6 |
2 |
0,3-0.02*N |
4 |
10 |
0,6 |
4 |
8 |
0,58 |
4 |
6 |
0,55+0.05*N |
4 |
4 |
0,5 |
4 |
2 |
0,4 |
2 |
10 |
0,9 |
2 |
8 |
0,85 |
2 |
6 |
0,7 |
2 |
4 |
0,65 |
2 |
2 |
0,4 |
Решение задачи необходимо провести с помощью программы, разработанной при выполнении практической части занятий 1, 2 и 4.
Контрольные вопросы к теме 2 |
1. Существует ли решение
матричной игры, нижняя цена которой
не равна верхней? Как
2. Что такое смешанная стратегия игрока?
3. Что такое активная стратегия?
4. Что такое цена матричной игры со смешанным расширением?
5. В каком интервале находится цена матричной игры со смешанным расширением?
6. Каким будет значение
выигрыша в матричной игре, если
один из игроков
7. Что такое решение матричной игры со смешанным расширением?
8. Какими методами решается матричная игра со смешанным расширением?
9. Сформулируйте математическую
запись задачи определения опти
10. Какое преобразование
коэффициентов платёжной
11. Как определить значение
цены игры и вероятности
12. Приведите примеры решения матричных игр со смешанным расширением в задачах реальной экономики.
Теоретическая часть |
Принятие управленческих решений предполагает наличие ситуаций выбора наиболее выгодного варианта поведения из нескольких имеющихся вариантов в условиях неопределённости. Такие задачи могут быть описаны матричными играми особого типа, в которых игрок взаимодействует не со вторым игроком, а с окружающей средой. Объективно окружающая среда не заинтересована в проигрыше игрока. В процессе принятия решения о выборе варианта поведения игрок имеет информацию о том, что окружающая среда может принять одно из нескольких возможных состояний и сталкивается с неопределённостью относительно того конкретного состояния, которое примет окружающая среда в данный момент времени.
Матричная игра, в которой
игрок взаимодействует с
В общем виде платёжная матрица статистической игры приведена на рисунке 3.1.
S1 |
S2 |
… |
Sn | |
A1 |
A11 |
A12 |
... |
A1n |
A2 |
A21 |
A22 |
... |
A2n |
… |
... |
... |
... |
... |
An |
am1 |
am2 |
... |
amn |
Рис. 3.1. Общий вид платёжной матрицы статистической игры
В данной игре строки матрицы (Ai ) - стратегии ЛПР, а столбцы матрицы (Sj) – состояния окружающей среды.
ЛПР определяет наиболее выгодную стратегию в зависимости от целевой установки, которую он реализует в процессе решения задачи. Результат решения задачи ЛПР определяет по одному из критериев принятия решения. Для того, чтобы прийти к однозначному и по возможности наиболее выгодному варианту решению, необходимо ввести оценочную (целевую) функцию. При этом каждой стратегии ЛПР (Ai) приписывается некоторый результат Wi, характеризующий все последствия этого решения. Из массива результатов принятия решений ЛПР выбирает элемент W, который наилучшим образом отражает мотивацию его поведения.
Критерий максимального математического ожидания выигрыша применяется в тех случаях, когда ЛПР известны вероятности состояний окружающей среды. Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой значение математического ожидания выигрыша при выборе соответствующей стратегии ЛПР:
где pj –вероятность j-го состояния окружающей среды.
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение математического ожидания выигрыша максимально:
W = max Wi
Применение критерия максимального математического ожидания выигрыша, таким образом, оправдано, если ситуация, в которой принимается решение, следующая:
1. ЛПР известны вероятности
всех состояний окружающей
2. Минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша.
Необходимость иметь информацию о вероятностях состояний окружающей среды ограничивает область применения данного критерия.
Данный критерий используется при наличии неполной информации о вероятностях состояний окружающей среды в задаче принятия решения. Вероятности состояний окружающей среды принимаются равными и по каждой стратегии ЛПР в платёжной матрице определяется, таким образом, среднее значение выигрыша:
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой значение среднего выигрыша максимально:
W = max Wi
Использование данного критерия оправдано в следующей ситуации:
1. ЛПР не имеет информации,
либо имеет неполную
2. Вероятности состояний окружающей среды близки по своим значениям;
3. Минимизация риска проигрыша представляется ЛПР менее существенным фактором принятия решения, чем максимизация среднего выигрыша.
Правило выбора решения в соответствии с максиминным критерием (ММ-критерием) можно интерпретировать следующим образом:
Платёжная матрица дополняется столбцом, каждый элемент которого представляет собой минимальное значение выигрыша в соответствующей стратегии ЛПР:
Wi = minj aij
Оптимальной по данному критерию считается та стратегия ЛПР, при выборе которой минимальное значение выигрыша максимально:
W = max Wi
Выбранная таким образом стратегия полностью исключает риск. Это означает, что принимающий решение не может столкнуться с худшим результатом, чем тот, на который он ориентируется. Это свойство позволяет считать ММ-критерий одним из фундаментальных.
Применение ММ-критерия оправдано, если ситуация, в которой принимается решение следующая:
1. О возможности появления
состояний окружающей среды
2. Решение реализуется только один раз;
3. Необходимо исключить какой бы то ни было риск.
Величина (amax j – aij ), где amax j - максимальный элемент j – го столбца, может быть интерпретирована как дополнительный выигрыш, получаемый в условиях состояния окружающей среды Sj при выборе ЛПР наиболее выгодной стратегии, по сравнению с выигрышем, получаемым ЛПР при выборе в тех же условиях любой другой стратегии. Эта же разность может быть интерпретирована как величина возможного проигрыша при выборе ЛПР I – й стратегии по сравнению с наиболее выгодной стратегией. На основе данной интерпретации разности выигрышей производится определение наиболее выгодной стратегии по критерию минимаксного риска.
Для определения оптимальной стратегии по данному критерию на основе платёжной матрицы рассчитывается матрица рисков, каждый коэффициент которой (rij) определяется по формуле:
rij = amax j – aij (5)
Матрица рисков дополняется столбцом, содержащим максимальные значения коэффициентов rij по каждой из стратегий ЛПР:
Ri = maxj rij
Оптимальной по данному критерию считается та стратегия, в которой значение Ri минимально:
W = min Ri
Ситуация, в которой оправдано применение критерия Сэвиджа, аналогична ситуации ММ-критерия, однако наиболее существенным в данном случае является учёт степени воздействия фактора риска на величину выигрыша.
В практике принятия решений ЛПР руководствуется не только критериями, связанными с крайним пессимизмом или учётом максимального риска. Стараясь занять наиболее уравновешенную позицию, ЛПР может ввести оценочный коэффициент, называемый коэффициентом пессимизма, который находится в интервале [0, 1] и отражает ситуацию, промежуточную между точкой зрения крайнего оптимизма и крайнего пессимизма. Данный коэффициент определяется на основе статистических исследований результатов принятия решений или личного опыта принятия решений в схожих ситуациях.
Платёжная матрица дополняется столбцом, коэффициенты которого рассчитываются по формуле:
Wi = C×minj aij + (1-C) ×maxj aij (6)
Где C – коэффициент пессимизма.
Оптимальной по данному критерию считается стратегия, в которой значение Wi максимально:
W = max Wi
При С=1 критерий Гурвица превращается в ММ-критерий. При С = 0 он превращается в критерий “азартного игрока”, делающего ставку на то, что «выпадет» наилучший случай.
Критерий Гурвица применяется в ситуации, когда :
1. Информация о состояниях окружающей среды отсутствует или недостоверна;
2. Необходимо считаться
с появлением каждого
3. Реализуется только малое количество решений;
4. Допускается некоторый риск.
Практическая часть |
Задание 6.1
В матрице:
S1 |
S2 |
S3 | |
Pj |
0,7 |
0,2 |
0,1 |
A1 |
20+N |
18 |
15-N |
A2 |
26 |
17+N/2 |
9 |
A3 |
40-N |
16 |
N-1 |
Информация о работе Решение матричных игр в чистых стратегиях