Автор работы: Пользователь скрыл имя, 07 Сентября 2015 в 01:22, контрольная работа
По данной платежной матрице найти:
Оптимальные стратегии в игре с природой, используя критерии Лапласа, Вальда, Севиджа, Гурвица;
Министерство Сельского хозяйства Российской Федерации
Федеральное государственное бюджетное образовательное учреждение
Высшего профессионального образования
«Смоленская государственная сельскохозяйственная академия»
Кафедра информационных технологий и высшей математики
Контрольная работа
по дисциплине «Теория игр»
Выполнила: студентка группы
заочной формы обучения
экономического факультета
Проверила:
Юденкова А.П.
Смоленск 2014
Теория игр.
Задача 1.
По данной платежной матрице найти:
Основная идея критерия Лапласа состоит в том, что надо выбрать ту стратегию, для которой математическое ожидание будет больше.
Решение:
Считаем все состояния природы равновероятными (табл 1.)
Таблица 1.
Bj |
B1 |
B2 |
B3 |
qj |
1/3 |
1/3 |
1/3 |
Рассчитаем математические ожидания выигрышей:
М1;
М2;
М3;
Поскольку математическое ожидание выигрыша при стратегии А3 наибольшее, то следует отдать ей предпочтение.
Согласно этому критерию оптимальной стратегией считается та, при которой гарантированный выигрыш в любом случае будет не меньше, чем «нижнее цена игры с природой»:
Решение:
Определим минимальные выигрыши по строкам и выберем ту стратегию, при которой минимум строки максимален:
В данном случае это третья стратегия (А3), для которой .
Оцениваем характерность действий самого игрока. В данном критерии необходимо ввести матрицу рисков.
Пусть природа находится в состоянии Bj, т.е. она «выбрала» j-й столбец платежной матрицы. Для нападающего наиболее удачной будет стратегия Аi, при которой выигрыш окажется максимальным. Пусть . При других стратегиях игрок будет терять какую-то часть выигрыша именно из-за своих неудачных действий. Величину такой потери назовем риском. Чтобы получить риск rij, нужно из вычесть фактический выигрыш aij:
rij,=aij
Решение:
Оптимальной в данном случае выбирается та стратегия, при которой величина максимального риска минимальна:
Согласно критерию Гурвица, оптимальная стратегия выбирается из условия:
,
где – коэффициент «пессимизма», причем . При критерий Гурвица переходит в критерий Вальда, при – в критерий «крайнего оптимизма», при котором выбирается стратегия-строка с максимальным выигрышем.
Значение .
Решение:
В каждой строке платежной матрицы выберем наибольшее и наименьшее значения и проведем расчеты согласно формулам:
Максимальное значение Нj(j=1,2,3) соответствует третьей стратегии. Она и является оптимальной, согласно критерию Гурвица, при данном значении .
Динамическое программирование
Задача 2.
В начале года банк имеет возможность вложить в два предприятия средства в размереаден. ед. От вложения на квартал в первое предприятие хден. ед. банк получает доход в размереbxден. ед. и остаток средств в размере pxден. ед. Для второго предприятия эти показатели составляют соответственно cxи sxден. ед. В каждом последующем квартале могут использоваться только остатки денежных средств.
Требуется определить программу квартального выделения средств каждому предприятию, обеспечивающую банку наибольший годовой (4 квартала) доход.
2. |
a =1500 |
b = 4 |
с = 5 |
p = 0,4 |
s = 0,2 |
Решение
xk+yk = ak, xk0, yk0 (k= 1,2,3,4).
Таким образом, решение будет заключаться в нахождении объема финансирования одного из двух предприятий.
wk = 4 xk+ 5 yk = 4 xk+ 5 (ak - xk) = 4 xk+5ak- 5xk = 5ak– 1 xk.
Здесь мы воспользовались тем, чтоyk = ak - xk .
Sk+ 1 = j(Sk, (xk, yk)) = 0,4 xk+ 0,2yk = 0,4xk+ 0,2 (ak - xk) = 0,4xk+ 0,2ak – 0,2 xk = 0,2ak + 0,2 xk.
Wk* (Sk- 1) =.
Начнем процесс условной оптимизации с последнего этапа, т.е. k= 4, а остаток равен 0, т.еWk+1 = 0:
W4*(S3) = = 4a4.
Условное оптимальное решение на 4-м шаге будет такое: профинансировать первое предприятие в размере a4усл. ед., второе предприятие не финансировать (x4 = a4, y4 = a4 – x4 = 0).
k = 3.
W3*(S2) =. = = = 5,8 a3.
На 3-м шаге никакие решения не повлияют на условный максимум W3*(S2) =5,8 a3, поэтому средства в размере a3, усл. ед. можно распределить произвольно между предприятиями.
k = 2.
W2*(S1) =. = = = 6,16a2.
Условное оптимальное решение на 2-м шаге: выделить все средства в размере а2усл. ед. второму предприятию, первое предприятие не финансировать (х2 = 0, y2 = а2).
k = 1.
W1*(S0) =. = = = 6,232 a1.
На 1-м этапе условный максимум достигается, если профинансировать второе предприятие, а первому предприятию средств не выделять (х1 = 0, y1 = а1). Условная оптимизация проведена.
На 1-м шаге выделяется a1 = 1500 усл. ед. Значит, S1 = 1500 усл. ед., (x1 = 0, y1 = 1500), W1* = 9348 усл. ед. – прибыль за все четыре шага.
На 2-м шаге S2 = a2 = 0,2a1 + 0,2 x1 = 0,2 1500 + 0,2 0 = 300 усл. ед., (x2 = 0, y2 = 300), W2* = 1848 усл. ед. – суммарная максимальная прибыль на 2-м, 3-м, 4-м шагах.
На 3-м шаге S3 = a3 = 0,2a2 + 0,2 x2 = 0,2 300 + 0,2 0 = 60 усл. ед., (, y3 = 300 – x3), W3* = 348усл. ед. – суммарная максимальная прибыль на 3-ми 4-м шагах.
k= 4.S4 = a4 = 0,2 a3 + 0,2 x3 = 12 + 0,2 x3, (x4 = 12 + 0,2 x3, y3 = 0), W4* = 4 (12 + 0,2 x3).
Заметим, что в данной задаче ДП существует бесконечно много оптимальных стратегий, приводящих к одной и той же оптимальной прибыли. Такая ситуация является достаточно типичной для ДП.