Контрольная работа по «Теория игр»

Автор работы: Пользователь скрыл имя, 07 Сентября 2015 в 01:22, контрольная работа

Описание работы

По данной платежной матрице найти:
Оптимальные стратегии в игре с природой, используя критерии Лапласа, Вальда, Севиджа, Гурвица;

Файлы: 1 файл

Teoria_igr_2_variant.docx

— 31.05 Кб (Скачать файл)

Министерство Сельского хозяйства Российской Федерации

Федеральное государственное бюджетное образовательное учреждение

Высшего профессионального образования

«Смоленская государственная сельскохозяйственная академия»

 

 

 

 

Кафедра информационных технологий и высшей математики

 

 

 

 

 

Контрольная работа

 

по дисциплине «Теория игр»

 

 

 

 

 

 

 

 

 

Выполнила: студентка группы

заочной формы обучения

экономического факультета

 

Проверила:

Юденкова А.П.

 

 

 

 

 

 

 

 

 

 

Смоленск 2014 
Теория игр.

Задача 1.

По данной платежной матрице найти:

  1. Оптимальные стратегии в игре с природой, используя критерии Лапласа, Вальда, Севиджа, Гурвица;

 

  1. Критерий Лапласа.

Основная идея критерия Лапласа состоит в том, что надо выбрать ту стратегию, для которой математическое ожидание будет больше.

Решение:

Считаем все состояния природы равновероятными (табл 1.)

Таблица 1.

Bj

B1

B2

B3

qj

1/3

1/3

1/3


 

Рассчитаем математические ожидания выигрышей:

М1;

М2;

М3;

Поскольку математическое ожидание выигрыша при стратегии А3 наибольшее, то следует отдать ей предпочтение.

  1. Критерий Вальда.

Согласно этому критерию оптимальной стратегией считается та, при которой гарантированный выигрыш в любом случае будет не меньше, чем «нижнее цена игры с природой»:

 

Решение:

Определим минимальные выигрыши по строкам и выберем ту стратегию, при которой минимум строки максимален:

 

В данном случае это третья стратегия (А3), для которой .

  1. Критерий Севиджа.

Оцениваем характерность действий самого игрока. В данном критерии необходимо ввести матрицу рисков.

Пусть природа находится в состоянии Bj, т.е. она «выбрала» j-й столбец платежной матрицы. Для нападающего наиболее удачной будет стратегия Аi, при которой выигрыш окажется максимальным. Пусть . При других стратегиях игрок будет терять какую-то часть выигрыша именно из-за своих неудачных действий. Величину такой потери назовем риском. Чтобы получить риск rij, нужно из вычесть фактический выигрыш aij:

rij,=aij

Решение:

 

 

Оптимальной в данном случае выбирается та стратегия, при которой величина максимального риска минимальна:

 

 

  1. Критерий Гурвица.

Согласно критерию Гурвица, оптимальная стратегия выбирается из условия:

,

где – коэффициент «пессимизма», причем . При критерий Гурвица переходит в критерий Вальда, при – в критерий «крайнего оптимизма», при котором выбирается стратегия-строка с максимальным выигрышем.

Значение .

Решение:

В каждой строке платежной матрицы выберем наибольшее и наименьшее значения и проведем расчеты согласно формулам:

 

 

 

Максимальное значение Нj(j=1,2,3) соответствует третьей стратегии. Она и является оптимальной, согласно критерию Гурвица, при данном значении .

 

Динамическое программирование

Задача 2.

В начале года банк имеет возможность вложить в два предприятия средства в размереаден. ед. От вложения на квартал в первое предприятие хден. ед. банк получает доход в размереbxден. ед. и остаток средств в размере pxден. ед. Для второго предприятия эти показатели составляют соответственно cxи sxден. ед. В каждом последующем квартале могут использоваться только остатки денежных средств.

Требуется определить программу квартального выделения средств каждому предприятию, обеспечивающую банку наибольший годовой (4 квартала) доход.

2.

a =1500

b = 4

с = 5

p = 0,4

s = 0,2


 

Решение

  1. В данном случае состояние системы характеризуется остатком средств, которые могут быть использованы на дальнейшее финансирование предприятий.
  2. Число шагов, следуя условию задачи, необходимо выбрать по числу кварталов n = 4.
  3. Пусть двум предприятиям выделяют на k-м этапе ak средств. Из них первому предприятию xk, второмуyk. Ограничения имеют вид:

xk+yk = ak, xk0, yk0 (k= 1,2,3,4).

Таким образом, решение будет заключаться в нахождении объема финансирования одного из двух предприятий.

  1. Определим функцию прибыли:

wk = 4 xk+ 5 yk = 4 xk+ 5 (ak - xk) = 4 xk+5ak- 5xk = 5ak– 1 xk.

Здесь мы воспользовались тем, чтоyk = ak - xk .

  1. Найдем функцию, определяющую изменение состояния системы в зависимости от решения на k-м шаге. Для этого необходимо рассчитать остаток средств на (k + 1)-м шаге:

Sk+ 1 = j(Sk, (xk, yk)) = 0,4 xk+ 0,2yk = 0,4xk+ 0,2 (ak - xk) = 0,4xk+ 0,2ak – 0,2 xk = 0,2ak + 0,2 xk.

  1. Уравнение Беллмана будет иметь вид:

Wk* (Sk- 1) =.

  1. Проведем условную оптимизацию.

Начнем процесс условной оптимизации с последнего этапа, т.е. k= 4, а остаток равен 0, т.еWk+1 = 0:

W4*(S3) = = 4a4.

Условное оптимальное решение на 4-м шаге будет такое: профинансировать первое предприятие в размере a4усл. ед., второе предприятие не финансировать (x4 = a4, y4 = a4 – x4 = 0).

k = 3.

W3*(S2) =. = = = 5,8 a3.

На 3-м шаге никакие решения не повлияют на условный максимум W3*(S2) =5,8 a3, поэтому средства в размере a3, усл. ед. можно распределить произвольно между предприятиями.

k = 2.

W2*(S1) =. = = = 6,16a2.

Условное оптимальное решение на 2-м шаге: выделить все средства в размере а2усл. ед. второму предприятию, первое предприятие не финансировать (х2 = 0, y2 = а2).

k = 1.

W1*(S0) =. = = = 6,232 a1.

На 1-м этапе условный максимум достигается, если профинансировать второе предприятие, а первому предприятию средств не выделять (х1 = 0, y1 = а1). Условная оптимизация проведена.

  1. Проведем безусловную оптимизацию.

На 1-м шаге выделяется a1 = 1500 усл. ед. Значит, S1 = 1500 усл. ед., (x1 = 0, y1 = 1500), W1* = 9348 усл. ед. – прибыль за все четыре шага.

На 2-м шаге S2 = a2 = 0,2a1 + 0,2 x1 = 0,2 1500 + 0,2 0 = 300 усл. ед., (x2 = 0, y2 = 300), W2* = 1848 усл. ед. – суммарная максимальная прибыль на 2-м, 3-м, 4-м шагах.

На 3-м шаге S3 = a3 = 0,2a2 + 0,2 x2 = 0,2 300 + 0,2 0 = 60 усл. ед., (, y3 = 300 – x3), W3* = 348усл. ед. – суммарная максимальная прибыль на 3-ми 4-м шагах.

k= 4.S4 = a4 = 0,2 a3 + 0,2 x3 = 12 + 0,2 x3, (x4 = 12 + 0,2 x3, y3 = 0), W4* = 4 (12 + 0,2 x3).

Заметим, что в данной задаче ДП существует бесконечно много оптимальных стратегий, приводящих к одной и той же оптимальной прибыли. Такая ситуация является достаточно типичной для ДП.

 

 

 

 

 

 

 


Информация о работе Контрольная работа по «Теория игр»