Методы и модели игры

Автор работы: Пользователь скрыл имя, 03 Декабря 2012 в 21:46, курс лекций

Описание работы

Рассмотрим игру, в которой участвуют два игрока, причем каждый из игроков имеет конечное число стратегий. Обозначим для удобства одного из игроков через А, в другого — через В.
Предположим, что игрок А имеет m стратегий — А1, А2, ..., Аm, а игрок В имеет n стратегий В1, В2, ..., Вn.
Пусть игрок А выбрал стратегию Ai, а игрок В стратегию Вk. Будем считать, что выбор игроками стратегий Ai и Вk однозначно определяет исход игры — выигрыш аik игрока А и выигрыш bik игрока В, причем эти выигрыши связаны равенством

Содержание работы

Часть I МАТРИЧНЫЕ ИГРЫ 59
1. Равновесная ситуация 60
2. Смешанные стратегии 65
Основные определения 65
Основная теорема матричных игр 68
Основные свойства оптимальных смешанных стратегий 68
3. Методы решения матричных игр 69
Итерационный метод решения матричных игр 77
Сведение матричной игры к задаче линейного программирования 79
4. Примеры задач, сводимых к матричным играм 81
Несколько слов в заключение 84
6. О классификации игр 85
Часть II ПОЗИЦИОННЫЕ ИГРЫ 86
1. Структура позиционной игры 86
2. Нормализация позиционной игры 88
3. Позиционные игры с полной информацией 97
Несколько слов в заключение 100
3.6 Принятие решений и теория игр. Примеры. 101
3.6.1. Оптимальное решение игры двух лиц с нулевой суммой 102
Упражнения 3.6,а 103
3.6.2. Решение матричных игр в смешанных стратегиях 105
Упражнения 3.6,b 107
Упражнений 3.6,с 110
3.7. Заключение 111
Литература 112
Комплексные задачи 112

Файлы: 1 файл

методы и модели игры 32.doc

— 1,021.50 Кб (Скачать файл)

 

a) Сформулируйте задачу в виде  игры двух лиц с нулевой  суммой.

b) Определите оптимальные стратегии  и цену игры.

c) Имеет ли задача альтернативные  решения?

d) Является ли эта игра справедливой, т.е. имеет ли она цену, равную нулю?

 

3. Университетские команды  UA и DU определяют свои стратегии игры в национальном чемпионате по баскетболу для колледжей. Оценивая возможности своих "запасных скамеек", каждый тренер разработал по четыре варианта замены игроков на протяжении игры. Способность каждой команды выполнять двух-, трех–очковые и штрафные броски является основным фактором, определяющим результат игры. Приведенная ниже таблица содержит очки чистого выигрыша команды UA на протяжении одного владения мячом в зависимости от стратегий, планируемых каждой командой.

 

 

DU1

DU2

DU3

DU4

UA1

3

–2

1

2

UA2

2

3

–3

0

UA3

–1

2

–2

2

UA4

–1

–2

4

1


 

a) Решите игру методами линейного  программирования и определите  выигрышные стратегии.

b) Исходя из имеющейся информации, какая из двух команд может выиграть чемпионат?

c) Пусть за всю игру имеется  60 возможностей владения мячом  (30 владений для каждой команды). Предскажите ожидаемое количество  очков, с которым будет выиграна  игра чемпионата.

 

4. Армия полковника Блотто сражается с вражеской армией за контроль над двумя стратегически важными позициями. Полковник имеет в своем распоряжении два полка, а его противник — три. Каждый из противников может посыпать на любую позицию только целое число полков или совсем не посылать. Позиция будет захвачена армией, которая атакует большим количеством полков. Иначе результат сражения является ничейным

 

a) Сформулируйте задачу в виде  игры двух лиц с нулевой  суммой и решите игр; методами  линейного программирования.

b) Какая армия выиграет сражение?

 

5. В игре двух лиц,  именуемой двухпальцевой игрой  Морра, каждый игрок показывает  один или два пальца и одновременно  отгадывает число пальцев, которые  покажет его противник. Игрок,  который угадал, выигрывает сумму,  равную суммарному числу показанных противниками пальцев. Иначе игра заканчивается вничью. Сформулируйте задачу в виде игры двух лиц с нулевой суммой и решите игру методами линейного программирования.

 

6. Покажите, что задача, двойственная к задаче линейного  программирования для игрока А, является задачей линейного программирования для игрока В и что еле дующие два утверждения не противоречат друг другу.

 

a) Задача линейного программирования  для игрока А записана в форме, приведенной в разделе 3.6.2.

b) Задача линейного  программирования для игрока А записана в форме, упомянутой в п. а), в которой все ограничения вида "≥" приведены к виду "≤".

3.7. Заключение

В этой главе рассмотрены критерии выбора оптимальных решений как  в ситуациях точными (детерминированными), так и неполными (вероятностными или неопределенными) данными. Дальнейшие приложения критериев выбора оптимальных решений в ситуациях с неполными данными будут рассмотрены в последующих главах. В частности, критерий ожидаемой величины используется в главах, посвященных управлению запасам) теории массового обслуживания, имитационному моделированию и марковским процесса принятия решений. Это вовсе не значит, что другие критерии неприменимы. Критерий ожидаемой величины используется скорее традиционно в силу своей простоты.

Литература

Chen S. and Hwang C. Fuzzy Multiple Decision Making, Springer – Verlag, Berlin, 1992.

Dantzing G. B. Linear Programming and Extension, Princeton University Press, Princeton, N. J., 1963.

Meyerson R. Game Theory: Analysis of Conflict, Harvard University Press, Cambridge, Mass., 1991.

Saaty T. L. Fundamentals of Decision Making, RWS Publications, Pittsburg, 1994.

Комплексные задачи

 

1. Руководитель цеха рассматривает три возможных решения относительно существующего фрезерного станка.

 

a) Модифицировать имеющийся станок, установив на нем автоматическую подачу (АП).

b) Купить новый станок с программным  управлением (ПУ).

c) Заменить станок обрабатывающим  центром (ОЦ).

 

Три альтернативы оцениваются на основе двух критериев: денежный и функциональный. Следующая таблица содержит необходимые данные.

 

Критерий 

Единицы

АП

ПУ

ОЦ

Денежный

Начальная стоимость ($)

 

12 000

25 000

120 000

Стоимость обслуживания ($)

 

2 000

4 000

15 000

Стоимость обучения персонала ($)

 

3 000

8 000

20 000

Функциональный 

Производительность

Изделий/день

8

14

40

Время наладки

Минут

30

20

3

Металлические отходы

Фунты/день

440

165

44


 

Руководитель считает, что денежный критерий в полтора раза важнее функционального. Кроме того, производительность в  два раза важнее времени наладки  и в три раза важнее, чем количество получаемых металлических отходов. Показатель, связанный с временем наладки, считается в четыре раза важнее показателя, связанного с количеством металлических отходов. Что же касается денежного критерия, то руководитель считает, что стоимость обслуживания и стоимость обучения персонала одинаково важны, а начальная стоимость в два раза важнее каждого из этих двух показателей.

Проанализируйте описанную ситуацию и дайте соответствующие рекомендации.

 

2.  Компания использует каталог товаров для продажи, включающий более 200 000 наименований, хранящихся на многих региональных складах. В прошлом компания считала важным иметь точный перечень запасов на каждом складе. Как следствие этого, каждый год проводился переучет — интенсивная и неприятная работа, которая неохотно выполнялась всеми складами. Компания для проверки качества складских операций в регионе сопровождала каждый переучет ревизией, которая охватывала около 100 наименований на каждом складе. Результаты проверки обнаружили, что в среднем лишь 64% наименований на каждом складе соответствовали действительной инвентарной описи, что является неприемлемым. Дабы исправить ситуацию, компания распорядилась чаще проводить переучет дорогих и быстро реализуемых товаров. Системному аналитику была поставлена задача разработать процедуры для реализации этих планов. Вместо того чтобы напрямую заняться выполнением задания компании, системный аналитик решил установить причину возникшей проблемы. Он перешел в своем исследовании от формулировки "Как мы можем увеличить частоту переучетов?" к "Как можно повысить точность переучетов?". Изучение проблемы под таким углом зрения свелось к следующему анализу. Предполагая, что доля точно сосчитанных наименований на складе равна р, аналитик затем предположил, что есть основания считать, что имеется 95%-ная вероятность того, что если изделие было правильно учтено в первый раз, то будет правильно переучтено и при последующем переучете. Для части 1 – р товаров, которая не была точно учтена в первом раунде проверки, доля правильного учета во втором раунде равна 80%. Используя эту информацию, аналитик с помощью дерева решений построил график безубыточности, который сравнил точность учета в первом и втором раундах проверки. Конечный результат сводился к тому, что склады, на которых уровень точности выше порога безубыточности, не требовали переучета. Удивительным результатом предложенного решения было рьяное усилие со стороны каждого склада сделать правильный учет за первый раз, что привело к повышению точности учета на всех складах.

Как аналитик убедил руководство в  жизнеспособности предложенного порога безубыточности для повторного переучета?

 

3. В аэрофлоте рабочие часы устанавливаются в соответствии с договорами, заключенными с профсоюзными организациями. В частности, максимальная продолжительность работы может быть ограничена 16 часами для полетов на Боинге-74719 (В-747) и 14 часами — на Боинге-707 (В-707). Если эти пределы превышаются в силу неожиданных задержек, экипаж должен быть заменен новым. Аэрофлот содержит резервные экипажи для таких случаев. Средняя годовая стоимость содержания член» резервного экипажа оценивается в 30 000 долларов. Задержка полета на одну ночь, обусловленная отсутствием резервного экипажа, может стоить 50 000 долларов. Член экипажа находится по вызову непрерывно 12 часов в сутки 4 дня в неделю и может находиться по вызову три оставшихся дня недели. Самолет В-747 может обслуживаться двумя экипажами для самолета В-707.

Следующая таблица содержит вероятности  вызова резервных экипажей, вычисленные на основании трехлетнего опыта.

 

Категория рейса

Рейс (время вылета)

Вероятность вызова

В – 747

В – 707

1

14.0

0.014

0.072

2

13.0

0.000

0.019

3

12.5

0.000

0.006

4

12.0

0.016

0.006

5

11.5

0.003

0.003

6

11.0

0.002

0.003


 

Приведённые данные свидетельствуют, например, что для 14-часового рейса вероятность вызова равна 0.014 для В-747 и 0.072— для В-707.

 

Типичная пиковая часть расписания дня имеет следующий вид.

 

Время дня

Самолет

Категория рейса

8:00

707

3

9:00

707

6

 

707

2

10:00

707

3

11:00

707

2

 

707

4

15:00

747

6

16:00

747

4

19:00

747

1


 

Существующая политика относительно резервных экипажей состоит в  использовании двух экипажей (по семь членов каждый) от 5:00 до 11:00, четырех  — от 11:00 до 17:00 и двух — от 17:00 до 23:00.

Оцените эффективность Существующей политики относительно резервных экипажей. В частности, является ли число резервных экипажей очень большим, очень малым или таким, как необходимо?

 

1 Экстремальные величины всегда существуют вследствие того, что функция является непрерывной на замкнутом множестве

.




Информация о работе Методы и модели игры