Джун Парки - Теория Игр И Принятия Решений

В теории принятия решений используются ‘‘разумные’’ процедуры выбора наилучшей из нескольких возможных альтернатив. Насколько правильным будет выбор, зависит от качества данных, используемых при описании ситуации, в которой принимается решение. С этой точки зрения процесс принятия решений может принадлежать к одному из трех возможных условий.

1. Принятие решений в условиях определенности, когда данные известны точно.

2. Принятие решений в условиях риска, когда данные можно описать с помощью вероятностных распределений.

3. Принятие решений в условиях неопределенности, когда данным нельзя приписать относительные веса (весовые коэффициенты), которые представляли бы степень их значимости в процессе принятия решений.

По существу, в условиях определенности данные надежно определены, в условиях неопределенности они не определены. Принятие решений в условиях риска, следовательно, представляет ‘‘промежуточный’’ случай.

14.1. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ ОПРЕДЕЛЕННОСТИ — МЕТОД АНАЛИЗА ИЕРАРХИЙ

Модели линейного программирования (главы 2--8) являются примером принятия решений в условиях определенности. Эти модели применимы лишь в тех случаях, когда альтернативные решения можно связать между собой точными линейными функциями. В этом разделе рассматривается иной подход к принятию решений в ситуациях, когда, например, для идей, чувств, эмоций определяются некоторые количественные показатели, обеспечивающие числовую шкалу предпочтений для возможных альтернативных решений. Этот подход известен как метод анализа иерархий.

Перед тем как изложить детали данного метода, рассмотрим пример, демонстрирующий способ, с помощью которого оцениваются различные альтернативные решения.

Пример 14.1.1

Мартин Ганс — выпускник-отличник средней школы, который получил полную стипендию от трех университетов: А, В и С. Для того чтобы выбрать университет, Мартин сформулировал два основных критерия: местонахождение университета и его академическая репутация. Будучи отличным учеником, он оценивает академическую репутацию университета в пять раз выше, чем его местонахождение. Это приводит к тому, что репутации университета приписывается вес примерно 83 %, а его местонахождению — 17 %о. Далее Мартин использует системный анализ (сущность его излагается ниже) для оценки трех университетов с точки зрения их местонахождения и репутации. Проведенный анализ дает следующие оценки.

Университет
Критерии А В С
Местонахождение 12,9% 27,7% 59,4%
Репутация 54,5% 27,3% 18,2%
Структура задачи принятия решений приведена на рис. 14.1. Задача имеет единственный иерархический уровень с двумя критериями (местонахождение и репутация) и три альтернативных решения (университеты А, В и С).

Критерий иерархии 1-го уровня:близнец Мартина Джейн также получила полную стипендию от трех университетов. Однако их родители ставят условие, что дети должны учиться в одном университете, тогда они смогут пользоваться одним автомобилем. На рис. 14.2 приведена структура задачи выбора решения, которая теперь включает два иерархических уровня со своими критериями. Величины p и q (предположительно равные) на первом иерархическом уровне представляют собой весовые коэффициенты, которые приписываются точке зрения Мартина и Джейн относительно процесса выбора соответственно. Второй иерархический уровень использует веса (p1, p2) и (q1, q2) для отображения индивидуальных точек зрения Мартина и Джейн относительно критериев местонахождения и академической репутации каждого университета. Остальная часть структуры принятия решения может быть интерпретирована аналогично предыдущему примеру. Заметим, что p + q = 1, p1 + p2 = 1,

q1 + q2 = 1 ph + p12 + p13 = 1 p21 + p22 + p23 = 1 qn + q12 + q^ = 1, q21 + q22 + q23 = 1. Определение комбинированного веса для университета А, представленное на рис. 14.2, демонстрирует, каким образом вычисляются эти показатели.

Решение:

Выбор университета

Критерий

иерархии

1- го уровня:

Критерий

иерархии

2- го уровня:

Мартин (р)

Джейн (д)

Местоположение (р{) Репутация (р2) Местоположение (q{) Репутация (<j2)

Альтернативы: Ун. A Ун. В Ун. С Ун. А Ун. В Ун. С Ун. А Ун. В Ун. С Ун. А Ун. В Ун. С foil)

-r— (Ptt) ы (Рп)

1 ІРц) ІР2 з) fell)

-Г— (?іг) fell) fe2l)

1 (я 22) fe) j

____і ______і Ун. А =р(р\ хрп2 хр21) + q{qx хqn + q2xq2l)

Рис. 14.2. Расширенная иерархия принятия решений примера 14.1.1

УПРАЖНЕНИЕ 14.1.1

1. Пусть для задачи выбора университета Мартином и Джейн установлены следующие значения весовых коэффициентов.

p = 0,5, q = 0,5, pi = 0,17, p 2 = 0,83, pn = 0,129, pi2 = 0,277, pi3 = 0,594, p 2i = 0,545, p 22 = 0,273, p23 = 0,182, qi = 0,3, q2 = 0,7,

qn = 0,2, q

0,3, qia = 0,5,

12

q2i 0,5, q22 0,2, q23 0,3.

Основываясь на этой информации, оцените с помощью комбинированных весов каждый из трех университетов.

Определение весовых коэффициентов. Сложность метода анализа иерархий заключается в определении относительных весовых коэффициентов (таких, как использованные в примере 14.1.1) для оценки альтернативных решений. Если имеется n критериев на заданном уровне иерархии, соответствующая процедура создает матрицу А размерности n х n, именуемую матрицей парных сравнений, которая отражает суждение лица, принимающего решение, относительно важности разных критериев. Парное сравнение выполняется таким образом, что критерий в строке i (i = 1, 2, ..., n) оценивается относительно каждого из критериев, представленных n столбцами. Обозначим через atj элемент матрицы А, находящийся на пересечении i-й строки и j-го столбца. В соответствии с методом анализа иерархий для описания упомянутых оценок используются целые числа от 1 до 9. При этом ац = 1 означает, что i-й и j-й критерии одинаково важны, atj = 5 отражает мнение, что i-й критерий значительно важнее, чем j-й, а atj = 9 указывает, что i-й критерий чрезвычайно важнее j-го. Другие промежуточные значения между 1 и 9 интерпретируются аналогично. Согласованность таких обозначений обеспечивается следующим условием: если atj = k, то автоматически an = 1/k. Кроме того, все диагональные элементы aa матрицы А должны быть равны 1, так как они выражают оценку критерия относительно самих себя.

Пример 14.1.2

Покажем, как определяется матрица сравнения А для задачи выбора Мартина из примера 14.1.1. Начнем с главного иерархического уровня, который имеет дело с критериями академической репутации университета и его местонахождения. С точки зрения Мартина, академическая репутация университета значительно важнее его местонахождения. Следовательно, он приписывает элементу (2, 1) матрицы А значение 5, т.е. а21 = 5. Это автоматически предполагает, что а12= 1/5. Обозначив через R и L критерии репутации университета и его местонахождения, можно записать матрицу сравнения следующим образом.

L R 2,

C [ 521)

Суммы элементов столбцов = [8, 3,5, 1,7].

Ar = B 1 C 1

Суммы элементов столбцов =[1,83, 3,67, 5,5],

Элементы матриц Ar и Al определены на основе суждений Мартина, касающихся относительной важности трех университетов.

При делении элементов каждого столбца матриц Ar и Al на сумму элементов этих же столбцов получаем следующие нормализованные матрицы.

A B C A f 0,125 0,143 0,1184 N l = B 0,250 0,286 0,294 C v 0,625 0,571 0,588, A B C A '0,545 0,545 0,545N N r = В 0,273 0,273 0,273 C 0,182 0,182 0,182, Средние значения элементов строк wLA =(0,125 + 0,143 + 0,118)3 = 0,129, vLB = (0,250 + 0,286 + 0,294)3 = 0,277, vLC = (0,625 + 0,571 + 0,588)3 = 0,594. Средние значения элементов строк vRA =(0,545 + 0,545 + 0,545)3 = 0,545, vRB =(0,273 + 0,273 + 0,273)3 = 0,273, wRC = (0,182 + 0,182 + 0,182)3 = 0,182.

Величины (wRA, wRB, wRC) = (0,545, 0,273, 0,182) дают соответствующие веса для университетов А, В и С с точки зрения академической репутации. Аналогично величины (wLA, wLB, wLC) = (0,129, 0,277, 0,594) являются относительными весами, касающимися местонахождения университетов.

Согласованность матрицы сравнений. В примере 14.1.2 мы отмечали, что все столбцы нормализованных матриц N и NR идентичны, а столбцы матрицы NL таковыми не являются. Одинаковые столбцы указывают на то, что результирующие относительные веса сохраняют одно и то же значение независимо от того, как выполняется сравнение. В этом случае говорят, что исходные матрицы сравнения A и AR являются согласованными. Следовательно, матрица AL не является таковой.

Согласованность означает, что решение будет согласовано с определениями парных сравнений критериев или альтернатив. С математической точки зрения

согласованность матрицы A означает, что atjajk = aik для всех i, j и к. Например, в матрице AR из примера 14.1.2 a13 = 3 и a12a23 = 2 х 3/2 = 3. Свойство согласованности требует линейной зависимости столбцов (и строк) матрицы A. В частности, столбцы любой матрицы сравнений размерностью 2 х 2 являются зависимыми, и, следовательно, такая матрица всегда является согласованной. Не все матрицы сравнений являются согласованными. Действительно, принимая во внимание, что такие матрицы строятся на основе человеческих суждений, можно ожидать некоторую степень несогласованности, и к ней следует относиться терпимо при условии, что она не выходит за определенные “допустимые” рамки.

Чтобы выяснить, является ли уровень согласованности ‘‘допустимым’’, необходимо определить соответствующую количественную меру для матрицы сравнений A. В примере 14.1.2 мы видели, что идеально согласованная матрица A порождает нормализованную матрицу N, в которой все столбцы одинаковы:

w1 wi ¦ ¦¦ wi w2 w2 ¦ ¦¦ w2 Отсюда следует, что матрица сравнений A может быть получена из матрицы N путем деления элементов i-го столбца на wi (это процесс, обратный к нахождению матрицы N из A). Итак, получаем следующее. (

1 3- ... w ] w2 wn Щ 1 ••• Щ A = w1 wn w ... 1

У v ^1 w2 Используя приведенное определение матрицы A, имеем

w.

w,

wn

w

w. w1 nw1 w1 w2 = nw2 = n w2 V wn У v nwn У V wn X w

w,

wn wn

4 w, w2

В компактной форме условие согласованности матрицы A формулируется следующим образом. Матрица A будет согласованной тогда и только тогда, когда

Aw = =nw,

где w — вектор-столбец относительных весов wi, i = 1, 2, ..., n.

Когда матрица A не является согласованной, относительный вес wi аппроксимируется средним значением n элементов i-й строки нормализованной матрицы N (см. пример 14.1.2). Обозначив через w вычисленную оценку (среднее значение), можно показать, что

Aw = nmaxW

где n > n. В этом случае, чем ближе n к п, тем более согласованной является

“ max J 7 max 7

матрица сравнения A. В результате в соответствии с методом анализа иерархий вычисляется коэффициент согласованности в виде

CR = C1, RI

где

Ci = rbsaxn — коэффициент согласованности матрицы А, n -1

ri = 1,98 (n - 2) n

— стохастический коэффициент согласованности матрицы А.

Стохастический коэффициент согласованности RI определяется эмпирическим путем как среднее значение коэффициента CI для большой выборки генерированных случайным образом матриц сравнения A.

Коэффициент согласованности CR используется для проверки согласованности матрицы сравнения A следующим образом. Если CR < 0,1, уровень несогласованности является приемлемым. В противном случае уровень несогласованности матрицы сравнения A является высоким, и лицу, принимающему решение, рекомендуется проверить элементы парного сравнения atj матрицы А в целях получения более согласованной матрицы.

Значение nmax вычисляется на основе матричного уравнения Aw = nmax w, при этом

нетрудно заметить, что і-е уравнение этой системы имеет вид:

Za.w = n w.,

ij j max i7

i = 1,2,n.

j=1

Поскольку Z” Wi = 1, легко проверить, что

n I n \ n

El ZaiJWJ 1 = nmax Z Wi = nmax "

i=1 V j=1 J i=1

Это значит, что величину nmax можно определить путем вычисления вектор-столбца Aw с последующим суммированием его элементов.

Пример 14.1.3

В примере 14.1.2 матрица AL является несогласованной, так как столбцы матрицы Nl неодинаковы. Требуется исследовать согласованность матрицы AL.

Вычислим значение nmax. Из данных примера 14.1.2 имеем

W1 = 0,129, W2 = 0,277, W3 = 0,594.

Следовательно,

A LW = 11 1 1 'I

2 5

2 1 1 10,129 ^ 0,277 10,3863N 0,8320 2

3 2 1

^ 1J V0,594 J V 1,7930 y Отсюда получаем

nmax = 0,3863 + 0,8320 + 1,7930 = 3,0113. Следовательно, для n = 3 имеем

n -1 3 -1

1,98(n -2) _ 1,98 х 1 n 3

CI _ n=xZn _ 3,0113-3 _ 0,00565,

RI-

: 0,66,

CR _ C _ M0565 _ 0,00856.

RI 0,66

Так как CR < 0,1, уровень несогласованности матрицы AL является приемлемым.

Реализация метода анализа иерархий в Excel. Шаблон Excel ch14AHP.xls разработан для решения задач принятия решений, у которых максимальный размер матриц сравнения не превышает 8х8. Так же, как и в шаблонах Excel, описанных в главах 10 и 11, здесь пользователю необходимо некоторые действия выполнить вручную.

На рис. 14.3 показано применение этого шаблона для решения задачи примера 14.1.2. Матрицы сравнения вводятся по одной за раз в верхнюю часть раздела входных данных. Порядок, в котором вводятся матрицы сравнения не важен, тем не менее, будет больше пользы, если рассматривать их в порядке иерархии. После ввода коэффициентов матрицы сравнения в разделе выходных результатов в нижней части рабочего листа появится соответствующая нормированная матрица, а также ее коэффициент согласованности CR. Далее вы должны скопировать значения весов w в столбце J и вставить их в область Solution summary (правая часть таблицы). Для вставки не забудьте выполнить команду ВставкаОСпециальная вставкаОЗначения, чтобы скопировать значения, а не формулы. Эти действия следует повторять для всех матриц сравнения.

3 2 ' 1 2 11

2 1 2 >

О

II

Ч Сс 3

3 1 2 S

, A Р = J M І 2 1 у M I1 2 1 у матрицы сравнений, приведенные ниже. Необходимо оценить три дома в порядке их приоритета и вычислить коэффициент согласованности каждой матрицы.

К Д Л Б Л Б K (1 2Л Л Г1 V Л Г1 4' A =

Д 1

К 2 1

У >

*

II 3

К3 1, , A Д =

Д Б І1 1J A B C A B C г 1 2 3 Г 1 Л 1 л A 1

2 A 2 2 A

АКЛ = B 1 2 A

s ЛКБ =B 1 1 1 C 1 1 1

У C 2 3 К 3 2 К 2 3 1У A B C A B C Г1 4 2' У

1 1 4 л

4 A 1

4 A 2 A

АДЛ =B 1 3 A

АДБ =B 2 1 3 C 1 1 1

У C 1 1 1

У К 2 3 к 4 3 3. Автор книги по исследованию операций определил три критерия для выбора издательства, которое будет печатать его книгу: процент авторского гонорара (R), уровень маркетинга (M) и размер аванса (A). Издательства H и P проявили интерес к изданию книги. Используя приведенные ниже матрицы сравнения, необходимо дать оценку двум издательствам и оценить согласованность решения.

2000 Акции компании В 1500 500 Вероятность события 0,6 0,4 Эта задача может быть также представлена в виде дерева решений, показанного на рис. 14.4. На этом рисунке используется два типа вершин: квадратик представляет

“решающую” вершину, а кружок — “случайную”. Таким образом, из вершины 1 (“решающая”) выходят две ветви, представляющие альтернативы, связанные с покупкой акций компании А или В. Далее две ветви, выходящие из ‘‘случайных’’ вершин 2 и 3, соответствуют случаям повышения и понижения котировок на бирже с вероятностями их появления и соответствующими платежами.

Повышение котировок (0,6)

Ь

Понижение котировок (0,4) Повышение котировок (0,6)

5000

Инвестиции в компанию .4

-2000

1500

Инвестиции в компанию В

500

Понижение котировок (0,4)

Рис. 14.4. Дерево решений для задачи инвестирования

Исходя из схемы рис. 14.4 получаем ожидаемую прибыль за год для каждой из двух альтернатив.

Для акций компании А: 5000 х 0,6 + (--2000) х 0,4 = 2 200 (долл.).

Для акций компании B: 1500 х 0,6 + 500 х 0,4 = 1 100 (долл.).

Вашим решением, основанным на этих вычислениях, является покупка акций компании А.

В теории принятия решений повышение и понижение котировок на бирже именуются состояниями природы, возможные реализации которых являются случайными событиями (в данном случае с вероятностями 0,6 и 0,4). В общем случае задача принятия решений может включать n состояний природы и m альтернатив. Если pj — вероятность j-го состояния природы, а atj — платеж, связанный с принятием решения i при состоянии природы j (i = 1, 2, ..., m, j = 1, 2, ..., n), тогда ожидаемый платеж для решения i вычисляется в виде

MV = ai1P1 + ад + ... + ^„p^i = 1 2 ...,

где по определению pt + p2 + ... + pn = 1.

Наилучшим решением будет то, которое соответствует MV* = maxt {MVi} или MV* = minf {MVi}, в зависимости от того, является ли платеж в задаче доходом (прибылью) или убытком (затратами).

УПРАЖНЕНИЯ 14.2.1

1. Вас пригласили на телевизионную игру Колесо фортуны. Колесо управляется электронным образом с помощью двух кнопок, которые сообщают колесу сильное (В) или слабое (Н) вращение. Само колесо разделено на равные области — белую (Б) и красную (К). Вам сообщили, что в белой области колесо останавливается с вероятностью 0,3, а в красной — 0,7. Плата, которую вы получаете за игру, равна (в долл.) следующему.

Н В

Б К 800 200 -2500 1000 Изобразите соответствующее дерево решений.

2. Фермер Мак-Кой может выращивать либо кукурузу, либо соевые бобы. Вероятность того, что цены на будущий урожай этих культур повысятся, останутся на том же уровне или понизятся, равна соответственно 0,25, 0,30 и 0,45. Если цены возрастут, урожай кукурузы даст 30 000 долл. чистого дохода, а урожай соевых бобов — 10 000 долл. Если цены останутся неизменными, Мак-Кой лишь покроет расходы. Но если цены станут ниже, урожай кукурузы и соевых бобов приведет к потерям в 35 000 и 5 000 долл. соответственно.

a) Представьте данную задачу в виде дерева решений.

b) Какую культуру следует выращивать Мак-Кою?

3. Допустим, у вас имеется возможность вложить деньги в три инвестиционных фонда открытого типа: простой, специальный (обеспечивающий максимальную долгосрочную прибыль от акций мелких компаний) и глобальный. Прибыль от инвестиции может измениться в зависимости от условий рынка. Существует 10% -ная вероятность, что ситуация на рынке ценных бумаг ухудшится, 50%-ная — что рынок останется умеренным и 40%-ная — рынок будет возрастать. Следующая таблица содержит значения процентов прибыли от суммы инвестиции при трех возможностях развития рынка.

Процент прибыли от инвестиции (%) Альтернатива (фонды) Ухудшающийся рынок Умеренный рынок Растущий рынок Простой +5 +7 +8 Специальный -10 +5 +30 Глобальный +2 +7 +20 a) Представьте задачу в виде дерева решений.

b) Какой фонд открытого типа вам следует выбрать?

4. Предположим, у вас имеется возможность вложить деньги либо в 7,5%-ные облигации, которые продаются по номинальной цене, либо в специальный фонд, который выплачивает лишь 1% дивидендов. Если существует вероятность инфляции, процентная ставка возрастет до 8%, и в этом случае номинальная стоимость облигаций увеличится на 10%, а цена акций фонда — на 20% . Если прогнозируется спад, то процентная ставка понизится до 6%. При этих условиях ожидается, что номинальная стоимость облигаций поднимется на 5%, а цена акций фонда увеличится на 20%. Если состояние экономики останется неизменным, цена акций фонда увеличится на 8%, а номинальная стоимость облигаций не изменится. Экономисты оценивают в 20% шансы наступления инфляции и в 15% — наступление спада. Ваше решение относительно инвестиций принимается с учетом экономических условий следующего года.

a) Представьте задачу в виде дерева решений.

b) Будете ли вы покупать акции фонда или облигации?

5. Фирма планирует производство новой продукции быстрого питания в национальном масштабе. Исследовательский отдел убежден в большом успехе новой продукции и хочет внедрить ее немедленно, без рекламной кампании на рынках сбыта фирмы. Отдел маркетинга положение вещей оценивает иначе и предлагает провести интенсивную рекламную кампанию. Такая кампания обойдется в 100 000 долл., а в случае успеха принесет 950 000 долл. годового дохода. В случае провала рекламной кампании (вероятность этого составляет 30%) годовой доход оценивается лишь в 200 000 долл. Если рекламная кампания не проводится вовсе, годовой доход оценивается в 400 000 долл. при условии, что покупателям понравится новая продукция (вероятность этого равна 0,8), и в 200 000 долл. с вероятностью 0,2, если покупатели останутся равнодушными к новой продукции.

a) Постройте соответствующее дерево решений.

b) Как должна поступить фирма в связи с производством новой продукции?

6. Симметричная монета подбрасывается три раза. Вы получаете один доллар за каждое выпадение герба (Г) и дополнительно 0,25 доллара за каждые два последовательных выпадения герба (заметим, что выпадение ГГГ состоит из двух последовательностей ГГ). Однако вам приходится платить 1,1 долл. за каждое выпадение решки (Р). Вашим решением является участие или неучастие в игре.

a) Постройте соответствующее дерево решений для описанной игры.

b) Будете ли вы играть в эту игру?

7. Предположим, у вас имеется возможность сыграть в игру следующего содержания. Симметричная игральная кость бросается два раза, при этом возможны четыре исхода: 1) выпадает два четных числа, 2) выпадает два нечетных числа, 3) выпадает сначала четное, затем нечетное число, 4) выпадает сначала нечетное, затем четное число. Вы можете делать одинаковые ставки на два исхода. Например, вы можете поставить на два четных числа (исход 1) и два нечетных (исход 2). Выигрыш на каждый доллар, поставленный на первый исход, равен 2 доллара, на второй и третий исходы — 1,95 доллара, на четвертый — 1,50 доллара.

a) Постройте дерево решений для описанной игры.

b) На какие исходы следует делать ставки?

c) Можно ли иметь стабильный выигрыш в этой игре?

8. Фирма производит партии продукции с 0,8, 1, 1,2 и 1,4 % бракованных изделий с вероятностями 0,4, 0,3, 0,25 и 0,05 соответственно. Три потребителя А, В и С заключили контракт на получение партий изделий с процентом некачественных изделий не выше 0,8, 1,2 и 1,4 % соответственно. Фирма штрафуется в сумме 1000 долл. за каждый пункт процента3 в случае, если процент некачественных изделий выше указанного. Наоборот, поставка партий изделий с меньшим процентом бракованных изделий, чем оговорено в контракте, приносит фирме прибыль в 500 долл. за каждый пункт процента. Предполагается, что партии изделий перед отправкой не проверяются.

a) Постройте соответствующее дерево решений.

b) Какой из потребителей должен иметь наивысший приоритет при получении своего заказа?

Пункт процента — это одна десятая процента. — Прим. ред.

9. Фирма планирует открыть новое предприятие в Арканзасе. В настоящее время имеется возможность построить либо крупное предприятие, либо небольшое, которое через два года можно будет расширить при условии высокого спроса на выпускаемую им продукцию. Рассматривается задача принятия решений на десятилетний период. Фирма оценивает, что на протяжении этих 10 лет вероятность высокого и низкого спроса на производимую продукцию будет равна 0,75 и 0,25 соответственно. Стоимость немедленного строительства крупного предприятия равна 5 млн. долл., а небольшого — 1 млн. долл. Расширение малого предприятия через два года обойдется фирме в 4,2 млн. долл. Прибыль, получаемая от функционирования производственных мощностей на протяжении 10 лет, приводится в следующей таблице.

Ожидаемый доход за год (тыс. долл.) Альтернатива Высокий спрос Низкий спрос Крупное предприятие сейчас 1000 300 Небольшое предприятие сейчас 250 200 Расширенное предприятие через 2 года 900 200 a) Постройте соответствующее дерево решений, принимая во внимание, что через два года фирма может либо расширить небольшое предприятие, либо не расширять его.

b) Сформулируйте стратегию строительства для фирмы на планируемый 10летний период. (Для простоты не принимайте во внимание возможную инфляцию.)

10. Решите предыдущее упражнение, предположив, что ежегодная учетная ставка равна 10 % и что решение принимается с учетом инфляции. (Совет. Для решения задачи необходимы таблицы сложных процентных ставок.)

11. Решите упражнение 9, предположив, что спрос может быть высоким, средним и низким с вероятностями 0,7, 0,2 и 0,1 соответственно. Расширение небольшого предприятия будет проведено лишь в том случае, если на протяжении первых двух лет спрос будет высоким. Следующая таблица содержит данные о прибылях за год.

Альтернатива Ожидаемый доход за год (тыс. долл.) Высокий спрос Средний спрос Низкий спрос Крупное предприятие сейчас 1000 500 300 Небольшое предприятие сейчас 400 280 150 Расширенное предприятие через 2 года 900 600 200 Компания хочет определить оптимальный период (в месяцах) между планируемыми профилактическими ремонтами.

a) Постройте соответствующее дерево решений.

b) Определите оптимальную длину цикла для профилактического ремонта.

13. Ежедневный спрос на булочки в продовольственном магазине задается следующим распределением вероятностей.

n 100 150 200 250 300 Pn 0,20 0,25 0,30 0,15 0,10 Магазин покупает булочку по 55 центов, а продает по 1,20 долл. Если булочка не продана в тот же день, то к концу дня она может быть реализована за 25 центов. Величина запаса булочек может принимать одно из возможных значений спроса, которые перечислены выше.

a) Постройте соответствующее дерево решений.

b) Сколько булочек необходимо заказывать ежедневно?

14. Пусть в предыдущем упражнении временной интервал, для которого необходимо решить задачу принятия решений, составляет два дня. Альтернативы для второго дня зависят от объема реализации булочек в первый день. Если реализован в точности весь запас первого дня, магазин закажет такое же количество булочек и на второй день. Если потребность в булочках в первый день превышает имеющийся запас, то для второго дня магазин может заказать любой из объемов спроса на булочки, который превышает запас первого дня. И наконец, если в первый день реализовано меньше булочек, чем было закуплено, то для второго дня магазин может заказать любой из объемов спроса на булочки, который меньше запаса первого дня. Постройте соответствующее дерево решений и определите оптимальную стратегию заказа.

15. Автомат производит а тысяч единиц некоего продукта ежедневно. Если а увеличивается, доля брака р, будучи случайной величиной, возрастает в соответствии со следующей функцией плотности вероятности:

f(Р)-=t“ 10 "Р"15

[0 в противном случае.

Каждое бракованное изделие приносит убыток в 50 долл., а качественное изделие — прибыль в 5 долл.

a) Постройте дерево решений для этой задачи.

b) Определите значение а, при котором ожидаемая прибыль принимает максимальное значение.

16. Наружный диаметр d цилиндра, производимого автоматом, имеет верхнее и нижнее допустимые значения d + tu и d - tL соответственно. Производственный процесс настроен так, что величина диаметра является нормально распределенной случайной величиной с математическим ожиданием р и стандартным отклонением а. Каждый цилиндр со значением диаметра, превышающим верхнее допустимое значение, доводится до нужных размеров за с1 долл. Цилиндр, диаметр которого меньше установленной нижней нормы, реализуется с убытком с2 долл. Определите оптимальное значение настройки для автомата.

17. Критерий предельного уровня. Фирма для технических целей использует в одном из своих производственных процессов химические препараты (химикалии). Срок годности этих препаратов составляет один месяц, после чего оставшаяся их часть уничтожается. Объем используемых фирмой химических препаратов (в галлонах) является случайной величиной, изменяющейся в соответствии со следующим распределением.

ной вероятностью будет ‘‘за’’, при снижении котировок вероятность его мнения ‘‘за’’ уменьшится до 50 %. Каким образом можно извлечь пользу из этой дополнительной информации?

Мнение друга фактически представляет условные вероятности ‘‘за--против’’ при заданных состояниях природы в виде повышения и понижения котировок. Введем следующие обозначения:

V — мнение ‘‘за’’, v2 — мнение ‘‘против’’,

m1 — повышение котировок, т2 — понижение котировок.

Мнение друга можно записать в виде вероятностных соотношений следующим образом.

P[vt | m1} = 0,9, P(vj | m2} = 0,1,

P{v2 | m1} = 0,5, P{v2 | m2} = 0,5.

С помощью этой дополнительной информации задачу выбора решения можно сформулировать следующим образом.

1. Если мнение друга ‘‘за’’, акции какой компании следует покупать — А или В?

2. Если мнение друга ‘‘против’’, то, опять-таки, — акции какой компании следует покупать — А или В?

Рассматриваемую задачу можно представить в виде дерева решений, показанного на рис. 14.5. Узлу 1 здесь соответствует случайное событие (мнение друга) с соответствующими вероятностями ‘‘за’’ и ‘‘против’’. Узлы 2 и 3 представляют выбор между компаниями А и В при известном мнении друга ‘‘за’’ или ‘‘против’’ соответственно. Узлы 4-7 соответствуют случайным событиям, связанным с повышением и понижением котировок.

Повышение котировок (т j) =0.730

$5000

-$2000

$1500

$500

$5000

-$2000

$1500

$500

Инвестиции в А

Понижение котировок (т2)

Р{т2|?і> =°.27°

Повышение котировок (тj) Pim^vJ = 0.730

Мнение "за" (vt)

Инвестиции в В

I Понижение котировок (т2) P{fn2\v^} = 0.270

Повышение котировок (т[) Р{тх\?2}= 0.231

Понижение котировок (ти2) Р{т2\?2} = 0.769 Повышение котировок (wj) P{mi|v2} = 0.231

Понижение котировок (тя2) Р{т2\?2) = 0.769

Инвестиции в А

Мнение "против" (?2)

Инвестиции в В

Рис. 14.5. Дерево решений с апостериорными вероятностями

Для оценки различных альтернатив, показанных на рис. 14.5, необходимо вычислить апостериорные вероятности P{mi | vj}, указанные на соответствующих ветвях, выходящих из узлов 4-7. Эти апостериорные вероятности вычисляются с учетом дополнительной информации, содержащейся в рекомендациях друга, с помощью следующих действий.

Шаг 1. Условные вероятности P{vj | т} для данной задачи запишем следующим образом.

Vi ?2 0,9 0,1 0,5 0,5 P{vj | mi} = mi

m2

Шаг 2. Вычисляем вероятности совместного появления событий.

Р{т, vj} = Р{? | т}Р{т} для всех і и j.

При заданных априорных вероятностях P{mJ = 0,6 и Р{т2} = 0,4 вероятности совместного появления событий определяются умножением первой и второй строк таблицы, полученной на шаге 1, на 0,6 и 0,4 соответственно. В результате имеем следующее.

Vi V2 0,54 0,06 0,20 0,20 P{mi, Vj} =

Сумма всех элементов этой таблицы равна 1.

Шаг 3. Вычисляем абсолютные вероятности.

P {vj }= X P {ті, Vj} для всех j.

по всем і

Эти вероятности получаются путем суммирования элементов соответствующих столбцов таблицы, полученной на шаге 2. В итоге имеем следующее.

P{Vi} P{V2} 0,74 0,26 Шаг 4. Определяем искомые апостериорные вероятности по формуле

р {ті, vj}

P {vj}

р{ 1 vj }

Эти вероятности вычисляются в результате деления каждого столбца таблицы, полученной на шаге 2, на элемент соответствующего столбца таблицы, вычисленной на шаге 3, что приводит к следующим результатам (округленным до трех десятичных знаков).

Vi ?2 0,730 0,231 0,270 0,769 Это те вероятности, которые показаны на рис. 14.5. Они отличаются от исходных априорных вероятностей Р{т1} = 0,6 и Р{т2} = 0,4.

Теперь можно оценить альтернативные решения, основанные на ожидаемых платежах для узлов 4-7.

Мнение ‘‘за’’

Доход от акций компании А в узле 4 = 5000 х 0,730 + (-2000) х 0,270 = 3110 (долл.).

Доход от акций компании B в узле 5 = 1500 х 0,730 + 500 х 0,270 = 1230 (долл.). Решение. Инвестировать в акции компании А.

Мнение ‘‘против’’

Доход от акций компании А в узле 6 = 5000 х 0,231 + (--2000) х 0,769 = -383 (долл.). Доход от акций компании B в узле 7 = 1500 х 0,231 + 500 х 0,769 = 731 (долл.). Решение. Инвестировать в акции компании B.

Заметим, что предыдущие решения эквивалентны утверждению, что ожидаемые платы в узлах 2 и 3 равны 3110 и 731 долл. соответственно (рис. 14.5). Следовательно, при известных вероятностях Р{?1} = 0,74 и Р{?2} = 0,26, вычисленных на шаге 3, можно определить ожидаемую плату для всего дерева решений (упражнение 14.2.2.3).

Вычисление в Excel апостериорных вероятностей. Шаблон Excel ch14Bayes-Posterior.xls вычисляет апостериорные вероятности для заданных матриц условных вероятностей, которые не должны превышать размер 10х10. Для вычислений необходимо задать вероятности Р{т} и P{v | m}. Excel проверит входные данные на наличие ошибок и при их обнаружении выведет соответствующее сообщение. На рис. 14.6 показано применение шаблона для решения задачи примера 14.2.2.

ная вероятность, что в сезон дождей будет идти дождь. В шесть часов вечера синоптики предсказали с 85%-ной вероятностью, что завтра будет дождь. Следует ли Джиму Бобу планировать рыбалку на завтра?

2. Фирма ‘‘Электра’’ получает 75 % электронных деталей от поставщика А и 25 % — поставщика В. Доля брака в продукции поставщиков А и В составляет 1 и 2 % соответственно. При проверке пяти деталей из полученной партии обнаружена лишь одна дефектная. Определите вероятность того, что партия получена от поставщика А. Проведите аналогичные вычисления относительно поставщика В. (Подсказка. Вероятность появления бракованной детали в партии подчиняется биномиальному закону распределения.)

3. Предположим, что в задаче из примера 14.2.2 есть дополнительный выбор, связанный с инвестированием 10 000 долл. в надежный депозит, который приносит 8 % прибыли. Совет вашего друга по-прежнему относится к инвестированию через биржу.

a) Постройте соответствующее дерево решений.

b) Какое оптимальное решение в этом случае? (Совет. Используйте вероятности Р{?1} и Р{?2}, полученные на шаге 3 в примере 14.2.2, для вычисления ожидаемой суммы инвестирования через биржу.)

4. Допустим, вы являетесь автором романа, который обещает быть популярным. Вы можете либо самостоятельно напечатать роман, либо сдать его в издательство. Издательство предлагает вам 20 000 долл. за подписание контракта. Если роман будет пользоваться спросом, будет продано 200 000 экземпляров, в противном случае — лишь 10 000 экземпляров. Издательство выплачивает авторский гонорар в сумме один доллар за экземпляр. Исследование рынка, проведенное издательством, свидетельствует о том, что существует 70%-ная вероятность, что роман будет популярным. Если же вы сами напечатаете роман, то понесете потери в сумме 90 000 долл., связанные с печатанием и маркетингом, но в этом случае каждый проданный экземпляр принесет вам прибыль в два доллара.

a) Принимая во внимание имеющуюся информацию, вы примете предложение издательства или будете печатать роман самостоятельно?

b) Предположим, что вы заключили договор с литературным агентом на исследование, связанное с потенциальным успехом романа. Исходя из предыдущего опыта, компания извещает вас, что если роман будет пользоваться спросом, то исследование предскажет неверный результат в 20 % случаев. Если же роман не станет популярным, то исследование предскажет верный результат в 85 % случаев. Как эта информация повлияет на ваше решение?

5. Вернитесь к проблеме выбора решения фермером Мак-Коем из упражнения 14.2.1.2. Фермер имеет дополнительный выбор, связанный с использованием земли как пастбища, что гарантированно принесет ему прибыль в 7500 долл. Фермер получил также дополнительную информацию от брокера, касающуюся степени стабильности будущих цен на продукцию. Оценки брокера ‘‘благоприятный — неблагоприятный” выражаются количественно в виде следующих условных вероятностей.

аі

Э2 0,15 0,85 0,50 0,50 0,85 0,15 si

P{aj | s} =

52

53

В данном случае a1 и а2 — оценки брокера “благоприятный” и “неблагоприятный”, а Sj, s2 и s3 представляют изменение в будущих ценах: соответственно “понижение”, “такие же’’, ‘‘повышение’’.

a) Постройте соответствующее дерево решений.

b) Найдите оптимальное решение задачи.

6. Пусть в упражнении 14.2.1.5 дирекция компании решила провести пробную продажу своей продукции в выбранных населенных пунктах. Результатом пробной продажи являются оценки ‘‘хорошо’’ (а1) или ‘‘плохо’’ (а2). Тест дает следующие условные вероятности с проведением рекламной кампании и без нее.

P{aj \ v,} с рекламной кампанией P{aj \ у} без рекламной кампании

ai a2 ai a2 Vi 0,95 0,05 wi 0,8 0,2 v2 0,3 0,7 W2 0,4 0,6 Здесь v1 и v2 обозначают соответственно ‘‘успех’’ и ‘‘неуспех’’, а w1 и w2 — ‘‘восприимчивый’’ и ‘‘невосприимчивый’’ покупатель.

a) Постройте соответствующее дерево решений.

b) Определите оптимальный план действий фирмы.

7. Статистические данные о работе компании показывают, что с вероятностью 5 % произведенная партия продукции будет неприемлемой (плохой). Плохая партия содержит 15 % дефектных изделий, а хорошая — лишь 4 %. Пусть значение переменной а = а1 (= а2) обозначает, что партия изделий является хорошей (плохой). Тогда соответствующие априорные вероятности равны соответственно Р{а = а1} = 0,95 и Р{а = а2} = 0,05.

Вместо того чтобы отправить партии продукции с характеристиками, основанными на априорных вероятностях, из каждой партии проверяются два изделия. Возможны следующие результаты проверки.

Оба изделия являются качественными (s1).

Одно изделие является качественным (s2).

Оба изделия являются бракованными (s3).

a) Определите апостериорные вероятности Р{аі \ s^, i = 1, 2; j = 1, 2, 3.

b) Предположим, что фирма отправляет партии продукции двум потребителям А и В. Контракты с ними определяют, что процент бракованных изделий в поставках не должен превышать 5 и 8 % соответственно. Предусматривается штраф в 100 долл. за превышение на один процент максимально допустимого лимита бракованных изделий. Поставка партий лучшего качества, чем указано в контракте, приносит производителю прибыль в 80 долл. за каждый процент уменьшения доли бракованных изделий. Постройте соответствующее дерево решений и определите приоритетную стратегию отправки партий продукции.

Функции полезности. В предыдущих примерах критерий ожидаемого значения применялся лишь в тех ситуациях, где платежи выражались в виде реальных денег. Зачастую возникают ситуации, когда при анализе следует использовать скорее

полезность, чем реальную величину платежей. Для демонстрации этого предположим следующее. Существует шанс 50 на 50, что инвестиция в 20 000 долл. или принесет прибыль в 40 000 долл., или будет полностью потеряна. Соответствующая ожидаемая прибыль равна 40000 х 0,5 - 20000 х 0,5 = 10000 долл. Хотя здесь ожидается прибыль в виде чистого дохода, разные люди могут по-разному интерпретировать полученный результат. Инвестор, который идет на риск, может вложить деньги, чтобы с вероятностью 50 % получить прибыль в 40 000 долл. Наоборот, осторожный инвестор может не выразить желания рисковать потерей 20 000 долл. С этой точки зрения очевидно, что разные индивидуумы проявляют разное отношение к риску, т.е. они проявляют разную полезность по отношению к риску.

Определение полезности является субъективным. Оно зависит от нашего отношения к риску. В этом разделе мы представляем систематизированную процедуру числовой оценки отношения к риску лица, принимающего решение. Конечным результатом является функция полезности, которая занимает место реальных денег.

В примере, приведенном выше, наилучший платеж равен 40 000 долл., а наихудший ----20 000 долл. Мы устанавливаем произвольную (но логически обос

нованную) шкалу полезности U, изменяющуюся от 0 до 100, где 0 соответствует полезности -20 000, а 100 — 40000, т.е. U(-20000) = 0 и U(40000) = 100. Далее определяем полезность в точках между --20000 и 40000 для определения общего вида функции полезности.

Если отношение лица, принимающего решение, беспристрастно к риску, то результирующая функция полезности является прямой линией, соединяющей точки (0, -20000) и (100, 40000). В этом случае как реальные деньги, так и их полезность дают совпадающие решения. В более реальных ситуациях функция полезности может принимать другой вид, отражающий отношение к риску лица, принимающего решение. На рис. 14.7 иллюстрируется вид функции полезности для трех индивидуумов X, Y и Z. Индивидуум X не расположен к риску (осторожен), так как проявляет большую чувствительность к потере, чем к прибыли. Индивидуум Z — противоположность в этом отношении индивиду X; он настроен на риск. Это следует из того, что для индивидуума X при изменении в 10 000 долл. вправо и влево от точки, соответствующей 0 долларов, увеличение прибыли изменяет полезность на величину ab, которая меньше изменения полезности bc, обусловленной потерями такой же величины, т.е. ab < bc. В то же время такие же изменения в ±10000 долл., относящиеся к индивидууму Z, обнаруживают противоположное поведение; здесь de > ef. Далее, индивидуум Y является нейтральным к риску, так как упомянутые изменения порождают одинаковые изменения полезности. В общем случае индивидуум может быть как не расположен к риску, так и настроен на риск, в зависимости от суммы риска. В этом случае соответствующая кривая полезности будет иметь вид удлиненной буквы S.

Кривые полезности, аналогичные изображенным на рис. 14.7, определены с помощью количественного показателя, характеризующего отношение к риску лица, принимающего решение, для различных значений уровня реальных денег в пределах установленного интервала. Так в рассмотренном примере установленным интервалом является (--20000, 40000), соответствующая полезность изменяется в интервале (0, 100). Необходимо определить полезность, соответствующую таким промежуточным значениям, как например, -10 000, 0, 10 000, 20 000 или 30 000. Соответствующая процедура построения функции полезности начинается с того, что организовывается лотерея для определения суммы реальных денег х, для которой ожидаемое значение полезности будет вычислено по следующей формуле.

U^) = _pU(-20000) + (1 -- _p)U(40000) = 0р + 100(1 -- р) = 100 - 100р, 0 <р < 1.

разному относящихся к риску Для определения значения U(х) просят лицо, принимающее решение, сообщить свое предпочтение между гарантированной наличной суммой х и возможностью сыграть в лотерею, в которой с вероятностью р реализуется проигрыш в сумме 20000 долл. и с вероятностью 1 -- р имеет место выигрыш в 40000 долл. При этом под предпочтением понимается выбор значения “нейтральной’’ вероятности р, при котором, с точки зрения лица, принимающего решение, возможности сыграть в лотерею и получить гарантированную сумму х являются одинаково привлекательными. Например, если х = 20000 долл., лицо, принимающее решение, может заявить, что гарантированные 20000 долл. наличными и лотерея одинаково привлекательны при р = 0,8. В этом случае вычисляется полезность для х = 20000 по следующей формуле.

U(20000) = 100 -- 100 х 0,8 = 20.

Эта процедура продолжается до тех пор, пока не будет получено достаточное количество точек (х, U^)) для определения формы функции полезности. Затем можно определить искомую функцию полезности путем регрессионного анализа или просто линейной интерполяции между полученными точками.

Хотя здесь применяется количественная процедура для определения функции полезности, сам подход далек от того, чтобы быть научно обоснованным. То, что процедура полностью определяется мнением лица, принимающего решение, порождает сомнения относительно надежности описанного процесса. Процедура, в частности, неявно предполагает, что лицо, принимающее решение, является рационально мыслящим — требование, которое не всегда может быть согласовано с вариациями в поведении и настроении, что является типичным для человеческой личности. В этом отношении лицо, принимающее решение, должно придерживаться концепции полезности в широком смысле, в соответствии с которой денежные величины не должны быть единственным решающим фактором в теории принятия решений.

УПРАЖНЕНИЯ 14.2.3

1. Допустим, вы — студент университета штата Арканзас, и имеете сильное желание присутствовать на следующем баскетбольном матче. Проблема в том, что входной билет стоит 10 долл., а у вас есть лишь 5 долл. Вы можете рискнуть 5 долл. в игре в покер с шансами 50 на 50 удвоить свою сумму или совсем ее проиграть.

a) Будете ли вы, исходя из реальной стоимости денег, искушать судьбу, играя в покер?

b) Учитывая ваше сильное желание присутствовать на матче, переведите наличные деньги в функцию полезности.

c) Основываясь на функции полезности, которую вы построили, примете ли вы участие в игре в покер?

2. Семья переехала в местность, где возможны землетрясения, и собирается построить дом. Решается вопрос, стоит ли строить дом в соответствии с высокими стандартами, рассчитанными на сейсмическую зону. Строительство дома в соответствии с такими стандартами обойдется в 850 000 долл., а без их учета — в 350 000 долл. В случае землетрясения (его вероятность равна 0,001) восстановление дома, построенного без соответствующих стандартов, обойдется в 900 000 долл. Примените в этой ситуации рассмотренную выше процедуру использования лотереи, предполагая, что шкала полезности изменяется от 0 до 100.

3. Инвестиция в 10 000 долл. в предприятие с высоким уровнем риска имеет шанс 50 на 50 увеличить эту сумму до 14 000 долл. на протяжении следующего года либо уменьшить ее до 8 000 долл. Это значит, что чистый доход составит либо 4000 долл., либо --2000 долл.

a) Принимая позицию нейтрального к риску инвестора и шкалу полезности от 0 до 100, определите полезность 0 долл. чистого дохода и соответствующую ‘‘нейтральную’’ вероятность.

b) Пусть два инвестора А и В определили следующие ‘‘нейтральные’’ вероятности.

Чистая прибыль (долл.) Вероятность Инвестор А Инвестор В -2000 1,00 1,00 -1000 0,30 0,90 0 0,20 0,80 1000 0,15 0,70 2000 0,10 0,50 3000 0,05 0,40 4000 0,00 0,00 Нарисуйте графики функций полезности для инвесторов А и В и охарактеризуйте их отношение к риску.

с) Пусть инвестор А может вложить деньги в одно из двух рискованных предприятий: I или II. Инвестиция в предприятие I может принести прибыль в сумме 3000 долл. с вероятностью 0,4 или убыток в 1000 долл.

с вероятностью 0,6. Инвестиция в предприятие II может принести прибыль в 2000 долл. с вероятностью 0,6 или вовсе не принести прибыли с вероятностью 0,4. Используя функцию полезности инвестора А, построенную в предыдущем пункте, и критерий ожидаемой полезности, определите предприятие, которое следует выбрать инвестору А. Каково ожидаемое денежное значение, соответствующее выбранному предприятию (используйте линейную интерполяцию функции полезности)?

d) Повторите упражнение предыдущего пункта для инвестора В.

14.3. ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Принятие решений в условиях неопределенности, как и в условиях риска, требует определения альтернативных действий, которым соответствуют платежи, зависящие от (случайных) состояний природы. Матрицу платежей в задаче принятия решений с m возможными действиями и n состояниями природы можно представить следующим образом.

Si S2 . . Sn ai v(ai, Si) v(ai, S2) . . v(ai, Sn) a2 v(a2, Si) v(a2, S2) . . v(a2, Sn) am v(am, Si) v(am, S2) . . v(am, Sn) Элемент а представляет i-е возможное решение, а элемент sj — j-е состояние природы. Плата (или доход), связанная с решением а и состоянием sj, равна v(a, sj).

Отличие между принятием решений в условиях риска и неопределенности состоит в том, что в условиях неопределенности вероятностное распределение, соответствующее состояниям sj, j = 1, 2, ..., n, либо неизвестно, либо не может быть определено. Этот недостаток информации обусловил развитие следующих критериев для анализа ситуации, связанной с принятием решений.

1. Критерий Лапласа.

2. Минимаксный критерий.

3. Критерий Сэвиджа.

4. Критерий Гурвица.

Эти критерии отличаются по степени консерватизма, который проявляет индивидуум, принимающий решение, перед лицом неопределенности.

Критерий Лапласа опирается на принцип недостаточного основания, который гласит, что, поскольку распределение вероятностей состояний P(sj) неизвестно, нет причин считать их различными. Следовательно, используется оптимистическое предположение, что вероятности всех состояний природы равны между собой, т.е. P{s1} = P{s2} = ... = P{sn} = 1/n. Если при этом v(a, sj) представляет получаемую прибыль, то наилучшим решением является то, которое обеспечивает

max i1 V v (a,, s.) a 1 nj^V 1 J}

Если величина v(at, s) представляет расходы лица, принимающего решение, то оператор ‘‘max’’ заменяется на ‘‘min’’.

Максиминный (минимаксный) критерий основан на консервативном осторожном поведении лица, принимающего решение, и сводится к выбору наилучшей альтернативы из наихудших. Если величина v(a, s) представляет получаемую прибыль, то в соответствии с максиминным критерием в качестве оптимального выбирается решение, обеспечивающее

max

a

jmin v (a

Если величина v(a, s) представляет потери, используется минимаксный критерий, который определяется следующим соотношением.

ljmax v (a

Критерий Сэвиджа стремится смягчить консерватизм минимаксного (максиминного) критерия путем замены матрицы платежей (выигрышей или проигрышей) v(a, s') матрицей потерь r(a, s), которая определяется следующим образом.

(max jv(ak,s,)- v(,s,), если v - доход, v (a,, s,)- min jv (ak, s,), если v - потери.

Чтобы показать, как критерий Сэвиджа ‘‘смягчает’’ минимаксный (максиминный) критерий, рассмотрим следующую матрицу платежей v(a , s):

S1 S2 Максимум строк аі 11 000 90 11 000 Э2 10 000 10 000 10 000 ^ минимакс Применение минимаксного критерия приводит к тому, что решение а2 с фиксированными потерями в 10000 долл. является предпочтительным. Однако можно выбрать и а1, так как в этом случае существует возможность потерять лишь 90 долл., если реализуется состояние s2, при потенциальном выигрыше 11 000 долл.

Посмотрим, какой результат получится, если в минимаксном критерии вместо матрицы платежей v(a, s) использовать матрицу потерь r(a,s).

S1 S2 Максимум строк а1 1000 0 1000 ^ минимакс а2 0 9910 9910 Как видим, минимаксный критерий, применяемый к матрице потерь, приводит к выбору решения а1 в качестве предпочтительного.

Рассмотрим теперь критерий Гурвица. Этот критерий охватывает ряд различных подходов к принятию решений — от наиболее оптимистичного до наиболее пессимистичного (консервативного). Пусть 0 < а < 1 и величины v(a, s) представляют доходы. Тогда решению, выбранному по критерию Гурвица, соответствует

max {а max ? (, sJ) + (1 - а) minv (, sJ

Параметр а— показатель оптимизма. Если а= 0, критерий Гурвица становится консервативным, так как его применение эквивалентно применению обычного минимаксного критерия. Если а= 1, критерий Гурвица становится слишком оптимистичным, ибо рассчитывает на наилучшие из наилучших условий. Мы можем конкретизировать степень оптимизма (или пессимизма) надлежащим выбором величины а из интервала [0, 1]. При отсутствии ярко выраженной склонности к оптимизму или пессимизму выбор а= 0,5 представляется наиболее разумным.

Если величины v(a, s) представляют потери, то критерий принимает следующий вид:

min {а min ? (, sJ) + (1 -а)шах v (, sJ

a ( SJ sj

Пример 14.3.1

Национальная школа выживания подбирает место для строительства летнего лагеря в центре Аляски в целях тренировки людей на выживание в условиях дикой природы. Школа считает, что число участников сбора может быть 200, 250, 300 или 350 человек. Стоимость летнего лагеря будет минимальной, поскольку он строится для удовлетворения только определенных небольших потребностей. Отклонения в сторону уменьшения или увеличения относительно идеальных уровней потребностей влекут за собой дополнительные затраты, обусловленные строительством избыточных (неиспользуемых) мощностей или потерей возможности получить прибыль в случае, когда некоторые потребности не удовлетворяются. Пусть переменные а14 представляют возможные размеры лагеря (на 200, 250, 300 или 350 человек), а переменные s1--s4 — соответствующее число участников сбора. Следующая таблица содержит матрицу стоимостей (в тысячах долларов), относящуюся к описанной ситуации.

S1 S2 S3 S4 аі 5 10 18 25 Э2 8 7 12 23 аз 21 18 12 21 а4 30 22 19 15 Описанная ситуация анализируется с точки зрения четырех рассмотренных выше критериев.

Критерий Лапласа. При заданных вероятностях Т1^} = 1/4, J = 1, 2, 3, 4, ожидаемые значения затрат для различных возможных решений вычисляются следующим образом.

M{a1} = (1/4)(5 + 10 + 18 + 25) = 14 500,

M{a2} = (1/4)(8 + 7 + 12 + 23) = 12 500 ^ Оптимум,

M{a3} = (1/4)(21 + 18 + 12 + 21) = 18 000,

M{a4} = (1/4)(30 + 22 + 19 + 15) = 21 500.

Минимаксный критерий. Этот критерий использует исходную матрицу стоимостей. S1 S2 S3 S4 Максимум строк аі 5 10 18 25 25 a2 8 7 12 23 23 аз 21 18 12 21 21 ^ минимакс а4 30 22 19 15 30 Критерий Сэвиджа. Матрица потерь определяется посредством вычитания чисел 5, 7, 12 и 15 из элементов столбцов от первого до четвертого соответственно. Следовательно,

S1 S2 S3 S4 Максимум строк а1 0 3 6 10 10 а2 3 0 0 8 8 ^ минимакс а3 16 11 0 6 16 а4 25 15 7 0 25 Критерий Гурвица. Результаты вычислений содержатся в следующей таблице. Альтернатива Минимум строк Максимум строк а(минимум строки) + (1 - а)(максимум строки) а1 5 25 25 - 20а а2 7 23 23 - 16а а3 12 21 21 - 9а а4 15 30 30 - 15а Используя подходящее значение для а, можно определить оптимальную альтернативу. Например, при а= 0,5 оптимальными являются либо альтернатива а1, либо а2, тогда как при а= 0,25 оптимальным является решение а3.

Реализация в Excel критериев принятия решений в условиях неопределенности. Шаблон Excel ch14UncertainlyDecision.xls можно использовать для вычисления всех критериев, описанных выше. Основой вычислений служит матрица затрат (диапазон В9:К19). Если надо использовать матрицу выигрышей, то все элементы этой матрицы надо умножить на -1. Максимальный размер матриц 10x10. На рис. 14.8 показано применение этого шаблона к данным примера 14.3.1.

УПРАЖНЕНИЯ 14.3

1. Хенк — прилежный студент, который обычно получает хорошие отметки благодаря, в частности, тому, что имеет возможность повторить материал в ночь перед экзаменом. Перед завтрашним экзаменом Хенк столкнулся с небольшой проблемой. Его сокурсники организовали на всю ночь вечеринку, в которой он хочет участвовать. Хенк имеет три альтернативы:

аг — участвовать в вечеринке всю ночь,

а2 — половину ночи участвовать в вечеринке, а половину — учиться, а3 — учиться всю ночь.

Кой имеет четыре альтернативы: а1 — выращивать кукурузу, а2 — выращивать пшеницу, а3 — выращивать соевые бобы, а4 — использовать землю под пастбища.

Платежи, связанные с указанными возможностями, зависят от количества осадков, которые условно можно разделить на четыре категории: s1 — сильные осадки, s2 — умеренные осадки, s3 — незначительные осадки, s4 — засушливый сезон.

Платежная матрица (в тыс. долл.) оценивается следующим образом.

Si S2 S3 S4 ai -20 60 30 -5 a2 40 50 35 0 аз -50 100 45 -10 а4 12 15 15 10 Что должен посеять Мак-Кой? Один из N станков должен быть выбран для изготовления Q единиц опреде- ленной продукции. Минимальная и максимальная потребность в продукции равна Q и Q соответственно. Производственные затраты TCi на изготовле- ние Q единиц продукции на станке i включают фиксированные затраты Ki и удельные затраты Сі на производство единицы продукции и выражаются формулой TCi = K + ctQ. a) Решите задачу с помощью каждого из четырех критериев принятия ре- шений в условиях неопределенности. b) Решите задачу при следующих данных, предполагая, что 1000 < Q < 4000. Станокi К (долл.) С (долл.) 1 100 5 2 40 12 3 150 3 4 90 8 14.4. ТЕОРИЯ ИГР

В теории игр рассматриваются ситуации, связанные с принятием решений, в которых два разумных противника имеют конфликтующие цели. К числу типичных примеров относится рекламирование конкурирующих товаров и планирование военных стратегий противоборствующих армий. Эти ситуации принятия решений отличаются от рассмотренных ранее, где природа не рассматривается в роли недоброжелателя.

В игровом конфликте участвуют два противника, именуемые игроками, каждый из которых имеет некоторое множество (конечное или бесконечное) возможных выборов, которые называются стратегиями. С каждой парой стратегий связан платеж, который один из игроков выплачивает другому. Такие игры известны как игры двух лиц с нулевой суммой, так как выигрыш одного игрока равен проигрышу другого. В такой игре достаточно задать результаты в виде платежей для одного из игроков. При обозначении игроков через А и В с числом стратегий m и n соответственно игру обычно представляют в виде матрицы платежей игроку А:

B1 B2 ... Bn A1 a11 a12 ... a1n A2 a21 a22 ... a2n Am am1 am2 ... amn Такое представление матричной игры означает, что если игрок А использует стратегию i, а игрок В — стратегию j, то платеж игроку А составляет atj и, следовательно, игроку В atj.

14.4.1. Оптимальное решение игры двух лиц с нулевой суммой

Поскольку игры берут свое начало в конфликте интересов, оптимальным решением игры является одна или несколько таких стратегий для каждого из игроков, при этом любое отклонение от данных стратегий не улучшает плату тому или другому игроку. Эти решения могут быть в виде единственной чистой стратегии или нескольких стратегий, которые являются смешанными в соответствии с заданными вероятностями. Рассматриваемые ниже примеры демонстрируют перечисленные ситуации.

Пример 14.4.1

Две компании А и В продают два вида лекарств против гриппа. Компания А рекламирует продукцию на радио (А1), телевидении (А2) и в газетах (А3). Компания В, в дополнение к использованию радио (В1), телевидения (В2) и газет (В3), рассылает также по почте брошюры (В4). В зависимости от умения и интенсивности проведения рекламной кампании, каждая из компаний может привлечь на свою сторону часть клиентов конкурирующей компании. Приведенная ниже матрица характеризует процент клиентов, привлеченных или потерянных компанией А.

Ві В-2 Вз В4 Минимумы строк 8 -2 9 -3 -3 6 5 6 8 5 максимин -2 4 -9 5 -9 8 5 9 8 минимакс Максимумы столбцов

Решение игры основано на обеспечении наилучшего результата из наихудших для каждого игрока. Если компания А выбирает стратегию А1, то, независимо от того, что предпринимает компания В, наихудшим результатом является потеря компанией А 3 % рынка в пользу компании В. Это определяется минимумом элементов первой строки матрицы платежей. Аналогично при выборе стратегии А2 наихудшим исходом для компании А является увеличение рынка на 5 % за счет компании В. Наконец, наихудшим исходом при выборе стратегии А3 является потеря компанией А 9 % рынка в пользу компании В. Эти результаты содержатся в столбце “Минимумы строк’’. Чтобы достичь наилучшего результата из наихудших, компания А выбирает стратегию А2, так как она соответствует наибольшему элементу столбца ‘‘Минимумы строк’’.

Рассмотрим теперь стратегии компании В. Так как элементы матрицы являются платежами компании А, критерий наилучшего результата из наихудших для компании В соответствует выбору минимаксного значения. В результате приходим к выводу, что выбором компании В является стратегия В2.

Оптимальным решением в игре является выбор стратегий А2 и В2, т.е. обеим компаниям следует проводить рекламу на телевидении. При этом выигрыш будет в пользу компании А, так как ее рынок увеличится на 5 %. В этом случае говорят, что цена игры равна 5 % и что компании А и В используют стратегии, соответствующие седловой точке.

Решение, соответствующее седловой точке, гарантирует, что ни одной компании нет смысла пытаться выбрать другую стратегию. Действительно, если компания В переходит к другой стратегии (В1, В3 или В4), то компания А может сохранить свой выбор стратегии А2, что приведет к большей потере рынка компанией В (6 или 8 %). По тем же причинам компании А нет резона использовать другую стратегию, ибо если она применит, например, стратегию А3, то компания В может использовать свою стратегию В3 и увеличить свой рынок на 9 %. Аналогичные выводы имеют место, если компания А будет использовать стратегию А1.

Оптимальное решение игры, соответствующее седловой точке, не обязательно должно характеризоваться чистыми стратегиями. Вместо этого оптимальное решение может требовать смешивания случайным образом двух или более стратегий, как это сделано в следующем примере.

Пример 14.4.2

Два игрока А и В играют в игру, основанную на подбрасывании монеты. Игроки одновременно и независимо друг от друга выбирают герб (Г) или решку (Р). Если результаты двух подбрасываний монеты совпадают (т.е. ГГ или РР), то игрок А получает один доллар от игрока В. Иначе игрок А платит один доллар игроку В.

Следующая матрица платежей игроку А показывает величины минимальных элементов строк и максимальных элементов столбцов, соответствующих стратегиям обоих игроков.

Вг Вр Минимумы строк Аг 1 -1 -1 Ар -1 1 -1 Максимумы столбцов 1 1 Максиминная и минимаксная величины (цены) для этой игры равны -1 долл. и 1 долл. соответственно. Так как эти величины не равны между собой, игра не имеет решения в чистых стратегиях. В частности, если игрок А использует стратегию АГ, игрок В выберет стратегию ВР, чтобы получить от игрока А один доллар. Если это случится, игрок А может перейти к стратегии АР, чтобы изменить исход игры и получить один доллар от игрока В. Постоянное искушение каждого игрока перейти к другой стратегии указывает на то, что решение в виде чистой стратегии неприемлемо. Вместо этого оба игрока должны использовать надлежащую случайную комбинацию своих стратегий. В рассматриваемом примере оптимальное значение цены игры находится где-то между максиминной и минимаксной ценами для этой игры:

максиминная (нижняя) цена < цена игры < минимаксная (верхняя) цена.

Следовательно, в данном случае цена игры должна лежать в интервале [--1, 1], измеряемом в долларах.

УПРАЖНЕНИЯ 14.4.1

1. Определите решение, определяемое седловой точкой, соответствующие чистые стратегии и цену игры для следующих игр, в которых платежи заданы для игрока А.

а)

Ві В2 Вз В4 Аі 8 6 2 8 A2 8 9 4 5 Аз 7 5 3 5 b) Ві В2 Вз В4 Аі 4 -4 -5 6 А2 -3 -4 -9 -2 Аз 6 7 -8 -9 А4 7 3 -9 5 В следующих играх заданы платежи игроку А. Укажите область значений для параметров p и q, при которых пара (2, 2) будет седловой точкой в каждой игре.

а) Ві В2 Вз Аі і q 6 А2 Р 5 іо Аз 6 2 з b)

Ві В2 Вз Аі 2 4 5 А2 іо 7 q Аз 4 Р 6 3. Укажите область, которой принадлежит цена игры в каждом из следующих случаев, предполагая, что платежи заданы для игрока А.

а)

Ві В2 Вз В4 Аі і 9 6 0 А2 2 з 8 4 Аз -5 -2 іо -з А4 7 4 -2 -5 B1 B2 B3 B4 A1 3 7 1 3 A2 4 8 0 -6 A3 6 -9 -2 4 b)

Bi B2 B3 B4 Ai -1 9 6 8 A2 -2 10 4 6 A3 5 3 0 7 A4 7 -2 8 4 c)









Ai

A2

A3

d)

4. Две фирмы производят два конкурирующих товара. Каждый товар в настоящее время контролирует 50 % рынка. Улучшив качество товаров, обе фирмы собираются развернуть рекламные кампании. Если они не будут этого делать, то существующее состояние рынка не изменится. Однако если какая-либо фирма будет более активно рекламировать свои товары, то другая фирма потеряет соответствующий процент своих потребителей. Исследование рынка показывает, что 50 % потенциальных потребителей получают информацию посредством телевидения, 30 % — через газеты и 20 % — по радио.

a) Сформулируйте задачу в виде игры двух лиц с нулевой суммой и выберите подходящие средства рекламы для каждой фирмы.

b) Укажите интервал значений, которому принадлежит цена игры. Может ли каждая фирма действовать с единственной чистой стратегией?

5. Пусть atj — (i, /)-й элемент платежной матрицы с m стратегиями игрока А и n стратегиями игрока В. Элементы платежной матрицы представляют собой платежи игроку А. Докажите, что

max min aij < min max aij.

i j J j i J

14.4.2. Решение матричных игр в смешанных стратегиях

Решение матричных игр в смешанных стратегиях может быть найдено либо графически, либо методами линейного программирования. Графический метод применим для решения игр, в которых хоть один игрок имеет две чистые стратегии. Этот метод интересен в том плане, что графически объясняет понятие седловой точки. Методами линейного программирования может быть решена любая игра двух лиц с нулевой суммой.

Графическое решение игр. Рассмотрим игру 2 х n, в которой игрок А имеет две стратегии.

Уі У2 . . Уп Si S2 . . Sn xi: Ai aii ai2 . . ain 1 — xi: A2 a2i a22 . . a2n Игра предполагает, что игрок А смешивает стратегии А1 и А2 с соответствующими вероятностями х1 и 1 -- x2, 0 < х1 < 1. Игрок В смешивает стратегии В2, В2, ..., Вп с вероятностями y2, у2, ..., уп, где y > 0, j = 1, 2, ..., n, и У1 + y2 + ... + yn = 1. В этом случае ожидаемый выигрыш игрока А, соответствующий j-й чистой стратегии игрока В, вычисляется в виде

ц - ащ) Х1 -- ау, j = 1, 2, ..., n.

Следовательно, игрок А ищет величину х1, которая максимизирует минимум ожидаемых выигрышей

max min {j - a2 j) Xj - a2 j}.

Пример 14.4.3

Рассмотрим следующую игру 2x4, в которой платежи выплачиваются игроку А.

Si Si S3 S4 Ai 2 2 3 -1 A2 4 3 2 6 Игра не имеет решения в чистых стратегиях, и, следовательно, стратегии должны быть смешанными. Ожидаемые выигрыши игрока А, соответствующие чистым стратегиям игрока В, приведены в следующей таблице.

Чистые стратегии игрока S Ожидаемые выигрыши игрока A i -2x1 + 4 2 —xi + 3 3 xi + 2 4 —7x1 + 6 На рис. 14.9 изображены четыре прямые линии, соответствующие чистым стратегиям игрока В. Чтобы определить наилучший результат из наихудших, построена нижняя огибающая четырех указанных прямых (изображенная на рисунке толстыми линейными сегментами), которая представляет минимальный (наихудший) выигрыш для игрока А независимо от того, что делает игрок В. Максимум (наилучшее) нижней огибающей соответствует максиминному решению в точке х* = 0,5 . Эта точка определяется пересечением прямых 3 и 4. Следовательно, оптимальным решением для игрока А является смешивание стратегий А1 и А2 с вероятностями 0,5 и 0,5 соответственно. Соответствующая цена игры v определяется подстановкой х2 = 0,5 в уравнение либо прямой 3, либо 4, что приводит к следующему.

5

2

5

2

- у3. Следовательно, ожидаемые платежи игрока В, соответствующие чистым стратегиям игрока А, имеют такой вид.

Чистые стратегии игрока А Ожидаемые платежи игрока В 1 4уэ - 1 2 -4уэ + 6 Наилучшее решение из наихудших для игрока В представляет собой точку минимума верхней огибающей заданных двух прямых (построение прямых и определение верхней огибающей будет для вас поучительным). Эта процедура эквивалентна решению уравнения

4Уз - 1 = -4уз + 6.

Его решением будет у3 = 7/8, что определяет цену игры ? = 4 х (7/8) -- 1 = 5/2.

Таким образом, решением игры для игрока А является смешивание стратегий А1 и А2 с равными вероятностями 0,5 и 0,5, а для игрока В — смешивание стратегий В3 и В4 с вероятностями 7/8 и 1/8. (В действительности игра имеет альтернативное решение для игрока В, так как максиминная точка на рис. 14.9 определяется более чем двумя прямыми. Любая выпуклая линейная комбинация этих альтернативных решений также является решением задачи.)

Для игры, в которой игрок А имеет m стратегий, а игрок В — только две, решение находится аналогично. Главное отличие состоит в том, что здесь строятся графики функций, представляющих ожидаемые платежи второго игрока, соответствующие чистым стратегиям игрока А. В результате ведется поиск минимаксной точки верхней огибающей построенных прямых.

УПРАЖНЕНИЯ 14.4.2

1. Решите графически игру с подбрасыванием монет из примера 14.4.2.

2. Робин часто ездит между двумя городами. При этом есть возможность выбрать один из двух маршрутов: маршрут А представляет собой скоростное шоссе в четыре полосы, маршрут В — длинную обдуваемую ветром дорогу. Патрулирование дорог осуществляется ограниченным числом полицейских. Если все полицейские расположены на одном маршруте, Робин с ее страстным желанием ездить очень быстро, несомненно, получит штраф в 100 долл. за превышение скорости. Если полицейские патрулируют на двух маршрутах в соотношении 50 на 50, то имеется 50 %-ная вероятность, что Робин получит штраф в 100 долл. на маршруте А и 30 %-ная вероятность, что она получит такой же штраф на маршруте В. Кроме того, маршрут В длиннее, поэтому бензина расходуется на 15 долл. больше, чем на маршруте А. Определите стратегию как для Робин, так и для полиции.

3. Решите графически следующие игры, в которых платежи выплачиваются игроку А.

а)



Ai

A2

b)_





Si B2 методом, он сразу установил эту взаимосвязь и обратил особое внимание на концепцию двойственности в линейном программировании. Этот раздел иллюстрирует решение матричных игр методами линейного программирования.

Оптимальные значения вероятностей х, i = 1, 2, ..., m, игрока А могут быть определены путем решения следующей максиминной задачи.

{f m m m Л I

min I ? аіЛ, ? a 2 Xj? ainXi lj>,

X. + X, + ... + х = 1, xt> 0, i = 1, 2, ..., m.

Чтобы сформулировать эту задачу в виде задачи линейного программирования, положим

f m m m Л

V = minI ?anxi,?ai2xi?ai„xi I.

I i=1 i=1 i=1 )

Отсюда вытекает, что

? aijxi > V j = 1,2,..., n.

i = 1

Следовательно, задача игрока А может быть записана в виде

максимизировать z = v

при ограничениях

m

v-?aijxi ^о, j = u,...,и,

i=1

X. + X0 + ... + X = 1,

1 2 m

Xi > 0, i = 1, 2, ..., m, v не ограничена в знаке.

Отметим последнее условие, что цена игры v может быть как положительной, так и отрицательной.

Оптимальные стратегии уг, У2, ..., yn игрока В определяются путем решения задачи

? j, ? a2 jyj,..., ? am

min

j=1

j=1

j=1

У1 + У2 + ... + Уп = 1,

y. > 0, j = 1, 2, ..., n.

Используя процедуру, аналогичную приведенной выше для игрока А, приходим к выводу, что задача для игрока В сводится к следующему.

Минимизировать w = v

при ограничениях

v -? a..y. > 0, i = 1,2,..., m, ij j j=1

у 1 + у 2 + ... + Уп = 1

у > 0, j = 1, 2, n,

v не ограничена в знаке.

Две полученные задачи оптимизируют одну и ту же (не ограниченную в знаке) переменную v, которая является ценой игры. Причиной этого служит то, что задача игрока В является двойственной к задаче игрока А (вам предлагается доказать это утверждение в упражнении 14.4.3.5, используя определение двойственности из главы 4). Это означает, что оптимальное решение одной из задач автоматически определяет оптимальное решение другой.

Пример 14.4.4

Решим следующую матричную игру методами линейного программирования.

Ві В2 Вз Минимумы строк Аі 3 -1 -3 -3 A2 -2 4 -1 -2 A3 -5 -6 2 -6 Максимумы столбцов 3 4 2 Значение цены игры v находится между -2 и 2.

Задача линейного программирования для игрока А

Максимизировать z = v

при ограничениях

v -- 3x1 + 2x2 + 5x3 < 0, v + x1 -- 4x2 + 6x3 < 0, v + 3x1 + x2 -- 2x3 < 0, x1 + x2 + x3 = 1, x1, x2, x3 > 0,

v не ограничена в знаке.

Оптимальным решением является x1 = 0,39, x2 = 0,31, x3 = 0,29 и v = -0,91. Задача линейного программирования для игрока В

Минимизировать z = v

при ограничениях

v -- 3У1 + У2 + 3Уз > 0,

v + 2уі -- 4у2 + Уз > 0, v + 5Уі + 6у2 -- 2Уз > 0,

Уі + У 2 + Уз = 1 Уl, У2, Уз > 0,

v не ограничена в знаке.

Оптимальным решением является Уі = 0,32, У2 = 0,08, У3 = 0,60 и v = -0,91.

В программе TORA для решения игр двух игроков с нулевой суммой надо выбрать команду Zero-sum GamesOSolveOLP-based (Игры с нулевой суммойОРешитьОКак задачу ЛП). На рис. 14.10 показан результат решения задачи примера 14.4.4 (файл ch!4ToraGamesEx14-4-4).

, трехочковые и штрафные броски является основным фак-

тором, определяющим результат игры. Приведенная ниже таблица содержит очки чистого выигрыша команды UA на протяжении одного владения мячом в зависимости от стратегий, планируемых каждой командой.

DUi DU2 DU3 DU4 UAi 3 -2 1 2 UA2 2 3 -3 0 UA3 -1 2 -2 2 UA4 -1 -2 4 1 a) Решите игру методами линейного программирования и определите выигрышные стратегии.

b) Исходя из имеющейся информации, какая из двух команд может выиграть чемпионат?

c) Пусть за всю игру имеется 60 возможностей владения мячом (30 владений для каждой команды). Предскажите ожидаемое количество очков, с которым будет выиграна игра чемпионата.

3. Армия полковника Блотто сражается с вражеской армией за контроль над двумя стратегически важными позициями. Полковник имеет в своем распоряжении два полка, а его противник — три. Каждый из противников может посылать на любую позицию только целое число полков или совсем не посылать. Позиция будет захвачена армией, которая атакует большим количеством полков. Иначе результат сражения является ничейным.

a) Сформулируйте задачу в виде игры двух лиц с нулевой суммой и решите игру методами линейного программирования.

b) Какая армия выиграет сражение?

4. В игре двух лиц, именуемой двухпальцевой игрой Морра, каждый игрок показывает один или два пальца и одновременно отгадывает число пальцев, которые покажет его противник. Игрок, который угадал, выигрывает сумму, равную суммарному числу показанных противниками пальцев. Иначе игра заканчивается вничью. Сформулируйте задачу в виде игры двух лиц с нулевой суммой и решите игру методами линейного программирования.

5. Покажите, что задача, двойственная к задаче линейного программирования для игрока А, является задачей линейного программирования для игрока В, и что следующие два утверждения не противоречат друг другу.

a) Задача линейного программирования для игрока А записана в форме, приведенной в разделе 14.4.2.

b) Задача линейного программирования для игрока А записана в форме, упомянутой в п. 1, в которой все ограничения вида приведены к виду “>’’.

ЛИТЕРАТУРА

1. Chen S. and Hwang С. Fuzzy Multiple Attribute Decision Making, Springer-Verlag, Berlin, 1992.

2. Clemen R. J. and Reilly T. Making Hard Decisions: An Introduction to Decision Analysis. 2nd ed., Duxbury, Pacific Grove, CA, 1996.

3. Dantzig G. B. Linear Programming and Extension, Princeton University Press, Princeton, N.J., 1963. (Русский перевод: Данциг Дж. Линейное программирование, его применения и обобщения. — М.: Прогресс, 1966.)

4. Meyerson R. Game Theory: Analysis of Conflict, Harvard University Press, Cam-ridge, Mass., 1991.

5. Saaty T. L. Fundamentals of Decision Making, RWS Publications, Pittsburg, 1994.

Литература, добавленная при переводе

1. Вилкас Э. Й., Майминас Е. З. Решения: теория, информация, моделирование. — М.: Радио и связь, 1981.

2. Карлин С. Математические методы в теории игр, программировании и экономике. — М.: Мир, 1964.

3. Ларичев О. И. Наука и искусство принятия решений. — М.: Наука, 1979.

4. Мулен Э. Теория игр с примерами из математической экономики. — М.: Мир, 1985.

5. Фишберн П. Теория полезности для принятия решений. — М.: Наука, 1978.

6. Фон Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. — М.: Наука, 1970.

КОМПЛЕКСНЫЕ ЗАДАЧИ

14.1. 5 Руководитель цеха рассматривает три возможных решения относительно

существующего фрезерного станка.

1. Модифицировать имеющийся станок, установив на нем автоматическую подачу (АП).

2. Купить новый станок с программным управлением (ПУ).

3. Заменить станок обрабатывающим центром (ОЦ).

Три альтернативы оцениваются на основе двух критериев: денежный и функциональный. Следующая таблица содержит необходимые данные.

Критерий АП ПУ ОЦ Денежный

Начальная стоимость (долл.) 12 000 25 000 120 000 Стоимость обслуживания (долл.) 2 000 4 000 15 000 Стоимость обучения персонала (долл.) 3 000 8 000 20 000 Функциональный

Производительность (изделия/день) 8 14 40 Время наладки (минуты) 30 20 3 Металлические отходы (фунты/день) 440 165 44 Руководитель считает, что денежный критерий в полтора раза важнее функционального. Кроме того, производительность в два раза важнее времени наладки и в три раза важнее, чем количество получаемых металличе-

Этот пример взят из работы Weber S. “A Modified Analytic Hierarchy Process for Automated Manufacturing Decisions”, Interfaces, Vol.23, No. 4, 1993, pp. 75-84.

ских отходов. Показатель, связанный со временем наладки, считается в четыре раза важнее показателя, связанного с количеством металлических отходов. Что же касается денежного критерия, то руководитель считает, что стоимость обслуживания и стоимость обучения персонала одинаково важны, а начальная стоимость в два раза важнее каждого из этих двух показателей.

Проанализируйте описанную ситуацию и дайте соответствующие рекомендации.

14.2. Компания использует каталог товаров для продажи, включающий более 200 тыс. наименований, хранящихся на многих региональных складах. В прошлом компания считала важным иметь точный перечень запасов на каждом складе. Поэтому каждый год проводился переучет — интенсивная и неприятная работа, которая неохотно выполнялась всеми складами. Компания для проверки качества складских операций в регионе сопровождала каждый переучет ревизией, которая охватывала около 100 наименований на каждом складе. Результаты проверки обнаружили, что в среднем лишь 64 % наименований на каждом складе соответствовали действительной инвентарной описи, что является неприемлемым. Дабы исправить ситуацию, компания распорядилась чаще проводить переучет дорогих и быстро реализуемых товаров. Системному аналитику была поставлена задача разработать процедуры для реализации этих планов.

Вместо того чтобы напрямую заняться выполнением задания компании, системный аналитик решил установить причину возникшей проблемы. Он перешел в своем исследовании от формулировки ‘‘Как мы можем увеличить частоту переучетов?” к ‘‘Как можно повысить точность переучетов?”. Изучение проблемы под таким углом зрения свелось к следующему анализу. Предполагая, что доля точно сосчитанных наименований на складе равнар, аналитик затем предположил следующее. Есть основания считать, что существует 95 %-ная вероятность того, что если изделие было правильно учтено в первый раз, то будет правильно переучтено и при последующем переучете. Для части 1 -- р товаров, которая не была точно учтена в первом раунде проверки, доля правильного учета во втором раунде равна 80 %. Используя эту информацию, аналитик с помощью дерева решений построил график безубыточности, который сравнил точность учета в первом и втором раундах проверки. Конечный результат сводился к тому, что склады, на которых уровень точности выше порога безубыточности, не требовали переучета. Удивительным результатом предложенного решения было рьяное усердие со стороны каждого склада сделать правильный учет за первый раз, что привело к повышению точности учета на всех складах.

Как аналитик убедил руководство в жизнеспособности предложенного порога безубыточности для повторного переучета?

14.3. В авиакомпаниях рабочие часы устанавливаются в соответствии с договорами, заключенными с профсоюзными организациями. В частности, максимальная продолжительность работы может быть ограничена 16 часами для полетов на Боинге--747 (В--747) и 14 часами — на Боинге-707 (В--707). Если эти пределы превышаются в силу неожиданных задержек, экипаж должен быть заменен новым. Авиакомпании содержат резервные экипажи для таких случаев. Средняя годовая стоимость содержания члена резервного экипажа оценивается в 30 000 долл. Задержка полета на одну ночь, обусловленная отсутствием резервного экипажа, может стоить 50 000 долл. Член экипажа находится по вызову непрерывно 12 часов в сутки 4 дня в неделю и может не находиться по вызову три оставшихся дня недели. Самолет В--747 может обслуживаться двумя экипажами для самолета В--707.

Следующая таблица содержит вероятности вызова резервных экипажей, вычисленные на основании трехлетнего опыта.

Вероятность вызова Категория рейса Рейс (время вылета) В-747 В-707 1 14:00 0,014 0,072 2 13:00 0,000 0,019 3 12:30 0,000 0,006 4 12:00 0,016 0,006 5 11:30 0,003 0,003 6 11:00 0,002 0,003 Приведенные данные свидетельствуют, например, что для 14-часового рейса вероятность вызова равна 0,014 для В-747 и 0,072 — для В--707.

Типичная пиковая часть расписания дня имеет следующий вид.

Время дня Самолет Категория рейса 8:00 707 3 9:00 707 6 707 2 10:00 707 3 11:00 707 2 707 4 15:00 747 6 16:00 747 4 19:00 747 1 Существующая политика относительно резервных экипажей состоит в использовании двух экипажей (по семь членов каждый) с 5:00 до 11:00, четырех — с 11:00 до 17:00 и двух — с 17:00 до 23:00.

Оцените эффективность существующей политики относительно резервных экипажей. В частности, является ли число резервных экипажей очень большим, очень малым или таким, как необходимо?



Это не значит, что в условии неопределенности полностью отсутствует информация о задаче. Речь идет о том, что имеющиеся данные трудно или невозможно классифицировать по степени значимости их для принятия решения, и что для этих данных, рассматриваемых как реализации случайных величин или процессов, неизвестна или не может быть определена их функция распределения или другие статистические характеристики. — Прим. ред.



Из-за ошибок округления результаты, полученные в Excel, немного отличаются от тех, которые были получены в примерах 14.1.2 и 14.1.3 (в Excel получены более точные результаты).



Кевин и Джун Парки (K и Д) покупают новый дом. Рассматриваются три вари



анта — А, В и С. Парки согласовали два критерия для выбора дома: площадь



зеленой лужайки (Л) и близость к месту работы (Б), а также разработали



Электроэнергетическая компания использует парк из 20 грузовых автомобилей для обслуживания электрической сети. Компания планирует периодический профилактический ремонт автомобилей. Вероятность поломки автомобиля в первый месяц равна нулю, во второй месяц — 0,03 и увеличивается на 0,01 для каждого последующего месяца, по десятый включительно. Начиная с одиннадцатого месяца и далее, вероятность поломки сохраняется постоянной на уровне 0,13. Случайная поломка одного грузового автомобиля обходится компании в 200 долл., а планируемый профилактический ремонт в 75 долл.



Этот принцип впервые сформулирован Я. Бернулли. — Прим. перев.



Этот пример взят из работы Millet I. “A Novena to Saint Anthony, or How to Find Inventory by Not Looking”, Interfaces, Vol. 24, No. 2, 1994, pp.69-75.



Этот пример взят из работы Gaballa A. “Planning Callout Reserves for Aircraft Delays”, Interfaces, Vol. 9, No. 2, Part 2, 1979, pp.78-86.



    Экономика: Знания - Циклы - Макроэкономика