Васин - Введение В Теорию Игр С Приложениями К Экономике
Книга представляет собой учебное пособие, пригодное как для первоначального, так и углублённого изучения теории игр и ее экономических приложений. В ее первой части приводятся основные понятия, модели и результаты для антагонистических, некооперативных и кооперативных игр. Во второй части излагаются модели, связанные с теорией экономических рынков и задачами налогового регулирования.
Для студентов математических и экономических специальностей, а также специалистов в области исследования операций, теории игр и математической экономики.
Предисловие
Содержание предлагаемого пособия основано на материалах лекционных курсов по теории игр и математической экономике, читавшихся авторами в течение ряда лет на факультете вычислительной математики и кибернетики МГУ им, М.В. Ломоносова,
В отличие от изданной ранее учебной литературы основное внимание уделяется теории некооперативных игр и ее экономическим приложениям, Излагаются новые разделы теории: иерархические и статистические игры, методы поиска ситуаций равновесия, доказательство сходимости метода Брауна для матричных игр и др. Рассматриваются модели несовершенной конкуренции, задачи оптимального налогообложения и организации налоговой инспекции. Для читателей, интересующихся математическими основаниями теории игр, в приложении даны доказательства теоремы об отделяющей гиперплоскости, теоремы Хелли о пересечении выпуклых компактов евклидова пространства, теоремы Брауэра и Каку іанп о неподвижной точке.
Пособие может быть использовано для чтения курсов по теории игр и математической экономике студентам, обучающимся по специальностям "Прикладная математика"и "Экономическая кибернетика". Предполагается знакомство читателей с начальными курсами математического анализа, линейной алгебры и теории вероятностей. Предлагаемые в каждом параграфе примеры и упражнения способствуют активному усвоению материала и позволяют использовать пособие также для проведения семинарских занятий. Последний раздел содержит решение всех упражнений, Каждая глава снабжена библиографическим комментарием, позволяющим заинтересованному читателю более глубоко изучить соответствующую тему.
Авторы признательны всем коллегам по кафедре исследования операций за поддержку и советы, во многом определившие структуру книги и стиль ее изложения. Мы также благодарны Полине Васиной, Евгению Жиглову, Юлии Сосиной, Алексею Теплову, Елене Тыртышниковой и Кириллу Чокпарову за помощь при подготовке пособия.
§1. Введение
Теорией игр называется математическая теория принятия решения в конфликтных ситуациях. Поясним это определение. Простейшие модели принятия решений рассматриваются в курсах математического анализа и оптимизации, В этих моделях лицо, принимающее решения (ЛПР), выбирает свое действие из некоторого множества стратегий (например, множество планов производства в задаче линейного программирования), Задана целевая функция, которая отражает интересы ЛПР и зависит от выбранной им стратегии (например, функция прибыли, зависящая от назначенного плана производства), Задача принятия решений в этой постановке состоит, как правило, в том, чтобы найти стратегию, доставляющую максимум целевой функции.
Отличие конфликтной ситуации в том, что решение принимается не одним индивидуумом, а несколькими участниками, и функция выигрыша каждого индивидуума зависит не только от его стратегии, но также и от решений других участников. Математическая модель такого рода конфликта называется игрой, а участники конфликта — игрока,ми.
В рамках теории игр существуют два основных направления. Теория некооперативных игр изучает принятие решений в предположении, что существует механизм, обеспечивающий выполнение совместно принятого решения. При этом основная проблема — указать множество взаимовыгодных решений е учетом интересов и самостоятельных возможностей отдельных игроков и коалиций, то сеть групп совместно действующих игроков. Если это множество включает несколько вариантов решения, то возникает также задача выработки критерия оптимальности, который позволил бы найти единственное, наилучшее в некотором смысле решение, В настоящем пособии основные понятия и некоторые результаты теории кооперативных игр изложены в § 15,
Некооперативные игры отражают ситуации, в которых игроки действуют самостоятельно, независимо друг от друга, и если какие-то соглашения заключаются, то они не являются обязывающими: каждый игрок может отклониться от договоренности. Таким играм уделяется основное внимание в данном пособии.
Если игроков двое, а интересы их противоположны, то игра называется антагонистической. Типичными примерами антагонистических игр являются шахматы, шашки, "крестики-нолики", а также азартные игры типа "орлянки". При проведении военных операций нападающая сторона обычно стремится нанести противнику максимальный ущерб, а противник стремится этот ущерб минимизировать. Поэтому в таких случаях военную операцию можно изучать как антагонистическую игру,
В некоторых задачах целевая функция ЛПР зависит от неопределенного фактора (например, погодных условий). Рассчитывая на "худший случай", предполагают, что этот фактор — стратегия противника, имеющего противоположные интересы. Возникает игра против "природы", также относящаяся к антагонистическим играм. Такие игры рассматриваются в первой главе.
Вторая и третья главы посвящены неантагонистическим играм. Экономика и социальная сфера дают многочисленные примеры таких игр. Пусть несколько фирм конкурируют на товарном рынке и заинтересованы в увеличении своих доходов. Цена на продукцию определяется спросом на товар и количеством выпущенной продукции. Теория игр предписывает фирмам-игрокам назначать выпуск продукции в таких количествах, при которых каждому отдельно взятому игроку было бы невыгодно отклоняться от предписанного объема. Соответствующий набор стратегий называют равновесием по Нэшу. Другим примером являются иерархические игры, отражающие взаимодействие между верхним и нижним звеньями управления (начальником и подчиненным, заказчиком и производителем продукции и т,п,). Здесь обычно интересуются не равновесием в игре, а наилучшим гарантированным результатом, который может себе обеспечить игрок-лидер, первым сообщающий свою стратегию другому игроку. Значительное внимание в указанных главах уделяется также решениям по доминированию.
В четвертой главе дается краткое введение в математическую экономику и рассматриваются приложения теории некооперативных игр к анализу актуальных экономических проблем. Одна из них — исследование экономических рынков в условиях несовершенной конкуренции и оценка отклонения ожидаемого состояния рынка от конкурентного равновесия, Изложенная в § 18 теорема благосостояния для однопродуктовой экономики показывает, что состояние конкурентного равновесия является оптимальным с точки зрения суммарного выигрыша всех участников, В § 19 рассматриваются модели рыночной конкуренции по Курно и Бертрану, а также аукцион функций предложения. Проводится сравнение равновесий по Нэшу и решений по доминированию с конкурентным равновесием,
В §§ 20, 21 обсуждаются модели, связанные с функционированием налоговой системы. Рассматриваются простейшие задачи оптимального выбора налоговых ставок для финансирования бюджетного сектора, а также модели организации налоговых проверок в условиях уклонения и коррупции.
ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
§ 2. Седловые точки и антагонистические игры
Пусть функция F(x,y) определена на декартовом произведении X х Y, где X,Y — множества произвольной природы.
Определение. Пара (x°,y°) Е X х Y называется седловой точкой функции F(x,y) на X х Y, если
F(x,y0) < F(x0,y0) < F(x0,y) V x Е X, V y Е Y (2.1)
или,эквивалентно,
max F (x,y0) = F (x0,y0) = min F (x0,y).
Понятие седловой точки используется в определении решения антагонистической игры.
Опишем антагонистическую игру, В ней принимают участие два игрока 1 и 2 (первый и второй). Игрок 1 выбирает стратегию x из множества стратегий X, игрок 2 выбирает стратегию y из множества стратегий Y. Нормальная форма игры подразумевает, что каждый игрок выбирает свою стратегию независимо, не зная выбора партнера. Задана функция выигрыша F(x, y) первого игрока, определеиная на X х Y. Выигрыш F(x,y) первого игрока является проигрышем для второго. Цель первого игрока состоит в увеличении своего выигрыша F (x,y), а цель втор ого — в уменьшении F(x,y).
Таким образом, антагонистическая игра задается набором Г = ^X, Y, F(x,y)). Термины "выигрыш"и "игрок"сложились исторически, когда анализировались преимущественно азартные игры. Эти термины не совсем точные. Например, если значение F(x,y) < 0, то "выигрыш "первого игрока является фактически его проигрышем. Кроме того, рассматривают игры, где F(x,y) является не денежным выигрышем, а, скажем, вероятностью поражения цели. Игрок 2 может не быть интеллектуальным противником. Часто рассматривают игры против "природы".
Вернемся к определению седловой точки, которой можно придать следующий игровой смысл. Если игроки выбрали в качестве стратегий компоненты x0,y0 седловой точки, то каждому из них невыгодно отклоняться от выбранной стратегии. Поэтому седловая точка является формализацией концепции равновесия в игре.
Определение. Говорят, что антагонистическая игра Г имеет решение, если функция F(x,y) имеет на X х У седловую точку. Пусть (x0,y0) — седловая точка функции F(x, у). Тогда тройка
(x°,y°,v = F(x0,у0)) называется решением игры, x0,y0 — оптимальными стратегиями игроков, a v — значением игры.
Покажем, что значение игры не зависит от выбора седловой точки.
Лемма, 2.1. Если (x0,y0), (x*,y*) — две седловые точки функции F(x,y) на X х У, то F(x0,y0) = F(x*,y*).
Доказательство. Наряду с (2.1), выпишем аналогичные неравенства для седловой точки (x*,y*)
F(x,y*) < F(x*,y*) < F(x*,y) V x G X, V y G У. (2.2)
Имеем
(2.2)
(2.1)
(2.1)
(2.2)
F(x*,y*) < F(x*,y0) < F(x0,y0) < F(x0,y*) < F(x*,y*).
Здесь все неравенства выполнены как равенства. ¦
Важнейший класс антагонистических игр образуют матричные игры.
Определение. Антагонистическая игра Г называется матричной, если множества стратегий игроков конечны: X = {1 ,...,m}, У = {1 ,...,n}. При этом принято обозначать стратегию первого игрока через i, стратегию второго через j, а выигрыш первого F(i,j) через aij. Матрица A = (aij)тхп называется матрицей игры. Первый игрок выбирает в ней номер строки i, а втор ой — номер стол бца j.
В обозначениях матричной игры (i0, j0) — седловая точка матрицы A, если
aij0 < ai0j0 < aioj, i = 1 ,...m, j = 1 ,...,n.
Пример 2.1. A
Здесь (1,1) и (2,1) — две седловые точки и значение игры v равно нулю. Заметим, что a12 = v, но (1,2) не является седловой точкой матрицы.
Пример 2.2. Игра "орлянка". Первый игрок закладывает монету орлом (О) или решкой (Р), а второй пытается отгадать. Если второй игрок отгадает, то первый платит ему единицу, если не отгадает, то — наоборот.
O P O (— 1 1
Здесь A
Нетрудно видеть, что эта матрица не имеет
P V 1-1
седловой точки.
Вернемся к общему определению седловой точки и антагонистической игры. Возникают два вопроса. Когда антагонистическая игра имеет решение, т.е. когда функция F(x,y) имеет седловую точку на X х Y? Как искать седловые точки, сели известно, что они существуют?
Рассмотрим игру Г с точки зрения первого игрока. Пусть он выбрал стратегию я. Ясно, что его выигрыш будет не меньше, чем inf F(x,y).
yeY
Величину inf F(x,y) назовем гарантированным результатом (вы,игры,-уеУ
шем) для первого игрока. Наилучший гарантированный результат для
первого игрока v = sup inf F(x,y) называется нижним значением игры, xexyeY
Определение. Стратегия я0 первого игрока называется максиминной, сели inf F(x0,y) = v.
y€Y
Рассмотрим игру Г с точки зрения второго игрока. Если он выбрал стратегию у, то для него естественно считать гарантированным результатом величину sup F(x,y). Проигрыш второго игрока будет не болыце, xex
чем эта величина. Наилучший гарантированный результат для второго
игрока v = inf sup F(x,y) называется верхним, значением игры, yeY xex
Определение. Стратегия y0 второго игрока называется минимаксной,
сели sup F(x, y0) = v. xex
Лемма, 2.2. В любой антагонистической игре Г справедливо неравенство v < v.
Доказательство. Возьмем произвольные стратегии игроков x и y. Тогда
inf F(x,y) < sup F(x,y). yeY xex
rnf F(x,y) < F(x,y) < sup F(x,y) yeY xex
Левая часть последнего неравенства зависит от x, а правая часть — нет.
sup inf F(x, y) < sup F(x, y) V y E Y ^ v < v. ¦ xexyeY xex
Теперь сформулируем необходимое и достаточное условие существования седловой точки для функции двух переменных.
Теорема 2.1. 1) Для того чтобы функция F(x, у) на X х Y имела седловую точку, необходимо и достаточно, чтобы было выполнено равенство
(2.3)
max inf F(x, у) = min sup F(x, y) xex yeY yeY xex
2) Пусть выполнено равенство (2,3), Пара (x0,y0) тогда и только тогда является седловой точкой, когда x0 — макеиминная, ay0 — минимаксная стратегии игроков.
Доказательство. Утверждения 1) и 2) будем доказывать одновременно.
Необходимость, Пусть (x0,y0) — седловая точка функции F(x,y). Покажем, что выполнено равенство (2, 3), a x0,y0 — макеиминная и минимаксные стратегии. Имеем
v < sup F(x, y0) xex
F(x0,y0) = v = inf F(x0,y) < v ^ v < v.
yeY
Но неравенство v < v верно в силу леммы 2,2, Поэтому v = v и в последних неравенствах всюду можно поставить знаки равенств. Из полученных равенств следует, что x0 — макеиминная, ay0 — минимаксная стратегии игроков.
Достаточность, Пусть равенство (2,3) выполнено. Возьмем x0,y0 — макеиминную и минимаксную стратегии и покажем, что они образуют седловую точку. Имеем
Поэтому
F(x0,y0) > inf F(x0,y)
v = ^v = sup F(x, y0) > F(x0, y0). xex
Во всех неравенствах можно поставить знаки равенств и получаем, что (x0,y0) — седловая точка фу нкции F (x,y). ¦
Замечание. Если выполнено равенство (2,3), то множество всех седловых точек прямоугольно и совпадает с X0 х Y0, где X0 и Y0 — множества всех макеиминных и минимаксных стратегий игроков.
Упражнение 2.1. Докажите, что 3 х 3-матрица не может иметь ровно 7 седловых точек.
Пример 2.3. Найдем все седловые точки матрицы
Здесь (min ) = (-4, 2, 2,-3) и (max ) = (7, 2, 7, 2). Отсюда v =
v = 2, X0 = {2, 3}, Y° = {2, 4}. Четыре седловые точки образуют множество X0 х Y0.
Пример 2.4- Пусть X = Y = [0,1], F(x, y) = 2x2 - 3xy + 2y2. Найдем величины v и v. При фиксированном x минимум по у функции F(x,y) достигается в точке y(x) = 3x/4 G Y. Поэтому функция минимума -W(x) = min F(x,y) = 7x2/8. Отсюда v = 7/8 и x0 = 1 - максиминная
0<y<1
стратегия. Зафиксируем y. Максимум функции F(x, y) no x достигается в концах отрезка [0,1] и равен
|
М(y) = max F(x,y) = max[F(0,y),F(1,y)] |
 |
Минимум функции M ^достигается при y0 = 2/3 и v = М (y0) = 8/9 > v = 7/8. Следовательно, функция F(x,y) не имеет седловой точки.
Упражнение 2.2. Найдите макеиминную и минимаксную стратегии, а также нижнее и верхнее значения игры Г, в которой
X = [-2, 3], Y = [-1,2], F(x, y) = -x2 + 4xy - 5y2 + 3x - 2y. Иногда в выражениях
v = sup inf F(x, y), v = inf sup F(x, y) xexv^Y v^Y xex
внешние sup и inf не достигаются, но
sup inf F(x,y) = inf sup F(x,y)
(2.4)
xexv^Y »eYxex
Тогда макеиминная (или минимаксная) стратегия не существует и седловой точки нет. Возможен другой случай, когда v < ?, но эти величины близки, В подобных случаях используют понятие е-седло?ой точки.
Определение. Пусть задано е > 0. Пар а (x?,y?) е X х Y называется е-седловой соткой функции F(x,y) на X х Y, если
F(x, y?) — е < F(x?, y?) < F(x?, y) + е V x е X, V y е Y.
Упражнение 2.3. Пусть x0, y0 — макеиминная и минимаксная стратегии, ае = ? — ?> 0. Доказать, что (x0, y0) — е-еедловая точка функции
F (x,y).
Определение. Пусть задано е > 0. Стратегия первого игрока x? называется е-макс^инной, если inf F(x?,y) > v — е. Стратегия второго
yeY
игрока y? называется е-мин^аксной, если sup F(x, y?) < v + е.
xex
Эти стратегии обеспечивают игрокам получение своих наилучших гарантированных результатов с точностью до е. Сформулируем аналог теоремы 2,1,
Теорема 2.1'. 1) Для того чтобы при любом е > 0 функция F(x,y) на X х Y имела е-еедловую точку, необходимо и достаточно, чтобы было выполнено равенство (2,4),
2) Пусть равенство (2,4) выполнено. Тогда компоненты е-седловой точки являются 2е-макеиминной и 2е-минимакеной стратегиями, Обратно, е-макеиминная и е-минимакеная стратегии образуют 2е-еедловую точку.
Упражнение 2.4- Докажите теорему 2,1',
Представляют интерес условия топологического характера, при которых существуют макеиминные и минимаксные стратегии.
Теорема 2.2. Пусть функция F(x, y) непрерывна на X х Y, где X, Y — компакты метрических пространств. Положим
Y(x) =Argmin F(x,y). Тогда
yeY
1) Функция минимума W(x) = min F(x, y) непрерывна на X.
y&
2) Предположим дополнительно, что при каждом x ? X множество Y(x) состоит го единственного элемента y(x). Тогда функция y(x) непрерывна на X.
Доказательство. 1) Возьмем произвольную последовательность {xk} элементов из X, сходящуюся к x0. Покажем, что lim W(xk) существует
k^-ж
и равен W(x0). Предположим противное. Тогда найдется такая подпоследовательность {ki}, что lim W(xkl) = A = W(x0). Возьмем поеледо-
вательность {ykl ? Y(xkl)}. В силу компактности множества Y можно считать, что lim ykl = y°. Покажем, что y0 ? Y(x0). Действительно, по
определению ykl
W (xkl) = F (xkl ,ykl) < F (xkl, y) V y ? Y.
Переходя в этом неравенстве к пределу при l ^ то и используя непрерывность функции F(x,y), получим
F(x0,y0) < F(x0,y) V y ? Y ^ y0 ? Y(x0).
Наконец, A = lim F(xkl,ykl) = F(x0,y0) = W(x0) (противоречие),
2) Покажем, что функция y(x) непрерывна на X, Предположим, что она разрывна в некоторой точке x0 ? X. Тогда найдется такая последовательность {xk} элементов из X, сходящаяся к x0, что соответствующая последовательность {y(xk)} те сходится к y(x0). Поэтому существует окрестность U точки y(x0), вне которой находится бесконечное число членов последовательности {y(xk)}. В силу компактности множества Y\U из этой последовательности можно выделить подпоследовательность {y(xkl)} С Y\U, сходящуюся к некоторому элементу y' = y(x0). Но, как и в части 1), нетрудно доказать, что у1 ? Y(x0). Получили противоречие с тем, что множество Y(x0) состоит из единственного элемента.
Замечание. В процессе доказательства теоремы мы также установили замкнутость множества {(x,y) | x ? X, y ? Y(x)}. Отметим также, что в теореме 2,2 компактность множества Y существенна,
Пример 2.5. Пусть
X = [-1, iL Y = (—^, F(x,y) = (y2 + 1)(xy - i)2.
Здесь множество Y не является компактом, а функции

разрывны.
Определение. Антагонистическая игра Г называется непрерывной, если X, Y — параллелепипеды евклидовых проетранетв, а функция F(x, у) непрерывна на X х Y , В частности, при
X = [a, b], Y = [c, d] будем говорить о непрерывной игре на прямоугольнике.
Из теоремы 2,2 следует, что в непрерывной игре Г существуют мак-еиминные и минимаксные стратегии игроков.
Теперь займемся достаточными условиями существования седловой точки функции двух переменных. Их можно сформулировать в терминах выпуклого анализа. Напомним некоторые определения.
Определение. Множество Z евклидова пространства называется выпуклым, если для любых точек Z = z" из Z и любого чиела 0 < Л < 1 точка Лz/ + (1 — Л)г" также принадлежит множеству Z.
Определение. Функция h(z), определенная на выпуклом множестве Z, называется выпуклой, если для любых точек Z = z" из Z и любого числа 0 < Л < 1 выполнено неравенство
(2.4)
h(\z' + (1 — Л)z") < Xh(Z) + (1 — ЛЩС').
Если последнее неравенство выполнено как строгое, то функция h(z) называется строго выпуклой. Если вместо неравенства < в (2,4) фигурирует неравенство > (>), то функция h(z) называется вогнутой (строго вогнутой).
Упражнение 2.5. Докажите, что функция Y) z2 строго выпукла.
i= 1
Упражнение 2.6. Докажите, что строго выпуклая непрерывная функция на выпуклом компакте евклидова пространства достигает минимума в единственной точке.
Теорема 2.3. Пусть X С Em и Y С Eп — выпуклые компакты евклидовых пространств, а функция F(x, у) непрерывна на X х Y. Предположим, что при любом у 6 Y функция F (x, у) вогнута по x и при любом x 6 X она выпукла по у. Тогда функция F(x, у) имеет на X х Y седловую точку.
Доказательство. Вначале докажем существование седловой точки в случае, когда функция F (x, у) строго выпукл а по у. Тогда для всякого x 6 X функция F(x, у) достигает минимума на Y в единственной точке у(x). По теореме 2.2 функции W(x) = minF(x,у) и уД) непрерывны
У&
на X. Возьмем точку x*, максимизирующую функцию W(x) на X, и докажем, что пара (x*, уД*)) является седловой точкой функции F(x, у). Для любых x и 0 < t < 1 положим у = у((1 — t)x* + tx). В силу вогнутости по x функции FД,у) имеем
W(x*) > W((1 — t)x* + tx) = F((1 — t)x* + tx, у) >
> (1 — t)F(x*,у) + tF(x,у) > (1 — t)W(x*) + tF(x,у/).
Отсюда tFД,у) < tW(x*). Сократив на положительное t и устремив t ^ 0+, получим неравенства для седловой точки
FД,уД*)) < W(x*) = FД*,уД*)) < F(x*,y) V x 6 X, V у 6 Y.
Докажем теорему в общем случае. При е > 0 функция
def ' п '
F^x^) = FД,у) + е ^ у| непрерывна, вогнута по x и строго выпукла
j=i
по у. По доказанному функция F6(x, у) имеет седловую точку Д^у6) на Xx. Y :
Fe(x, у6) < Fe(x?, у6) < Fe(x?, у) V x 6 X, V у 6 Y.
Возьмем последовательность положительных чисел {ек}, сходящуюся к нулю. Из компактности множеств X и Y следует, что без потери общности x6k ^ x0, у6к ^ у0. Полагая в ^^^едних неравенствах е = ек и переходя к пределу при к ^ то, получим неравенства (2.1) из определения седловой точки. ¦
Заметим, что первая часть доказательства теоремы конструктивна: для поиска седловой точки функции F(x,у), строго выпуклой по у, достаточно найти макеиминную стратегию x* и наилучший ответ на нее
у(х*) второго игрока. Аналогично, пусть в условиях теоремы 2,3 функция F(х, у) строго вогнута по х, у* — минимаксная стратегия, a х(у*) ? Argmax F(х,у*) — наилучший ответ на нее первого игрока. Тогда
x€X
(х(у*),у*) — седловая точка функции F(х,у).
Из первой части доказательства вытекает, что для существования седловой точки вместо строгой выпуклости функции F(х, у) по переменной у достаточно потребовать при любом х ? X единственность наилучшего ответа у(х) второго игрока. Если последнее условие не выполнено, то пара (х*,у*), где у* ? Y(х*), может не быть седловой точкой. Например, для функции F(х, у) = ху на X х Y = [0,1] х [0,1] пара (х*,у*) = (0,1) седловой точкой не является.
Пример 2.6. X = Y = [0,1], F(х,у) = —х2+у+ху2 — 4у. Здесь функция F(х, у) выпукла по у и строго вогнута по х. Функция наилучшего ответа первого игрока — х(у) = у2/2 и
М(у) = max Fу) = F(х(у), у) = у4/4 + у3 — 4у.
0<x<1
Производная М'(у) = у + 3у2 — 4 обращается в нуль в точках 1,—2, Отсюда у0 = 1 — минимаксная стратегия и х(у0) = 1/2. Следовательно, (1/2,1) — седловая точка функции F(х,у).
§ 3. Смешанные расширения антагонистических игр
В предыдущем параграфе приводился пример антагонистической игры, не имеющей решения ("орлянка"). Играть в подобные игры весьма непросто. Проигравшему игроку каждый раз хочется сменить свою стратегию, но он будет бояться это сделать (а вдруг партнер догадается?). Теория игр предлагает игрокам использовать смешанные стратегии.
Определение. Смешанной стратегией первого игрока в игре Г называется вероятностное распределение р на множестве стратегий X.
Для первого игрока применить смешанную стратегию р — это выбрать стратегию х ? X как реализацию случайной величины, имеющей закон распределения р. Далее рассматриваются три вида смешанных стратегий,
1) Пусть X = {1,...,ш}, как это имеет место в матричной игре. Тогда вместо р для обозначения смешанной стратегии будем использовать 11 вероятностный11 вектор p = (p1, ...,pm), удовлетворяющий ограничениям
m
'Yhpi = 1, Pi > 0, i = 1,..., m. Если применяется p, то стратегия i выби-
І= 1
рается с вероятностью pi. Например, в игре "орлянка"опытные игроки используют смешанную стратегию р0 = (1/2,1/2), подбрасывая монету и выбирая "орел"или "решку"в зависимости результата бросания.
Вообще, одна из возможных реализаций смешанной стратегии — это бросание монет, С помощью одного бросания одной монеты можно осуществить только вероятность 1/2, С помощью двух монет или двукратного бросания одной монеты можно уже реализовать вероятности 1/2, 1/4 и 3/4, Ясно, что бросанием нескольких монет или многократным бросанием одной монеты можно реализовать широкий спектр вероятностей. Другой возможный и более удобный способ реализации смешанной стратегии — использовать рулетку. Делим круг рулетки на сектора с площадями, пропорциональными заданным вероятностям использования чистых стратегий. Затем вращаем стрелку и используем ту стратегию, в секторе которой она остановится,
2) Пусть X = [a,b], как это имеет место в непрерывной игре на прямоугольнике, Здесь смешанная стратегия — функция распределения <р на отрезке [a,b].
Пример 3.1. Пусть X = [0,1], c(x) — неубывающая дифференцируемая функция, определенная на отрезке [1/2,1] и удовлетворяющая условиям c(1/2) = 1/2, c(1) = 1. Определим функцию распределения
<?о(х)
Д, —то < х < 0, 1/4, 0 < х < 1/2, c(x), 1/2 < х < 1, Д, 1 < х < +то.
Интеграл Стилтьееа от непрерывной функции Дх) по функции распределения <^0(х) вычисляется по формуле
і і
/вдлатэД М°) + і Мі/2) + / ВДЩ)*.
о 1/2
доточенная в конечном числе точек:
m m
4«(х), ^2Pi
i=1 i=l
1, pi > 0, x(i) G X, i = 1, ..., m,
I x = x(i)
-1- kKj
0, x = x(i).
р(4
где
/де (x)
Отметим, что для любого борелевского множества Б р(Б) = pi.
i:x(r>eB
При использовании меры р стратегия x(i) выбирается е вероятностью pi. Интеграл от непрерывной функции h(x) по рассматриваемой мере имеет вид
/т
h(x)dр(x) = ^2 Pi h(x(i)). x i=1
Обозначим через {р} — множество всех смешанных стратегий первого игрока на множестве X. Можно считать, что X С {р}, Действительно, в последнем случае стратегию x можно отождествить с вероятностной мерой /х. Если множество X конечно, то выбор i эквивалентен выбору смешанной стратегии p = (0,..., 0,1,0,..., 0), где единица стоит на i-м месте, а при X = [a, b] стратегию x G [a, b] можно отождествить с функцией распределения, имеющей скачок 1 в точке x.
Множество X будем называть множеством чистых стратегий первого игрока (в противовес смешанным).
Займемся построением смешанного расширения антагонистической игры Г = (X, Y, F(x,y)). Мы определили множество {р} смешанных стратегий первого игрока. Аналогично, пусть {ф} — множество смешанных стратегий второго игрока, т,е, вероятностных распределений ф на множестве Y его чистых стратегий. При заданных стратегиях р и ф математическое ожидание выигрыша первого игрока определяется формулой
F(р,ф)= / F(x,У)dP(x)dф(У).
X Y
Здесь предполагается, что двойной интеграл существует.
Определение. Антагонистическая игра
Г = ({р} {ф} F(р,ф))
называется смешанным расширением игры Г.
Определение. Решение (р0,ф0,? = F(р°,ф0)) игры Г называется решением исходной игры Г в смешанных стратегиях. При этом <р°, называются оптимальными смешанными стратегиями игроков, а ? — значением игры Г.
Далее будут построены смешанные расширения матричных и непрерывных игр и будет показано, что эти игры всегда имеют решение в смешанных стратегиях.
Напомним, что матричная игра Г задается матрицей A = (aij)mxn. Множество смешанных стратегий первого игрока —
m
Р = {p =(pi,...,pm) I Pi = 1 Pi > О,і = l,...,m},
i=l
множество смешанных стратегий второго игрока —
n
Q = {q =(qi,...,qn) 1 qj =1 q > {0, j = 1,...,n},
j=i
а математическое ожидание выигрыша первого игрока —
m n
A(p,q) = YY1 Pian qj.
i=i j=i
Таким образом, Г = (Р, Q, A(p,q)) — смешанное расширение матричной игры Г.
Теорема 3.1 (Основная теорема матричных игр). Всякая матричная игра имеет решение в смешанных стратегиях.
Доказательство. Достаточно доказать ,что функция A(p, q) имеет седловую точку на Р х Q. Множества Р, Q — многогранники евклидовых пространств, а функция A(p, q) билинейна и поэтому непрерывна на Р х Q, вогнута по p и выпукла по q. По теореме 2.3 функция A(p, q) имеет на Р х Q седловую точку. ¦
Упражнение 3.1. Покажите, что тройка
(p0, q0,v) = ((l/2,1/2), (1/2,1/2), 0)
— решение в смешанных стратегиях игры "орлянка".
Отметим типичные случаи, когда применяются смешанные стратеГИИ,
1) Игра повторяется много раз, В этом случае за большое число повторений игры средний выигрыш первого игрока, использующего оптимальную смешанную стратегию, будет близок к значению игры или будет превышать его,
2) Смешанная стратегия реализуется в виде "физической смеси "чистых стратегий. Что это означает, поясним на примерах.
Пример 3.2. Игра против природы. Фермер (игрок 1 ) имеет участок земли, который можно засеять тремя сельскохозяйственными культурами, Год может быть нормальным, засушливым и дождливым (это три стратегии игрока 2 — природы). Пусть H = (hij)3х3 — матрица урожайности, а Ьі — цена за единицу продукции г-го вида. Тогда A = (bihij)3х3 — матрица игры, где выигрыш фермера — стоимость произведенной продукции, Пусть р0 = (1/2,1/4,1/4) — оптимальная смешанная стратегия первого игрока. Реализовать ее можно, засеяв половину участка первой культурой, а оставшиеся две четверти — второй и третьей культурами.
Пример 3.3. Некоторая страна (игрок 1) использует три типа истребителей для борьбы с самолетами противника (игрока 2), Если истребитель типа г первого игрока встречается с самолетом типа j второго игрока, то он побеждает противника с вероятностью aij. Смешанная стратегия р0 = (1/2,1/4,1/4) первого игрока может быть реализована в виде парка истребителей с пропорциями типов 2:1:1,
3) Смешанные стратегии можно применять и при однократном повторении игры, когда игрок действует в условиях риска. При этом необходимо выигрыши заменить на их "полезности", учитывающие отношение игрока к риску.
Пример 3-4- Пусть игрок вынужден один раз сыграть в игру с матри-

. Выигрышам 10 и 0 припишем полезности 1 и 0, Опре
делим полезность выигрыша 5, Пусть в некоторой лотерее выигрыш 10 ожидается с вероятностью 0 < a < 1. Первому игроку предлагается выбрать такое значение a, при котором игрок согласен купить лотерейный билет по цене 5, Выбранное значение a и будет полезностью выигрыша 5, Если a = 1/2, то отношение игрока к риску нейтральное, если a > 1/2, то игрок осторожен, а если a < 1/2, то игрок азартен.
Элементы теории полезности см, в конце данного параграфа.
Займемся смешанным расширением непрерывной игры Г. Ограничимся игрой на прямоугольнике X х Y = [a,b] х [c, d]. При заданных стратегиях риф — функциях распределения на отрезках X и Y — ожидаемый выигрыш F(р,ф) первого игрока равен
F (Р,ф)
F (x,y)dр(x)dф(y).
Здесь двойной интеграл от непрерывной функции F(x,y) существует. Более того, по теореме Фубини он равен повторному
d
J F(р,y)dф(y),
С
b
I F(x,ф)dр(x)
F (р,ф)
где
b
I F(x, y)dp(x).
d
I F(x,У)dф(У), F(P,y)
F (х,ф)
c а
Итак, построено смешанное расширение Г = ({р}, {ф}, F(р,ф)) непрерывной игры Г на прямоугольнике. Наша ближайшая цель — доказать существование решения игры Г.
Нам потребуется известный результат.
Теорема 3.2. Множество смешанных стратегий {р} на отрезке [a, b] является слабым компактом. Это означает, что из любой последовательности смешанных стратегий {рк} можно выделить подпоследовательность {ркі}, слабо сходящуюся к некоторой стратегии р0, т.е. такую, что для любой непрерывной на отрезке [a,b] функции h(x) выполнено
b b
lim J h(x)dрkl (x) = j h(x)dр0(x).
а а
Лемма 3.1. В непрерывной игре Г на прямоугольнике существуют максиминная и минимаксная смешанные стратегии игроков. Доказательство. Рассмотрим выражения
v = sup inf F(р,ф), v = inf sup F(р,ф) фе{ф} фе{ф}
и докажем, что внешние sup и inf в них достигаются. По определению верхней грани v найдется такая последовательность смешанных стратегий {рк}, что
inf F(рк,ф) > v — ?к, ?к ^ 0+,
Ф?{Ф}
или
J F (х,ф)&рк (x) > v — ?к V ф Е {ф}, к = 1, 2,.... (3.1)
Выделим из {рк} подпоследовательность {ркі}, слабо сходящуюся к смешанной стратегии р0. Заметим, что при фиксированной стратегии ф функция F(х,ф) непрерывна по х. Переходя в (3,1) к пределу по подпоследовательности {кг}, падучим неравенство F(р0,ф) > v V ф Е {ф}. Отсюда
inf F(р0,ф) > v ^ inf F(р0,ф) = v Ф?{Ф} Ф?{Ф}
и р0 — макеиминная смешанная стратегия первого игрока. Аналогично доказывается существование минимаксной смешанной стратегии, ¦
Лемма 3.2. Рассмотрим две антагонистические игры
Г = <X, Y, F(x,y)), Г = (X, Y, F'(x,y)),
в которых функции F(x,y) и F'(x, у) ограничены на X х Y и при ? > 0 выполнено условие
|F(x,y) — F'(x,y)| < ? V (x,y) Е X х Y.
Тогда |v — у. | < ?, |v — v'| < ?.
Доказательство. Для всякого x Е X справедливы неравенства rnf F(x,y) — rnf F'(x,y) > inf(F(x,y) — F'(x,y)) > —?.
y?Y y?Y y?Y
Можно получить аналогичные неравенства, меняя местами функции F(x,y) и F'(x,y). В результате находим, что
| inf F(x,y) — inf F'(x,y)| < ? Vx Е X.
yEY yEY
Далее,
sup inf F(x,y) — sup inf F'(x,y) < sup(inf F(x,y) — inf F'(x,y)) < ?. xexy^Y xexy^Y xex y^Y y^Y
Как и выше, находим, что \v — ?\ < е. Аналогично доказывается неравенство \v — ?'\ < е. ¦
Теорема 3.3 (Основная теорема непрерывных игр). Всякая непрерывная игра Г на прямоугольнике имеет решение в смешанных стратегиях.
Доказательство. По теореме 2,1 достаточно доказать равенство величин v = max inf F(ф,^) и v = min sup F(фД).
Фе{Ф} Уе{у} ve{^}
Заметим, что достижимость здесь внешних максимумов и минимумов вытекает из леммы 3.1. Возьмем произвольное е > 0. Из непрерывности функции F(x,y) следует существование такого разбиения отрезка X = [a, b] на неперееекающиеся промежутки (отрезок и полуинтервалы) Xг, i = 1,...,m и такого разбиения отрезка Y = [c,d] на аналогичные промежутки Yj, j = 1, ...,n, что
\F(x,y) — F(X,y)\ < е V (x,y), (x',y/) G X% x Yj, V i,j. (3.2)
Для любых i, j возьмем точки хг G Xг, yj G Yj и определим ступенчатую функцию
Fi(x,y) = F(x\yj) V (x,y) G X% x Yj, i ^..^m j = 1,...,n.
Тогда из (3.2) следует, что
\F(x,y) — Fi(x,y)\ < е V (x,y) G X x Y. (3.3)
Итак, функция F1(x, y) аппроксимирует функцию F(x, y) с точностью до е > 0. Непрерывная игра Г фактически приближена игрой с матрицей
A (aij )mxn (F (x,y^' ))mxn.
Всякой смешанной стратегии ф поставим в соответствие вектор Р = (pi, ...,Pm) : Рг = J dp(x), i = 1, ...,m,
X1
где рг — вероятность попадания реализации смешанной стратегии в множество Xг (мера множеетва Xг ). Очевидно, что р является смешанной стратегией первого игрока в матричной игре, т.е. р G P. Построенное отображение P : {ф} —^ P является отображением на P. Действительно, для любой стратегии р G P функция распределения ф со скачками
Рі в точках хг является прообразом p при отображении V, Аналогично определяется отображение Q : {ф} ^ Q, где Q — множество смешанных стратегий второго игрока матричной игры. Далее, для любых стратегий р, ф и соответствующих стратегий p = V(р), q = Q(ф) справедлива формула
Ыр,ф)
= / Fi(х,У)^Р(х)^Ф(У) = PiF (xг, )q?' = A^ q)- (3-4)
a с г=і j=i
Кроме того, используя (3,3), получим
|F(Р,ф) — ^1(Р,ф)| = \ / /(F(х,У) — Fl(x,y))dP(x)dф(y)| <
e.
< / / |F(х,У) — ^^1(х,У)|^Р(х)^ф(У) < / / ?dp(x)dip(y)
a c a c
Последнее неравенство означает, что для функций F(р,ф), F1(p,t^) выполнены условия леммы 3,2, Из нее вытекают неравенства
(3.5)
(3.6)
| max inf F(р,ф) — max min F^p^) < e, <pe{<p} фе{Ф} vCv] фе{Ф}
| min sup F(р,ф) — min max F^p^) < e. фе{ф} ^eM фе{ф}
I Is (3,4) и основной теоремы матричных игр следует, что
max min F^p, ф) = max min A(p,q) =
^e{^}Фе{Ф} peP qeQ
= min max A(p,q)= min max F1(p,ф). qeQ peP фе{Ф}^e{^}
Отсюда и из неравенств (3,5),(3,6) следует |v — v| < 2e. В силу произвольности e > 0 подучаем v = V. ¦
Элементы теории полезности
Правомерность использования математического ожидания выигрыша в смешанном расширении игры вызывает сомнения. Когда игроки применяют заданные смешанные стратегии, то выигрыш каждого является случайной величиной е заданным законом распределения, В теории полезности такую величину называют лотереей. Формально она задается набором параметров (A^...,Ak; x\,...,xk), где выигрыш Ai возникает
к
с вероятностью xi, l = 1,..., к, и ^ xi = 1.
1=1
Упражнение 3.2. Указать параметры лотереи, которая соответствует паре смешанных стратегий (p, q) в матричной игре.
Оценка исхода любой игры по математическому ожиданию предполагает, что лотереи (0; 1), ($5000, $ — 5000; 1/2,1/2) и (—1руб.,10000 руб.;10000/10001,1/10001) эквиваленты для индивидуума. Можно предположить, что для многих читателей это не так. Далеко не все могут себе позволить сыграть во вторую лотерею, даже если несколько увеличить размер выигрыша, В то же время значительная часть населения участвует в лотереях, подобных третьей, даже при отрицательном среднем выигрыше: многие готовы рискнуть маленькой суммой в расчете на счастливый случай. Вообще, отношение людей к риску достаточно сложно и не до конца исследовано. Его изучением занимается теория полезности (в экономике функции выигрыша обычно называют функциями полезности).
Один из важнейших результатов этой теории состоит в следующем. Предположим, что у индивидуума есть отношение предпочтения на множестве всевозможных лотерей, т,е, для любых двух лотерей L1, L2 он может указать, какое из соотношений ( причем только одно) выполняется: L1 У L2 (Li предпочтител ьней L2), L2 У L1 ил и L1 ~ L2 (лотереи эквивалентны), Пусть эти соотношения удовлетворяют следующим (довольно естественным) аксиомам:
I. Если L1 У L2 и L2 У L3, то L1 У L3,
II. Если L1 ~ L2 и L2 ~ L3, то L1 ~ L3,
III. Если L1 ~ L2 и L2 У L3, то L1 У L3,
IV. Если L1 У L2 и L2 ~ L3, то L1 У L3,
V. Лотереи, которым соответствует одинаковое распределение вероятностей, являются эквивалентными.
Пусть L1,L2 — две лотерей, 0 < r < 1, Обозначим через rL1 + (1 — r)L2 лотерею, в которой с вероятностью r разыгрывается лотерея L1, а с вероятноетыо 1 — r — лотерея L2.
Из аксиомы V вытекает, что для любых лотерей LbL2,L3 и вероятностей r, s справедливы соотношения
rLi + (1 - r)L2 ~ (1 - r)L2 + rLi,
rLi + (1 - r)(L2 + (1 - s)L3) ~ rLi + (1 - r)L2 + (1 - r)(1 - s)L3.
VI. Если Li ~ L2 (Li У L2), to для любой лотереи L3 и любой вероятности r > 0 выполнено соотношение
rLi + (1 - r)L3 ~ rL2 + (1 - r)L3 (rLi + (1 - r)L3 у rL2 + (1 - OL3),
VII. Если Li У L2 У L3, to найдется такая вероятность r, что rLi + (1 - r)L3 ~ L2.
Аксиома VII похожа на теорему о промежуточном значении для непрерывной функции на отрезке и означает, что отношение предпочтения непрерывно в некотором смысле. Пусть, наконец, справедлива аксиома
VIII. Если Ai > Ah, то (A; 1) У (Afe; 1).
Лемма 3.3. Пусть на множестве лотерей предпочтение индивидуума удовлетворяет аксиомам I - VIII и Li У L2. Тогда для любых вероятностей в < а выполнено соотношение aLi + (1 - a)L2 У /$Li + (1 - e)L2.
Доказательство, По аксиоме VI при L3 = L2 получаем aLi + (1 - a)L2 У L2. Представим в в виде в = 7а, где 7 е [0,1). Тогда по аксиомам VI и V
aLi + (1 - a)L2 У y(aLi + (1 - a)L2) + (1 - y)L2 ~
~ yaLi + [7(1 - a) + 1 - y]L2 ~ eLi + (1 - в)L2. ¦
Теорема 3.4. При выполнении указанных аксиом I- VIII существует функция полезности u(L), определенная на множестве лотерей вида (Ai,..., Ak; xi, ...,xk) и такая, что выполнены следующие свойства:
1) Для любых лотерей Li, L2 u(Li) > u(L2) ^ Li У L2.
k
2) Для любой лотереи L = (Ai,..., Ak; xi,..., xk) u(L) = xlu(Al).
i=i
3) Функция u(A; 1) монотонно возрастает no A.
Более того, эта функция единственна с точностью до линейного преобразования: если другая функция v(L) удовлетворяет тем же свойствам 1)-3), то существуют такие конетанты c > 0 и Ь, что для любой лотереи L v(L) = cu(L) + Ь.
Утверждение теоремы означает, что для каждого индивидуума (при выполнении аксиом I - VIII) существует монотонное преобразование функции выигрыша, которое позволяет оценивать любую лотерею, исходя из математического ожидания выигрыша, В частности, сели в матричной игре взять преобразованную функцию выигрыша u(aij), то случайный исход при использовании смешанных стратегий р и q можно
m n
оценивать по математическому ожиданию piu(aij)qj. Отметим, что
i= 1 j= 1
функция полезности u(L) — своя для каждого индивидуума, поэтому игра с преобразованными матрицами выигрышей (u1(aij)) и (u2(aij)) вполне может оказаться неантагониетичеекой.
Упражнение 3.3. Докажите теорему 3,4,
Указание. Без потери общности можно считать, что A1 У A2 У ... У Ak. Положим u(A1) = r1 = 1, u(Ak) = rk = 0, а величины u(Ai) = rl, I = 2,..., k — 1 определим го соотношений rl(A1) + (1 — rl)Al ~ Al, 0 < rl < 1, используя аксиому VII. С помощью леммы 3,3 покажите, что функция
k
u(L) = u(Ab ..., Ak; X1, ...,xk) = Y, xTl
1=1
удовлетворяет веем утверждениям теоремы,
§ 4. Свойства решений в смешанных стратегиях
В данном параграфе рассматриваются свойства решений в смешанных стратегиях матричных игр и непрерывных игр на прямоугольнике. Эти свойства в частных случаях позволяют находить оптимальные смешанные стратегии.
Теорема 4.1. Для того чтобы тройка (р°,ф°,?) была решением в смешанных стратегиях непрерывной игры Г, необходимо и достаточно, чтобы было выполнено условие
F(x, ф0) < ? < F(р°, y) V x е X, V y е Y. (*)
Доказательство. Необходимость, Пусть (р°,ф°,?) — решение непрерывной игры в смешанных стратегиях. Тогда ? = F(р°,ф°) и по определению седловой точки
F(Г,ф0) < F(г0,ф0) = ? < F(Г°,ф) V г е {г}, V ф е {ф}.
Возьмем в последних неравенствах вместо г и ф чистые стратегии x и у. В результате получим условие (*).
Достаточность, Пусть для тройки (р0,ф0рг) выполнено условие (*). Проинтегрируем первое неравенство этого условия по любой стратегии р, а второе — по любой стратегии ф и получим
F(р,ф0) < v < F(р0,ф) V р G {р}, V ф G {ф}.
Подставляя, в частности, р = р° и ф = ф0, находим, что F(р°,ф°) = v и пара (р0,ф0) — седловая точка функции F(р,ф) на {р} х {ф}. ¦
Отметим, что теорема 4,1 справедлива для произвольных смешанных расширений антагонистических игр.
Сформулируем аналогичную теорему для матричных игр.
Теорема 4.1Для того чтобы тройка (p0,q0,v) была решением в смешанных стратегиях игры с матрицей A, необходимо и достаточно, чтобы было выполнено условие
A(i,q0) < v < A(p0,j), i = l, ...m, j = l,...,m. (*)
Упражнение фі. Докажите теорему 4,1
Отметим, что проверка выполнения условия (*) теоремы 4,1' сводится к подсчету скалярных произведений вектора р° на столбцы, а также вектора q0 на строки матрицы A и сравнению их с числом v.
Пример 4-1. Пусть матрица игры — циклическая:
Д1 с2 ... сп \
A Сп с1 ... СП— 1
\с2 ... сп С1 /
п
Покажем, что р0 = q0 = (l/n,..., l/n), v = ск/п — решение игры
k=1
в смешанных стратегиях. Действительно, условие (*) здесь выполнено, поскольку все неравенства в нем выполнены как равенства, В качестве конкретного примера рассмотрим игру "мешок, камень, ножницы "с матрицей
МКН
Можно дать следующую интерпретацию этой игры. Двое выбирают один из трех предметов: мешок, камень или ножницы. Каждый предмет против самого себя никакого выигрыша не дает, поэтому на диагонали стоят 0, Ножницы тупятся о камень, поэтому они проигрывают камню 1, а тот в свою очередь выигрывает у ножниц 1, Камень можно поместить в мешок, поэтому мешок выигрывает у камня 1, а камень проигрывает мешку 1, Ножницы режут мешок, поэтому они выигрывают у мешка 1, а мешок проигрывает ножницам 1,
Упражнение 4-2. Пусть B — матрица, полученная прибавлением константы c ко всем элементам матрицы A. Показать, что значения соответствующих матричных игр связаны соотношением v(B) = v(A) + c, а оптимальные смешанные стратегии игроков совпадают.
Пример 4-2. Продавец выставляет на продажу три предмета, не представляющие для него особой ценности (старые телевизоры и т,п,). Он готов их продать даже за незначительную цену. Имеются два покупателя (игрока), располагающие одинаковыми суммами денег A. Игрок становится обладателем предмета, если предлагает за него сумму, большую, чем партнер. Цель первого игрока состоит в покупке двух каких-либо предметов из трех. Цель второго игрока — воспрепятствовать этому,
3
Пусть x = (xi,x2,x3) Е X = {x | ^ xi = A, x\,x2,x3 > 0} —
i=l
стратегия первого игрока, состоящая в предложении суммы xi за г-ый предмет. Аналогичную стратегию y = (yl,y2,y3) Е Y = X использует второй игрок.
Будем писать x >- y, если какие-либо две компоненты вектора x больше соответствующих компонент вектора y. Определим функцию выигрыша первого игрока
F (x,y)
О x ^ y,
0, в противном случае.
Заметим, что
?х Е X 3 y Е Y : — (x >- y) ^ v = 0;
Vy Е Y 3 x Е X : x >- y ^ v = 1.
Отсюда следует, что игра не имеет решения в чистых стратегиях. Найдем ее решение в смешанных стратегиях.
Множество стратегий X (совпадающее с Y) изобразим на плоскости в виде равностороннего треугольника высоты A. Точка y имеет барицентрические координаты yl,y2,y3, определяющие ее расстояния от трех сторон треугольника. На рис, 4,1 изображены линии хі = уі, х2 = У2, хз = Уз.

(0, 0, A) (0, A, 0)
Рис. 4-1
Множество стратегий вне этих линий разобьем на два подмножества хі(У) = {х е X 1 х у y}, X2(y) = {х е X 1 у У х}.
Заметим, что Xi (у) является объединением трех треугольников. Например, нижний треугольник на рис, 4,1 состоит из таких векторов х, для которых х2 > у2,х3 > у3.
Множество
C = {х е X | 0 < х* < 2A/3, i = 1, 2, 3} представляет собой правильный шестиугольник с центром у0, совпадающим с центром треугольника X (рис, 4,2),
 |
Рис. 4-8
Пусть Д — равномерное распределение на C. Докажем, что тройка |
(Д, Д, 1/2) — решение игры в смешанных стратегиях. Для этого достаточно проверить условие (*) теоремы 4,1,
Обозначим через mes(S) площадь фигуры S С X. Тогда
F (Г°,?)
mes(Xl(,v;Ln C} Vy е Y.
mes(C)
Нетрудно показать, что mes(Xi(y) П C) = 0.5mes(C) для всех у е C. Действительно, для центра шестиугольника у0 это утверждение очевидно, Пусть у = у0. Определим вектор у1 е C :
УІ = ?l, У3 = У° = АА Уз1 = 2А/3 — Уз.
Сравнивая фигуры Хз(у) П C, Хз(уз) П C и Хз(у°) П C, убеждаемся, что их площади равны. Следовательно, при у е C F(Д,у) = 1/2. Методом сравнения площадей можно также показать, что mes(Xl(y) П C) > 0.5mes(C), если у е C. Итак, доказано, что F(Д,у) > 1/2 ?у е Y. Поскольку
mes(X2(x) П C) mes(C)
Vx е X,
F (x,A
для доказательства неравенства F(x, Д) < 1/2 Vx е X достаточно заметить, что
mes(X3(x) П C) + mes(X2(x) П C) = mes(C) Vx е X. ¦
Пусть Г — смешанное расширение произвольной антагонистической игры Г.
Определение. Смешанная стратегия второго игрока называется выравнивающей, если F(x,^°) = const на множестве X.
Аналогично определяется выравнивающая стратегия первого игрока.
Утверждение 4-Т Если в игре Г у обоих игроков существуют выравнивающие стратегии Д, А, то они оптимальны.
Доказательство. Действительно, по определению
F(<^°,у) = сз ?у е Y, F(x,^°) = c2 Vx е X.
Интегрируя эти равенства по А и р° соответственно, получим F(Д, А) = сз = с2. При v = F(Д, А) неравенства из условия (*) теоремы 4,1 для тройки (^°,^°,v) выполнены как равенства, ¦
Доказанное утверждение можно усилить.
Упражнение 4-3. Пусть в игре Г ф0 — выравнивающая стратегия второго игрока и найдется такая смешанная стратегия первого игрока, что F(р0,ф0) = min F(р0, ф). Докажите, что р0,ф0 — оптимальные ф?{ф}
смешанные стратегии игроков.
Упражнение 4-4- Приведите пример игры с матрицей размеров 2 х 3, в которой второй игрок имеет выравнивающую, но не оптимальную смешанную стратегию.
Пример 4-3¦ Первый игрок ведет стрельбу по цели, которая может находиться в одной из трех точек: либо в концах отрезка [B, C] длины 2, либо в его середине D, Первый игрок выбирает точку прицела B, C или D. Пусть d — расстояние от точки прицела до положения цели, а вероятности ее поражения равны 1 ,а, 0 для расстояний d = 0,1, 2 соответственно, Выигрыш первого игрока — вероятность поражения цели. Требуется определить оптимальную стратегию стрельбы в зависимости от значения параметра а G (0,1).
BCD B ( 1 а 0 \
Составим матрицу игры A = C I а 1 а I .
D\0 а 1 )
Пусть q0 = (q0,q2,9з) — выравнивающая стратегия второго игрока. Матрица A симметрична и смешанная стратегия р0 = q0 первого игрока также является выравнивающей. Из утверждения 4,1 вытекает, что стратегии р0 и q0 оптимальны. Найдем q0. В силу симметрии концов отрезка [B, C ] по отношению к его се редине D можно считать, что q0 = q0 Следовательно,
2q°i + q° = 1 q°i + = v, 2щ°і + q° = v.
Выпишем решение полученной системы уравнений
1 — 2 а2 3 — 4 а
1 — а 3 — 4 а,
1 — 2 а 3 — 4 а,
q0
Из условия неотрицательности q°,q° находим, что а < 1/2. При а > 1/2 покажите, что тройка (р0, q0, v) = ((0,1, 0), (1/2, 0,1/2), а) — решение игры в смешанных стратегиях.
Упражнение 4-5. Используя выравнивающие стратегии, решите аналогичную игру с матрицей
0 < а < 1.
(1 а 0 0\ а 1 а 0 0 а 1 а у0 0 а 1J
Теорема 4.2. Для непрерывной игры Г справедливы следующие два утверждения:
1) F(^)=min F(^у) V P E M;
-Фе{-Ф] yeY
2) sup F(р,ф) = max F(х,ф) V ф E {ф}.
xeX
Доказательство. Докажем 1). Возьмем любую стратегию р. Заметим, что min F(р, у) достигается, поскольку функция F(р, у) непрерывна
yeY
по у. Далее,
if F(Р,ф) < тіД F(Р,У)
Це{У} yeY
(4.1)
и для любого ф E {ф}
F (р,ф)
F(г,у)^Ф(у) >
F (р,у).
F (г,у)^ф(у)
min
yeY
min
yeY
Отсюда
(4.2)
ff F(Р,ф) > min F(р,у)
ye{y} yeY
Из (4.1) и (4.2) следует первое утверждение теоремы. Утверждение 2) доказывается аналогично. ¦
Следствие. Значение •и непрерывной игры Г может быть представлено в виде следующих двух формул:
v = max min F(р,у)= min max F(х,ф).
ye{^} yeY ye{y} xex
Доказательство. По теоремам 2.1,3.2 и 4.2 получаем
v = max inf F(р,у) ^ v = max inf F(р,у). yeMye{y} ye{^}yeY
Вторая формула выводится аналогично.
Упражнение 4-6. Докажите, что значение •и непрерывной игры Г удовлетворяет неравенствам
v = max min F(х, y) < v < min max F(x, y) = v.
x€X yEY y& x€X
Теорема 4.2'. Для игры с матрицей A справедливы следующие два утверждения:
1) min A(p,q) = min A(p,j) V p E P;
qeQ 1 <j<n
2) max A(p,q)= max A(i,q) V q E Q.
p?P 1 <i<m
Докажите самостоятельно.
Следствие. Значение v игры с матрицей A может быть представлено в виде следующих двух формул:
v = max min A(p, j) = min max A(i, q).
p€P 1<j<n q€Q 1<i<m
Теперь обсудим так называемое свойство дополняющей нежесткости. Определим множество Sp(<p) С X — спектр смешанной стратегии р, заданной на отрезке X.
Определение. Будем говорить, что точка х' E X = [a, b] принадлежит спектру стратегии р, если для всякого е > 0 существует такой отрезок [a', b/], содержащий х', что b' — a' < е и р(Ъ') — р(а') > 0. Множество всех точек спектра обозначим через Sp(p).
Упражнение 4-гІ- Докажите, что точки скачка функции распределения р и точки, где ее производная существует и положительна, принадлежат спектру Sp^).
Теорема 4.3 (Свойство дополняющей нежесткости). Пусть (р0 ,ф0 ,v) — решение в смешанных стратегиях непрерывной игры Г. Тогда
1) х E Sp(р0) ^ F(х,ф0) = v;
2) У E Sp(^0) ^ F(р0,y) = v.
Доказательство. Докажем утверждение 1). Предположим противное, т.е. найдется такая точка х' E Sp^0), что F(х',ф0) = v. Тогда по свойству (*) теоремы 4.1 будет выполнено неравенство F(х',ф0) < v. Из непрерывности функции F(х, ф0) и определения спектра стратегии р0
вытекает, что для всякого е > 0 найдется такой отрезок \a',b'], содержащий точку я', и такое чиело v' < v , что для всех x Е \а', b'\
F(х,ф°) < v' <v, b' — а' < е, p°(b') — р°(а') > 0.
Теперь
F(Г°,ф°) = J F(x,^°)d^0(x) =
X
F(х, ip°)d<?°(x) +
F(x^°)dip°(x) < / v'dp°(x) +
X\(a,,bn]
+ J vdp°(x) < (<p°(b') — p°(a'))v + J vdp°(x) = v,
X\(a',b'} X\(а, ,b,]
что противоречит определению значения игры. Утверждение 2) доказывается аналогично, ¦
Следствие. Пусть (р°,ф°ри) — решение в смешанных стратегиях непрерывной игры Г, Тогда
1) F(x/ф0) < v ^ x Е Sp(<p°);
2) F(<Р°,?) >v ^ у Е Бр(ф°).
Сформулируем аналогичную теорему для матричных игр.
Теорема 4.3' (Свойство дополняющей нежесткости). Пусть (p°,q°,v) — решение в смешанных стратегиях игры с матрицей A. Тогда
1) p° > 0 ^ A(i, q°) = v;
2) q° > 0 ^ A(rp°,j) = v.
Упражнение 4-8. Докажите теорему 4,3',
Следствие. Пусть (p°, q°,v) — решение в смешанных стратегиях игры с матрицей A. Тогда
1) A(i, q°) < v ^ p° = 0;
2) A(p°,j) > v ^ q° = 0.
Поясним выражение "дополняющая нежесткость", заимствованное из теории двойственности линейного программирования. Поставим в соответствие неравенству A(i,q°) < v (A(p°,j) > v) из условия (*) неравенство p° > 0 (q° > 0) с тем же номером. Тогда если одно из этих неравенств выполнено строго ("нежестко"), то по теореме 4,3 ' и ее следствию
соответствующее неравенство выполнено как равенство ("жестко"). Все это можно записать в следующей краткой форме: для решения (p0, q0, v) в смешанных стратегиях игры с матрицей A справедливы равенства
p0(v - A(i,q0)) = q0(A(p0,j) - v) = 0, і = l,...,m, j = 1 ,...,n.
Пример 4-4- Решим игру с диагональной матрицей A, в которой диагональные элементы ai > 0. Предположим, что все компоненты оптимальных смешанных стратегий p0, q0 положительны. Тогда по теореме 4.3'
П
A(i,q0) = aiq° = v, i =1,...,n^^q° = 1.
i=1
Решая эту систему относительно n + 1 неизвестных q0, i = 1,...,n, v,
П
получим q0 = v/ai, i = 1,...,n, где v = 1/ ^ 1.
k=i “fc
Аналогично можно найти, что p0 = q0.
Приведем одну интерпретацию этой игры. Пусть милиционер (первый игрок) ищет преступника (второго игрока) в одном из n баров. Если милиционер приходит в бар i, где находится преступник, то вероятность его задержания равна ai. Оптимальные смешанные стратегии предписывают игрокам идти с большей вероятностью в тот бар, где вероятность задержания меньше. Поэтому оптимальная стратегия преступника естественна, а милиционера — парадоксальна. Отметим также, что мы одновременно решили следующую задачу поиска макеимина:
v = max min A(p, i) = max min aipi.
peP l<i<n peP i<i<n
§ 5. Методы решения матричных игр
В этом параграфе изложены некоторые методы решения матричных игр в смешанных стратегиях. При этом наша цель будет состоять в поиске хотя бы одного решения игры,
I, Доминирование строк и столбцов.
Если элементы некоторой строки i1 матрицы A меньше соответствующих элементов другой строки i^, то интуитивно ясно, что строку i1 первому игроку можно не использовать. Сформулируем условия доминирования строк и столбцов матрицы игры, позволяющие уменьшить ее размеры.
Определение. Будем говорить, что вектор а = (аі,...,щ) слабо доминирует вектор b = (&і, ...,bi), если аі > С, i = 1,...,/. Будем говорить о строгом доминировании, если все нестрогие неравенства > заменены на строгие >, Заметим, что слабое доминирование возможно даже в случае равенства векторов а и b.
Определение. Для векторов а(і), i = 1 ,...,m, евклидова пространства
т т
и чисел pi > 0, i = 1,...,m, ^2рі = 1, линейная комбинация ^р»а(г)
i=1 i=1
называется выпуклой комбинацией векторов а(і) с коэффициентами pi.
Теорема 5.1 (О доминировании строк). Пусть некоторая строка матрицы A слабо доминируется выпуклой комбинацией остальных строк. Тогда эта строка входит с нулевой вероятностью в некоторую оптимальную смешанную стратегию первого игрока. Если указанное доминирование строгое, то эта строка входит с нулевой вероятностью в любую оптимальную смешанную стратегию первого игрока. Доминируемые строки можно вычеркнуть из матрицы игры.
Доказательство. Пусть строка матрицы A с номером i1 слабо доминируется выпуклой комбинацией остальных строк с коэффициентами Pi > 0, i = ii :
ащ Ріац, j = 1,...,n^^Pi = 1 (5Л)
i=il i=il
Рассмотрим матрицу A, подученную из A вычеркиванием (исключением) ^-ой строки. Пусть (р, q0,v) — решение игры с матрицей A. Положим Р0 = (pb ...,'Pil-1, 0,pil+1, ...,'Рт) и докажем, что тройка (p0,q0,v) — решение игры с матрицей A. Тем самым будет доказано второе утверждение теоремы и обосновано вычеркивание і1-ой строки. Действительно, решая игру с матрицей A, мы находим решение исходной игры, добавляя в р нулевую і1-?ю компоненту.
Проверим условие (*) для тройки (р0, q0, v) в игре с матрицей A. Имеем
A(P0,j) = A(p,j) > v, j = 1,...,n; A(i,q0) = A(i,q0) < v V i = i1. Пусть i = i1. Тогда, полагая p = (pi, i = i1), получим
n n
A(i1,q0) = ^ ачіq°j < ^(^ Tjp^q0 = A(p',q0) < v,
j=1 j=1 i=il
поскольку стратегия q0 второго игрока оптимальна в игре с матрицей A. Итак, (p°,q°,v) — решение игры с матрицей A.
Предположим, что неравенства в (5,1) строгие. Тогда в последних выкладках первое неравенство также строгое и A(ii, q0) < v. Пусть p* — произвольная оптимальная смешанная стратегия первого игрока. Тогда (p*,q0,v) — решение игры с матрицей A. Из последнего неравенства по свойству дополняющей нежесткости получаем р*1 = 0. ¦
Отметим, что при исключении строго доминируемых строк оптимальные смешанные стратегии первого игрока сохраняются. При слабом доминировании оптимальные стратегии могут теряться, В качестве примера достаточно рассмотреть матрицу игры с равными элементами.
Следующую теорему докажите самостоятельно.
Теорема 5.1' (О доминировании столбцов). Пусть некоторый столбец матрицы A слабо доминирует выпуклую комбинацию остальных столбцов этой матрицы. Тогда этот столбец входит с нулевой вероятностью в некоторую оптимальную смешанную стратегию второго игрока. Если указанное доминирование строгое, то этот столбец входит с нулевой вероятностью в любую оптимальную смешанную стратегию второго игрока. Доминирующие столбцы можно вычеркнуть из матрицы игры.
Пример 5.1. Решить игру с матрицей
/3 1 5\
A = I 1 3 3 1 .
\ 2 2 1/
Здесь полусумма первых двух строк слабо доминирует третью строку и ее можно вычеркнуть, В полученной матрице третий столбец слабо доминирует второй. После его вычеркивания получим циклическую матрицу
с решением (p,q,v) = ((1/2,1/2), (1/2,1/2), 2). Поэтому исходная игра имеет решение
(p0,q0,v) = ((1/2,1/2, 0), (1/2,1/2,0), 2).
Упражнение 5.1. Пусть матрица A имеет седловую точку. Показать, что после исключения слабо доминируемых строк и слабо доминирующих столбцов без использования выпуклых комбинаций редуцированная матрица имеет седловую точку матрицы A,
Упражнение 5.2. Полковнику Блотто (первому игроку) поставлена задача прорыва тремя полками через два горных перевала, охраняемых двумя полками противника (второго игрока). Стратегия Блотто (к1,к2) ^ X = {(3,0), (2,1), (1, 2), (0, 3)} состоит в том, что к1 полков направляются на первый перевал, а к2 — на второй. Противник располагает аналогичными стратегиями (l1, l2) Е Y = {(2, 0), (1,1), (0, 2)}. Полки Блотто и противника, встретившись на перевале, взаимно уничтожают друг друга. Выигрышем Блотто является общее число его полков, прорвавшихся через два перевала, т,е, величина max[k1 —11,0]+max[k2 —12,0]. Решить матричную игру и найти оптимальную стратегию Блотто,
II, Графический метод решения игр с матрицами размеров 2 х n и m х 2.
Рассмотрим игру с 2 х n-матрицей A. Смешанная стратегия первого игрока p = (p1,1 — p1) определяется вели чиной p1 Е [0,1]. Значение игры, согласно следствию теоремы 4,2 ', представимо в виде
v = max min A(p, j) = max min [a1?-p1 + a2j(1 — p1)].
peP 1<j<n o<p1<11<j<n J J
Для нахождения значения игры и оптимальной смешанной стратегии первого игрока достаточно на отрезке [0,1] построить графики семейства линейных функций j (p1) = a1jp1 + a2j (1 — p1) с угловыми коэффициентами kj = a1j — a2j, j = 1,..., n, и найти точку максимума p1 функции min lj(p1) — нижней огибающей семейства (рис, 5,1),
1<j<n
 |
|
Рис. 5.1 |
Найдем оптимальную смешанную стратегию второго игрока. Разберем следующие возможности,
а) 0 < pi < 1.
Этот случай представлен на рис, 5,1, Возьмем две прямые lj1 и lj2, проходящие через точку (pi, v) и имеющие угловые коэффициенты j > 0, kj2 < 0, Рассмотрим уравнение
kjiq* + kj2 (1 - q*) = 0. (5.2)
Оно имеет решение q*, принадлежащее отрезку [0,1], Из (5,2) следует, что угловой коэффициент прямой ljl(pi)q* + lj2 (pi)(1 — q*) равен нулю. Смешанная стратегия второго игрока
fq% j = ji
q0: q0 = <1 — q*, j = j2, l0, j = j'ij^
оптимальна, поскольку при всех pi G [0,1]
Afeq0) = lji (pi)q* +l j2 (pi)(1 — q*) = v.
б) pi = 0.
В этом случае чистая стратегия 2 первого игрока является оптимальной, Покажем, что у второго игрока также имеется чистая оптимальная стратегия. Действительно, найдется прямая j, проходящая через точку (0, v) и имеющая угловой коэффициент j < 0. Выбирая чистую стратегию jb второй игрок не позволит первому выиграть больше, чем v, поскольку A(p, Д) = lj1 (pi) < v при всех pi G [0,1]. Итак, матрица игры имеет седловую точку (2, ji).
в) pi = 1.
В этом случае, аналогичном б), матрица игры также имеет седловую точку.
1 —2 3
2 4 1
Пример 5.2. Решим игру с матрицей A
Построив три прямые (рис, 5,2) li(pi) = (—1)pi + 2(1 — pi) = 2 — 3pi, l2(pi) = (—2)pi + 4(1 — pi) = 4 — 6pi,
1/5 — точке
ls(pi) = 3pi + 1(1 — pi) = 1 + 2pi, найдем, что максимум нижней огибающей достигается в pi пересечения прямых Си l3.

Значение игры v = li(p?) = 7/5 и p0 = (1/5, 4/5). Здесь j1 = 3, k3 =
2, j2 = 1, k1 = -3. Из уравнен ня 2q* + (—3)(1 — q*) = 0 находи м q* = 3/5. Отсюда q0 = (2/5, 0, 3/5) — оптимальная стратегия второго игрока. Сделайте проверку условия (*) теоремы 4.1' для найденного решения
(p0,q0,v).
Упражнение 5.3. Найдите все оптимальные стратегии игроков в игре с матрицей A
Теперь рассмотрим игру cm х 2-матрицей A. Смешанная стратегия q = (q1,1 — q1) второго игрока определяется величиной q1 е [0,1]. Значение игры, согласно следствию теоремы 4.2 ', представимо в виде
v = min max A(i, q) = min max [ai1q1 + ai2(1 — q1)].
qeQ 1 <i<m 0<q-i<11<i<m
Поэтому необходимо построить верхнюю огибающую max /i(q1) семей-
1<i<m
ства прямых li(q1) = ai1q1 + ai2(1 — q1), i = 1,..., m, и найти на отрезке [0,1] точку q° ее минимума. Она будет соответствовать оптимальной смешанной стратегии второго игрока. Оптимальная стратегия первого игрока строится с использованием уравнения, аналогичного (5.2).
III. Сведение решения матричной игры, к па,ре двойственных задач линейного программирования.
Сведение решения матричной игры к задачам линейного программирования — наиболее эффективный прием, позволяющий использовать алгоритм симплекс-метода.
Без потери общности будем предполагать, что значение матричной игры v положительно. Согласно следствию теоремы 4.2 ', оно представимо в виде
m
v = max min A(p,j) = max min piaij.
pEP 1 <j<n pEP 1 <j<n i=i
Введем вспомогательную переменную u и запишем задачу нахождения макеимина как задачу линейного программирования v = max u, где
(u,p)EB
B = {(u,p) | ?PiOij > u, j = 1,...,n, f>i =1, Pi > 0, i = 1,...,m}.
i= 1 i= 1
Действительно, при фиксированном p G P максимальное значение u при ограничениях (u,p) G B равно min A(p, j).
1<j<n
Поскольку v > 0, ^татать, что u принимает положительные
значения. Сделаем замену переменных zi = pi/u, z = (z1, ...,zm). Тогда, учитывая ограничения (u,p) G B, получим
m m
y^zj = 1/u, ^2,aij zi > l, j = 1,...,n, zi > 0, i = l,..., m.
i=1 i=1
Отсюда
v = max u
Ez:
i=1
(u,p)EB
где z0 — оптимальное решение задачи линейного программирования
|
m |
 |
|
i=1 |
m
^aijzi > 1, j = 1,..., n, zi > 0, i = 1,..., m. (I)
i= 1
По z0 находим значение игры и оптимальную смешанную стратегию пер-
m
вого игрока: v = 1^^ z0, p0 = vz0.
i= 1
Аналогично можно получить, что
v = min max A(i, q)
E
j=1
qeQ 1<i<m
где w0 — оптимальное решение задачи линейного программирования
wj
max
n
aij Wj < 1, i =l,...,m, Wj > 0, j = 1 ,...,n. (II)
j=i
Здесь q0 = vw0 — оптимальная смешанная стратегия второго игрока. Задачи (I) и (II) двойственны одна по отношению к другой.
Отметим свойство дополняющей нежееткоети для оптимальных решений z0 и w0 задач (I) и (II) :
П
1) z0 > 0 ^ aij wj = 1;
j=i
m
2) w° > 0 ^ ^ a»,-z0 = 1.
i=1
Оно непосредственно вытекает из утверждения теоремы 4,3 ' после замены переменных p0 = vz0, q0 = vw0.
4
-3
Пример 5.3. Решить игру с матрицей A
. Отметим, что
стратегия p = (1/2,1/2) обеспечивает первому игроку положительный выигрыш. Поэтому v > 0. Выпишем задачи линейного программирования
z1 + z2 ^ min
2z2 > 1, 3zi + z2 > 1, 4zi — 3z2 > 1, (I)
zi,z2 > 0;
wi + w2 + w3 ^ max
3w2 + 4w3 < 1, 2wi + w2 — 3w3 < 1, (II)
wi, w2,w3 > 0.
Используя графические построения на плоскости, нетрудно найти, что z0 = (5/8,1/2) — оптимадьное решение задачи (I). Отсюда
v = 1/(z0 + z0) = 8/9, p0 = vz0 = (5/9,4/9).
Найдем оптимальное решение w° задач и (II). Поскольку z0,z0 > 0 и 3z0 + z0 > 1, по свойству дополняющей нежееткоети
3w0 + 4w0 = 1, 2w0 + w0 — 3w0 = 1, w0 = 0.
Поэтому w0 = (7/8, 0,1/4), q0 = vw0 = (7/9, 0, 2/9).
IV, Необходимые условия для крайних оптимальных смешанных стратегий.
Здесь рассматривается комбинаторного типа алгоритм решения игры, основанный на переборе подматриц матрицы A
Определение. Пусть Z — выпуклое множество евклидова пространства, Точка z0 ? Z называется крайней точкой множества Z, сели не существует таких точек Z = z" ? Z и такого чиела 0 < Л < 1, что z0 = Л? + (1 — ЛД".
Другими словами, крайняя точка выпуклого множества Z не является внутренней точкой никакого отрезка, соединяющего две точки этого множества. Нетрудно видеть, что крайняя точка не может быть внутренней точкой множества Z, Однако не всякая граничная точка множества Z является крайней точкой этого множества. Например, у квадрата крайними точками являются только его вершины.
Упражнение 5.4- Пусть Z — выпуклый компакт евклидова пространства и z0 ?Argmax |z|2. Докажите, что z0 — крайняя точка множества
Z.
Упражнение 5.5. Пусть h(z) — линейная функция, определенная на выпуклом компакте Z евклидова пространства,. Докажите, что h(z) достигает максимума в некоторой крайней точке множества Z.
Если множество Z — многогранник, то его крайние точки называются вершинами. Вернемся к игре с матрицей A и рассмотрим множество оптимальных смешанных стратегий первого игрока
m
р0 = {p0 ? Р 1 Еp0«ij > j = 1,..., ,
І= 1
где v — значение матричной игры. Нетрудно видеть, что Р0 — многогранник евклидова пространства.
Определение. Крайней оптимальной смешанной стратегией первого игрока будем называть вершину многогранника Р0.
Множество оптимальных смешанных стратегий второго игрока
П
q0 = {q0 Е Q \ Е aijqj < v, i =1, ...,m}
j=i
также является многогранником и его вершины — крайние оптимальные смешанные стратегии.
|
Теорема 5.2. Пусть в игре с матрицей A = (aij)mxn значение v = 0. Тогда для любой пары p°,q° крайних оптимальных смешанных етрате- |
|
гий игроков матрицы А, |
найдется такая невырожденная подматрица А = что выполнены условия |
(aijjt )kxk |
|
|
k
XX aijt = V, * = Е'
1=i |
..,k, |
tpi = i,
1=i |
(5.3) |
|
|
k
Xa^qj = v, l = 1,.‘
t=i |
..,k, |
k
t j = i-
t=i |
(5.4) |
|
Доказателъство. Определим следующие множества чистых стратегий игроков:
П
ii = {i \ pl > °} І2 = {i \ Е aijqj = v},
j=i
m
Ji = {j \ qj > 0}, J2 = {j \ Epjaij = v}.
i=1
Из свойства дополняющей нежесткости (теорема 4,3 ') следует, что І1 С І2, J1 С J2. Без потери общности будем считать, что
Іі = {1,...,r}, І2 = {1,...,d}, Ji = {1,...,s}, J2 = {1,...,h},
где r < d и s < h. Этого всегда можно добиться подходящей перестановкой строк и столбцов матрицы A.
Рассмотрим подматрицу А = (aij)dxh матрицы A. Докажем, что первые r строк матрицы А линейно независимы. Предположим противное. Тогда найдутся такие числа ai, i = 1,..., r, не все равные нулю, что
r
t a
i=i |
aij = 0, j = 1,...,h. |
(5.5) |
|
Покажем, что при этом |
r |
|
|
|
= 0.
i=i |
(5.6) |
Действительно, из (5,5) и из определения множества І2 следует, что
hr r h r
о = j )q° = an qj) = v^2ai.
j=1 i= 1 i= 1 j=1 i=1
Поскольку v = 0, отсюда следует (5,6), Чтобы придти к противоречию, рассмотрим ненулевой вектор a = (a1,...,ar, 0,..., 0) G Em и пр и е = 0 определим вектор p? = р° + еа. Из (5,6) следует, что сумма компонент вектора р? равна единице и при доетаточно малом е эти компоненты можно сделать неотрицательными. Таким образом, при малом е вектор р? является смешанной стратегией первого игрока. Покажем, что при достаточно малом е стратегия р? оптимальна. Действительно, используя
(5,5) и определение множества J2, при малом е получим
= О j=l,--,h, > v, j > h.
mm r
A(p?,j) = ^2 p?aij = ^2 p°iaij+е^2 aiaij i= 1 i= 1 i= 1
Следовательно, смешанная стратегия р? ^^и малых е оптимальна. Наконец, р0 = (р? + р-?)/2, что противоречит определению стратегии р0.
Аналогично доказывается, что первые s столбцов матрицы A линейно независимы. Обозначим через fc ранг матрицы А. Из доказанного вытекает, что k > max[r, s]. Без потери общности можно считать базисными первые k строк и первые k столбцов матрицы А. На их пересечении стоит невырожденная подматрица А = (aij)кхк. Для этой подматрицы справедливы равенства
к
S р0
i=1
1,
^р0aij = v, j = l,...,k,
i=1
которые представляют собой системы (5,3) и (5,4), если вернуться к исходной нумерации строк и столбцов, ¦
Упражнение 5.6. Докажите, что условия (5,3) и (5,4) достаточны для того, чтобы оптимальные смешанные стратегии р0 и q0 были крайними оптимальными.
Покажем, что система к + 1 линейных уравнений (5,3) относительно к + 1 неизвестных р0 , l = 1,..., к, v либо не имеет решения, либо имеет единственное решение. Действительно, расширенная матрица системы (5,3) имеет вид
|
^ailjl ¦ |
¦ aik jl 1 |
0\ |
|
|
¦ ¦¦¦ —1 |
0 |
|
ail jk ¦ |
¦ aik jk — 1 |
0 |
|
V 1 ¦ |
¦ 1 0 |
V |
Нетрудно видеть, что ее ранг равен к + 1. Если система (5,3) имеет решение, то по теореме Кренекера-Капелли ранг матрицы системы также равен к + 1 и он а — невырожденная. Отсюда следует единственность решения системы (5,3),
Выпишем в последнем случае решения систем (5,3) и (5,4) в явном виде. Для этого введем векторы
Р = (Р° , 1 = 1,...,k), q = (4, t = l,...,k), е = (1,..? 1) е Ек и запишем систему (5,3) в матричных обозначениях
pA = ve, (р, е) = 1.
Умножая первое равенство справа на матрицу (A)-1, выразим вектор р через v : р = ve(A)-1. Подставляя это выражение в уравнение (р, е) = 1, получим
e(A)-1 = 1
4e(A)-1 ,еЗ , v = 4e(A)-1,e3 .
Аналогично из системы (5,4) находится
4A)-1e .
4(A)-1 е,е)'
Упражнение 5.7. Приведите пример 2 х ^^^^^ицы A, для которой система (5,3) не имеет решения.
Рассмотрим теперь алгоритм решения матричной игры. Перебираем все невырожденные к х к-подматрицы A матрицы A, начиная с к = 2.
Для каждой подматрицы A решаем системы уравнений (5,3) и (5,4), Если решения не существует или некоторые компоненты
Pj, I = l,...,k, q0jt, t = 1,...,к
отрицательны, то переходим к следующей подматрице A. Пусть указанные компоненты решений неотрицательны. Тогда определим смешанные стратегии
qj t, j = fa
0, j = jt.
Ріі, 0,
* — *і, о
. , . q
* = *і;
Р°і
Теперь для тройки (pj, qj, v) необходимо проверить условие (*) теоремы 4,1'. Если оно выполнено, то искомое решение (p0,qj,v) найдено, В противном случае переходим к следующей подматрице A.
Пример 5.4- Рассмотрим матрицу вида
Здесь нет слабо доминируемых строк (даже никакими выпуклыми комбинациями — докажите!) и слабо доминирующих столбцов , Если применить указанный выше алгоритм, то подматрица
a11 a15 a41 a45
даст решение в смешанных стратегиях
р0 = (1/2, 0, 0,1/2), q0 = (1/2, 0, 0, 0,1/2), v = 1/2.
V, Метод Брауна.
В этом параграфе мы рассмотрим итерационный метод приближенного решения игры с матрицей A Пусть задано число е > 0. Требуется найти значение игры с точностью до величины е, а также е-макеиминную и е-минимакеную смешанные стратегии игроков.
Метод Брауна состоит в многократном фиктивном разыгрывании матричной игры, при котором игроки по определенным правилам выбирают свои чистые стратегии. Пусть за к повторений игры первый игрок r раз выбрал стратегию i, i = 1,..., m, а второй j раз выбрал стратегию j, j = 1 ,...,n. Векторы частот выбора чистых стратегий
I ri rm
p(k>=i -
являются смешанными стратегиями игроков.
Определим итерационный процесс Брауна,
Шаг 1. Игроки выбирают произвольно стратегии А и j1.
Пусть за k повторений игры первый игрок выбрал стратегии i1, ...,ik, а второй — стратегии j1,...,jk. При этом p(k) и q(k) — соответствующие векторы частот.
Шаг к + 1. Игроки выбирают стратегии ik+1 и jk+1 из условий A(ik+i,q(k)) = max A(i,q(k)) = V1 (к),
1<г<ш
A(P(k), jk+1) = min A(p(k^j) = v2(k).
1<j<n
Каждый игрок выбирает свою чистую стратегию как наилучший ответ на соответствующий вектор частот партнера. Если наилучших ответов несколько, то выбирается любой из них.
Покажем, что v^k) и v2 (k) — оценки для значения v матричной игры:
v2(k) < v < v1(k), k = 1,2,.... (5.7)
Действительно, используя следствие теоремы 4,2 ', получим
v2(k) = min A(p(k), j) < max min A(p, j) = v =
1<j<n pGP 1<j<n
= min max A(i,q) < max A(i,q(k)) = v1 (k).
1<i<^ 1 <i<m
Для доказательства сходимости последовательностей {v1 (k)}, {v2(k)} к значению игры v нам потребуется обобщенный итерационный процесс. Пусть c(0) ? Em, d(0) ? En — два вектора, удовлетворяющие условию max сг(0) = min dj(0). Возьмем
1<i<m 1<j<n
i1 ? Arg max сг (0), j1 ? Arg min dj (0).
1<i<m 1<j<n
Пусть определены стратегии i1, ...,ik, jі,..., jk и векторы c(0), c(1),..., c(k), d(0),d(1),...,d(k). Возьмем
ik+1 e Arg max Ci(k), jk+і e Arg min dj(k)
1<i<m 1 <j<n
и положим для всех i = 1 ,...,m,j = 1 ,...,n
Ci(k + 1) = Ci(k) + aijk, dj(k + 1) = dj(k) + aikj.
Таким образом, вектор c(k + 1) есть сумма век тора c(0) и столбцов матрицы А с номерами j1,...,jk. Аналогично, вектор d(k + 1) есть сумма вектора d(0) и строк матрицы А с номерами i1,...,ik. Нетрудно видеть, что
k П
Ci(k) = Ci(0) + ^2 aijt = Ci(0) + ^2 aijlj = Ci(0) + kA(i,q(k)), t=1 j=1
dj(k) = dj(0) + kA(P(k),j).
При нулевых векторах c(0) и d(0) построенный итерационный процесс
совпадает с процессом Брауна, Поскольку множества
Arg max Ci(k) и Arg min dj (k) могут содержать более одного элемента,
1<i<m 1<j<n
последовательности {C(k)}, {d(k)} определяются в ходе итерационного процесса не однозначно.
Определим, как и ранее, последовательности величин
Ci(k)
k
dj (k) k
V2 (k)
V1(k)
1,2,....
min
1<j<n
max
1<i<m
Далее будет доказана их сходимость к значению игры v для любых векторов c(0), d(0).
Из неравенств (см, доказательство неравенства (5,7))
max A(i,q(k)) > v > min A(p(k),j), k = 1, 2,...,
1<i<m 1<j<n
следует, что
Ci (0)
k
lim v1(k)
+ A(i,q(k))
lim max
k^x 1<i<m
> v>
Отсюда
-— dj(0) . , .
> lim min + A(p(k),j)
k—^ 1 <з<п k
lim v2(k).
к—— TO
V2(k)) > 0. V2(k)) < 0.
(5.8)
(5.9)
lim (v1(k) -
к—то
Покажем, что
lim (v1(k) -
к—то
Будем использовать обозначение
A(k) = max d(k) — min dj(k).
1<i<m 1<j<n
С помощью него условие max q(0) = min dj(0) можно записать в виде
1 <i<m 1<j<n
A(0) = 0.
Определение. Будем говорить, что г-ая строка (j-й столбец) матрицы A существенна (существенен) на отрезке шагов [s,s + t], если для некоторого шага t' Е [s, s + t] if = г (jf = j).
Лемма 5.1. Пусть все строки и столбцы матрицы A существенны на отрезке шагов [s, s + t]. Тогда
max ci(s + t) — min dj(s + t) < 4at, (5.10)
1<i<m 1<j<n j
где a = max max |aij|.
1<i<m 1 <j<n
Доказательство. Покажем сначала, что в условиях леммы справедливы неравенства
|
max ci(s + t) — |
min ci(s + t) < 2at, |
(5.11) |
|
1<i<m |
1<i<m |
|
max dj (s + t) —
1<j<n |
min dj (s + t) < 2at.
1<j<n |
(5.12) |
Докажем (5,11), Пусть для 1-ой строки выполнено равенство min ci(s +1) = q(s +1). Из условия леммы вытекает, что найдется такой
1<i<m
номер шага t' Е [s, s + t], что max ci(t') = q(t'). Тогда
1<i<m
max ci(s + t) — min ci(s + t) =
1<i<m 1<i<m
= max Ci(s + t) — max c(t') + q(t') — cAs + t) <
1 <i<m 1<i<m
< max (ci(s + t) — Ci(t')) + c(t') — c(s + t) < 2at,
1<i<m
поскольку все последние разности на превосходят at. Неравенство (5,12) доказывается аналогично. Покажем также, что справедливо неравенство
min ci(s + t) — max dj(s + t) < 0. (5.13)
1<i<m 1 <j<n
Пусть vT
значение игры с матрицей AT , транспонированной к A. Тогда
min A(i, q(s + t)) < max min A(i, q) = vT =
1<i<m qeQ 1<i<m
= min max A(p, j) < max A(p(s + t),j)
p?P 1<j<n 1<j<n
Отсюда
< max Ci(0) + min A(i, q(s +1)) <
1<i<m s + t 1<i<m
Ci (0) s +1
+ A(i,q(s +t))
min
1<i<m
dj(0)
s +1
+ A(p(s + t),j))
dj(0) . . . ..
< min--+ max A(p(s + t),jmax
1<j<n s +1 1<j<^ 1<j<n
Домножая это неравенство на s + t, выводим (5,13), Неравенство (5,10) получается сложением неравенств (5,11)— (5,13), ¦
Лемма 5.2. Для произвольной матрицы A и произвольного е > 0 найдется такой номер шага fco, что для любых последовательностей c(k), d(k), k = 0,1,... итерационного процеееа A(k) < ek щэи k > k0.
Доказательство. Утверждение леммы верно для 1 х ^^^^^риц A, поскольку тогда c(k) = d(k) для всех k > 1. Примем, что лемма верна для всех подматриц матрицы A и докажем, что она верна и для A. Выберем k1 таким образом, чтобы для любых последовательностей c1(k),d1(k), k = 0,1,... итерационного процесса, соответствующего подматрице A1 = (aij)ie/jeJ, полученной из A вычеркиванием строки или столбца, было выполнено неравенство
A1 (k) = max c1 (k) ie/
min d1 (k) < -ek, k > k
1.
jeJ
Докажем, что если для матрицы A некоторая строка (столбец) несущественна (несущественен) на отрезке [s,s + k\], то справедливо неравенство
A(s + ki) < A(s) + -ek\. (5.14)
Предположим, например, что подматрица A1 получается вычеркиванием из A несущественной /-й строки. Положим I = {1, ...,m}\{/},
d1(0) = dj(s) + A(s), j = 1,...,n, с1(0) = Ci(s), i Е I.
Поскольку /-ая строка матрицы A несуществен на, A1(0) = 0 и в итерационном процессе можно взять i\ = is+k, j\ = js+k, k = 1,..., k1. Следовательно, d1(k) = dj(s + k) + A(s), j = 1,...,n, c1 (k) = (c.i(s + k),i Е I), k =
1,..., k1. Итерационный процесс для матрицы A1 можно продолжать и при k > k1.
На основании выбора k1 A1(k1) < 2ek1. Поэтому
A(s + k1) = A1(k1) + A(s) < A(s) + -ek1 и неравенство (5,14) доказано.
Мы можем теперь показать, что для любых последовательностей c(k), d(k), k = 0,1,..., итерационного процесса A(k) < ek при k > 8ak1/e.
Рассмотрим целое k > k1 и представим его в виде k = (? + t)k1, где 0 < ? < 1, а t > 0 — целое (?^ — остаток от деления k на ki).
Случай 1. Найдется такое целое положительное число h < t, что все строки и столбцы матрицы A на отрезке [(? + h — 1)k1, (? + h)k1] существенны, Беря наибольшее из таких h, имеем
A(k) < A((? + h)k1) + -e(t — h)k1. (5.15)
Это неравенство получено повторным применением неравенства (5,14), поскольку на каждом из отрезков
[(? + r — 1)k1, (? + r)k1], r = h + 1, ...,t,
некоторая строка или столбец матрицы A несущественны.
Из леммы 5,1 на основании выбора h имеем
A(^ + h)k1) < 4ak1. (5.16)
Из (5,15) и (5,16) получаем
A(k) < 4ak\ + -e(t — h)k\ < (4a + -?t)k\.
Случай 2. В каждом отрезке [(? + h — l)ki, (? + h)ki], h = l,...,t, некоторая строка или столбец несущественны. Следовательно, как и при выводе (5,15),
A(k) < A(?k1) + -?tk1 < (2а? + -?t)k1.
В обоих случаях, используя неравенство tk1 < k, получим A(k) < (4а + 1 ?t)k1 < 4ak1 + 2?k < ?k при k > 8ak1/?. ¦
Из леммы 5,2 вытекает неравенство (5,9) и сходимость последовательностей v1(k), v2(k), k = 0, l,..., к значению игры v.
Вернемся к методу Брауна, Сформулируем правило остановки. Пусть задано число ? > 0. Будем останавливаться на шаге k0, когда впервые выполнено неравенство
V1(ko) — V2(ko) < ?. (5.17)
Из (5,7) и (5,17) следует, что величины v1 (k0),v2(k0) приближают значение v матричной игры с точностью до ?. Покажем, что p(k0) — ?-максиминная стратегия первого игрока. Действительно,
min A(p(k0),j) = v2(k0) > v — ?.
1<j<n
Аналогично, q(k0) —
?-минимаксная стратегия второго игрока.
Теорема 5.3. В методе Брауна lim v1(k) = lim v2(k) = v, а любые
предельные точки p0, q0 ^^^^^^^ад?ельностей {p(k)}, {q(k)} являются оптимальными смешанными стратегиями игроков.
Доказательство. Сходимость последовательностей {v^k)} и {v2(k)} к значению игры v го леммы 5,2, Пусть р0 — любая предель
ная точка последовательности {p(k)}^ ^^^жм, что р0 — оптимальная смешанная стратегия первого игрока. Действительно, поскольку последовательность {p(k)} принадлежит ком пакту P, без потери общности (выделяя соответствующую подпоследовательность) можно считать, что она сходится к р0. Тогда
min A(p(k),j) > v — ?k, k = 1, 2,...,
1<j<m
где ?к ^ 0 + . Переходя в этих неравенствах к пределу при к ^ <х>, получим неравенство min A(p0,j) > v, что означает оптимальность етра-
1<j<m
тегии р0 , Аналогично доказывается оптимальность для второго игрока любой предельной точки q0 последовательности {д(к)}. ¦
Оценим скорость сходимости последовательностей {vi(k)} и {v2(k)} к значению игры v.
Пусть A1, l > 0 — подматрица, полученная из матрицы A вычеркиванием каких-либо l строк или столбцов, a {v1 (к)}, {v2(к)} — последовательности обобщенного итерационного процесса, соответствующего подматрице A1 .Обозначим через кг число повторений игры, при котором для любой подматрицы A1 и любых начальных векторов cl(0),dl(0) выполнено неравенство v1 (к) — vl2 (к) < 2-1 ? ?к > кг. Просматривая доказательстволеммы 5,2, замечаем, что кт+п-1 = Іи к0 > 8 ак1?-1. Аналогичным неравенством связаны кг и кг+1 : кг > 218акі+1?-1, l = 0, І, ...,m + n — 2. Отсюда
ко > 8ак1 >
?
/ \ 2 / \ 3
2к2 >
2 • 22к3 > ...
m+n-1
m+n-1
(m+n-2)(m+n-1)
2 2
21+2+...+m+n-2 к 2 кт+п-1
Таким образом, при любом к > к0 выполнены неравенства
1
m + n-1
, , . def m + n-2
v2(k) < ? = 2 2 8a
v^)
Итак, полученная оценка скорости сходимость процесса Брауна малоэффективна при больших размерах матрицы A. Практически наблюдаемая скорость сходимости существенно выше,
В заключение рассмотрим модификацию правила остановки по методу Брауна, Положим
vl(r) = min v1(t), v2i(r) = max v2(t), к = І, 2,...
1<t<k 1 <t<k
Из неравенств (5,7) следует, что
v^) < v < vKE), к = І, 2,.... (5.І8)
Таким образом, v^(k),v^(k) — наилучшие оценки снизу и сверху для значения игры v за k ее повторений. При заданном е > 0 будем останавливать процесс на шаге k0, когда впервые выполнено неравенство v1*(k0) — v2(k0) < е. При этом величины v\(k0),v2(k0) приближают значение игры v с точностью до е. Пусть v^(k0) = v1(t1), v\(k0) = v2(t2). Покажем, что p(t2) — е-максиминная стратегия первого игрока. Действительно, используя неравенство (5.18) при k = k0, получим
min A(p(t2),j) = v2(t2) = v2*(k0) > v — e.
1<j<n
Аналогично, q(t1) — е-минимаксная стратегия второго игрока.
Пример 5.5. Пусть е = 1 /5, а матрица игры —
/ 210 I
A = I 2 0 3 I .
?-і 3 -з
Отметим, что решение игры в смешанных стратегиях имеет вид
p0 = q° = (0, 2/3,1/3), v =1.
Применяя метод Брауна, найдем приближенное значение игры, а также е-макеиминную и е-минимакеную смешанные стратегии игроков. Вычисления удобно производить в форме таблицы. В каждой ее k-ой строке подчеркнуты наибольшие значения величин Ci(k), i = 1, 2, 3 и наименьшие значения величин dj (k), j = 1,2, 3.
|
Табл. 5.1 |
|
k |
ik |
Ci(-) |
C20 |
cs(^) |
vi(^) |
jk |
diO |
d2() |
d3() |
v20 |
|
1 |
1 |
2 |
2 |
-1 |
2 |
1 |
2 |
1 |
0 |
0 |
|
2 |
1 |
2 |
5 |
-4 |
5/2 |
3 |
4 |
2 |
0 |
0 |
|
3 |
2 |
2 |
8 |
-7 |
8/3 |
3 |
6 |
2 |
3 |
2/3 |
|
4 |
2 |
3 |
8 |
-4 |
2 |
2 |
8 |
2 |
6 |
1/2 |
|
5 |
2 |
4 |
8 |
-1 |
8/5 |
2 |
10 |
2 |
9 |
2/5 |
|
6 |
2 |
5 |
8 |
2 |
4/3 |
2 |
12 |
2 |
12 |
1/3 |
|
7 |
2 |
6 |
8 |
5 |
8/7 |
2 |
14 |
2 |
15 |
2/7 |
|
8 |
2 |
7 |
8 |
8 |
1 |
2 |
16 |
2 |
18 |
1/4 |
|
9 |
3 |
8 |
8 |
11 |
11/9 |
2 |
15 |
5 |
15 |
5/9 |
|
10 |
3 |
9 |
8 |
14 |
7/5 |
2 |
14 |
8 |
12 |
4/5 |
|
vi*(10) = 1, ^(10) = 4/5, Г = 8, І2 = 10, p(10) = (1/5, 3/5,1/5), q(8) = (1/8, 5/8,1/4).
Упражнение 5.8. Проверить 1/5-оптимальность полученных стратегий, Сделать еще 8 шагов по алгоритму и улучшить точность до е = 1/18.
§ 6. Игры с вогнутой функцией выигрыша
Определение. Антагонистическая игра Г = (X,Y,F(х, у)) называется игрой с вогнутой функцией выигрыша, если X С Em, Y С Еп — выпуклые компакты евклидовых пространств, функция F(x,y) непрерывна на X х Y и при любом у 6 Y она вогнута по х.
Игра Г называется игрой с выпуклой функцией выигрыша, сели (вместо требования вогнутости) при любом х 6 X функция F(х,у) выпукла по у.
Теорема 6.1 (Хелли). В евклидовом пространстве Еm имеется семейство Da, а 6 {а} выпуклых компактов, обладающее следующим
m+1
свойством: для любых а1, ...,ат+1 Р| Da. = 0, Тогда
j=i
П Da = 0,
аб{а}
Доказательство теоремы см, в Приложении 112.
Упражнение 6.1. Докажите теорему при m =1.
Теорема 6.2. Для игры Г с вогнутой функцией выигрыша справедливо равенство
v = maxmin F (х,у)= min max min F (x,yj). xex yeY yj?y xex i<j<m+i
j = 1,...,m+1
Доказательство. Обозначим последнюю величину через w. Для любых у1, ...,ут+1 6 Y справедливо неравенство
max min F(х,у7) > max min F(х,у) = v. xex 1<j<m+1 xex yeY
Следовательно, w > v. Докажем неравенство w < v. По определению w для любых у1, ...,ут+1 6 Y
max min F(х,у7) > w ^ xex 1<j<m+1
^3 x Е X : F(x,yj) > w, j = 1 ,...,m + 1.
Введем множества Dy = {x Е X | F(x,y) > w}, y Е Y, представляющие собой выпуклые компакты в Em. Из последних неравенств вытекает, что
m+1
П Dyj = 0 при любых y1, ..,ym+1 Е Y. Следовательно, выполнены усло-3 = 1
вия теоремы 6,1 и П Dy = 0 т-е-yeY
3 x Е Р) Dy ^ F(x, y) > w V y Е Y ^ min F(x, y) > w.
yeY y€Y
Отсюда v > w ^ v = w. ¦
m+1
Положим Q = {q Е Em+1 | Qj = 1, Qj > 0, j = 1, ...,m + 1}.
3 = 1
Теорема 6.3. Игра Г с вогнутой функцией выигрыша имеет решение в смешанных стратегиях вида (x0, +, v), где x0 — макеиминная стратегия первого игрока,
m+1
00 = ^ qjhj, q0 = (q0, ..., qm+1) Е Q,
j=1
(y3,j = 1,...,m + 1) Е Arg min max min F(x,yj),
3 yj eY xeX 1<j<m+1
j = 1,...,m + 1
a q0 — минимаксная стратегия в задаче
m+1
minmaxФ(x, q), Ф+, q) = > F(x,yj)qj. qeQ xex —/
j=1
Доказательство. По теореме 6,2 и по выбору
Уз ,j = 1,...,m +1, v = w = max min F (x,yj).
J xeX 1<3<m+1
Функция Ф + q) непрерывна, линей на no q и вогнута по x. Следовательно, по теореме 2,3 она имеет седловую точку. Поэтому
v = max min F (x,yj) = maxmin Ф+ q) =
xex 1<j<m+1 xex qeQ
= min max Ф(x, q) = max Ф(x, q0) = qeQ xex xex
m+1
= max V F(x,yj)q° xex ^J j=i
max F (x, ф°). xex
F (x,y)d^0(y)
max
xex
Отсюда следуют равенства
max F (x, -0°) = v = min F (x0, y)
xeX yeY
и по теореме 4,1 тройка (x°,0°,v) — решение игры в смешанных стратегиях, ¦
Замечание. В доказательствах теорем 5,2 и 5,3 выпуклость множества Y те использовалась. Y можно было считать компактом метрического пространства.
Аналогично доказывается следующее утверждение,
n+1
Положим P = {p Е En+1 | ^ pi = 1, pi > 0, i = 1, ...,n + 1}.
i=1
Теорема 5.4. Игра Г с выпуклой функцией выигрыша имеет решение в смешанных стратегиях вида (г°, y°, v), где y° — минимаксная стратегия первого игрока,
n+1
^ i = 1,...,n + 1) Е P,
P°Ixi, Р°
i=1
(xi, i =1,...,n + 1) Е Arg max min max F(xi,y),
yeY 1<i<n+1
i=1,...,n + 1
a p° — максиминная стратегия в задаче
n+1
max min Ф1^, y), peP yeY
ф1(p,y) = ^ piF (xi,y).
i= 1
F(x,y) = 1 — (x — y)2 — игра c
4, x° = 1, 0° = q°/yi + q°/y2,
0 < y1 < y2 < 1.
Пример 6.1. Пусть X = Y = [0,1], вогнутой функцией выигрыша. Здесь
v = v = max min [1 — (x — y)2] = °<x<1°<y<1
q° + 1 q°,q° > 0,
Найдем величину
w = min max min[F(x,yO,F(x,y2)]
0<y1<y2 <10<X<1 v y ' v y n
При фиксированных y^y2
y1 — y2
2
max min[1 — (x — y1)2,1 — (x — y2)2] = 1
0<x<1
Отсюда
y1 — y2\ = 3 2 4,
y1 = 0, y2
1.
w = min 1
0<y! <y2<1
Найдем теперь q0,q0, решая задачу
min max $(x,o) = min max[(1 — x2)q1 + (1 — (x — 1)2)q2].
0<qi<1 0<Ж<1 0<qi <10<x<1
Имеем ФХ(х, q) = —2xq1 — 2(x — 1)q2 = 0. Отсюда стратегия x = q2 максимизирует функцию Ф(x, q) то перемен ной x. Следовательно,
max Ф(х, q) = 1 — q1 (1 — q^ — q0° = q°°
0<ж<1
Отметим, что полученное решение игры можно было предугадать и проверить лишь условие (*).
Упражнение 6.2. Решите игру е вогнутой функцией выигрыша
X = {(x1,x2) | 0 < Хі < 1, i = 1, 2}, Y = X, F (х1,Х2,У1,У2) = 1 — (x1 — y1)2 — (x2 — y2)2.
Широкий класс игр е выпуклыми функциями выигрыша образуют статистические игры. Дадим необходимые определения.
Статистик наблюдает реализации zi независимых, одинаково распределенных случайных величин Zi, i = 1,..., n, имеющих плотность распределения g(zi|x), зависящую от вектора неизвестных параметров x ? X. Здесь X — выпуклое множество евклидова, пространства. Пусть Z =
(Zi,..., Zn) — векторная случайная величина, принимающая значения
П
z = (z1,..., zn) E Z и имеющая плотность распределения g(z\x) = П g(zi\x).
i= 1
Статистик оценивает вектор x, жпшъзуя решающую функцию у :
Z ^ A = X. Величина а = y(z) называется оценкой вектора x из множества оценок A. Ошибка в определении вектора x задается с помощью функции потерь L(x,a). Математическое ожидание этой функции
F(x,y)d=E[L(x,y(Z))] = J L(x,y(z))g(z\x)dz
Z
называется функцией риска.
Статистик (второй игрок) использует решающее правило (стратегию) у го некоторого множества Y и стремится минимизировать функцию риска. Природа (первый игрок) стремится ее максимизировать, выбирая x E X. Построенная антагонистическая игра Г = ^X, Y, F(x,y)) называется статистической.
Пусть оцениваемый вектор является случайной величиной X, принимающей значения x E X и имеющей плотность распределения f. С игровой точки зрения это означает, что природа использует смешанные стратегии f E {f}.
Обычно используется следующий метод решения статистической игры, Сначала строится уравнивающая риск решающая функция статистика у0 : F(x,y0) = const на X. Затем подбирается стратегия природы — плотность распределения f0, относительно которой решающая функция у0 является байесовской, т.е. минимизирующей функцию риска:
F(f0, у0) = min F(f0, у). Тогда в соответствии с результатом упражнения уеУ
4,3 f0,у0 — оптимальные стратегии природы и статистика. Плотность распределения f0 называется априорной.
Покажем, что для плотности распределения f0 при квадратичной функции потерь L(x,a) = \x — а\2 байесовская решающая функция у0 определяется однозначно. Определим апостериорную плотность распределения f0(x\z) = g(z\x)f0(x)/p(z), где
p(z) = J g(z\x)f0(x)dx.
X
Утверждение 6.1. Пусть у0 — байесовская решающая функция относительно плотности распределения f0. Тогда при квадратичной функции
потерь
y0(z) = E[X.lz]=J xf0(x\z)dx V z G Z. (6.1)
Доказательство. Поскольку множество X выпукло, можно показать, что y0 (z) g A = X V z g Z. Для произвольной решающей функции y g Y
F(f 0,y) = J J L(x,y(z))g(z\x)dzf0(x)dx =
X Z
= J [J \x — y(z)\ f (x\z)dx]p(z)dz.
Z X
При фиксированном z G Z внутренний интеграл является квадратичной функцией от а = y(z). Поэтому его минимум достигается при а° = y0(z) из (6.1). ¦
В дальнейшем будем считать, что функция распределения д каждой случайной величины Zi зависит только от одного неизвестного параметра — математического ожидания x. Дисперсию случайной величины Zj обозначим через D(x). Для математического ожидания часто иепользу-
П
етея несмещенная оценка z = ^ zj/n. Свойство несмещенности означает,
i= 1
ЧТО
_ E Е Zj
E Z = j=: = x.
n
Поэтому естественно рассмотреть множество решающих правил вида
Y = {y \ y(z) = c{z + С2, Cl, C2 > 0}.
Функцию потерь будем предполагать квадратичной:
L(x, а) = (x — а)2. Положим c = (c1,c2). Тогда функция риска
ЧЧ/ \def
_2
F(x, c) = F(x, y) = E(x — c1Z — c2)2 = c2EZ + 2c1(c2 — x)EZ + (x — c2)2 =
^ „2D(x) + (C1.r — x + c2)2
n
:1 ( Dnx) + x2 I + 2c1 (c2 — x)x + (x — c2)2 = c
выпукла no c.
Рассмотрим конкретные примеры статистических игр.
Пример 6.2. Пусть случайные величины Zi имеют биномиальное распределение:
1,
0;
[0,1].
x, zj
1 — x, zi x), x E X
g(zi|x) = D(x) = x(1
n
'Yllzi = nz. Тогда
i= 1
g(z|x)
Положим к =
F(x, c) -
xk (1 — x)n-k,
2c1x2 + 2c1c2x + x2
2 1 x(1-x) . 2
cl I Д 1 + x
2c2 x + c2 =
П n 1 c2 — 2c1 + 1 j x2 + ( c1 + 2c1c2 — 2oA x + c2
Найдем выравнивающую решающую функцию y0(z) = c°z+c°. Для этого решим систему уравнений
„2
0 (6.2)
|
П c2 2c1 + 1 = |
0, + 2c1c2 — 2c |
|
n |
n |
|
и получим |
|
|
0 Vе |
0 1 |
|
1 vn +1, |
2 = 2(Vn +1). |
|
Второе решение |
|
|
Vn |
1 |
|
c1 = vn— 1: |
1 c2 =2(Vn— 1) |
|
отбросим. |
|
|
|
Рассмотрим на отрезке X = [0,1] бета-распределение с плотностью |
f °(x)
xp-1(1 — x)q—1
В (p,q)
где В(p, q) = f x1 1(1 — x1)q-1dx1 — бета-функция, а параметры p и q 0
положительны. Интегрируя по частям, нетрудно вывести, что
xf 0 (x)dx
Покажем, что при подходящем выборе параметров p и q решающая функция у0 является байесовской относительно бета-раепределения f0. Найдем
і
p(z) = g(z\x)f0(x)dx =
xk (1 - x)n-kxp-1(1 - x)q—1
B(k + p, n + q — k) В (p,q)
-dx
B{p, q)
Отсюда условная плотность
xk+p-1(l — x)n-k+q-1
В(k + p, n + q — k)
g(z\x)f 0(x)
p(z)
f 0(x\z)
задает бета-распределение с параметрами p* = k + p и q* = n + q — k. Байесовская решающая функция
k + p nz + p
n + p + q n + p + q
p*
p* + q*
E [X\z] = xf0(x\z )dx
совпадает с выравнивающей функцией у0 при p = q = ^.
Итак, доказано, что для оценки параметра биномиального распределения
\fnz + 0.5
л/n + 1
y0(z)
— минимаксная решающая функция.
Интересно сравнить значения функции риска при минимаксной у0 и классической z решающих функциях. Имеем
x(1 — x) n
1
4(1 + /n)2 ,
F (x,y0) = v
F(x, z)
Неравенство F(x,y0) < F(x,z) выполнено лишь при
de/yTT2/n 2(1 + /n)
Если n велико, то минимаксная оценка лучше классической лишь при значениях x, принадлежащих малой ?-окреетноети точки 1/2, Однако, при малых n интервал значений x, где минимаксная оценка лучше, значительно увеличивается.
Во многих задачах не существует выравнивающей решающей функции и указанный выше метод решения етатиетичеекой игры использовать нельзя, В таких случаях минимаксную стратегию статистика у0 можно найти, решая непосредственно задачу
v = min max F(x,y) = max F(x,y0).
y€Y x€X x€X
Пример 6.3. Страховая компания осуществляет страхование гражданской ответственности автомобилистов. Водители обычно разбиваются на группы по нескольким признакам (профессия, стаж вождения и т,п,). Рассмотрим некоторую группу, состоящую из n водителей. Требуется оценить среднее число х дорожных происшествий в расчете на одного водителя, которые произойдут в течение ближайшего года, исходя из информации о происшествиях прошедшего года. Задачу можно свести к решению статистической игры.
Пусть число дорожных происшествий с водителем i является случайной величиной Zі, распределенной по закону Пуассона
xzi e x
g(Zi\x) =-—, z E Z = {0, ф 2,..., }.
Zi!
Здесь EZi = x, VarZi = D(x) = x, x E X = [0,x*], где x* — верхняя грань возможных значений параметра x. Имеем
F(x, c) = clD(x) + (c?x — x + c2)2 = c?X + (c?x — x + c2)2. n n
Нетрудно проверить, что не существует выравнивающей решающей функции.
Обозначим M(c) = sup F(x,c) и найдем
0<x<x+
v = min M(c) = M(c0).
Cp,C2>0
Поскольку F(x, c) выпукла no x, M(c) = max[F(0, c), F(x*, c)].
Утверждение 6.2. Для минимаксной стратегии y0(z) = c°0Z + c0 выполнено условие F(0,c0) = F(x*,c0) или
c0 = n' c2 =
n (ci )2 + (c0 — 1)2x*
2(1 — c?)
Доказательство. Допустим, что F(x*, c0) > F(0,c0). Если cl > 0, то
+ (c0°_x* + c2 — x*) > F(x*,c1 — ?,c0 + ex*) =
при малом e > 0 F (x*,c0)
(c0°)x*
(co0 — e)x* n
jo r „0
+ (c0x* + c2 — x*) > F(0, c0°_ — e, c° + ex*) = (c°° + ex*)
и M(c0 — e, c2 + ex*) < M(c0) (противоречие). Если cl = 0, то
F(x*,c0) = (c2 — x*) > F(0,c0) = (c2).
Отсюда следует, что c2 < x*/2. Увеличивая c2 на малoe e > 0, придем к противоречию. Случай F(x*,c0) < F(0,c0) разбирается аналогично, ¦ Из доказанного утверждения вытекает, что
П (Cl) + (Cl — 1)x* 2(1 — ci)
min M(c)
ci,C2>0
min
0<c1<1
Последний минимум достигается при x*n +1 — V x*n + 1
Vx*n + 1 — 1
c2
cl
x*n +1 " n
Таким образом, при оценке параметра распределения Пуассона
Vx*n + 1 n
x*n +1 — V x*n + 1 x*n + 1
y0(z)
— минимаксная стратегия статистика, В частном случае при n = 30, x* = 0.5, z = 0.2 получаем оценку y0(z) = 0.16.
Упражнение 6.3. Пусть все случайные величины Zj имеют нормальное распределение с плотностью
1
,— e -\/2ла
(zi-x)
2а
g(zi|x)
§ 7. Исследование игровых моделей
Модель "нападение-оборона".
Имеется n обороняемых пунктов с номерами i = 1 ,...,n возможного прорыва средств нападения. Пусть A и B — количества средств нападения и обороны. Эти средства предполагаются бесконечно-делимыми. Стратегия первого игрока (нападения) состоит в раепределении своих средств по пунктам в соответствии е вектором
П
x = (x1, ..., xn) E X = {x | ^ Xi = A, Xi > 0, i = 1,..., n}.
i= 1
Второй игрок (оборона) использует аналогичную стратегию
П
У = (yi,...,Vn) E Y = {y 1 Vi = B, Vi > 0, i = 1,...,n}.
i= 1
Пусть pi — количество средств нападения, которое может уничтожить одна единица средств обороны на i-ом пункте. Если xi > piyi, то через Ей пункт прорывается xi — piyi средств нападения, Если xi < piyi, то через этот пункт нападение не прорвется. Объединяя оба случая, находим формулу для количества средств нападения, прорвавшегося через i-й пункт: max[xi — piyi, 0]. Определим функцию выигрыша первого игрока
П
F(x, y) = Y max[xi — pyh 0]
i= 1
— общее количество средств нападения, прорвавшееся через все пункты.
Заметим, что функция F(x, y) выпукла по y. По теореме 6,4 значение игры v = v и минимаксная стратегия y0 обороны оптимальна. Займемся исследованием этой игры в чистых и смешанных стратегиях. Без потери общности предположим, что коэффициенты эффективности обороны pi упорядочены: p1 > p2 > ... > pn и n-й пункт обороны является слабейшим,
а) Покажем, что
v = max min F (x, y) = max[A — pnB, 0], x(n) = (0,..., 0, A)
x€X yEY
— макеиминная стратегия нападения, состоящая в нанесении "концентрированного "удара по слабейшему пункту.
Для любой стратегии нападения х определим вспомогательную стратегию обороны у :
-1
БхЛ -і V] —
Уі
к= 1
-к
Тогда
П
min F(х,у) < F(х,у) ^ У^тах[хі - ДіУі, 0]. yE Y '
i= 1
n
Если Б > , to yi > хі/ді, г =1,..., n ^ F(x,y) = 0.
j 1
k= 1
В противном случае yi < хі/ді, г = 1, ...,п, и
n n
F(x, У) = Х](хі - ДіУі) < A - -п? Уі = A - -пБ.
i=1 i=1
Таким образом, для любой стратегии х minF(х,у) < max[A — дпБ, 0] = minmax[A — Дпуп, 0] = minF(х(п),у)
yGY yGY yGY
и х(п) — макеиминная стратегия нападения,
б) Покажем, что
max[A — Б ^
k= 1 |  |
v = min max F(х, у)
yGY xGX ^
0],
п 1 _ 1
Дді ? -
v ^ -k
У0 : Уі0
, г = 1,...,n,
k=1
— минимаксная стратегия обороны.
Сначала докажем равенство
(7.1)
max F(х,у) = max F(х(і) ,у) V у е Y,
1<і<п
где х(і) = (0,...,0,..., 0) — стратегия нападения, состоящая в нанесе-
І
нии к0НценТрИр0ванн0г0 удара п0 г-му пункту.
Представим стратегию x в виде x = ^ Ax(i). По определению выпук
i= 1
лой функции
F(x,y) XF(x(i),y) < max F(x(i),y).
* /А \<r<n.
i= 1
Следовательно,
maxF(x,y) < max F(x(i),y) < maxF(x,y)
x^z^X 1 i^C,n x^z^X
и (7,1) доказано. Далее имеем
v = min max F (x,y) = min max F (x(i),y)
y& ж€Х y& 1 <i<n
= min max max[A — my,-, 0] = minmax[A — min my,-, 0] =
y€Y 1<i<n P y yeY 1<i<ra У
= max[A — B max min дiyi/B, 0] = [замена переменных
yEY 1<i<n
n
P = y/B G p = {p = (p1,...,Pn) | E Pi = l, Pi > 0, i = l,...,n}] =
i=1
= max[A — B max min діpi, 0] =
pen 1<i<n
(n \ — 1
E -1) , 0]
П \ — 1
1
При этом
n 1 -1
,n.
y°i = BP0 = B{vi ^ —) , i = l,
k=1 Дк
Когда в игре существует решение в чистых стратегиях?
n
Если B > A Е —, то v = 0 > v > 0 и, еледовательно, v = v = 0,
k=1
Для нападения любая стратегия оптимальна, В этом случае оборона так может распределить свои силы, чтобы не позволить нападению, использующему концентрированный удар, прорваться на каком-либо пункте,
n
Если B < A Е — , то функция F(x,y) седловой точки не имеет, Дей-
к=1
егвигел ыю.
n _і 1 11
v = A — b(V —) — > A — b(-) — = A — pnB.
Кк=1 Дк' ?Дп?
Заметим, что ? > 0 , Поэтому v > max[A — pnB, 0] = v.
в) Покажем, что в игре существует решение в смешанных стратегиях вида (p°,y°,v), где y° — чистая минимаксная стратегия обороны, а оптимальная смешанная стратегия для нападения имеет вид
П
^ у Pi , Pi
i=1
Л —1
p ? -)
k=1
1 ,-,п.
Поскольку функция F(x, у) выпукла по у, достаточно проверить условие (*) для смешанной стратегии д° :
F(Р0,У) > v ?у G Y.
Имеем
F (Р0,У)= F (x,y)dV°(x) = ^2 P°F (x(i),y) = x i=1
n n
y^P° max [A — Pi yi, 0] = ^ max[p°A — Pip°yi, 0] >
i=1
n
i=1
> max^(p°A — PiP°yi), 0] = max[A — ^2 yd ^2 —) , 0]
Pk
i=1
i=1 k=1
n i _ 1
= maxi A —
[A — B( ? J-'01 = v
к=Ю k
Здесь мы воспользовались элементарным неравенством
n n n
^i ) ^ij > ШОъЛф / 'i^/j ^i-l ?
i=1 i=1 i=1
y^max[gj,bi] > max^ ai, У~Чф
справедливом для любых вещественных чисел ai,bi, i = 1, ...,n.
Модель дуэли.
В дуэли принимают участие два дуэлянта ( первый и второй игроки), В начальный момент времени дуэлянты находятся на расстоянии d° и по команде начинают сближаться, В распоряжении каждого дуэлянта имеется один выстрел, который он может произвести в противника с любого расстояния (конечно, при условии, что дуэлянт жив), он даже может подойти к противнику вплотную.
Пусть pk (d) — функция меткости k-ro дуэлянта, равная вероятности поражения противника, если выстрел был произведен с расстояния d. Предположим, что функции pk (d) непрерывны и убывают на отрезке [0, d0] и без потери общности pk(0) = 1, pk(d0) = 0, k = 1, 2.
Определим антагонистическую игру. Пусть х Е X = [0, d0] — расстояние, с которого первый игрок намечает произвести свой выстрел. Аналогично, у Е Y = [0,d0] — расстояние, с которого намечает свой выстрел второй игрок. Определим функцию выигрыша F(x,y) первого игрока. Рассмотрим сначала шумную дуэль, когда противники слышат выстрелы друг друга. Тогда
F (х,У)
Pi(x), 0 < у < х < do,
1 — P2 (у), 0 < х<у < do.
По смыслу F(х,у) есть вероятность поражения первым игроком второго, Если х < у и второй игрок промахнется, то первый, услышав выстрел противника, стреляет в него с расстояния 0 вместо х. Отметим, что F(х,у) является осреднением функции, принимающей значение 1 или 0 в зависимости от того, убит второй дуэлянт или нет. Итак, шумная дуэль определена как игра в нормальной форме Г = (X, Y, F(х, у)).
Покажем, что шумная дуэль имеет решение в чистых стратегиях (d*,d*,v = p1(d*)), где d* — единственный корень уравнения p1(d) = 1 — p2 (d). Проверим неравенства из определения седловой точки
F(х^*) < p1(d*) = F(d*,d*) < F^*,у) V х Е X, V у Е Y.
Имеем
F(х, d*)
p^) < p1(d*), d* < х < d0,
1 — p2(d*) = p1(d*), 0 < х < d*,
f (<г*,у)= p1<d*>- 0 < у < d*-
[1 — p2(у) > 1 — p2(d*) = p1(d*), d* < у < do.
Если функции меткости игроков одинаковы, то из уравнения p1(d) = 1 — p1(d) находим, что значение игры равно 1/2, a d* является корнем уравнения p1(d) = 1/2.
В бесшумной дуэли игроки не слышат выстрелы друг друга и
F (х,у)
Pl(x), 0 < у < х < do,
p1 (х)(1 — p2(у)), 0 < х < у < do.
Покажем, что бесшумная дуэль не имеет решения в чистых стратегиях. Найдем величину v = sup inf F(x,y). Стратегия x = d0 не может
” 0<x<d0 0<y<do
быть макеиминной, поскольку F(d0,y) = pi(d0) = 0 при всех y G Y. Пусть 0 < x < d0. Тогда
rnf F(x,y) = mrn[ rnf F(x,y), rnf F(x,y)] =
0<y<do 0<y<x x<y<do
= min[pi(x),pi(x)(1 - P2 (x))] = pi (x)(1 - p2 (x)).
Отсюда v = max pi(x)(1 — p2(x)).
0 <x<d0
Упражнение 7.1. Докажите, что
v = inf sup F(x,y)= pi(d*).
0<y<do 0<x<d0
Таким образом, v = max pi(x)(1 — p2 (x)) <
0<x<do
< max min[pi(x), 1 — p2(x)] = pi(d*) = v.
0 <x<d0
Решение бесшумных дуэлей обычно сводится к интегрированию обыкновенных дифференциальных уравнений. Мы ограничимся исследованием конкретного примера.
Пример 7.1. Рассмотрим бесшумную дуэль с одинаковыми функциями меткости игроков pi(d) = p2(d) = 1 — d, 0 < d < d0 = 1. Тогда
F (x,y)
a
j F (x,y)f (x)dx
0
 |
x)yf (x)dx + / (1 |
x)f(x)dx
(7.2)
v.
Дифференцируя дважды по у интегральное уравнение (7,2), получим дифференциальное уравнение 3f (у) = (1 — у)/'(у), имеющее (после замены у на x ) общее решение вида f (x) = c(1 — ж)-3. По определению
і
плотности f f (x)dx = 1 (условие нормировки). Отсюда о
a
(7.3)
(1 — a)2
cl__dx = -
cj (1 — x)3dx 2 0
Найденная плотность f (x) должна также удовлетворять исходному интегральному уравнению (7,2), т.е.
v.
(7.4)
Поскольку уравнение (7,4) не является тождеством по у, смешанная стратегия Д (x) указанного вида не существует. Поэтому предположим, что функция распределения Д (x) имеет скачок вели чины а в нуле. Тогда уравнения (7,2) —(7,4) изменятся:
y a
ау + / (1 — x^f (x)dx + / (1 — x)f (x)dx = v, (7.2)'
1
(1—a?
(7.3) '
(7.4) '
1,
ау + c
v.
Для того чтобы уравнение (7.4)' выполнялось как тождество, необходимо положить а = c. Из уравнений (7.3)', (7.4)' получаем
1
(1 — а)2
ca
1 — а
(7.5)
v.
Из свойства дополняющей нежесткости также следует, что F(x, -0°) = v V x Е [0, а] или
a
А1
|
F ЖуЖу^у |  |
(7.6)
v.
Отсюда, как и выше, получим g(y) = ci(1 — у) 3. Подставляя g(y) в
уравнение (7,6), находим
dy +
dy
c1(1 — x)
(1 — у)3
(1 — У)3
или, используя условие нормировки j g(y)dy = c1 j(1 — y)-3dy = 1
Ci + Ci
1 — a 1 — x
(1 — x) 1
v.
Для того чтобы последнее равенство выполнялось тождественно, необходимо, чтобы c1 = v =1 — a. Отсюда и из (7,5) находим
2 — V2
2
a = 2 — х/2, c1 = v = V2
1, c = a
Окончательно
2 — -y/2 4
1,
1
(x — 1)2
0 < x < 2 — \[2, 2 — ^2 < x < 1,
^0(x)
— 1 2
1,
1
(У—!-
0 < у < 2 — \[2, 2 — ^2 < у < 1.
Ф°(у)
Особенность оптимальной смешанной стратегии Д состоит в том, что первый игрок с вероятностью a = 2=2f2 ждет до полного сближения с противником. Отметим также, что значение игры v = \[2 — 1 бесшумной дуэли меньше значения игры v = 1/2 шумной дуэли, что объясняется уменьшением информированности первого игрока.
§ 8. Многошаговые антагонистические игры
Определим многошаговую антагонистическую игру с полной информацией. Игра происходит в течение T шагов е номерами t = 1, ...,T. На
каждом шаге t игроки выбирают по очереди альтернативы — значения переменных xt,yt.
Шаг 1. Сначала первый игрок выбирает альтернативу xi G U\, затем второй игрок, зная выбор первого, выбирает альтернативу y1 G V1(x1) =
Vi(-).
Пусть игроки в течение t — 1 шагов выбрали альтернативы xi, ...,xt-i,yi,..., yt-1. Положим xt = (xi, ...,xt), y = (yi, ...,yt).
Шаг t. Сначала первый игрок, зная предысторию xt-1,yt_ 1, выбирает альтернативу xt G Ut(xt-1,yt-1) = Ut(-). Затем второй игрок выбирает альтернативу yt G Vt(xt,yt-1) = Vt(-), зная предысторию xt,yt-1, включая выбор xt первого игрока на данном шаге.
После завершения шага T возникает пара (xT ,yT) называемая партией игры. По смыслу партия игры — это запись всех альтернатив, выбранных игроками. Для любой партии (xT,yT) задается выигрыш F(xT,yT) первого игрока.
Определим теперь игру в нормальной форме. На шаге t первый игрок может выбрать альтернативу xt как значение функции xt : xt = xt(xt-1,yt_ 1), которая должна быть определена при всевозможных значениях аргументов xt-1,yt-1. Обозначим множество всех таких функций xt через Ut. Заметим, что x1 = x1, поскольку на первом шаге первый игрок никакой информацией не располагает.
Стратегия первого игрока представляет собой набор функций
T
x = (xt, t = 1,...,T) G X = П Ut.
t= i
Аналогично, на шаге t второй игрок может выбирать альтернативу yt как значение функции yt : yt = yt(xt,yt_ 1), которая должна быть определена при всевозможных значениях аргументов xt, yt_ 1. Обозначим множество всех таких функций yt через Vt. Стратегия второго игрока представляет собой набор функций
T
y = (yt, t = 1,...,T) G Y = П Vt.
t=1
Игроки могут выбрать стратегии x, y независимо друг от друга до игры, а во время игры — применять их "автоматически,"Любой паре стратегий (x,y) однозначно соответствует партия игры:
Хі = Х1, Уі = Уі(хі), X2 = x2(x1,y1) и Т.Д.
def
Далее F(X, y) = F(xT, yT), где (xT, yT) — партия, соответствующая стратегиям Хи y, Итак, мног ошаговая игра с полной информацией определена в нормальной форме Г = (X , Y, F (X, y)).
В дальнейшем будем рассматривать два класса игр: игра Г', в которой тсс множества Ut(-),Vt(-) конечны; игра Г", в которой тсс множества Ut(-) = Ut, Vt(-) = V не зависят от предыстории и являются компактами метрических пространств, а функция F (xT, Ут) непрерывна на произведении
U1 х ¦ ¦ ¦ х UT х V1 х ¦ ¦ ¦ х VT.
Определим пару стратегий
X0 = (x0,t = l,...,т), у0 = (yt0,1,...,T),
используя метод динамического программирования. Доопределим функцию F на всех отрезках партии вида (xt,yt_ 1) или (xt,yt) и назовем ее функцией Веллмана. Компоненты стратегий Х0, У0 будем задавать в порядке, обратном выборам игроков.
Определим сначала yT. Для этого зафиксируем произвольное значение аргументов (xT , yT-1) и зададим значение функции
yT (XT ,yT-1)=/y° :
F(xt, yT-ъ yT) = min , F(xT, yT-1,yT)=F(xT, yT-1).
ут GVt (•)
Определим функцию XT- Зафиксируем произвольное значение аргументов (xT— 1,yT_ 1) и зададим значение функции
xT (XT-1, Ут-1) = xT :
F(xt—1,XT,Ут —1) = max F(xt—1,xt,Ут-1)== f(xT-1,Ут-1).
xt Gut (•)
Пусть определены компоненты стратегий и значения функции Веллмана
yT,XT,...,yt0+l,x0+l, F(XT,yT-1),...,F(xt,yt).
Тогда yt1,X0, F(xt,yt-1),F(xt-1,yt-1) задаются по приведенным выше формулам с заменой T на t.
Покажем, что стратегии X0, y0 определены корректно для игр Г' и Г". Действительно, в игре Г' все множеетва Ut(-), Vt(-) конечны и поэтому максимумы и минимумы, фигурирующие в определениях X0, у0, достигаются, Аналогичное утверждение справедливо и для игры Г", поскольку по теореме 2,2 функция Веллмана непрерывна на соответствующих компактах.
Определим величину
def F(xi)
F (xi,yi) =...
v = max F(xi)
xieUi
max min
xieUi yieVi(-)
= max min ... max min F(хт,Ут).
xiGUi yiGVi(-) xtGUt(•) УтGVT(•)
Справедлива следующая
Теорема 8.1 (Цермело). Всякая многошаговая антагонистическая игра с полной информацией Г' (или Г") имеет решение (X0,y0,v).
Доказательство. Докажем, что функция F(X, у) имеет седловую точку (X0, у/0^ на X х Y. Для этого достаточно доказать, что
1) F(X0, у) > v V у е Y;
2) F(X,y0) < v V X е X.
Докажем неравенство 1), Имеем
F(х0,у) > min F(x0,yi,...,yT-ьУт) = F(x0,yi,...,yT-i) =
Ут е?т (¦)
def xT T7(~0 ~0 \
= ma* F (хі,...,хт-1,хт ,Уі,...,Ут-і) =
xt GUt (•)
= F(X?,...,XT-i,yi,...,yT-1) > ... > F(x0,y1) > maX F(х1) = v.
xiGUi
Неравенство 2) доказывается аналогично, ¦
Пример 8.1. Покажем, что игра "шахматы"имеет решение. Существует такое целое число T, что в соответствии с правилами игры любая шахматная партия заканчивается не позднее хода T. Поэтому без потери общности можно считать, все партии продолжаются T ходов. Шахматы являются игрой вида Г'. Ut(Xt-1,y^ 1) есть множество разрешенных правилами альтернативных выборов хода белыми (первым игроком) на t-м ходу в позиции, определяемой предыдущими ходами игроков (Xt-1,yt-1).
Аналогично интерпретируется множество V(xt,yt_выборов хода черными на t-м ходу. Выигрыш белых определяется по правилу
1, если выиграли белые,
F (хт,Ут)
0, если выиграли черные,
1/2, если сыграли вничью.
По теореме Цермело игра "шахматы"имеет решение. Практическое значение этот результат имеет для позиций эндшпиля, где обычно ищут форсированный выигрыш, либо ничью.
Пример 8.2. Рассмотрим матрицу
/5 3 1 4\
2 7 2 0
3 2 3 3 \4 0 2 5/
Разобьем множество ее строк на подмножества Ы\ = {1,2} и М2 = {3, 4}, а множество столбцов — на подмножеетва N = {1,2} и N2 = {3, 4}. Определим двухшаговую игру с полной информацией.
Шаг 1. Сначала первый игрок выбирает номер а ? {1, 2} множества Ма, из которого он будет на втором шаге делать выбор строки матрицы A. Затем второй игрок, зная а, выбирает номер в ? {1,2} множеетва N, из которого он будет на втором шаге выбирать номер столбца матрицы
A.
Шаг 2. Первый игрок выбирает номер строки і ? Ма, зная а, в, затем второй игрок выбирает номер столбца j ? Np, зная а,в,і-
Выигрыш первого игрока равен .
Для решения задачи воспользуемся позиционной форм,ой игры, которую будем отображать на плоскости в виде дерева.

Начальная (корневая) вершина дерева соответствует первому ходу первого игрока (выбор альтернативы а), в вершинах второго уровня альтернативу в выбирает второй игрок и т.д. В финальных вершинах, отвечающих различным партиям игры, указаны выигрыши первого игрока F(a,e,i,j) = а^. В вершинах четвертого уровня указаны значения функции Веллмана F(а, в, г) = min F(а,в,іл), в вершинах
третьего уровня — F(а, в) = max F(а,в,г), в вершинах второго уров-
ІЕЫа
ня — F(а) = min F(а, в), а в начальной вершине — значение игры V = max F(а) = 2.
а=1,2
Укажем оптимальные стратегии игроков
X0 = (а0,і0(а,в)), У° = (в°(а),?(а,в,і)):
а0 = 2, г°(2,1) = 3, г°(2, 2) = 3, в°(1) = 2, в°(2) = 1,
j°(1, 2,1) = 3, ,j°(1, 2, 2) = 4, j0(2,1,3) = j0(2,1, 4) = 2.
Отметим, что сначала мы подсчитали функцию Веллмана, а затем построили в естественном порядке компоненты оптимальных стратегий, В результате была достигнута некоторая экономия вычислений, поскольку эти компоненты необязательно следует определять при всех значениях аргументов. Например, а0 = 2 и значения функции і0(а,в) нужно находить только при а = 2.
Еще более существенное сокращение вычислений достигается с использованием приемов теории искусственного интеллекта.
Рассмотрим вопрос о программировании шахмат, В текущей позиции шахматной партии при ходе, скажем, белых дерево игры порождается на глубину нескольких ходов, В финальных вершинах дерева выигрыш белых задается с помощью оценочной функции, учитывающей материальные и позиционные особенности финальной позиции. После этого решается получившаяся игра с полной информацией и находится оптимальный ход белых в текущей позиции.
Обычно дерево игры порождается с помощью рекурсивной процедуры построения поддеревьев. При этом в вершинах дерева вычисляются значения функции Веллмана, Рассмотрим возможный ход белых а1 в текущей позиции. Пусть построено поддерево игры, соответствующее этому ходу и получена оценка хода а1 (точнее, позиции, возникающей после этого хода), равная 4, Рассмотрим другой ход белых а2 в текущей позиции, Теперь пусть черные выбрали ход b1 и установлено, что его оценка равна 1, Тогда оценка хода а2 будет не больше 1 и его можно отбросить, поскольку он хуже хода аі. Таким образом, здесь не потребовалось полное построение поддерева хода а2. Оценка хода а1 в данном случае называется а-отсечением,.
Если в текущей позиции ход черных, то аналогично можно определить понятие в-отсечения.
Многошаговые антагонистические игры с неполной информацией.
Определим теперь более общую модель многошаговой игры, в процессе которой игроки могут не иметь полной информации о сделанных выборах, Ограничимся играми Г' с конечными множествами Ut(-), Vt(-), t = 1 T
Пусть Щ(Щ2) — множество всех отрезков партий вида (Xt-1 , yt-1) (вида (Xt,yt_ 1)), Предположим, что множество Щ1 разбито на непере-еекающиеея подмножества Ht1(at), at G Lt. Перед выбором xt первому игроку известно, что (Xt-1,yt_ 1) G Ht1(at). Аналогично, пусть множество Щ2 разбито на непересекающиеся подмножества Ht2(et), fit G Bt. Перед выбором yt второму игроку извеетно, что (Xt,yt-1) G Ht2(et). Если, в частности, at = (Xt-1,yt-1), fit = (xt,yt-1), а множества Щ(а-і-) ч Щ2(вО содержат по одному элементу at и et соответственно, то получим игру с полной информацией.
Стратегия X ? X первого игрока задается набором функций Xt от at, принимающих значения Xt(at) ? Ut(at), t = 1,..., T. Стратегия y ? Y второго игрока задается набором функций yt от во принимающих значения yt(et) ? Vt(et), t = 1,...,T. По определению F(X, y) = F(XT,yT), где партия игры (xT ,yT) одн означно задается стратегиями игр оков X и y. Итак, определена игра Г = (X, Y, F(X,y)) в нормальной форме.
Пример 8.3. Пусть at = pt = (Xt-1, yt-1),
Ht1(at) = {аt}, Ht2(et) = {(xt,yt-i) 1 xt ? Ut(et)}.
Здесь на каждом текущем шаге игроки не знают выбора друг друга, но они знают все выборы, сделанные на предыдущих шагах. При этом будем говорить об игре с полной информацией о предыдущих шагах. Конкретным примером может служить повторяющаяся игра "орлянка".
Упражнение 8.1. Показать, что в игре Г с полной информацией о предыдущих шагах (пример 8,3) нижнее и верхнее значения игры задаются следующими выражениями:
v = max min max min ••• max min F(XT,yT),
xiEUi yiGVi X2EU2(xi,yi) y2EV2(xi,yi) xtEUt(ат) УтEVt(вт)
v = min max min max ••• min max F(XT,yT).
yiGVi xi€Ui y2EV2(xi,yi) X2EU2(xi,yi) утEVt(вт) xtEUt(ат)
Упражнение 8.2. Найти верхнее и нижнее значения игры из примера 8,2, предполагая полную информированность игроков о предыдущих шагах.
Если в игре Г v < v, то игроки должны использовать смешанные стратегии. Ограничимся примерами.
Пример 8-4- Найдем решение в смешанных стратегиях игры из примера 8,2, предполагая полную информированность игроков о предыдущих шагах. На втором шаге значения а, в игрокам известны и возникает подыгра с 2х2-подматрицей (aij)iEMajEN/3 матрицы A. Пусть (р°(а,в), q°(a, в), ?(а, в)) — решение в смешанных стратегиях указанной подыгры, В следующей таблице эти решения приведены при всех значениях а и в.
Табл. 8.1
|
а |
в |
р0(а,в) |
q0(a,e) |
?(а,в) |
|
1 |
1 |
(5/7,2/7) |
(4/7,3/7) |
29/7 |
|
1 |
2 |
(2/5,3/5) |
(4/5,1/5) |
8/5 |
|
2 |
1 |
(1,0) |
(0,1) |
2 |
|
2 |
2 |
(1,0) |
(1,0) |
3 |
На первом шаге первый игрок стремится увеличить свой ожидаемый выигрыш, получаемый на втором шаге, а второй игрок стремится этот выигрыш уменьшить. Поэтому на первом шаге игроки участвуют в игре с матрицей
МЛ* =(Т f).
Решение этой игры в смешанных стратегиях имеет вид
(р0, q°,v) = ((35/124, 89/124), (49/124, 75/124), 323/124).
Итак, первый игрок должен выбирать а = 1 с вероятностью 35/124, а второй игрок должен выбирать в = 1 с вероятностью 49/124. Значение игры Г равно 323/124,
Пример 8.5. Ведущий телевизионного шоу предлагает участнику показать на одну из трех закрытых дверей, за которыми размещены "Мерседес "и два козла. После этого ведущий открывает какую-либо из двух невыбранных дверей, за которой находится козел, и вторично (шаг 2) предлагает участнику открыть одну из оставшихся дверей. Если за дверью стоит "Мерседес", то участник получает его в качестве приза, если — козел, то участник ничего не получает. Пусть выигрыш участника равен 1 или 0 в зависимости от того, получен им приз или нет. Найдем оптимальные стратегии участника (первого игрока) и ведущего шоу (второго игрока), а также значение игры.
Если на первом шаге первый игрок показал на дверь, за которой стоит козел, то ясно, что на втором шаге он должен открыть другую дверь и наверняка получить приз. Отсюда, используя соображения симметрии, укажем оптимальные смешанные стратегии игроков.
Определим стратегию р0 первого игрока: на первом шаге он должен выбрать одну из трех дверей с вероятностью 1/3, а на втором шаге открывать другую оставшуюся дверь.
Определим стратегию q0 второго игрока: он должен поместить "Мерседес "за одной дверью из трех с вероятностью 1/3, Если первый игрок показал на дверь е "Мерседесом", то второй игрок должен открыть одну из двух других дверей е вероятностью 1/2,
Значение игры равно 2/3,
Для доказательства оптимальности указанных стратегий проверим условие (*). При любой чистой стратегии второго игрока первый игрок, применяя p0, показывает на дверь с козлом с вероятностью 2/3, На втором шаге он указывает на другую дверь и выигрывает приз, С другой стороны, пусть второй игрок применяет стратегию q0, Покажем, что первый игрок не может выиграть приз е вероятностью, большей, чем 2/3, Рассмотрим типичную чистую стратегию первого игрока: сначала он выбирает первую дверь, на втором шаге он открывает вторую дверь, если второй игрок открыл третью и открывает первую дверь, если второй игрок открыл вторую. Нетрудно подсчитать, что вероятности его выигрыша при размещениях МКК, КМК и ККМ равны 1/6, 1/3 и О соответственно, Таким образом, данная чистая стратегия обеспечивает выигрыш приза е вероятностью 1/2, Если на втором шаге первый игрок указывает не на первую дверь, то выигрыш приза (только в этом случае) увеличивается до 2/3,
Отметим, что в этом примере мы обошлись без полного описания множеств стратегий игроков и матрицы игры. Это представляет собой весьма непростую задачу, сели рассмотреть обобщение игры на случай, когда имеется n дверей, за которыми располагаются один "Мерседес"и n — 1 козел. Игра происходит в течение n — 1 шагов. На каждом из первых n — 2 шагов участник показывает на какую-либо закрытую дверь, а ведущий открывает другую дверь, за которой стоит козел. На шаге n — 1 все происходит так же, как и при n = 3. Значение игры здесь равно (n — 1)/n, Докажите оптимальность следующей стратегии первого игрока, С равной вероятностью 1/n он выбирает одну из дверей, на которую показывает в течение первых n — 2 шагов. На последнем (n — 1)-м шаге, когда останутся две закрытые двери, он открывает другую дверь.
Пусть многошаговая игра задана в позиционной форме. Тогда информированность игроков задается с помощью информационных множеств.
Определение. Информационным множеством игрока называется множество вершин дерева игры, в которых очередь хода принадлежит данному игроку и имеется одинаковое число альтернатив. Игрок знает, что позиция игры соответствует одной из вершин информационного множества, но не знает какой именно. На информационное множество накла-дываетея следующее ограничение: оно не может содержать двух вершин лежащих на одном пути, ведущим из начальной вершины в финальную.
Будем считать, что все информационные множества первого игрока
I1,...,Ik пронумерованы таким образом, что если какая-то вершина множества I реализуется в игре раньше некоторой вершины множества Ij, то i < j. Все информационные множества второго игрока J1,...,Jl пронумерованы аналогичным образом.
Стратегией первого игрока является вектор x = (щ, ..., xk) Е X, где xj — либо альтернатива, выбираемая игроком в множестве Ij, либо Xj = *. Последнее означает, что выбор альтернатив xi,...,xj-i гарантирует, что в игре заведомо не будет реализована никакая вершина из множества Ij. Аналогичным образом определяются стратегии у = (y1,...,yl) Е Y второго игрока.
Отметим, что в игре могут встречаться позиции случая. Это означает, что в некоторых вершинах дерева игры выбор альтернативы не принадлежит игрокам, а осуществляется случайным образом с известным законом распределения (см, пример ниже). Тогда при выбранных стратегиях игроков x и у выигрыш первого игрока, определяемый по финальной вершине, будет случайной величиной и значение F(x, у) следует определить как математическое ожидание этого выигрыша. Таким образом, мы свели позиционную форму игры к нормальной форме.
Пример 8.6. Игра "покер". Колода состоит из двух карт: старшей (с) и младшей (м). Игрокам сдается по одной карте рубашкой вверх. Первый игрок берет свою карту и имеет две альтернативы: либо пасовать (и), выплачивая второму игроку сумму а > 0, либо увеличивать ставку (у) до суммы b > а. Если первый игрок увеличивает, то второй игрок, не зная расклада карт, может либо пасовать, выплачивая первому а, либо увеличивать ставку до b. Если оба игрока увеличивают ставку, то карты открываются и игрок со старшей картой получает сумму b от партнера. На рис, 8,2 изображено дерево игры.
I
П |
/°\
с/
1/ |
\ м
\ h
П |
a
у |
Ji |
|
—a
у |
|
|
|
|
|
п/ |
у\ |
п / |
у\ |
|
a |
b |
a |
—b |
|
|
Рис. |
8.2 |
|
Первый игрок имеет два информационных множества, отвечающих двум равновероятным раскладам карт. Поэтому у первого игрока четыре стратегии: (и,и),(и,у),(у,и),(у,у). Второй игрок не знает расклада карт. Он имеет единственное информационное множество и две стратегии: п и у. Матрица игры в нормальной форме имеет вид
|
|
и |
У |
|
|
|
|
и,и) |
/ —a |
—a \ |
|
(—a |
—a \ |
|
п, у) |
2 (—a) + 1 a |
2(—a) + 2(—b) |
|
0 |
a+b
2 |
|
У;11) |
1 a + 2 (—a) |
1 b + 2(—a) |
|
0 |
b-a
2 |
|
У,у) |
\ 2 a + 2 a |
^ b + ^ (—b) У |
|
у a |
0 У |
Нетрудно видеть, что третья строка матрицы доминирует первую и вторую строки. Вычеркивая их и решая игру с 2 х 2-матрицей, получим решение в смешанных стратегиях
0, 0,
b — а 2а \ a(b — a)
b + a,b + a),V b + a
Можно сделать вывод, что чем больше значение b/a, тем с большей вероятностью первый игрок должен блефовать (увеличивать на младшей карте), а второй — ему не верить (пасовать).
Комментарий и библиография к главе I
§ 2, Основные понятия теории антагонистических игр были введены Э.Борелем (см, английский перевод [15] трех его работ 1920-х годов). Термин "физическая смесь стратегий "использовала Е.С. Вентцель в [29], Пример 3,2 взят из книги Г.11. Дюбина и В,Г, Суздаля [46], Еще один пример 9,7 использования "физической смеси стратегий "в биматричной игре см, во второй главе. Основы теории полезности заложены в фундаментальном труде Дж, фон Неймана и О, Моргенштерна [72], О методах построения функций полезности см, [49],
Интересно проанализировать поведение первого игрока, использующего оптимальную смешанную стратегию (а/( 1 + а), 1/(1 + а)) в игре с

примера 3,4, в зависимости от его
отношения к риску. Чем более осторожен игрок (с ростом полезности а), тем ближе его стратегия к (1/2,1/2). Азартный игрок выбирает чистую вторую стратегию с тем большей вероятностью, чем меньше значение а. Сходное поведение мы наблюдали у милиционера в примере 4,4,
Теорема 2,1 доказана в книге Дж, фон Неймана и О, Моргенштерна [72], Теорема 2,2 получена М, Шифманом [104] в ходе доказательства теоремы 2,3, Пример 2,5 был сообщен автору С,А, Ашмановым, Аналогичный пример см, в [6] (с,237), Теорема 2,3 доказана С, Какутани [47] с использованием обобщения теоремы Л, Брауэра о неподвижной точке. Однако она вытекает из полученного четырьмя годами раньше следующего результата [74],
Теорема (Дж. фон Нейман). Пусть X С Em и Y С En — выпуклые компакты евклидовых пространств, а компакты U,V С X х Y удовлетворяют следующему условию: для любых x Е Хи у е Y множества Y(x) = {у Е Y | (x,y) Е V} и X(у) = {х Е X | (x,y) Е U} являются непустыми выпуклыми компактами. Тогда U П V = 0.
Действительно, полагая в условиях теоремы 2,3
x€X
X(у) = ArgmaxF(x,y), U = {(x,у) Е X х Y | x Е X(у)},
Y(x) = ArgminFД,у), V = {Д,у) Е X х Y | у Е Y(x)},
уЕУ
получим, что существует пара Д0,у0) Е U П V — седловая точка функции FД,у). Поэтому теорему 2,3 обычно связывают с именем Дж, фон Неймана,
Доказательства С, Как панн и М, Шифмана теоремы 2,3 можно прочесть в книге С. Карлина [48].
§ 3, С теорией интеграла Стилтьееа можно ознакомиться по учебнику А,Н, Колмогорова и С,В, Фомина [50], Основная теорема матричных игр (теорема 3,1) была доказана Дж,фон Нейманом в 1928 году [73] методом математической индукции по размерам матрицы игры. Ранее Э, Борель [15] продемонстрировал ее справедливость для кососимметрической 3x3-матрицы. Приведенное доказательство теоремы 3,1 принадлежит С, Каку іанп [47], Теорема 3,2 объединяет две теоремы Э, Хелли ([50]), Основная теорема непрерывных игр (теорема 3,3) была доказана Ж, Виллем [30].
§ 4, Свойства решений в смешанных стратегиях матричных и непрерывных игр излагаются в большинстве книг по теории игр (ем,, например, [45, 63]), Пример 4,2 принадлежит Э, Борелю [16], Он также рассматривал дискретный вариант игры с A = 7, которому дал следующую интерпретацию. Игроки набирают по семь карт. Каждая карта может быть одной из трех мастей (содержащих по 14 карт): трефы, бубны или червы. Первый игрок побеждает, если в каждой из каких-либо двух мастей он имеет больше карт, чем противник, О других решениях этой игры см. [78].
Выравнивающие стратегии впервые использовал Э, Борель [15] для доказательства существования решения в смешанных стратегиях игры с кососимметрической 3x 3-матрицей, Игры с диагональными и циклическими матрицами, а также некоторые их обобщения см, в [48],
§ 5, Понятия доминирования строк и столбцов в матричных играх использовались многими авторами, В форме теорем они, по-видимому, впервые были сформулированы М, Дрешером в 1951 году в отчете корпорации РЭНД (см, его книгу [45]), Графический метод решения игр с 2 x 2-матрицами использовал еще Э, Борель, Более общий метод "двойного опиеания"ем, в работе [70], Эквивалентность решения матричной игры задаче линейного программирования была продемонстрирована Г, Данцигом [43], Теорема 5,2 о крайних оптимальных смешанных стратегиях доказана Л,С, Шепли и Р, Сноу [101],
Итерационный метод решения матричной игры был сформулирован Г, Брауном в [17], Сходимость процесса Брауна доказана Джулией Робинсон [84], Она использовала более общий итерационный процесс с ненулевыми начальными векторами c(0) и d(0), называемый в литературе процессом Брауна-Робинсон, Оценка скорости сходимости O(k-m+n-2) была получена Г.Н. Шапиро в [100], Модификация условия остановки по методу Брауна была предложена Ю.Б, Гермейером в [36], О других игровых процессах типа Брауна-Робинсон см, [8].
§6, Теорема 6,1 о пересечении выпуклых компактов евклидова пространства была открыта Э, Хелли в 1913 году и сообщена И, Радону, опубликовавшему ее доказательство в [83] как следствие собственных результатов, Геометрическое (и более наглядное) доказательство методом математической индукции по размерности пространства было опубликовано Э, Хелли в [94], Многочисленные обобщения и приложения теоремы Хелли см, в [42],
Структура решений в смешанных стратегиях игр с вогнутыми и выпуклыми выигрышами установлена Х,Ф, Боненбластом, С, Карлином и Л,С, Шепли в [12], Приводимые здесь конструктивные доказательства теорем 6,2 и 6,3 принадлежат Э.Г, Давыдову [41], который опирался на результат 1938 года Л,Г, Шнирельмана [106], придав ему современный вид .
Основы теории статистических решений были заложены А, Вальдом [21] (см, также [11, 20]), где, в частности, введена функция риска, С приложениями теории статистических игр можно ознакомиться в [40], Минимаксная оценка параметра биномиального распределения получена Дж, Ходжесом и Е, Леманом [96], а аналогичная оценка математического ожидания нормального распределения при известной дисперсии получена И, Вольфовицем [33],
§ 7, Модель "нападение-оборона"определена и изучена Ю.Б, Гермейером [36], Она является модификацией модели О, Гросса, в которой функ-
П
ция выигрыша нападения имеет вид F(x,y) = k max[x — yi, 0], a k
i= 1
интерпретируются как коэффициенты важности пунктов. В,А, Горелик предложил сходную игровую модель производства бензина [39],
Приводимые здесь шумная и бесшумная модели дуэлей исследованы Ю.Б, Гермейером [36], В классических моделях [48] F(x, у) получается осреднением функции, принимающей значение 1, если убит второй дуэлянт, а первый остался жив, значение —1, если убит первый дуэлянт, а второй остался жив и значение 0 в остальных случаях (оба дуэлянта живы или оба убиты). Методы решения игр с выбором момента времени (дуэльного типа), основанные на использовании интегральных и дифференциальных уравнений, ем, в [9, 48],
§ 8, Теорема существования решения многошаговой игры е полной информацией е целью применения к шахматной игре доказана Э.Цермело в 1912 году [97], Основные понятия теории позиционных игр определены Дж, фон Нейманом и О, Моргенштерном в [72], Полная формализация этих игр проведена Г.У. Куном [58], Пример 8,5 был сообщен автору Н.М. Новиковой, Пример 8,6 простейшей модели покера принадлежит Э, Борелю [16],
ГЛАВА II. ИГРЫ ДВУХ ЛИЦ
§ 9. Ситуации равновесия в играх двух лиц
Понятие антагонистической игры можно значительно расширить, В игре двух лиц интересы игроков необязательно бывают противоположными, Рассматривают и игры многих лиц. Им посвящена третья глава.
Определим игру двух лиц. Пусть первый игрок имеет в своем распоряжении стратегии x го множества стратегий X, а второй игрок — стратегии у из множества стратегий Y. Будем рассматривать игру в нормальной форме. Это означает, что каждый из игроков выбирает стратегию, не зная выбора партнера. Пару стратегий (x,y) будем называть ситуацией. У первого игрока имеется функция выигрыша F(x,y), а у второго — функция выигрыша G(x,y), определенные на множестве всех ситуаций X х Y. Каждый игрок стремится, по возможности, максимизировать свою функцию выигрыша. Таким образом, игра двух лиц в нормальной форме задается набором Г = (X,Y,F(x,y),G(x,y)).
В антагонистической игре понятие решения мы связывали с седловой точкой функции выигрыша первого игрока, В произвольной игре двух лиц аналогом седловой точки является понятие ситуации равновесия.
Определение. Ситуация (x0, у0) называется ситуацией равновесия (равновесием по Нэшу) игры Г, если
maxF(x,y0) = F(x0,y0) maxG(x°,y) = G(x0,y0).
xEX yEY
Стратегии x0 и y0, составляющие ситуацию равновесия, будем называть равновесными. Если оба игрока придерживаются ситуации равновесия, то одному игроку от нее невыгодно отклоняться.
Упражнение 9.1. Если F (x,y) = — G(x, y), то игр а Г — антагонистическая, Докажите, что в антагонистической игре ситуации равновесия — это седловые точки функции F(x,y) на X х Y.
Обсудим, как можно использовать понятие равновесия по Нэшу с точки зрения принятия решений, В теории игр, как и во многих других теориях, можно выделить два подхода: нормативный и позитивный. Нормативный подход состоит в том, что теория дает рекомендации, как следует действовать в той или иной конфликтной ситуации, А при позитивном подходе теория пытается описать, как на самом деле происходит взаимодействие между игроками. Изначально теория игр развивалась как нормативная, И сейчас мы обсудим понятие равновесия по Нэшу именно е такой точки зрения, В этом случае правило принятия решения можно сформулировать следующим образом: в конфликтной ситуации, описываемой игрой в нормальной форме, каждому участнику следует использовать стратегию, которая входит в равновесие по Нэшу, Позитивный подход обсуждается в конце § 10,
Ситуация равновесия в произвольной игре двух лиц может не обладать теми свойствами, которые характерны для седловой точки антагонистической игры,
В антагонистической игре, имеющей решение, компоненты седловой точки являются максиминной и минимаксной стратегиями игроков и, наоборот, любая пара таких стратегий образует седловую точку. Таким образом, в антагонистической игре принцип равновесия согласуется с принципом оптимизации игроками своих гарантированных результатов. Кроме того, во всех седловых точках выигрыш первого игрока один и тот же и равен значению игры, К сожалению, в общем случае ситуации равновесия не обладают указанными свойствами. Убедимся в этом на примерах. Предварительно введем понятие биматричной игры.
Определение. Игра двух лиц Г называется биматричной, если множества стратегий игроков конечны:
X = {l,...,m}, Y = {1 ,...,п}.
Здесь i 6 X, j 6 Y — стратегии первого и второго игроков. Выигрыши игроков задаются двумя матрицами
A (F (i,j ))mxn (aij )
(bij)
в = (G(i,j ))r
ij jmxni
ij )mxn-
Запишем определение ситуации равновесия в обозначениях биматричной игры.
Определение. Ситуация (i0, j0) биматричной игры Г называется ситуацией равновесия (равновесием по Нэшу), если
aijo < aiojo, i = 1, ...,m, bio j < biojo, j = 1 ,...,n.
Всегда ли в игре двух лиц существует ситуация равновесия? В общем случае ответ — отрицательный, поскольку, например, в антагонистической игре не всегда существует седловая точка.
Приведем пример неантагонистической игры, не имеющей ситуации равновесия.
Пример 9.1. Покупатель (игрок 2) приходит на рынок за яблоками. Продавец, торгующий яблоками (игрок 1), использует пружинные весы, У него есть две стратегии:
1) честно взвесить 1 кг яблок;
2) подкрутить пружинку и обвесить покупателя на 200 грамм. Назовем эти стратегии "чеетноеть"и "обман"соответственно.
Покупатель также имеет две стратегии:
1) поверив продавцу, заплатить деньги и уйти;
2) взвесить купленные яблоки на контрольных весах и в случае обнаружения обмана звать кого-то и доказывать, что его обвесили. Назовем эти стратегии "поверить"и "проверить"соответственно.
Определим выигрыши продавца и покупателя в каждой ситуации:
а) Продавец честно взвесил, а покупатель ему поверил. Соответствующие выигрыши обоих, равные 0, выберем в качестве начала отсчета,
б) Продавец обманул, а покупатель ему поверил. Выигрыш продавца равен 1, так как он получил дополнительную прибыль. Выигрыш покупателя равен —1, поскольку он получил меньше яблок,
в) Продавец честно взвесил, а покупатель его проверил. Выигрыш продавца равен 0, Выигрыш покупателя равен —1/2: он, во-первых, зря потратил время, а, во-вторых, глупо себя чувствует,
г) Продавец обманул, а покупатель его проверил. Выигрыш продавца равен —1, так как обнаружение обмана грозит ему определенными неприятностями (например, его могут лишить лицензии на торговлю на этом рынке). Выигрыш покупателя равен 1/2, так как, во-первых, ему возместили обвес, а, во-вторых, он испытывает моральное удовлетворение от разоблачения обманщика.
Получается следующая биматричная игра:
пов пров
пов пров |
 |
Легко проверить, что здесь нет равновесий по Нэшу,
В приведенном примере элементы матриц Ли B удовлетворяют следующим неравенствам:

Упражнение 9.2. Проверить, что если элементы в матрицах выигрышей игроков связаны такими соотношениями, то в игре не существует равновесий по Нэшу,
Игры, подобные примеру 9,1, распространены в моделях, описывающих экономические и экологические взаимодействия. Рассмотрим пример игры, имеющей две ситуации равновесия.
Пример 9.2. Игра "семейный спор":
|
ф т |
|
A |  |
|
ф т |
|
B |  |
Интерпретация, Жена и муж (первый и второй игроки) обсуждают вопрос, куда пойти развлечься: на футбол (стратегия 1 ) или в театр (стратегия 2), Если идут на футбол, то жена получает 1 единицу, а муж — 2 единицы "удовольствия,11 Если идут в театр, то выигрыш жены — 2, а мужа — 1, Ести оба идут в разные места, то выигрыши игроков — нулевые,
В игре существует две ситуации равновесия: (1,1) и (2,2), Первая из них предпочтительней второму игроку, а вторая — первому. Если игроки будут действовать независимо, то первый выберет стратегию 2, а второй — стратегию 1, В результате оба получат по нулю. Пример 9,2 показывает, что необходим какой-то механизм координации при выборе стратегии, если существует несколько равновесий по Нэшу, Поэтому игры, подобные примеру 9,2, называют также "играми на координацию".
Использование ситуаций равновесия на практике часто связывается со следующим сценарием поведения игроков. Они сначала должны договориться о ситуации равновесия, затем всякие переговоры запрещаются и игроки независимо выбирают свои стратегии, возможно нарушая принятое соглашение. Заметим, что одному игроку будет невыгодно отклоняться от своей равновесной стратегии. Если игроки придерживаются в игре такого сценария поведения, то игра Г называется бескоалиционной.
Приведем еще один пример "игры на координацию".
Пример 9.3. Игроками являются два водителя, которым надо проехать через перекресток, к которому они подъехали одновременно. Есть две стратегии пересечения перекрестка: использовать "правило правой руки", согласно которому водитель должен пропустить помеху справа (стратегия 1), или "правило левой руки", согласно которому водитель должен пропустить помеху слева (стратегия 2), Если оба водителя придерживаются одного правила, то они успешно разъедутся, но если один из них использует "правило правой руки", а другой "правило левой руки", то может возникнуть авария. Следовательно, для благоприятного исхода в таких играх у всех игроков должен быть одинаковый подход к выбору правил поведения.
Упражнение 9.3. Объяснить (см, рис, 9,1), почему выигрыши игроков в последнем примере можно задать следующими матрицами:
пр.р лев.р
A _ пр.р / 1 -10
лев.р 1—1 0
|
|
пр.р |
лев.р |
|
B _ пр.р 1 |
f 0 |
— 10 |
|
лев.р \ |
? —1 |
1 |
1
Рис. 9.1
Рассмотренные в примерах 9,2 и 9,3 игры характеризуются следующими соотношениями элементов матриц выигрыша:

> Ьы\
< b22 /
Упражнение 9.4- Проверить, что при выполнении таких соотношений в игре всегда существует два равновесия по Нэшу,
Приведем пример, который показывает, что равновесие по Нэшу может быть неэффективным с точки зрения интересов игроков.
Пример 9-4- Игра "дилемма заключенного":
пр нет пр нет
A _ пр / —8 0\ B _ пр /—8 -10\
нет у —10 — 1 J ’ нет у 0 — 1 J ’
Интерпретация, Два бандита (игроки 1 и 2), подозреваемые в совершении тяжкого преступления, находятся изолированно друг от друга в предварительном заключении. Ввиду отсутствия прямых улик успех или неуспех обвинения зависит от признания (стратегия 1) или непризнания (стратегия 2) самих бандитов. Если оба бандита признаются (ситуация (1,1)), то они будут признаны виновными и приговорены к 8 годам тюрьмы, Если ни один из них не признается (ситуация (2,2)), то по обвинению в главном преступлении они будут оправданы, но обвинителю вее-таки удается доказать их виновность в некотором сопутствующем менее тяжком преступлении, например, в ношении оружия, в результате чего они будут приговорены к 1 году тюрьмы. Если, наконец, признается только один из них (ситуации (2,1) и (1,2)), то признавшийся будет освобожден (за помощь следствию), а непризнавшийся будет приговорен к отбытию максимального срока — 10 лет,
В этой игре имеется единственная ситуация равновесия (1,1): обоим признаться. Однако есть ситуация (2,2), более выгодная обоим игрокам, но не являющаяся ситуацией равновесия. Следовательно, равновесия по Нэшу могут быть неэффективны в том смысле, что за счет отклонения обоих игроков от ситуации равновесия можно улучшить выигрыши каждого из них.
Описанная в примере 9,4 игра имеет следующую структуру:

Упражнение 9.5. Проверить, что при выполнении таких соотношений в игре всегда существует единственное равновесие по Нэшу,
В связи с последним примером дадим определение ситуации, оптимальной по Парето.
Определение. Ситуация (x0,y0) игры Г называется оптимальной по Парето, если не существует такой ситуации (x,y) что выполнены неравенства
F(x,y) > F(x0,y0), G(x, y) > G(x°,y°)
и при этом хотя бы одно из них — строгое,
В примере 9,4 в ситуации (2,2) оба игрока получают по —1, что больше, чем их выигрыш —8 в ситуации равновесия (1,1). Следовательно, ситуация равновесия не является оптимальной по Парето,
Упражнение 9.6. Докажите, что в антагонистической игре любая ситуация оптимальна по Парето,
Следующий пример показывает, что не всегда равновесные стратегии являются максиминными.
Пример 9.5. Пусть
Здесь (1,1) — единственная ситуация равновесия, но стратегия 1 первого игрока не является макеиминной. Действительно,
W(1) = min a\j = 0, W(2) = min a2j = 2.
1<j<3 1<j<3
Стратегия 1 второго игрока также не является макеиминной. Если игрок неблагожелательно настроен по отношению к партнеру, то он может нарушить соглашение и вместо равновесной стратегии выбрать макси-минную. В результате он получит тот же выигрыш 2, что и в ситуации равновесия, а партнер получит 0,
Мы отметили три недостатка понятия равновесия по Нэшу:
1) равновесий по Нэшу в игре может не существовать;
2) равновесие по Нэшу может быть не единственно;
3) равновесие по Нэшу может быть неэффективно.
Но, несмотря на эти недостатки, указанное понятие играет центральную роль в теории принятия решений в конфликтных ситуациях.
Приведем теорему существования ситуации равновесия в игре двух лиц, которая является обобщением теоремы 2,3, Предварительно сформулируем топологическую теорему о неподвижной точке.
Теорема 9.1 (Брауэр), Пусть f : Z ^ Z — непрерывное отображение в себя выпуклого компакта Z конечномерного евклидова пространства, Тогда у него существует неподвижная точка z0 : f (z0) = z0.
Доказательство теоремы ем, в Приложении (ПЗ,П4),
Упражнение 9.7. Докажите теорему для X = [0,1].
Отметим, что все условия теоремы существенны. Например, если множество Z — невыпуклое, то утверждение теоремы может быть неверным. Действительно, если Z — окружность, a f — ее поворот на угол а < 2п, то f неподвижной точки не имеет.
Упражнение 9.8. Постройте контрпримеры к утверждению теоремы, если
1) Z = [0, w);
2) Z =(0,1];
3) Z = [0,1], но функция f разрывна.
Теорема 9.2. Пусть в игре двух лиц Г множеет ва Хи Y — выпуклые компакты евклидовых пространств Em и Еп. Предположим, что функции F (x, у) и G(x, у) непрерывны на Х х ^функция F (x, у) вогнут по x при любом фиксированном у, а функция G(x, у) вогнута по у при любом фиксированном x. Тогда в игре Г существует ситуация равновесия.
Доказательство. Вначале предположим, что функции F(x, у) и G(x, у) непрерывны на Х х Y и строго вогнуты по "своим"переменным x и у соответственно, Тогда для любых стратегий у a x множества наилучших ответов игроков
Х(у)=ArgmaxF(x^ = {x(y)}, Y(x)=/Argmax= {уД)}
xEX yEY
содержат по одному элементу x^) и у^). Согласно теореме 2,2, функции x^) и y(x) непрерывны. Будем называть их функциями наилучшего ответа первого и второго игроков соответственно.
Положим Z = Х х Y и рассмотрим отображение f : Z ^ Z, f (x/у) = ^(у),у^)). По теореме 9,1 отображение f имеет неподвижную точку z0 = (x0,y0) : f (z0) = z0 или x^0) = x0, y(x0) = у0. Следователь
но, (x0^0) — ситуация равновесия.
Теперь предположим, что функции F^,у) и G(x, у) вогнуты по "своим" переменным x и у, но необязательно строго. Положим
m m
^SO^ = F (x^ — ^^x2, — е?у2,
i=1 j=1
где е > 0. Функции F^x^) и Gs(x, у) непрерывны на Х х Y, F^x^) строго вогнута по x, a Gs(x, у) строго вогнута по у. По доказанному в игре Г = (Х, Y, Fs(x,у), Gs(x, у)) существует ситуация равновесия (x?, у?). Пусть {eh} — такая последовательность чисел, что eh ^ 0+ и соответствующая последовательность ситуаций равновесия {(x?h, у?к)} сходится к некоторой ситуации (x0,у0). По определению (x?h, у^)
Fsh (x,y?h ) < Feh (x?h ,у?h ) V x G Х,
Gsh (x?h, у) < GSh (x?h yy?h) V y E Y.
Переходя в этих неравенствах при фиксированных x и у к пределу при h ^ ж, получим
F(x,y°) < F(x°,y°) V x E X, G(x°,y) < G(x°,y°) V у E Y,
Это означает, что (x°,y°) — ситуация равновесия игры Г. ¦
Рассмотрим метод поиска ситуации равновесия е использованием множеств наилучших ответов X(y) = Arg max F(x, y) и Y(x) = Arg max G(x, y)
x€X уёУ
Он состоит в решении системы включений
x° E X(y°), y° E Y(x°). (9.1)
В случае, когда у игроков существуют непрерывные функции паи.лучшего ответа x(y) и y(x) (см, первую часть доказательства теоремы 9,2), система включений (9,1) эквивалентна системе уравнений
|
x(y°) = x°, y(x°) = |
= y°. |
|
|
|
Пример 9.6. Найдем все ситуации равновесия игры Г : |
|
|
/ 2 3 5 —1\ |
|
/ 7 5 4 7\ |
|
A = |
4 —2 3 4 |
, в = |
4 5 5 4 |
|
2 15 4 |
— 3 6 6 2 |
|
|
^—1 25 3/ |
|
у 8 7 3 6/ |
В матрице A подчеркнуты наибольшие элементы в столбцах, а в матрице B — наибольшие элементы в строках. Общий подчеркнутый элемент соответствует (3,3) — единственной ситуации равновесия.
Пример 9.7. Рассмотрим игру двух лиц Г = (X, Y, F(x, y), G(x, y)), где X, Y и F(x, y), G(x, y) — множества стратегий и функции выигрыша первого и второго игроков. Пусть
X = Y = [0,1], F(x,y) = —3x2 + 2y2 + 7xy, G(x,y) = —(x + y — 1)2.
Функции F(x,y) и G(x, y) строго вогнуты по переменным x и y соответственно, Функции наилучшего ответа —
0 < y < 6/7, 6/7 < y < 1,
7y/6,
1,
x(y)
y(x)
1 — x.
Решая систему x(y) = x, y(x) = у, находим x° = 7/13, у0 = 6/13.
Для численного решения системы включений (9,1) часто применяется процедура нащупывания по Курно. Она заключается в построении последовательности стратегий:
x1 е X, у1 е Y(x1), x2 е X(у1), у2 е Y(x2) и т.д.
Пусть последовательности стратегий {xk}, {yk} сходятся соответственно к x0 и у0. Тогда (x0,y0) — ситуация равновесия, поскольку для (x0,y0) справедлива система включений (9,1) (см, доказательство теоремы 2,2), Однако последовательности {xk}, {yk} сходятся не всегда.
Пример 9.8. Рассмотрим антагонистическую игру Г = (X, Y, F(x,y)), в которой
X = Y = [—1,1], F(x,у) = —x2 + 2axy + у2,
где a е (0,1] — параметр. Функция F(x, у) строго вогнута по x, строго выпукла по у и имеет единственную седловую точку (0,0). Функции наилучшего ответа игроков равны x(y) = ay, y(x) = —ax. Пусть x1 = 0. Тогда процедура нащупывания по Курно порождает последовательности {xk = (—a)k-1x1}, {yk = (—a)kx1}, сходящиеся при 0 < a < 1 и расходящиеся при a =1.
Следующий пример показывает, что для поиска равновесия по Нэшу можно использовать необходимые условия оптимальности первого порядка.
Пример 9.9. Модель дуополии. Две фирмы выпускают бесконечноделимый товар для продажи на рынке. Пусть x и у — количества товара, выпускаемого первой и второй фирмами, а 0 < c1 < c2 — затраты на его производство, т.е. себестоимости единицы товара для обеих фирм. Цена товара p(x + у) зависит от общего выпуска x + у. Функции выигрыша фирм F(x,y) = (p(x + у) — c1)x и G(x,y) = (p(x + у) — c2)y — прибыли, полученные от реализации произведенной продукции.
Пусть цена на продукцию определяется по следующей формуле p(x + у) = K/(x + y)a, где 1 > а > 0. Тогда можно считать, что X = [0, (А'М)1/а], поскольку при x > (K/c1)1/a первая фирма терпит убытки. Аналогично Y = [0, (K/c2)1/a].
Заметим, что для полученной игры выполнены условия теоремы 9,2 и ситуация равновесия (x0, у0) существует. Пуеть x0 > 0, у0 > 0. Тогда
равновесные стратегии х°, у0 находятся из системы уравнений
аКх0
К (х0,у0) = G (х0,у0) =
(х0 + у0) K
(х0 + у0)а+1 аКу°
- С2 -
(х0 + у°)а (х0 + у0)“+1
Складывая уравнения, находим сначала сумму
(2 - а)К \? Cl + С2 /
а
, а затем
C2 + (а - 1)c1 ,C1 + (а
х0 + у0
1 / (2 — а) К \(«+1)/«
— а)К V C1 + C2 '

(х0, у0)
а(2
Поскольку у0 > 0, то необходимо c1 + (а - 1)c2 > 0. Если выполнено неравенство c1 + (а - 1)c2 < 0, то первая фирма является на рынке монополистом и равновесные стратегии имеют вид
0.
(1 - а)К\1/а C1 ) ,
Байесовское равновесие
Пусть в игре двух лиц Г = (X, Y, F(х,у,с), F(х,у, с)) функции выигрыша игроков F(х,у,с) и С(х,у,с) зависят не только от ситуации (х,у), то и от случайного вектора параметров с = (с1,с2) Е C. Предположим, что множество C конечно и р(с), с Е C - вероятностное распределение на C, известное всем игрокам. Пусть Ck - множество значений, принимаемых параметром ск, когда вектор с пробегает множество C. Игроку k перед выбором стратегии становится известным значение "своего "параметра ск, k = 1, 2. Поэтому стратегией первого игрока является функция х : C1 ^ X, а второ го - функция у : C2 ^ Y, Множество всех таких функций х обозначим через X, а функций у - через Y.
Определим оередненные функции выигрыша игроков
Ях,у) = ^2 p^)F (x(c),y(c),c),
вес
С(х,у) = ^2 Р(с)С(х(с),у(с),с).
вес
Определение. Игра Г = (X, Y, І^(х,у), С(х,у)) и ситуации равновесия в ней называются байесовскими.
Пример 9.10. В продолжение примера 9,9 рассмотрим модель дуополии с функциями выигрыша игроков F(x,y,ci) = (p(x + y) — ci)x, G(x,y,c2) = (p(x+y) — c2)y и линейной функцией цены p(x+y) = a — x — y. Пусть себестоимость cl известна обоим игрокам, а себе стоимость c2 представляет собой случайную величину, принимающую значения c2 и c2 с вероятностью 1/2, В этих предположениях етратегия x игрока 1 является функцией-константой и совпадает с x. Положим уг = y(c2), i = 1, 2. Тогда в байесовской игре функции выигрыша игроков имеют вид
F(x, y) = (a — x — (У + У ) — x,
G(x,y) = x(a — x — yl — cl)yl + x(a — x — y2 — c2)y2.
Найдем байесовскую ситуацию равновесия (x0, (y0l,y02)) при a > 2max[cl,c2,c2]. Функции наилучшего ответа игроков имеют вид
yl + y2

x*(yl,y2)
max
a — c2
2
y*(c2,x)
i = 1, 2.
max
Решая систему уравнений
x*(yl,y2) = x, y*(c2,x) = y\ i = 1,2,
находим ситуацию равновесия
a — 2ci +
c2 + c2 2
у01 = ^ ( a + cl — 7 cl — 4c2
1 7 2 1 l
3 I a + cl — 4c2 — 4c2
.02
§10. Ситуации равновесия в биматричиых играх
Перейдем к смешанным расширениям биматричиых игр Г, задаваемых матрицами
A = (aij)
в = (Ьц)
ШХПі
ШХП'
Смешанные стратегии игроков здесь такие же, как и в матричной игре: p ? P, q ? Q. Ожидаемые выигрыши игроков —
А(р,о) = pian q,
i=i j=i
в (p,q) = p^ij qj.
i=l j=l
В результате получили смешанное расширение биматричной игры
Г = (p,Q,A(p,q),B(p,q)).
Ситуации равновесия игры Г будем называть ситуациями равновесия в смешанных стратегиях (или смешанными равновесиями по Нэшу) исходной игры Г.
Множества смешанных стратегий P и Q — выпуклые компакты евклидовых пространств, а функции A(p, q) и B(p, q) билинейны. По теореме 9,2 в игре Г существует ситуация равновесия с смешанных стратегиях (p°,q°). Для нее по определению выполнены неравенства
A(p,q0) < A(p°,q°) Vp ? p, B(p°,q) < B(p°,q°) V q ? Q.
Рассмотрим свойства ситуаций равновесия в смешанных стратегиях, аналогичные свойствам решений матричных игр.
Лемма 10.1. Для того чтобы ситуация (p°,q°) была ситуацией равновесия в смешанных стратегиях биматричной игры Г, необходимо и достаточно, чтобы было выполнено условие
A(i,q°) < A(p°,q°), i = l,...,m, B(p°,j) < B(p0,q0), j = l,...,n.
Доказательство. Необходимость, Пусть (p°,q°) — ситуация равновесия, Тогда A(p, q°) < A(p°, q°) V p ? P. Полагая p = (0, ...0, l, 0,..., 0), получим неравенства условия (*) для матрицы A. Аналогично выводятся неравенства для матрицы B.
Достаточность, Пусть ситуация (p0 , q0) удовлетворяет условию (*). Возьмем произвольную смешанную стратегию p первого игрока, домно-жим неравенства A(i,q°) < A(p°,q°) на pi и сложим их, В результате получим неравенство A(p,q0) < A(p0,q0). Аналогично, для любой смешанной стратегии q второго игрока справедливо неравенство B(p0,q) < B(p°,q°). ¦
Теорема 10.1 (свойство дополняющей нежесткости). Пусть (p0,q0) — ситуация равновесия в смешанных стратегиях биматричной игры Г. Тогда
1) р° > 0 ^ A(i,q0) = A(p0,q0);
2) qj > 0 ^ B(p0,j) = B(p0,q0).
Доказательство. Докажем утверждение 1), Предположим, что для некоторого i1 p0l > 0 и A(ibq0) < A(p0, q0). В условии (*) каждое неравенство A(i,q0) < A(p0,q0), i = 1,..., m умножим на p0 и сложим их. Поскольку А-е неравенство сохранится строгим, получим A(p0,q0) < A(p0,q0) (противоречие). Утверждение 2) доказывается аналогично, ¦
Следствие. Пусть (p0,q0) — ситуация равновесия в смешанных стратегиях биматричной игры Г. Тогда
1) A(i,q0) < A(p0,q0) ^ p0 = 0;
2) B(p0,j) < B(p0,q0) ^ q0 = 0.
Теорема 10.2. Для того чтобы ситуация (p0, q0) была ситуацией равновесия в смешанных стратегиях биматричной игры Г, необходимо и достаточно, чтобы нашлись множества X0 С X, Y0 С Y и числа v1,v2, для которых выполнены условия
|
У |
aij qjj |
= |
Vi |
|
V i |
: g |
X 0 |
|
jev0 |
|
|
|
|
|
|
|
|
Е |
aij qj |
< |
Vi |
|
V i |
: e |
X 0 |
|
jev0 |
|
|
|
|
|
|
|
Е |
q0 = |
1, |
q0 |
> 0 |
V j |
i G |
Y 0 |
|
jev0 |
|
|
|
|
|
|
? |
pi bij |
= |
V2 |
|
V j e |
Y 0 |
|
iex0 |
|
|
|
|
|
|
|
|
Е |
p%j |
< |
V2 |
|
V j i |
Y 0 |
|
iex0 |
|
|
|
|
|
|
|
|
Е |
p0 = |
1, |
p0 |
> 0 |
V г |
; G |
X 0 |
|
|
Kiex° |
(10.1)
(10.2)
Доказательство. Необходимость, Пусть (p°,q°) — ситуация равновесия, Положим ?\ = A(p°,q°), v2 = B(p°,q°),
X0 = {i e X | > 0}, Y0 = {j e Y | q° > 0}.
Условия (10,1) и (10,2) вытекают из леммы 10,1 и теоремы 10,1,
Достаточность, Пусть для ситуации (p0, q0) выполнены условия (10,1) и (10,2), Покажем, что тогда необходимо A(p0,q0) = vi. Действительно, из (10.1)
П
У, aijqj = У aijqj = Vi V i e X0.
jeY0 j=i
Умножая эти равенства нар0, i e X0, и складывая их, получим A(p0,q0) = vi. Анмогично доказывается, что B(p0,q0) = v2, По лемме 10,1 (p0,q0) является ситуацией равновесия, ¦
Упражнение 10.1. Докажите, что в игре Г с матрицами
существует единственное равновесие по Нэшу
(p0, q0) = ((1/3,1/3,1/3), (1/3,1/3,1/3)).
Сформулируем условие, обеспечивающее равенство |X0| = |Y0|Ч В этом случае матрицы систем (9,7) и (9,8)
A = (aij)iex0jeY0, B = (bij)iex0j&0
являются квадратными.
Определение. Говорят, что система векторов a(i) e Em, i e X0, |X0| > m +1 имеет максимальный аффинный, ранг, если найдутся такой номер i0 e X0 и такое множество X С X0, i0 e X, |X | = m, что векторы a(i) — a(i0), i e X линейно независимы. Напри мер, при m = 2 система точек на плоскости тогда и только тогда имеет максимальный аффинный ранг, когда точки не лежат на одной прямой.
Определение. Говорят, что матрица A (матрица B) находится в общем положении, если система строк (столбцов) любой ее подматрицы A =
(aij)iex°jeY° с |X0| > |У0| (подматрицы B = (bj)i€x°jeY° e |X0| < |У0|)
имеет максимальный аффинный ранг.
Отметим, что для любых двух матриц A и B найдутся сколь угодно поэлементно близкие матрицы A' и B', для которых выполнено условие общности положения. Это утверждение можно доказать, используя непрерывность определителя матрицы как функции ее элементов.
Теорема 10.3. Пусть матрицы A и B игры Г находятся в общем положении. Тогда для любой ситуации равновесия (p°,q°) в смешанных стратегиях найдутся такие множества X0 С X, У0 С Y и такие числа v\, v2, что выполнены условия (10,1), (10,2) и |Х0| = |У01.
Доказательство. Пусть (p0,q0) — произвольная ситуация равновесия в смешанных стратегиях. Тогда по теореме 10,2 найдутся такие множества X0 С X, У0 С У и такие числа vi,v2, что выполнены условия (10,1) и (10.2).
Докажем, что |X0| = |У01. Предположим, что |X0| > |У0|. Рассмотрим подматрицу A = (aij)ieX°jeY°, отвечающую системе уравнений (10,1), Из условия общности положения найдутся такой номер i0 ? X0 и такое множество X1 С X0, i0 ? X1, |X 1| = |У0|, что матрица (aij — ai°j)ieXijeY° — невырожденная.
Из (10,1) получаем систему уравнений
^ (aij — ai°j)qj = 0 V i ? X1, jeY °
имеющ?ю нулевое решение qj1 = 0, j ? У0, что противоречит равенству
Е qj0 = i."
jeY °
Аналогично приходим к противоречию, предполагая, что |X0| < |У0|,
¦
Условие общности положения для матриц An B трудно проверить. Отказавшись от него, можно получить утверждение, более слабое, чем теорема 10,3,
Теорема 10.3'. В любой биматричной игре Г для некоторой ситуации равновесия (p0,q0) в смешанных стратегиях найдутся такие множества X0 С X, У0 С У и такие числа v1,v2, что выполнены условия (10,1), (10.2) и |X0| = |У0|.
Доказательство. Для матриц A и B найдутся такие последовательности матриц {Ak}, {Bk}, удовлетворяющих условию общности положения, что поэлементно Ak ^ A, Bk ^ B.
Возьмем последовательность ситуаций равновесия {(pk , qk)} игр Гк с матрицами Ak , Bk. По теореме 10,3 найдутся такие множества Xk С X, Yk С Y и числа v\,vk, что \Xk| = |Yk| и выполнены условия
ГЕ
jeYk
aij qj
vk
' E pk bkj. = v2k
iexk
V j e Yk,
V j eYk,
Vi e Xk.
< E aij qk < vf
jeYk
< E pki bij < vk iexk
e pk = i, pk > о
jexk
E qjk = 1, j > 0
jeYk
Без потери общности (выделяя соответствующие подпоследовательности) можно считать, что pk ^ p0, qk ^ q0 и Xk = X0, Yk = Y0 при
всех к. Переходя в последних уравнениях и неравенствах к пределу при к ^ то, получим условия (10.1),(10.2) для емешанных стратегий p0,q0. По теореме 10,2 ситуация (p0,q0) будет равновесием по Нэшу, ¦
Рассмотрим алгоритм поиска ситуаций равновесия в смешанных стратегиях, Перебираем квадратные подматрицы
A (aij)iex0jeY0, B (bij)iex0jeY
и решаем системы уравнений из (10,1),(10,2), Если решения этих систем p0, i e X0, vi и q0, j e Y0, v2 удовлетворяют неравенствам из условий 10,1 и 10,2, то, добавляя компоненты pi = 0, i e X0, qj = 0, j e Y0, получим ситуацию равновесия (p0, q0^. № теоремы 10,3' вытекает, что через конечное число шагов алгоритм приводит к ситуации равновесия. Проиллюстрируем работу алгоритма для игр с матрицами размеров 2 х n :
bii
b2i
bin
b2n
aii
a2i
ain
a2n
В данном случае смешанная стратегия первого игрока имеет вид p = (pi, 1 — pi)^i;e 0 < pi < 1. Перебирать нужно 2 x 2-подматрицы, Каждая из них задается номерами двух столбцов j, j2. Запишем систему (10,2)
p°bijl + (1 — p0)b2ji = v2, p0bij2 + (1 — p0)b2j2 = v2,
p°bij + (1 — pi)b2j < v2 V j = jl, j2, 0 < p0 < 1.
Если эта система несовместна, то перейдем к другой паре j, j2. Если решение p?,vi системы (10,2) существует, то рассмотрим систему (10,1)
aijiq* + aij2(1 — q*) = vi, a2jq* + a2j2(1 — q*) = vi, 0 < q* < 1.
Пусть существует ее решение q*,v\. Определим стратегию
fq*, j = 3ь
q0: q0 = fi - q*, 3 = 32
[o, 3 = 31,3 2,
и ситуация (p0,q0) будет смешанным равновесием по Нэшу,
Здесь алгоритму можно дать геометрическую интерпретацию. На отрезке 0 < p1 < 1 строим прямые lj(p1) = b1jp1 + b2j(1 — p1), j = 1 ,...,n. Точки излома верхней огибающей семейства прямых lj соответствуют парам j1,j2, для которых существует решение p?,v2 системы (10,2), Поэтому последовательно перебираем точки верхней огибающей и решаем систему уравнений из (10,1) с проверкой неравенств 0 < q* < 1.
При n = 2 обе матрицы A и B имеют размеры 2 х 2, В этом случае прямые l1(p1) = b11p1+b21(1— p^ и l2(p1) = b12p1+b22(1—p1) тогда и только тогда пересекаются в точке 0 < p°1 < 1, когда выполнено неравенство (рис, 10,1)
(b22 — b21)(b11 — b12) > °. (10.3)

Если столбцы матрицы B (и соответствующие прямые ^ и l2) не совпадают, то компоненты смешанной стратегии р°, удовлетворяющей системе (10,2), можно записать в явном виде
(10.4)
0 = b22 — b21 0 = b11 — b12
^1 b22 — b21 + b11 — b12 ’ ^2 b22 — b21 + b11 — b12
Для системы (10,1), из которой вычисляется смешанная стратегия второго игрока, все рассуждения проводятся аналогичным образом, В результате мы получим следующее условие на матрицу первого игрока, обеспечивающее существование решения системы (10,1):
(«22 - «12)(«11 - «21) > 0. (10.5)
Это условие можно выписать и сразу, исходя из следующих соображений: надо заменить второго игрока первым и учесть, что второй игрок выбирал свои стратегии по столбцам, а первый выбирает их по строкам. Поэтому, чтобы выписать условие существования решения, надо выписать условие (10,3), заменив одну матрицу на другую, а строки на столбцы, Если строки матрицы A не совпадают, то компоненты смешанной стратегии q°, удовлетворяющей системе (10,1), можно записать в явном виде
«11 — «21
«22 — «12 + «11 — «21
(10.6)
о «22 — «12 о
qi =-:-, q2
«22 — «12 + «11 — «21
Пример 10.1. Модель технического контроля за качеством продукции. Завод выпускает автомобили партиями по 100 штук. За каждую автомашину завод получает от концерна 1,3 ед, оплаты, из которых 1 ед, составляют премиальные, а 0,3 ед, предназначены для операций технического контроля (ОТК), Завод (игрок 1) может выпускать партию автомобилей либо с ОТК (стратегия 1), либо без ОТК (стратегия 2), увеличивая сумму премиальных. При использовании первой стратегии итоговая сумма премиальных, полученная заводом за партию, составляет 100 ед,, при использовании второй стратегии — 130 ед,
С целью уменьшения производственного брака концерн решил привлечь независимую фирму, осуществляющую технический контроль за качеством продукции. Стоимость проверки автомобиля для фирмы составляет 0,12 ед. Если ОТК заводом не проводится, то автомобиль неисправен с вероятностью 4/5. В случае обнаружения неисправностей завод обязан их устранить, затратив 0,3 ед,, и заплатить дополнительно фирме 0,2 ед, из своих премиальных. Фирма (игрок 2) может либо проверить партию (стратегия 1), либо отказаться от ее проверки (стратегия 2), Выигрышем первого игрока является ожидаемая сумма премиальных, полученная заводом от концерна за партию автомобилей с учетом издержек на ОТК и возможных выплат фирме. Выигрышем второго игрока является ожидаемая сумма выплат, полученных от завода при проверке партии автомобилей е учетом затрат на эту проверку. Выпишем матрицы игры
12 0 4 0
100 100 90 130
Например, если завод не проводит ТК, а фирма проверяет партию, то средние премиальные равны 100(0.8(4/5) + 1.3(1/4)) = 90 ед,, а ожидаемая прибыль фирмы составит 100(0.08(4/5) — 0.12(1/5)) = 4 ед. Нетрудно видеть, что в данной игре не существует ситуации равновесия в чистых стратегиях. Условия (10,3) и (10,5) выполнены и ситуацию равновесия находим по формулам (10,4) и (10,6)
(р0, q0) = ((1/4, 3/4), (3/4,1/4)).
Равновесные стратегии р0 и q0 могут быть реализованы в виде "физических смесей": первый игрок "должен"25 автомобилей каждой партии выпускать с ОТК, второй игрок должен проверять по 75 автомобилей каждой партии.
Пример 10.2. Пусть

Здесь /і(рі) = 3рі, /2(рі) = 2, /з(рі) = 3(1 — pi). Первая точка верхней огибающей ( пересечение прямых 12 и 13 на рис, 10,2) имеет абсциссу
рі = 1/3. Рассмотрим систему уравнений из 10,1
4q* + 5(1 - q*) = vb 2q* + (1 - q*) = щ.
Из нее находим q* = 2 > 1, что невозможно. Переходим ко второй точке огибающей, лежащей на пересечении прямых Іі и І2, Она имеет абсциссу РІ = 2/3. Система
2q* + 4(1 - q*) = vi, 4q* + 2(1 - q*) = vi
имеет решение q* = 1/2, vi = 3. Поэтому
(p0, q0) = ((2/3,1/3), (1/2,1/2,0))
- искомая ситуация равновесия в смешанных стратегиях.
Отметим, что рассматриваемый алгоритм не всегда приводит к нахождению всех ситуаций равновесия.
Пример 10.3. Пусть
Здесь пересечение прямых Іі и І2 дает стратегию р0 = (1, 0) с нулевой компонентой (вырожденный случай). Решая систему уравнений из (10,1), находим q0 = (1/2,1/2). Полученная ситуация равновесия не единственна, Действительно, запишем условие (10,1) для стратегии (q*, 1 - q*) второго игрока с учетом свойства дополняющей нежесткости
1 - q* = vi, q* < vi, 0 < q* < 1.
Отсюда 0 < q* < 1/2, Таким образом, в данном примере получили целый отрезок ситуаций равновесия {((1, 0), (q*, 1 - q*)) | 0 < q* < 1/2}.
Для игры с матрицами размеров 3 х 3 поиск смешанных равновесий по Нэшу уже требует достаточно большого перебора всевозможных подматриц исходных матриц +iB. Однако в некоторых случаях, обсуждаемых в следующих двух параграфах, этот перебор можно значительно сократить.
Вполне смешанное равновесие
Определение. Ситуация равновесия называется вполне смешанной, если все чистые стратегии используются с положительными вероятностями.
В общих предположениях (для "почти любой биматричной игры") вполне смешанное равновесие может существовать, только сели m = n. Это интуитивно понятно: для нахождения смешанной стратегии второго игрока, в которой все компоненты отличны от нуля, требуется решить систему уравнений из (10,1), содержащую m + 1 уравнение с n + 1 неизвестным (число элементов во множестве Y плюс еще одно неизвестное щ), Следовательно, для существования решения должно выполняться условие n > m. Аналогично, смешанная стратегия первого игрока удовлетворяет системе уравнений из (10,2), содержащей n +1 уравнение с m + 1 неизвестным, и для существования решения должно быть m > n. В результате получаем, что для существования решения обеих систем должно быть m = n, если обе системы невырожденные.
Выпишем для вполне смешанного равновесия (p°,q°) системы уравнений из (10,1) и (10,2) в матричном виде
Aq° = ще, (q°,e) = 1, p°B = v2e, (p°,e) = 1,
где e = (1,..., 1) E Em.
Аналогичные системы (5,3) и (5,4) справедливы для крайних оптимальных смешанных стратегий из 5, (Там же см, и способ нахождения решения этих систем.) Пусть матрицы A и B — невырожденные. Тогда
A 1 е
(A-1e, е) ,
1
(A-1 е, е) ,
?1
еВ-1 _ 1
(еВ-1,е) , ?2 = (еВ-1,е) .
Доминирование в биматричных играх
При поиске ситуаций равновесия в биматричных играх можно использовать доминирование строк матрицы A и столбцов матрицы В.
Определение. Будем говорить, что в биматричной игре Г стратегия первого игрока i1 строго доминирует стратегию i2 (i1 У i2) на множестве Y С Y, если ailj > ai2j V j E Y, Будем говорить о слабом доминировании, (і1 У i2), еели ai1j > ai2j V j E Y,
По смыслу при строгом доминировании стратегия і1 приносит первому игроку больший выигрыш, чем стратегия і2, как бы ни играл второй игрок, используя стратегии из множества Y. Аналогично вводятся понятия строгого и слабого доминирования для стратегий второго игрока.
Определение. Будем говорить, что в биматричной игре Г стратегия второго игрока ji строго доминирует стратегию j2 (ji >- j2) на множестве X С X, если bij1 > bij2 V i ? X. Будем говорить о слабом доминировании (ji h J2), еели biji > bij2 V i ? X.
Определим процедуру последовательного исключения строго доминируемых стратегий. Эта процедура состоит в построении двух последовательностей вложенных множеств X = X1 D X2 D • • • D Xk и Y = Y1 D Y2 D • • • D Yk. При этом для l = 1,..., k — 1 выполнены следующие условия:
V І2 ? Xi\Xi+i 3 ii ? Xi+i : ii ^ І2Иa Yi;
V j2 ? Yi\Yi+i 3 ji ? Y+ : ji ^ j2 на Xt.
Мы описали процедуру последовательного исключения стратегий формально, Посмотрим, как эта процедура осуществляется на практике.
Шаг 1, Из множеств X = Xi и Y = Yi строим множеетва X2 и Y2. Для этого выкидываем из множества Xi все строго доминируемые на множестве Yi стратегии, т,е, мы ищем такие пары стратегий ii, i2, что строка ii поэлементно больше строки i2 в матрице A : ai1j > ai2j, j = 1 ,...,n. Вычеркиваем все такие найденные строки i2 в обеих матрицах. Аналогично ищем столбцы j2 в матри це B второго игрока, которые строго доминируются другими столбцами ji : bij1 > bij2, i = 1, ...,m. Вычеркиваем все такие доминируемые столбцы j2 из обеих матриц. Предположим, что нам удалось вычеркнуть хотя бы одну строку или столбец. Тогда переходим к шагу 2,
Шаг 2, После вычеркивания строк и столбцов на первом шаге мы получили редуцированные матрицы, в которых множество строк — X2, а множество столбцов — Y2. При этом либо X2 = Xi, либо Y2 = Yi, либо
оба множества не совпадают с предыдущими. Может получиться так, что в редуцированных матрицах окажутся новые доминируемые строки и столбцы. Вычеркиваем их и переходим к следующему шагу,
И так далее. Продолжаем процедуру до тех пор, пока не вычеркнем все, что можно. Ниже доказано, что при этом сохраняются все смешанные равновесия по Нэшу,
Определение. Будем говорить, что множество Z = X х Y строго доминирует множество Z = X х Y (Z >- Z), если оно получено из множества
Z последовательным исключением строго доминируемых стратегий, т.е. в описанной выше процедуре X = Xk, Y = Yk. Будем говорить о слабом доминировании (Z У Z), ести множество Z получено го множества Z последовательным исключением слабо доминируемых стратегий.
Рассмотрим понятие доминирования в смешанных стратегиях.
Определение. Будем говорить, что смешанная стратегия p строго доминирует чистую стратегию г на множестве Y С Y (р У г), если A(p, j) > aij V j G Y. Будем говорить о слабом доминировании на множестве Y С Y (р У г), если A(p,j) > aij V j G Y.
Аналогично определяется доминирование в смешанных стратегиях второго игрока.
Как искать строго доминируемую стратегию?
Пример 10.4- Рассмотрим игру Г с матрицами
Найдём в каждом столбце первой матрицы максимальный элемент. Если максимум единственный и стоит в некоторой строке, то она не может быть строго доминируемой. Следовательно, строго доминируемой может быть только первая строка, В чистых стратегиях доминирования нет. Исследуем доминирование в смешанных стратегиях. Возьмём вторую и третью строки с коэффициентами 1/2, Видно, что эта комбинация строго доминирует первую строку.
Введём понятия доминирующих множеств для смешанных стратегий.
Определение. Будем говорить, что множество Z = X х Y строго доминирует множество Z = X х Y в смешанных стратегиях (Z У Z), если оно получено из множества Z последовательным исключением строго доминируемых по смешанному доминированию стратегий, т.е,
Z = Zk С Zfc-1 С ••• С Zi = Z, Zi = Xi х Y, l = 1,..., k,
и выполнены условия
V г G Xi\Xi+i 3 р G P : р У г на Y, Ps = 0 V s G Xi+i;
V j G Y\Yi+1 3 q G Q : q У j на X, qk = 0 V к G Y+i.
Будем говорить, что множество Z = X х Y слабо доминирует множество Z = X х Y в смешанных стратегиях (Z У Z), если оно получено
из множества Z последовательным исключением слабо доминируемых по смешанному доминированию стратегий, т.е.
Z = Zk С Zk-1 С ••• С Zi = Z, Zi = Xt х Y, l = 1,..., k, и выполнены условия
V i e Xi \Xt+1 3 p e P : p У imxYi, ps = 0 V s (/ X+;
V j e Yi\Y+i 3 q e Q : q У ^aXi, qk = 0 V k e Yl+i.
Как связаны различные отношения доминирования?
строгое доминирование в чистых стратегиях
слабое доминирование в чистых стратегиях
строгое доминирование в смешанных стратегиях
слабое доминирование в смешанных стратегиях
Вернёмся к примеру 10,4 и найдём доминирующие множества. Первую строку мы вычеркнули, так как она строго доминируема комбинацией второй и третьей строк. Рассмотрим вторую матрицу. Можно заметить, что первый столбец строго доминируется, например, вторым столбцом. Следовательно, первый столбец можно вычеркнуть. Получаем, что
{2, 3} х {2, 3}^ Z.
Теперь сформулируем теорему о связи исключения доминируемых стратегий и поиска смешанных равновесий по Нэшу,
Теорема 10.4. 1) Пусть множество Z = X х Y строго доминирует множество Z = X х Y в смешанных стратегиях. Тогда для любой ситуации равновесия (p0,q0) выполнены условия
i e X ^ р°і = 0;
j e Y ^ q0 = °.
2) Пусть множество Z = X х Y слабо доминирует множество Z = X х Y в смешанных стратегиях и (p,q) — ситуация равновесия в игре с матрицами
A (aij)iex jeY, B (bij)iex jeY
Определим смешанные стратегии
Pi i е X,
0, І е X\X;
Qj, j е Y,
0, j е Y\Y.
Р0 : Р°і
q0: «0
Тогда (p0,Q0) — ситуация равновесия в исход ной игре Г.
Упражнение 10.2. Докажите теорему 10,4,
Обсудим смысл теоремы. Второе утверждение говорит о том, что если редуцированная игра получена путем исключения слабо доминируемых стратегий, то каждому смешанному равновесию по Нэшу (р, q) в этой редуцированной игре будет соответствовать смешанное равновесие по Нэшу (р0, q0) в исходной игре, определяемое по указанному правилу. Первое утверждение теоремы показывает, что при вычёркивании строк и столбцов по строгому доминированию мы не теряем равновесий по Нэшу,
Таким образом, при поиске всех равновесий по Нэшу можно вычеркнуть все строго доминируемые строки и столбцы и искать равновесие в редуцированной игре. Дополнив нулями найденное равновесие, мы получим равновесие смешанное в исходной игре. Если необходимо найти хотя бы одно смешанное равновесие по Нэшу, тогда можно вычёркивать строки и столбцы по нестрогому доминированию. Исключение строк и столбцов позволяет сократить перебор подматриц для поиска равновесий по Нэшу, В примере 10,4 после исключения строго доминируемых стратегий получим редуцированную игру

В этой игре ситуация (p,q) = ((3/5,2/5), (7/11,4/11)) является единственным смешанным равновесием по Нэшу, Следовательно, ситуация (p0,Q0) = ((0, 3/5, 2/5), (0, 7/11,4/11)) является смешанным равновесием по Нэшу в исходной игре Г.
Пример 10.5. Рассмотрим игру Г с матрицами
Ищем максимальные элементы в столбцах первой матрицы, В чистых стратегиях доминирования нет. Рассмотрим доминирование в смешанных стратегиях. Видно, что четвёртая строка строго доминируется комбинацией второй и третьей строк с весами 1/2, Поэтому ее можно вычеркнуть.
Теперь найдём максимальные элементы в строках второй (редуцированной) матрицы. Второй столбец строго доминируется комбинацией первого и четвёртого столбцов с весами 1/3 — еж 2/3 + е при малых е > 0. Мы можем вычеркнуть второй столбец. Следовательно, {1, 2, 3} х {1, 3, 4} + Z, В результате исключения четвертой строки и второго столбца получим следующие редуцированные матрицы:
_ /2 6 0\ _ /7 6 0\
A = I 3 0 4 I , B = I 0 0 4 I .
\0 7 0/ \0 2 3/
Повторяем процедуру последовательного исключения стратегий для редуцированных матриц. Ищем максимальные элементы в столбцах первой матрицы, В чистых стратегиях доминирования нет. Рассмотрим доминирование в смешанных стратегиях. Вторую и третью строку исключить невозможно, так как в них содержатся максимальные по столбцам элементы. Первая строка не содержит ни одного максимального по столбцу элемента, однако, ее также невозможно исключить, так как она не доминируется ни одной линейной комбинацией второй и третьей строки. Аналогично, невозможно исключить ни один столбец во второй матрице. Следовательно, процедура исключения по доминированию смешанными стратегиями завершена и {1, 2, 3} х {1,3, 4} = Z,
Позитивный подход к понятию равновесия
Следует отметить, что использование смешанных стратегий с помощью механизма бросания монет или других подобных механизмов не характерно для реального поведения людей. Другая интерпретация смешанных равновесий относятся к играм, соответствующим типичным конфликтным ситуациям, в которых принимают участие много индивидуумов, Такие ситуации описаны в примерах 9,1-4: множество покупателей приходит на рынок и сталкивается с множеством продавцов; различные пары водителей сталкиваются у перекрестков и т.п. Позитивный подход к равновесию в смешанных стратегиях предполагает, что каждая такая стратегия описывает распределение индивидуумов в соответствующей роли. Например, если (p0,q0) — ситуация равновесия в игре "продавец-покупатель" (пример 9,1), то на практике доля р\ продавцов ведет себя честно, а доля р° обманывает, доля q1 покупателей не проверяет купленный товар, а остальные проверяют, и т.п. Очевидно, что лишь если распределения по стратегиям в каждой роли соответствуют смешанным равновесиям по Нэшу, то ни у кого не будет стимула поменять стратегию поведения. Формально это отражено в лемме 10,1 и теореме 10,1, Поэтому можно ожидать, что стабильные распределения по стратегиям в реальных взаимодействиях больших групп отвечают смешанным равновесиям по Нэшу, Теоретическое обоснование этого тезиса дают динамические модели поведения (ем, §14), Примером модели поведения игроков может служить метод Брауна фиктивного разыгрывания матричной игры, изложенный в § 5, Аналогичный метод можно применять и для поиска ситуаций равновесия в биматричных играх специального вида.
Определение. Игру Г с матрицами А и B назовем эквивалентной антагонистической, если найдется такая матрица А' = (aj)mxn (антагонистической игры) и найдутся такие числа fj, j = 1 ,...,n, gi, i = l,...,m, что
aij = aij + fj, bij = —a'ij + g^ i ^..^m j = 1,...,n. (10.7)
Заметим, что матрица А' и коэффициенты fj, gi здесь определяются не однозначно. Действительно, если они удовлетворяют равенствам (10,7), то для любого числа c матрица с элементами aij + си коэффициенты fj — с, gi + с также удовлетворяют (10,7),
Если игра Г эквивалентна антагонистической, то сумма ее матриц представима в виде А + B = (gi + fj)mxn. Обратно, если такое представление имеет место, то Г эквивалентна антагонистической игре с матрицей
А (aij fj )mxn ( bij + gi)mxn.
Упражнение 10.3. Пусть биматричная игра Г эквивалентна антагонистической игре с матрицей А', а f\ = 0. Выразите элементы матрицы А' через элементы матриц А и B,
Упражнение 10-4- Пусть биматричная игра Г эквивалентна антагонистической игре Г'. Для того чтобы пара (p0, q0) была седловой точкой в смешанных стратегиях игры Г', необходимо и достаточно, чтобы (p0,q0) была ситуацией равновесия игры Г. Докажите,
Определим итерационный процесс, аналогичный процессу Брауна из
§5.
Шаг 1. Игроки выбирают произвольно стратегии А и j1.
Пусть за k повторений игры первый игрок выбрал стратегии i1,..., ik, а второй — стратег ии j1,...,jk. При этом p(k) и q(k) — соответствующие векторы частот.
Шаг к + 1. Игроки выбирают стратегии ik+1 и jk+1 из условий A(ik+i,q(k)) = max A(i,q(k)), В(p(k),jk+1) = max B(p(k),j).
1 <i<m 1<3<n
Каждый игрок выбирает свою чистую стратегию как наилучший ответ на соответствующий вектор частот партнера. Если наилучших ответов несколько, то выбирается любой из них.
Теорема 10.5. Пусть биматричная игра Г эквивалентна антагонистической, Тогда любая предельная точка (p°,q°) последовательности {(p(k), q(k))} итерационного процесса является ситуацией равновесия игры Г.
Упражнение 10.5. Докажите теорему 10,5,
Если биматричная игра Г не эквивалентна антагонистической, то утверждение теоремы 10,5 может быть неверным. Вся оставшаяся часть параграфа будет посвящена доказательству этого факта, В качестве примера рассмотрим игру Г из упражнения 10,1 с матрицами
/2 0 1\ /10 2\
A = 11 2 01 , В = 12 1 01 ,
\0 12/ \0 2 1/
в которой существует единственное смешанное равновесие по Нэшу ' (p°, q°) = ((1/3,1/3,1/3), (1/3,1/3,1/3)).
Пусть el ? E3 — вектор, i-ая компонента которого равна 1, а две другие равны нулю. Пусть с (k + 1)-го по (k + Д-ый шаг первый игрок выбирал чистую стратегию i. Тогда
kp(k) + sel k + s
p(k) +
p(k + s)
Нетрудно видеть, что точка p(k + t) при изменении t = 0,1,..., s, перемещается вдоль отрезка [p(s),el] от точки p(s) до точки p(k + s). Аналогичная формула может быть записана и для векторов частот второго игрока.
Пусть на некотором k-ом шаге (к > 1) возникла пара (ik, jk) = (1,1). Это означает, что выполнены неравенства A(1,q(k - 1)) > A(i,q(k - 1)), i = 2, 3,
В(p(k - ^ 1) > В(p(k - 1),j), j = Д 3.
Тогда
(k - 1)A(1,q(k - 1)) + A(1,e1) k
A(1,q(k))
1)A(1, q(k - 1)) + 2 > (k - 1)A(2, q(k - 1)) + 1
(k
A(2,q(k)).
Аналогично доказывается, что A(1,q(k)) > A(3,q(k)). Поэтому необходимо ik+1 = 1. Далее,
B(P(k), 1)
(k - 1)B(p(k - 1), 1) + В(e1,1) k
B(P(k), 2)
(k - 1)B(p(k - 1),1) + 1 > (k - 1)B(p(k - 1), 2)
k k
и, следовательно, jk+1 = 2.
Таким образом, на (k + 1)-м шаге возникнет пара (1,1) или (1,3), Причем после нескольких возможных повторений пара (1,1) обязательно перейдет в пару (1,3). Аналогично доказывается, что после пары (1,3) процесс обязательно перейдет в пару (3,3) и т.д. по схеме
(1,1) ^ (1,3) ^ (3, 3) ^ (3, 2)^ (2, 2) ^ (2,1) ^ (1,1).
Пусть на (k + 1)-м шаге процесс перешел с пары (2,1) на пару (1,1) (т.е, ik = 2, jk = 1, ik+1 = jk+1 = 1), на (k + s + 1)-м шаге - с пары (1,1) на пару (1,3), а на (k + s +1 + 1)-м шаге - с пары (1,3) на пару (3,3):
k k+s k+s+t
..., (2,1), (1,1),..., (1,1), (1,3),..., (1,3), (3, 3),...
Тогда A(1,q(k)) > A(3,q(k)) и
A(3,q(k + s + t)) = kA(3-q(k)) + sai1 + ta33 > A(1, q(k + s + t))
k + s + t
= kA(1, q(k)) + san + ta1^ kA(3, q(k)) + san + ta13 k + s + t > k + s + t
Отсюда получаем неравенство sa31 + ta33 > sa11 + ta13 или t > 2s.
Итак, "пребывание"процесса в его остановке на паре (1,3) будет по крайней мере в два раза продолжительнее, чем на непосредственно предшествовавшей остановке на паре (1,1). Точно так же последующая остановка на паре (3,3) по крайней мере в два раза продолжительнее, чем на паре (1,3) и т.д.
Теперь рассмотрим, как меняются стратегии игроков. Если первый игрок на некотором шаге использует стратегию 1, то в дальнейшем он ее сменит на стратегию 3, потом стратегию 3 на стратегию 2 и т.д. по следующему циклу: 1 ^ 3 ^ 2 ^ 1. Разобьем рассматриваемый процесс на отрезки шагов постоянного использования первым игроком своих чистых стратегий. Длина такого отрезка — это число содержащихся в нем шагов.
Лемма 10.1. Длина отрезка постоянного использования первым игроком любой чистой стратегии более, чем в три раза превышает число шагов процесса, предшествовавших данному отрезку.
Доказательство. Без потери общности будем считать, что процесс начинается с пары стратегий (А,Д) = (1,1). Пусть первый игрок Іі = 1 + s раз подряд, начиная с первого шага, выбирал стратегию 1 ( один раз при паре (1,1) и s раз при паре (1,3)). Далее, пусть он І3 = t + h раз выбирал стратегию 3 ( t раз при паре (3,3) и h раз при паре (3,2)). Затем он І2 раза подряд выбирал стратегию 2. Тогда, согласно ранее доказанному, s > 2, t > 2s, h > 21 > 4s ^ i3 = t + h > 6s. Ho l1 = 1 + s < 3s/2 < l3/4. Следовательно, i3 > 4l1 > 3l1. Аналогично можно доказать неравенство i2 > 4І3 > 3(l1 + i3).
Итак, утверждение леммы доказано для начальных отрезков использования стратегий 1,3 и 2. Завершим доказательство индукцией по числу отрезков использования первым игроком своих стратегий.
Пусть ik = 3 и, начиная е (k + 1)-го шага, первый игрок і2 раз использовал стратегию 2, затем с (k + І2 + 1)-го шага он І( раз использовал стратегию 1 и далее стратегию 3. Тогда І( > 4І2 (это доказывается аналогично неравенству І1 > 4І2). Индуктивное предположение состоит в выполнении неравенства І2 > 3k. Но тогда І( > 4І2 > 3(i2 + k). ¦
Из леммы непосредственно вытекает, что если в момент k + 1 первый игрок меняет свою стратегию i (ik = i, ik+1 = i), то i-ая компонента вектора p(k) больше 3/4.
Посмотрим, как перемещается точка p(k) в еимплексе P — множестве всех смешанных стратегий первого игрока. Используя барицентрические координаты, симплекс P можно изобразить на плоскости в виде равностороннего треугольника (см, комментарий к рис, 4,1), На рис, 10,3 точки M, N, и K разбивают стороны треугольника P в отношении 3:1, Отрезки \e1,M], [e2,K] и [e3,N], пересекаясь, образуют внутренний треугольник ABC.

В течение нескольких начальных шагов точка p(k) находится в вершине e1. Затем она перемещается вдоль отрезка [e1, e3] до некоторой точки р', минуя при этом точку K, Далее точка p(k) движется вдоль отрезка [р', e2] до некоторой точки р", пересекая отрезок [e1, M], Затем она перемещается вдоль отрезка [р", e1] до некоторой точки р'", пересекая отрезок [e3, N], и т,д, При этом точка p(k) никогда не будет находиться внутри треугольника ABC содержащего точку р0 = (1/3,1/3,1/3). Поэтому р0 не является предельной точкой последовательности {р(к)}. Аналогично доказывается, что q0 = (1/3,1/3,1/3) не является предельной точкой последовательности {q(k)}.
§11. Иерархические игры двух лиц
Здесь мы рассматриваем игры двух лиц, в которых игроки прежде, чем выбрать стратегии x Е X, y Е Y, предварительно обмениваются информацией о своих выборах. Такого рода игры описывают взаимодействие между верхним и нижним звеньями управления (начальником и подчиненным, центром и производителем продукции и т.п.) и называются иерархическими. Будем считать, что первый игрок осуществляет управление вторым игроком и делает сообщение первым.
Рассмотрим исходную игру двух лиц в нормальной форме Г = (X,Y,F(x, y), G(x, y)), на основе которой будем строить иерархические игры. При этом нас будет интересовать наилучший гарантированный результат (выигрыш), который может получить в игре первый игрок, В данном параграфе предполагается, что функции F(x,y) и G(x,y) непрерывны на произведении XхУ компактов метрических пространств. Игра Гі_ Первый игрок выбирает ет ратегию x ? Хи сообщает ее второму, Затем второй игрок выбирает стратегию y ? У, зная x. При этом
2
будем использовать схематичную запись x^y, Смысл подобных сообщений очевиден в тех случаях, когда интересы игроков близки. Например, если вы решили с кем-нибудь встретиться, то сообщаете, куда придете, Игра Г1 является неантагонистической одношаговой игрой с полной информацией.
Экономическая интерпретация: первый игрок (центр) сообщает второму игроку (производителю продукции) цену x на продукцию. Второй игрок выпускает продукцию в количестве y, зная цену x.
Полезно записать игру Г1 в нормальной форме. Второй игрок использует стратегии вида g : X ^ У, Множество всех таких стратегий обозначим через {g}. Тогда
Гі = ах {g},FOcg^Ocg^
где F(x,g)= F(x,g(x)), G(x,g)<= G(x,g(x)).
Найдем наилучший гарантированный результат F1 первого игрока в игре Г^, Предположим, что второй иг рок, зная x, выбирает
y ? У(x) = Argmax G(x,y), yeY
т,е, максимизирует свою функцию выигрыша G(x, y). Первый игрок знает функцию выигрыша второго игрока, ему также известно, что второй будет выбирать стратегию из множества У (x), но он не знает конкретного выбора y ? У (x).
Величина W(x) = min F(x,y) называется оценкой эффективности
yeY (x)
(гарантированным результатом) стратегии x.
Заметим, что множество У (x) — непустое и является компактом. Следовательно, min достигается и наилучший гарантированный результат
yeY (x)
имеет вид
Fi = sup min F(x, у). xexv^Y (x)
Определение. Пусть задано e > 0. Стратегия тарного игрока x? называется e-оптимадьной в игре Г1; если W(х?) > Fi — e,
В дальнейшем мы приведем пример, в котором sup не достигается,
xex
Решить игру Г1 — это значит найти величину Fi и e-оптимальную стратегию х? при заданы ом e > 0.
Игра Г2. Первый игрок перед выбором х имеет полную информацию об у. Он ходит первый и сообщает второму игроку стратегию вида f :
Y ^ X. Множество всех таких стратегий обозначим через {f}. Схема
2 1
сообщений в игре Г2 : f ^ у ^ х = f (у).
Экономическая интерпретация: f (у) — величина премии, обещаемая центром за произведенную продукцию у.
Найдем выражение для наилучшего гарантированного результата F2 первого игрока в игре Г2. Предположим, что второй игрок, зная f, выбирает у из множества Y(f) =ArgmaxG(f (у),у). Множество Y(f) может
у&
оказаться пустым, если функция f разрывна, В случае пустого Y(f) будем считать, что второй игрок может выбрать любую стратегию у ? Y. Определим множество
Y*(f) J Y(f), Y(f ) =
f ) 1Y, Y(f ) =
В сделанных предположениях второй игрок выбирает у ? Y*(f) и оценка эффективности стратегии f задается формулой
W (f )= mf F (f (у), у).
У& *(f )
Наилучший гарантированный результат первого игрока имеет вид
F2 = suP f F (f (у),у).
fe{f}yeY (f)
Определение. Пусть задано e > 0. Стратегия f? называется в игре Г2, есл и W (f?) > F2 — e.
Поиск величины F2 по указанной формуле весьма сложен, так как связан с решением оптимизационной задачи на множестве функций {f}. Мы далее упростим формулу для F2 таким образом, чтобы оптимизация велась по исходным множествам X и Y.
Игра Г3, Пусть второй игрок играет против первого в игру Г2, т.е.
сообщает ему стратегию g : X ^ Y (функцию ответа). Первый игрок
в игре Г3 первым сообщает второму стратегию f\ : {g} ^ X. Схема
2 1 2
сообщений в игре Г3 : f1 ^ g ^ x = f1(g) ^ y = g(x).
Экономическая интерпретация: f1(g) — величина ресурса, который выделяет центр производителю продукции, когда тот сообщает ему свои производственные возможности ( функцию g ),
Наилучший гарантированный результат первого игрока в игре Г3 имеет вид
F3 = sup inf F (fl(g),g),
fi e{/i> где
Y *(fi) = { f Y (f1) = ?’ Y (fi) = Arg max G(fi(g), g).
{g}, Y (f1) = 0, ae{9}
Вернемся к игре Г2. Найдем более простую формулу для F2. Положим X(y) =Argmax F(x,y) — множество наилучших ответов первого игрока,
x€X
X*(y) =Arg max G(x,y) — множество наил?чших ответов первого игро-
xex(y)
ка, благожелательных по отношению ко второму. Определим стратегию первого игрока f * : f *(y) G X*(y) Vy G Y.
Лемма 11.1. Функция G(f*(y),y) полунепрерывна сверху в любой точке y0 G Y, т.е. для любой последовательности {yk}, сходящейся к y0, выполнено неравенство
Tim"G(f*(yk),yk) < G(f*(y0),y0). (11.1)
k^^
Доказательство. Пусть в некоторой точке y0 е Y функция G(f *(y), y) не является полунепрерывной сверху. Тогда найдется такая последовательность {yk}, сходящаяся к y0, что
G'=fJimG(f*(yk),yk) > G(f*(y0),y0). (11.2)
Без потери общности считаем (выделяя соответствующую подпоследовательность), что f *(yk) ^ x'. Из непрерывности функции G(x,y) следует
G' = lim G(f*(yk),yk) = G(x',y0).
Покажем, что x' ? X(y0). Действительно, то определению функции f * имеем F(f *(yk),yk) > F(x,yk) V x ? X, k = 1, 2,.... Отсюда, переходя в последнем неравенстве к пределу при k ^ то, получим
F(x',y0) > F(x,y0) V x ? X ^ X ? X(y0).
Итак, неравенство (11,2) можно записать в виде G = G(x',y0) > G(f*(y0),y0). Оно противоречит тому, что f*(y0) ? X*(y0).u "
Нам потребуется следующие величины и множества:
G2 = max min G(x,y) — наилучший гарантированный результат вто-
y€Y x€X
рого игрока при условии, что первый применяет по отношению к нему стратегию "наказания"^ : fH(y) ?ArgminG(x,y) V y ? Y;
x€X
E =Argmaxmin G(x, y) — множество максиминных стратегий второго
y€Y x€X
игрока;
D = {(x,y) ? X x Y | G(x,y) > G2};
( sup F(x,y), D = 0,
K = < (x,y)eD
\—ж, D = 0;
M = min max F(x,y).
Теорема 11.1 (Гермейер), В сделанных предположениях наилучший гарантированный результат первого игрока в игре Г2 равен F2 = max[K, M].
Замечание. Для нахождения F2 необходимо решить оптимизационные задачи на исходных множествах X и Y. Оптимальные (е-оптимальные) стратегии, обеспечивающие max[K,M], будут указаны в первой части доказательства теоремы. Результат max[K, M] довольно велик. Чтобы в этом убедиться, рассмотрим частный случай. Допустим, что существует пара (x0,y0) ?Arg max F(x,y) П D. Тогда
(x,y)ex xY
K = sup F(x,y)= max F(x,y) = F2,
(x,y)eD (x,y)eX xY
T,e, результат F2 равен максимуму функции F(x, y) на X x Y.
Доказательство. Первая часть. Построим стратегии первого игрока, обеспечивающие ему результат max[K, M], Рассмотрим два случая.
1) K > M ^ D = 0. Покажем, что для всякого е > 0 найдется такая стратегия f?, что W(f?) > K — е. По определению верхней грани K найдется такая пара (x?,y?) ? D, что F(x?,y?) > K — е. Положим
f ?(y)
x?, у = y?,
/Н (y), у = у?.
Покажем, что W(f?) = F(x?,y?) > K — е. Действительно, второй игрок, получив сообщение о /?, выберет y = y?, так как в противном случае он получит выигрыш G(fH(y),y) = minG(x,y) < G2 < G(x?,y?). Посколь-
xeX
к? второй игрок максимизирует свой выигрыш, он выберет y = y?, т.е.
Y*(f?) = {y?}.
2) K < M. Укажем стратегию f0, для которой W(f0) > M. Положим
f 0(y)
f *(y), y ? E, fH(y), y ?E,
где стратегия f * была определена выше перед леммой 11,1, Получив сообщение о f0, второй игрок выберет y ? E. Действительно, если y ? E, то G(fH(y),y) = minG(x,y) < G2. Далее, при y ? E G(f0(y),y) =
G(f*(y),y) > minG(x,y) = G2. Функция G(f*(y),y) полунепрерывна
x€X
сверху на компакте E, поэтому Y*(f0) ^ArgmaxG(f*(y),y) C E. Отсюда
veE
W (f 0) %em*in o)F (f *(y),y) >
> min F(f *(y),y) = min max F(x,y) = M.
yeE veE xex
Вторая часть. Докажем, что для произвольной стратегии f ? {f} W(f) < max[K, M]. Имеем
SUp G(f (y),y) > maxmin G(x,y) = G2. veY veY xex
Рассмотрим два случая,
1) sup G(f (y), y) > G2. В этом случае найдется такая стратегия второ-yeY
го игрока y0 ? Y*(f)^?о G(f (y0),y0) > G2^e, (f (y0),y0) ? D. Действительно, если sup достигается, то Y(f) = 0 и y0 возьмем реализующим
yeY
sup. Если sup те достигается, то Y*(f) = Y и стратегия y0 найдется по
veY yeY
определению sup. Отсюда
yev
W(f) = inf F(f (y),y) < F(f (y°),y°) < K < max[K, M].
yeY)
2) supG(f(y),y) = G2. Покажем, что E C Y*(f). Действительно,
yev
пусть y 6 E. Тогда
G2 = minG(x,y) < G(f (y),y) < supG(f(y),y) = G2. xeX yeY
В этой цепочке неравенства выполнены как равенства. Отсюда y 6 Y*(f) и E С Y*(f). Итак,
W(f)= inf F(f (y),y) <
yev *(f )
< inf F (f (y),y) < min max F (x,y) = M < max[K, M]. ¦
yeE yeE xeX
Сформулируем аналогичный результат для игры Гз_ Напомним, что
в игре Г3 ^^^»к выбирает y, стратегии x первого ему
известен. Второй игрок использует стратегию д : X ^ Y. Определим
следующие величины и множество:
G3 = minmaxG(x,y) = maxG(xH,y) — наилучший гарантированный xeX yev yev
результат второго игрока, когда первый применяет стратегию наказания
и.
D' K'
i(x,y) 6 X X Y 1 G(x,y) > G3}; sup F (x,y), D' = 0,
(xy)eE'
— ж, D' = 0.
Тогда можно доказать, что F3 = max[K',Fi] (см, упражнения 11,12), Если F1 > K', то первый игрок применяет е-оптимальную стратегию игры Г1. ^«;ть F1 < K'. В этом стучае ^^ідется такая пара (x?,y?) 6 D', что F(x? ,y?) > K' — е.
Упражнение 11.1. Докажите, что для стратегии
xf
ff (g)
g(x?) = yC g(x?) = y?,
оценка эффективности W(ff) > K' — е.
Упражнение 11.2. Докажите, что для любой стратегии f1 первого игрока в игре Г3 W(f1) < max[K', F1].
Упражнение 11.3. Докажите, что в игре Г в нормальной форме всегда существует ситуация равновесия.
Упражнение ІІД. Докажите, что F1 < F3 < F2.
Пример 11.1. Решим игры Гі, Г2, Г3 для игры Г с матрицами
7 4 3N 7 7 3 Л 6 6,
'3 6 8'
A = I 4 3 2
,7 -5 -1,
Игра Г1. F1 = max min ai?- = max W(i), Y(i) = Arg max bi?-, W(1) =
i<*<3 jeY(i) 1 <i<3 i<j<3 J
W(2) = 3, W(3) = —5 ^ F1 = 3 и i0 = 1, 2 — оптимальные стратегии. Игра Г2. G2 = max- mm hj = 4, E = {1, 2}, D = {(i,j) 1 hj > 4}
1<j<31<i<3
K = max aij = 4, M = min max ai7- = 6 =>- F2 = M = 6
(i,j)eD 1<j<21<i<3
r0 ( Л ) 3, j 1,
и f (j) = \ — оптимальная стратегия,
l1, j = 2, 3,
Игра Г3. G3 = min max bij = 6, D' = {(i, j) | bij > 6},
1<i<31<j<3
K' = max aij = 4 > F1 = 3 ^ F3 = K' = 4
(i,j)eD> j
f0, , (2, g(2) = 1,
и f 0 (g) = ) — оптимальная стратегия,
l3, g(2) =1
Пример 11.2. Решим игры Г 1, Г2, Г3 для игры Г :
X = Y = [0, ^ F(x,y) = 3x/4 + y/2, G(x,y) = (x — y)2.
Игра Г1. F1 = sup min (3x/4 + y/2),
0<x< 1 V^Y (x)
{1}, 0 < x< 1/2,
Y(x) = Arg max (x — y)2 =
0<y<1
График функции W (x)
{0,1}, x =1/2,
{0}, 1/2 < x < 1.
min (3x/4 + y/2) ем, на рис, 11,1,
yeY (x)
Здесь Fi = 7/8, x? = 1/2 — 4е/3 — е-оптимальная стратегия. Отметим, что внешняя верхняя грань в выражении для F1 не достигается,
Игра Г2. G2 = max min (x — у)2
0<V<10<X<1
О, D = {(x,y) 1 (x — у)2 >
y?,
К = 5/4 = ^ (x?,y?) = (1 — 4е/3,1), f?(y)
— е-оптимальная стратегия.
Игра Г3. G3 = min maX(x — У)2 = 1/4, xH = 1/2,
D' = {(x^) | |x — У<> 1/2}, К1 = sup (3x/4 + у/2) = 1 >
(x,v)GD/

7/8 = Fi F3
f?(g) = [\\n
= K', (x?^?) = (1,1/2 — 2е) E K', g(1) = 1/2 — 2е,
— е-оптимальная стратегия,
g(1) = 1/2 — 2е,
Пример 11.3. Игра перестрахования. Перестраховщик (игрок 1) и страховщик (игрок 2) заключают договор перестрахования. Пусть Z — суммарное возмещение страховщика клиентам, представляющее собой случайную величину е экспоненциальной плотностью распределения e-z/m/m, z > 0. При заключении договора страховщик выбирает предел убыточности У E Y = {у E E 1 | у > 0} : если Z > у, то сумму Z — у возмещает перестраховщик. Отметим, что при у = 0 страховщик полностью передает оплату исков перестраховщику. Величина
(z — у)- e-z/mdz
y/m
к(у) = E max[Z — у, 0]
me
— средняя величина выплат перестраховщика. Стоимость договора пе-
def
рестрахования равна d(x,y) = (1 + x)h(y), где x > 0 — коэффициент надбавки за риск, устанавливаемый перестраховщиком. Будем считать, что оплата договора осуществляется страховщиком из фонда страховых платежей величины A > m. Договор может быть заключен лишь при выполнении неравенства d(x,y) + y < A. Положим
У(х) = {y Е Y | d(x,y) + y < A}, X = {x Е E1 | x > 0, Y(x) = 0}.
Если y Е У (x), то договор заключается, выигрыш перестраховщика равен его ожидаемой прибыли F(x,y) = xh(y), а выигрыш етраховщика — гарантированной величине остатка фонда страховых платежей G(x,y) = A — d(x,y) — y, соответствующей случаю Z > y.
Решим игру Г1. Напомним, что сначала первый игрок сообщает второму стратегию x Е X. Затем второй игрок выбирает стратегию y Е Y(x) = Arg max G(x,y). Пусть x Е X. Максимум
yEY(x)
max G(x, y) = max [A — (1 + x)me-y/m — y] = A — m — mln(1 + x)
yEY(x) yEY(x) достигается в единственной точке y(x) = mln(1 + x). Отсюда вытекает, что y(x) = 0, если A — m — mln(1 + x) > 0. Следовательно, X = [0,x0],
где x0 d= e(A-m)/m — 1. Отсюда
x0m 1 + x0
F1 = max F(x,y(x)) = max -
xex o<x<x° 1 + x
и x0 — оптимальная стратегия первого игрока.
Упражнение 11.5. Рассмотрите игру двух фирм из примера 9,9 при а = 1 и решите игру Г1. Сравните наилучший гарантированный результат первого игрока F1 с выигрышем, который он получает в ситуации равновесия.
Равновесие по Штакельбергу
Определим теперь равновесие по Штакельбергу игры Г1. Положим Y*(x) =Arg max F(x, y) - множество наил?чших ответов второго игрока,
yEY (x)
благожелательных по отношению к первому.
Определение. Ситуация (x0,y0) называется равновесием по Штакельбергу, если
x0 Е Arg max max F(x,y), y0 Е Y*(x°).
x€X y€Y(x)
Здесь предполагается, что второй игрок, получив информацию о ж, использует свой наилучший ответ, благожелательный по отношению к первому игроку.
Покажем, что в сделанных предположениях равновесие по Штакель-бергу существует. Для этого определим стратегию второго игрока д* : д*(ж) ? Y*(ж) ?ж ? Y. По лемме 11,1 функция F(ж,д*(ж)) полунепрерывна сверху на X. Следовательно, она достигает на компакте X наибольшее значение в некоторой точке ж0 .Тогда при у0 = д*(ж0) ситуация (ж0, у0) будет равновесием по Штакельбергу, ¦
Упражнение 11.6. В условиях примеров 11,1 и 11,2 найдите равновесия по Штакельбергу,
Отметим, что использование равновесия по Штакельбергу требует от игроков сотрудничества, которое, как показывает следующий пример, не всегда возможно, В игре с матрицами

ситуация (2,2) является единственным равновесием по Штакельбергу, Однако договориться о ней игрокам будет очень сложно, поскольку в ситуации (1,2) (возникающей при решении игры Гі) выигрыш второго игрока существенно больше, чем в (2,2), и он едва ли согласится на ситуацию (2,2),
Комментарий и библиография к главе II
§ 9, Понятие ситуации равновесия в частном случае, еще в 19-м веке, использовалось О, Курно при анализе модели дуополии [59], Определение ситуации равновесия для игры многих лиц принадлежит Дж, Нэшу
[76], В 1999 году Джон Нэш получил Нобелевскую премию по экономике. Критический разбор понятия ситуации равновесия (в частности, анализ игр "семейный епор"и "дилемма заключенного") сделан Р.Д, Льюсом и X, Райфой [61], Пример 9,3 является модификацией примера "перекре-еток"из [71],
Теорема 9,1 о неподвижной точке принадлежит Л, Брауэру [18], Комбинаторное доказательство этой теоремы, использующее лемму Э, Шпер-нера [107], получено Б, Кнастером, К, Куратовеким и С, Мазуркевичем
[53] (доказательство теоремы см, в Приложении и в [79]),
Теорема существования ситуации равновесия в игре многих лиц е вогнутыми функциями выигрыша (ем, также следующую главу) доказана X, Ника,йдо и К, Исода [75], Пример 9,6 является частным случаем модели О, Курно [59], Байесовские игры введены Дж, Харшаньи [92], Пример 9,10 взят из [91],
§ 10, Термин "биматричная игра"был предложен Н,Н, Воробьевым (ем,
[34], где содержится систематическое изложение теории бескоалиционных игр). Теорема существования ситуации равновесия в биматричных играх доказана Дж, Нэшем |70|. Там же приведены свойства ситуаций равновесия в смешанных стратегиях. Условие общности положения для биматричных игр использовали К, Лемке и Дж, Хоусон [60] при разработке алгоритма поиска всех ситуаций равновесия. Теорема 10,3 имеется в книге Э, Му.юна [71], Изложенный алгоритм поиска ситуаций равновесия биматричной игры является весьма упрощенным вариантом алгоритма К, Лемке и Дж, Хоусона [60, 79],
Концепция ситуации равновесия, основанная на исключении доминируемых стратегий, предложена Э, Му. юном [71], Доказательство отсутствия сходимости итерационного процесса к ситуации равновесия игры из примера 10,1 принадлежит Л,С, Шепли [103]
§11, Основы теории иерархических игр е использованием принципа гарантированного результата для игрока,-лидера, (игрока 1) заложены Ю.Б, Гермейером [37, 38], В частности, Ю.Б, Гермейеру принадлежит центральный результат этот теории — теорема 11,1, Аналогичный результат для игр Г3 (упражнения 11,1 и 11,2) получен Н,С, Кукушкиным [57], Экономическая интерпретация иерархических игр предложена И,А, Вателем и Ф.И. Ерешко [28], Определение равновесия по Штакель-берг? еформ?лировано в [95], Обзор работ по иерархическим играм ем, в [52].
§ 12. Равновесие по Нэшу. Решение игр в нормальной форме
Пусть имеется множество A участников игры или игроков. Игрок а имеет в своем распоряжении стратегии sa из множества етратегий Sa. Каждый из игроков выбирает стратегию, не зная выборов партнеров, В результате в игре возникает набор стратегий
s = (sa, а е A) е S = 0 Sa,
a€A
называемый ситуацией. У каждого игрока а имеется функция выигрыша ua(s), определенная на множестве ситуаций S, которую игрок стремится, по возможности, максимизировать. Таким образом, игра многих лиц в нормальной форме задается набором
Г = (A, Sa, ua(s), а е A).
Важнейшим принципом принятия решений в конфликтных ситуациях является понятие равновесия по Нэшу,
Определение. Ситуация s = (sa, а е A) называется ситуацией равновесия (равновесием по Нэшу) игры Г, если
max ua(s||sa) = ua(s) V а е A.
Стратегии sa, составляющие ситуацию равновесия, будем называть равновесными.
Выражение "s||sa"читается "s при условии sa". Оно обозначает ситуацию, в которой все компоненты, кроме стратегии игрока а , совпадают с s , а стратегия игрока а есть sa. Определение равновесия показывает, что стратегия sa , входящая в ситуацию в, является оптимальной для игрока а при фиксированных стратегиях всех остальных игроков. Таким образом, можно сказать, что равновесие по Нэшу — это такая ситуация, от которой ни одному из игроков не выгодно отклоняться индивидуально. Опишем один класс игр, для которых равновесие всегда существует.
Определение. Функция h(z), определенная на выпуклом множестве Z евклидова пространства, называется квазивогнутой, если для любых Z ,z" е Z и любого чиела 0 < А < 1 выполнено неравенство
h(Xz' + (1 — A)z") > min[h(z'), h(z")\.
Нетрудно видеть, что любая вогнутая функция является квазивогнутой, Примером квазивогнутой функции на прямой может служить произвольная возрастающая (или убывающая ) функция.
Определение. Пусть z0 ? Z. Для функции h(z), определенной на Z, множества вида Z + (z0) = {z ? Z | h(z) > h(z0)} называются множествами Лебега.
Упражнение 12.1. Для того чтобы функция h(z) была квазивогнутой на выпуклом множестве Z, необходимо и достаточно, чтобы ее множества Лебега Z + (z0) были выпуклыми при любых z0 ? Z. Докажите,
Пусть Zi и Z2 — выпуклые компакты евклидовых пространств. Определим точечно-множественное отображение Ф : Zi ^ 2Z2, сопоставляющее каждому z ? Zi компакт Ф(z) С Z2.
Определение. Точечно-множественное отображение Ф : Zi ^ 2Z2 называется выпуклозначным, если при каждом z ? Zi множеетво Ф(z) выпукло, Оно называется замкнутым, если его график {(z,y) | z ? Zi, y ? Ф(z)} — замкнутое множество, т,е, для любых последовательностей {zn ? Zi} и {yn ? ФДп)}, таких, что zn ^ z0 и уп ^ у0, необходимо у0 ? Ф(z0).
В частном случае Ф может быть просто отображением из Z в Z. Тогда свойство замкнутости отображения Ф совпадает со свойством непрерывности, Таким образом, предыдущее определение обобщает понятие непрерывности для точечно-множественных отображений.
Теорема 12.1 (Какутани). Пусть Z — выпуклый компакт конечномерного евклидова пространства, а Ф : Z ^ 2Z — замкнутое выпуклозначное точечно-множественное отображение. Тогда существует неподвижная точка z0 отображен ня Ф, т,е, z0 ? ФД0).
Докажем теорему для Z С E1, В данном случае в соответствии с условием теоремы Z — отрезок [а,Ь\. Рассмотрим множество Z = {z ? Z | тахФД) > z}. Это множество непусто, так как а ? Z. Пусть z0 = sup Z и покажем, что z0 ? ФД0). Действительно, тахФД0) > z°, так как ФД) — замкнутое отображение. Докажем, что тіпФД0) < z0. Если z0 = b, то утверждение очевидно. Пусть z0 < b. Рассмотрим последовательность {zk}, сходящуюся к z0 и для которой zk > z0, k = 1,2,....
По определению z0 для нее шахФДk) < zk, k = 1,2,.... Поэтому найдется такая последовательность {yk е Ф(zk)}, что yk < zk, k = 1,2,.... Без потери общности можно считать, что последовательность {yk} сходится к y0 < z0. Поскольку Ф(z) — замкнутое отображение, у0 е Ф(z0) и шinФ(z0) < z0. Отсюда z0 е ФД0). ¦
Доказательство теоремы Какутани в общем случае основано на теореме Брауэра и содержится в Приложении (ПЗ).
Теорема 12.2. Пусть в игре Г множества Sa — выпуклые компакты евклидовых пространств, а функции ua(s) непрерывны на S и квазивогнуты по sa (при любых фикеированных sb е Sb, b е A\{a}). Тогда в игре Г существует ситуация равновесия.
Доказательство. Определим точечно-множественное отображение Ф : S ^ 2s следующим образом: для любой ситуации s е S положим
ФД) = 0 Фa(sb, b е A\{a}),
aeA
где
Фa(sb, b е A\{a})d= Arg шах ua(s||ha)
haesa
— множество наилучших ответов игрока a на стратегии sb, b е A\{a}, остальных игроков. Нетрудно проверить, что отображение
" Фa : 0 Sb ^ 2sa
beA\{a}
замкнуто (см. замечание к теореме 2.2) и выпуклозначно. Поэтому отображение Ф удовлетворяет условиям теоремы 12.1 и имеет неподвижную точку s е ФД), которая и будет равновесием по Нэшу в игре Г. ¦
Смешанное расширение игры
Пусть в игре Г множества стратегий игроков конечны:
Sa = {1, ...,ma}, а е A. Стратегии sa, входящие в Sa, называются чистыми стратегиями игрока а. Смешанная стратегия игрока а определяется как вероятностное распределение na = (п?, ...,п^a), где п? — вероятность выбора чистой стратегии sa е Sa в качестве реальной стратегии игрока а. Множество смешанных стратегий игрока a — это симплекс
ma
na = {т“
1,..., ma}.
1, <a > 0, s?
na
) ' ' /уу-f a
na /I ca
sa=1
Для заданного набора смешанных стратегий
п = (na, а е A) е П = ® na
aeA
определим p(s|n) = П п^а — вероятность реализации ситуации
аеЛ
s = (sa, a G A). Тогда, математическое ожидание выигрыша игрока a
будет задаваться функцией па(п) = p(s|n)ua(s). Таким образом, сме-
ses
шанное расширение игры Г в нормальной форме имеет вид
Г = (A, Па, па(п), a G A).
Ситуации равновесия игры Г будем называть ситуациями равновесия в смешанных стратегиях игры Г или смешанными равновесиями по Нэшу,
Каждая функция па(п), очевидно, непрерывна по п и линейна по па при любых фиксированных nb, b G A\{a}. Поэтому из теоремы 12,2 вытекает следующий результат.
Теорема 12.3. В любой игре Г с конечными множествами стратегий существует смешанное равновесие по Нэшу,
Для анализа и вычисления смешанного равновесия по Нэшу полезно следующее утверждение.
Утверждение 12.1. Для того чтобы ситуация п = (па, a G A) была смешанным равновесием по Нэшу, необходимо и достаточно, чтобы
max па(п|Ыа) = па(п) V a G A.
sa esa
Более того, па(п|^а) = па(п) для любой такой стратегии s'1, что
па а > 0.
Доказательство этого утверждения полностью аналогично доказательствам леммы 10,1 и теоремы 10,1,
Пример 12.1. Каждое из трех предприятий, использующих воду из природного водоема, располагают двумя стратегиями: строить сооружения для полной очистки отработанной воды (стратегия 1) или же сбрасывать ее через имеющиеся очистные сооружения без биологической очистки (стратегия 2), Предполагается, что особенности водоема и технологических процессов таковы, что в случае, когда не полностью очищенную воду сбрасывает не более одного предприятия, вода в водоеме остается пригодной для использования и предприятия убытка не несут. Если же не полностью очищенную воду сбрасывают не менее двух предприятий, то каждый пользователь воды несет убытки в размере трех единиц. Найдем все ситуации равновесия в чистых и смешанных стратегиях описанной игры трех лиц.
Исходная игра Г представлена в табл, 12,1,
Табл. 12.1.
|
s1 |
s2 |
s3 |
u1(s) |
u2 (s) |
u3(s) |
|
1 |
1 |
1 |
-1 |
-1 |
-1 |
|
1 |
1 |
2 |
-1 |
-1 |
0 |
|
1 |
2 |
1 |
-1 |
0 |
-1 |
|
1 |
2 |
2 |
-4 |
-3 |
-3 |
|
2 |
1 |
1 |
0 |
-1 |
-1 |
|
2 |
1 |
2 |
-3 |
-4 |
-3 |
|
2 |
2 |
1 |
-3 |
-3 |
-4 |
|
2 |
2 |
2 |
-3 |
-3 |
-3 |
Построим смешанное расширение Г, Пусть pa е [0,1], а = 1,2, 3, — вероятность, с которой предприятие а выбирает стратегию 1, Возможные ситуации в игре Г составляют множество
п= = (p\p2,P3) 1 Ра е [0, ^ а = 1, 2 3}.
Функция выигрыша первого предприятия в игре Г
u1(n) = pl[—p2p3 — p2( 1 — p3) — (1 — p2)p3 — 4(1 — p2)(1 — p3)] +
+ (1 — p1)[—3p2(1 — p3) — 3(1 — p2)p3 — 3(1 — p2)(1 — p3)] =
= (—6p2p3 + 3p2 + 3p3 — 1)p1 + 3p2p3 — 3 = k1(p2,p3)p1 + l1(p2,p3). Аналогично,
k3(p1,p2)p3 +l3 (p1,p2),
u2(n) = k2(p1,p3)p2 + l2(p1,p3), u3(n)
где
l1(p2,p3) k1(p2,p3) =
3p2p3 — 3, l2(p1,p3) = 3p1p3 — 3,
6p2p3 + 3p2 + 3p3 — 1, k2(p1,p3) = k3(p1,p2) = —6p1p2 + 3p1 + 3p
l3(p1,p2) = 3p1 p2 —
—6p1p3 + 3p1 + 3p3 2- 1.
3,
1,
Пусть п жим
(pa, a = 1, 2, 3) — произвольная ситуация равновесия, Поло-
k1(p2,p3), k2
k2(p1,p3), k3
k1(p1,p2).
Заметив, что если k > 0, то pa = 1, а если k < 0, то pa = 0, рассмотрим все возможные случаи.
Пусть k > 0, a =1, 2, 3; тогда pa = 1 и k = —1 — противоречие. Пусть k > 0, a = 1, 2, k < 0. В этом случае ситуация равновесия (1,1,0), Аналогично, (1,0,1) и (0,1,1) — также ситуации равновесия.
—1
т2 -г3
-У3
1 и p2 = p
0, k = — 1 —
Пусть k > 0, k~,k" < 0. та:1 да p1 противоречие.
Аналогично, нет и других ситуаций равновесия, соответствующих случаю одной положительной и двух отрицательных величин k .
Пусть k < 0, a =1, 2, 3; тогда ситуация равновесия (0,0,0),
Пусть k =0, a =1, 2, 3. Решая полученную систему, найдем две ситуации равновесия:
((3 — х/э)/6, (3 — х/Э)/6, (3 — л/3)/6) и ((3 W3)/6, (3 W3)/6, (3 W3)/6).
Пусть k =0, a =1, 2, k > 0; тогд а p3 = 1. Решая соответствующую
систему, получаем ситуацию равновесия (2/3, 2/3,1). Если k = 0, a =
1,2, k < 0, то p3 = 0, p1 = p2 = 1/3, k =1/3 — противоречие.
Аналогично, (1,2/3, 2/3) и (2/3,1,2/3) — ситуации равновесия.
Наконец, рассуждая аналогично, убеждаемся, что нет ситуаций рав-" „ " ~ra - "
новееия, соответствующих одной из величин k , равной нулю, и двум,
отличным от нуля.
Итак, в игре Г девять ситуаций равновесия в чистых и смешанных стратегиях.
Доминирование в играх многих лиц
Понятия и результаты о доминировании стратегий в играх двух лиц, изложенные в § 10, легко обобщаются на игры многих лиц Г.
Определение. Будем говорить, что стратегия ha строго доминирует стратегию ga (ha У ga) на множестве ситуаций S С S, если выполнено неравенство ua(s||ha) > ua(s||ga) V s G S. Будем говорить о слабом доминировании (ha У g^^^mи ua(s||ha) > ua(s||ga) V s G S.
Определение. Будем говорить, что множество S строго (соответственно слабо) доминирует множество S (обозначается S У S и S У S соответственно), если оно может быть получено из S в результате по-
еледовательного исключения строго (соответственно слабо) доминируемых стратегий, т.е. существует последовательность вложенных множеств S = S1 D S2 D ... D Sk = S, для которой при любом l = 1,..., k — 1 выполнены следующие условия:
S = 0 S“ и для любых а ? A, ga ? S“\Sl+1 найдется такая стратегия
аеА
ha ? S^^, что ha У ga (ha У ga) на S.
Процедура последовательного исключения доминируемых (в строгом или слабом смысле) стратегий состоит в следующем. На первом шаге выясняем для каждого игрока, какие стратегии являются доминируемыми на множестве всех ситуаций S1 = S и выбрасываем их. Получаем суженное множество S2. Теперь стратегии, которые не были доминируемыми на множестве S1; могут оказаться доминируемыми на множестве S2. На следующем шаге мы их выкидываем, получаем множество S3 и т.д.
Определение. Будем говорить, что игра Г разрешима по доминированию, если для некоторого слабо доминирующего множества S для каждого а ? A функция ua(s) те зависит от sa на S, т.е, для любых s ? S и ha ? Sa ua(s) = ua(s||ha).
Определение. Будем говорить, что смешанная стратегия na строго доминирует стратегию ga (na У ga) на множестве ситуаций S С S, если выполнено неравенство ua(s||na) > ua(s||ga) V s ? S. Будем говорить о слабом, доминировании (na У ga), если ua(s||na) > ua(s||ga) V s ? S.
Определение. Будем говорить, что множество S строго (соответственно слабо) доминирует множество S в смешанных стратегиях (обозначается S У S и S У S соответственно), если существует последовательность вложенных множеств S = S1 D S2 D ... D Sk = S, для которой при любом l = 1,..., k — 1 выполнены следующие условия:
Si = 0 Sa и для любых а ? A, ga ? Sza\S0+1 найдется такая стратегия
a? А
na ? S^, что na У ga (na У ga) на S и = 0 V sa ? Sia+1.
Следующее утверждение аналогично теореме 10,4,
Теорема 12.4. 1) Пусть множество S = 0 S?a строго доминирует
a€A
множество S в смешанных стратегиях. Тогда для любого смешанного равновесия по Нэшу П = (na, а ? A) выполнено условие: для любых а ? A и sa ? SC необходимо я^а = 0.
2) Пусть множество S = (^) Sa слабо доминирует множество S в сме-
aeA
шанных стратегиях и П = (nasa, sa G Sa, a G A) — смешанное равновесие по Нэшу в игре Г = (^A, Sa, ua(s), a G A^ с сокращенными множествами стратегий. Определим ситуацию в смешанных стратегиях П исходной игры Г : для любо го a G A
П Sa
П^а, если sa G Sa, 0, если sa G Sa.
Тогда П — равновесие то Нэшу в исход ной игре Г.
Модели игровой динамики
Модели этого типа развиты как альтернатива статическим принципам оптимальности (таким, как равновесие по Нэшу, решения по доминированию), Указанные принципы принятия решения требуют для своей реализации полной информированности игроков относительно условий игры (т.е. относительно множеств стратегий и функций выигрыша всех участников). Более того, игроки должны быть рациональны в принятии собственных решений и предполагать такую же рациональность от своих партнеров. Рассматриваемые динамические модели предъявляют значительно меньше требований к информированности и рациональности игроков и больше похожи на реальные методы принятия решений.
Предположим, что конфликтная ситуация описывается игрой Г = (A, Sa, ua(s), a G A) с конечными множествами стратегий Sa, a G A. Пусть игра повторяется в периоды времени t = 1,2,.... Каждый игрок выбирает стратегию sa(t + 1) на период (шаг) t + 1, исходя из истории ht = {s(t) = (sa(r),a G A)}T<t, сложившейся к этому периоду. Бесконечную последовательность ситуаций {s(t)} будем называть траекторией процесса. Обозначим через H множество всевозможных историй, т.е,
н = и т.
t> і
Правило поведения игрока в этом процессе задается отображением pa : H ^ Sa. Совокупноеть (Г; pa, a G A) называется детерминированным игровым процессом,.
Определим понятие адаптивного поведения. Смысл его состоит в том, что игрок прогнозирует вероятности реализации стратегий партнеров sA\M = (sb, b G A\{a}), исходя из предыстории, и максимизирует собственный выигрыш на основании такого прогноза, В качестве примера рассмотрим модель наилучших ответов.
Процесс начинается с выбора игроками произвольных стратегий sa(1), а ? A. Далее после t шагов на следующем, (t + 1)-м шаге
sa(t + 1) ? Arg max ua(s(t)||sa), a ? A.
Таким образом, игрок максимизирует собственный выигрыш, исходя из предположения, что другие игроки не меняют своих стратегий по сравнению с предыдущим шагом,
В более общем случае предположения о поведении партнеров в момент времени t +1 можно характеризовать набором параметров {Л?т > 0}т<t, таким, что Y1 т = 1. Игрок а считает, что с вероятностью
Т <t
Ла т в моме нт t + 1 повторится набор стратегий друг их игроков sA\{a}(r), случившийся в момент т. Исходя из этого, игрок а максимизирует математическое ожидание своего выигрыша. Следовательно,
sa(t + 1) ? Arg max Л^иа(в(т)||sa), a ? A. (12.1)
Т <t
Определение. Пусть T — минимальное число периодов, для которого t—т > T ^ Ла т = 0 V а ? A, t, т. Тогда T называется памятью игрового процесса (игроки не помнят то, что происходило T шагов назад).
Примером процесса с бесконечной памятью является итерационный процесс Брауна для матричных игр, изложенный в § 5, или аналогичный процесс для биматричных игр из § 10, где Ла т = 1/t для всех таких т и t, что т < t. В общем случае правило прогнозирования можно задать отображением pa(sA\{a}|ht), определяющем для игрока а субъективную вероятность реализации sA\{a} в зависимости от истории ht. При использовании правил прогнозирования pa, а ? A, на (t + 1)-м шаге игроки выбирают стратегии по правилу
sa(t + 1) ? Arg max ^ pa(sA\{a} | ht)ua(sA\{a}, sa), а ? A.
sA\{a}
Адаптивные правила соответствуют ситуации, когда каждый игрок считает поведение партнеров, не зависящим от его собственного выбора. Он либо не учитывает возможного влияния выбора в текущий период на последующие повторения, либо они его не интересуют (не случайно другим названием модели наилучших ответов является "близорукое приспособление").
Динамика игровых процессов с адаптивными правилами поведения оказывается для многих игр хорошо согласованной с указанными выше статическими принципами оптимальности. Приводимые ниже утверждения подтверждают возможность использования понятий равновесия по Нэшу и доминирующих множеств для описания поведения индивидуумов с ограниченной рациональностью.
Определение. Правило прогнозирования pa назовем адаптивным, если для любой траектории {s(t)} и любого набора стратегий sA\{a}, который встречается в {s(t)} лишь конечное число раз, субъективная вероятность pa(sA\{a}|h*) стремится к нулю при t ^ го, где {h*} — последовательность историй, отвечающих траектории {s(t)}.
Упражнение 12.2. Покажите, что в процессе Брауна игроки используют адаптивные правила прогнозирования.
Теорема 12.5. Пусть последовательность множеств ситуаций S = Si D S2 D ... D Sk получена в результате последовательного исключения стратегий, строго доминируемых смешанными стратегиями, и ga Е Sr\S<T+1 для некоторых а Е A, r Е {1,..., к — 1}, Тогда справедливы следующие утверждения,
1) Для любой траектории {s(t)} модели наилучших ответов sa(t + 1) = ga при t > r.
2) Для всякой адаптивной динамики с набором параметров {Л*,т} и памятью T sa(t + 1) = ga при t > rT.
Доказательство. 1) Предположим сначала, что стратегия ga получена в результате последовательного исключения стратегий, строго доминируемых чистыми стратегиями. Проведем доказательство методом математической индукции по г. Пусть sa >- ga, т,е, r =1. Тогда стратегия ga не является наилучшим ответом на любые стратегии других игроков. Следовательно, sa(t + 1) = ga при t > 1. Пусть утверждение доказано для любых стратегий из множества S1\Sr. По индуктивному предположению s(t) Е Sr при люб ых t > r. Поэтому, начиная с шага r, можно ограничиться редуцированной игрой с множествами стратегий Sra, а Е A. Возьмем ga Е S'a\S'a+1. В рассматриваемой редуцированной игре стратегия ga строго доминируема и sa(t + 1) = sa при люб ых t > r.
Перейдем к доминированию смешанными стратегиями. Пусть смешанная стратегия na строго доминирует стратегию да, т.е. r =1. Тогда для любой ситуации s(t) найдется чистая стратегия sa, для которой па > 0 и ua(s(t)||sa) > ua(s(t)||ga). Следовательно, sa(t + 1) = ga при любых t > 1. Доказательство, как и для случая доминирования чистыми стратегиями, завершается индукцией по г.
2) Пусть sa У ga. Тогда стратегия ga не является наилучшим ответом игрока а при t > 2, а начиная с шага T +1, она не входит в правые части (12,1) и не влияет на поведение остальных игроков. Поэтому при t > T + 1 можно рассматривать редуцированную игру с множествами стратегий S\ V b G A. Далее проводятся рассуждения по индукции. Пусть теперь стратегия ga строго доминируется смешанной стратегией na. Тогда для любой ситуации s(t) выполнено неравенство ^па3аua(s(r)||sa) > ua(s(r)||ga), а отсюда
Sa
Y^nta-XAGua(s(t)||sa) ^Aa,rua(s(r)||ga).
sa T <t T <t
Следовательно, найдется такая стратегия sa, для шторой п^а > 0 и J2T<t Aa,Tua(s(T)||sa) > J2T<t Aa)Tua(s(r)||ga). Поэтому sa(t + 1) = ga при t > 1, а при t > T + 1 стратегия ga не влияет на выборы других игроков. Поэтому, начиная с шага T + 1, можно рассматривать редуцированную игру с множествами стратегий S2b V b G A. Далее проводятся рассуждения по индукции, ¦
Утверждение 12.2. Пусть траектория {s(t)} соответствует набору адаптивных правил pa, a G A и s(t) = s при t > t Тогда s — равновесие по Нэшу игры Г.
Доказательство. Из условия вытекает, что
lim pa(sA\{a})|ht) = 0
t^-ГО
при любых sA\{a} = (sb, b G A\{a}). Следовательно,
lim pa(s^, b G A\{a})|ht) = 1 V a G A. (12.2)
t^TO
Предположим, что s не является ситуацией равновесия. Тогда найдется такая стратегия sa некоторого игрока а, что ua(s||sa) > ua(s). С учетом
(12,2) при достаточно большом t
pa(sAK{a}
sA\{a}
sa) > У pa(
sA\{a}
I h )ua(sA\{a}
sA\{a}
| ht)ua(sA\{a}
sa).
Отсюда sa(t + 1) = sa, что противоречит условию, ¦
Большой интерес представляют обратные результаты — о сходимости адаптивных процессов к равновесиям по Нэшу (см, теоремы 5,3 и 10,5),
§ 13. Позиционные игры с полной информацией
Многие реальные конфликтные ситуации имеют длительный характер, Их участники действуют неоднократно и с учетом информации о предшествующем развитии конфликта. Для соответствующих моделей общие теоремы существования решения для игр в нормальной форме не позволяют находить или даже конкретизировать оптимальное поведение из-за большого числа возможных стратегий. Для решения динамических игр с конечным числом игроков часто удобно использовать позиционное представление игры. Наиболее простым классом позиционных игр является класс конечношаговых позиционных игр с полной информацией, В такой игре на каждом шаге игры делает ход лишь один игрок, имеющий полную информацию о текущем состоянии, всех происходящих действиях и общей структуре игры. Это предположение обычно характеризуется как полная информация. Хорошо известными примерами таких игр являются шашки и шахматы. Многошаговые антагонистические игры с полной информацией рассматривались в § 8, В этом параграфе будут получены более общие результаты.
Напомним пример 9,1 взаимодействия продавца (игрока 1) и покупателя (игрока 2), У продавца две стратегии: "чеетноеть"и "обман", У покупателя также две стратегии: "поверіпь"п "проверить". Матрицы выигрышей игроков имеют вид
Рассмотрим динамическую модификацию игры: пусть покупатель способен заметить, обвешивает его продавец или нет, т.е. он выбирает свой
|
вариант поведения, зная поведение продавца. Соответствующая схема изображена на рис, 13,1, \ |
 |
|
Рис. 13.1 |
Интуитивно понятно, что рациональным поведением покупателя является выбор оптимального ответа, выделенного на рисунке жирными линиями, В свою очередь, продавец может выбрать оптимальную стратегию, зная реакцию покупателя. Ниже дается обобщение этого метода решения для любой игры е полной информацией. Приведем соответствующие формальные определения.
Определение. Конечным деревом,, или ориентированным графом без циклов, называется пара (X, а), где X — конечное множество вершин, или позиций, а отображение а : X ^ X сопоставляет каждой вершине ее ближайшего предшественника, причем
• существует единственная началеная вершина х0, такая, что а(хо) =
х0;
• существует целое l > 0 , что а1 (х) = х0 для всех х ? X; наименьшее такое l называется длиной дерева (X, а).
Любая вершина х, для которой а-1(х) = 0, называется финальной вершиной дерева (X, а), а множество всех таких вершин обозначается через T. Для нефинальных вершин х множество а-1 (х) состоит из преемников х, т,е, го следующих за х вершин. Ребра дерева (X, а) называются альтернативам,и.
Определение. Позиционной игрой с полной информацией, называется следующая совокупность:
G = (A, (X, а), ua(x),x ? T, а ? A; X\T = J Xa U X0,
' aeA
V х ? X0 3 p(x'|x), X ? а-1(х)^, где
• A — множество игроков;
• (X, о) — конечное дерево с начальной вершиной x0 и множеством T финальных вершин;
• R = {Xa, a Е A, X0} — разбиение множества X\Т на попарно неперееекающиеея подмножества;
• X a — множество позиций, в которых дел ас т ход игрок a Е A; Xa называется множеством личных позиций игрока a.
• X0 — множество позиций, в которых "делает ход"случай;
• ua : T ^ E1 — функция выигрыша игрока а;
• для каждого х Е X0 заданы вероятности
p(x'|x) > 0, p(x'|x) = 1,
x'?a—1(x)
перехода из позиции х в позиции X Е o-1(x).
Разбиение R определяет, какой игрок (или случай, сели x Е X°) ходит в каждой конкретной нефинальной вершине x. Если x° Е Xa, а Е A, то игра начинается с того, что игрок а должен выбрать следующую за x° вершину, скажем, x1 Е o-1(x°). Если x1 — финальная вершина, то игра окончена и выигрыши игроков суть ua(x1), а Е A. Если x1 — нефинальная вершина, то игрок Ь, для которого x1 Е Xb, имеет право хода и выбирает следующую за x1 вершину, скажем, x2 Е о-1 (x1) и т.д. Если в какой-то момент мы попадаем в вершину x Е X0 (в которой ходит случай), то с вероятностью p(x'|x) мы переходим к одной из вершин X Е o-1(x), в которой продолжаем действовать способом, описанным выше.
Если игрок а в вершине x Е Xa верш ину X Е o-1(x), то
также будем говорить, что он выбирает соответствующую альтернативу — ребро дерева, соединяющего вершины x и x'.
|
1 |
 |
|
Рис. 13.2 |
На рис, 13,2 отмеченные крестиками вершины являются финальными, В вершине 0 ходит случай, в остальных — игроки 1, 2 и 3,
Чтобы определить исход позиционной игры, для каждой позиции л го-бого игрока должна быть указана вершина, куда он перейдет. Введем для этого несколько понятий.
Определение. Стратегией игрока а ? A называется отображение ца, определяющее для каждой вершины x ? Xa позицию, в которую он перейдет: V x ? Xa ца(х) ? a-1(x). Множество всех стратегий игрока а обозначим через {ца}.
Набор таких стратегий ц = (ца, а ? A) называется ситуацией. Для каждого х ? X для данной ситуации ц можно определить вероятность p(x|ц) перехода в позицию х. При этом р(х0|ц) = 1 — игра всегда начинается с позиции x0.
В общем случае вероятность попасть в позицию x, непосредственно следующую за позицией игрока a(x) ? Xa, а ? A, определяется по формуле p(x|ц) = p(a(x)^)p(x|a(x), ц), где
p(x|a(x), ц)
I 1, если ца(a(x)) = x,
I 0 в противном случае.
Если же a(x) ? X0 — позиция случая, то вероятность p(x|a(x),^ = p(x|a(x)) задана условиями игры. Таким образом, для любой ситуации ц для каждого игрока а ? A определено среднее значение функции выигрыша
иа(ц) = E(ua(x)|ц) = p(x^)ua(x).
xET
Упражнение 13.1. На рис, 13,3 ребра дерева, соответствующие ситуации ц, выделены жирными линиями, а финальные позиции пронумерованы от 1 до 6, т,е, T = {1,..., 6}, Найдите вероятности p(x|ц), x ? T.
О
 |
Рис. 13.3
Определение. Игра r(G) = ^A, {ца}, иа(ц), а ? Aj называется нормальной форм,ой позиционной игры G. |
Для любой вершины z ? X можно рассмотреть позиционную поды-
гру, начинающуюся из этой точки:
Oz), Xz", X:
A, (Xz,
ua(x), a E A
где
• Xz = {x | существует такое целое I > 0, что ol(x) = z};
• oZ есть сужение отображения о на Xz и oZ (z) = z;
• Xza = XaП Xz, a E A, X" = X0 П Xz;
• ua(x) = ua(x), если x E Xz П T.
Пусть ц = (pa, a E A) — ситуация в иrpe r(G). Обозначим через pz = (^, a E A) — ее сужение на Xz, а через ua (цz) — значение выигрыша игрока a в с итуаци и ц. Таким об разом, для люб ого z E X определена игра r(GZ) = (A, {цa}, ua(дz), a E A\ — нормальная форма для игры
Упражнение 13.2. На рис, 13,4 изображено дерево игры G, В финальных позициях указаны векторы выигрышей игроков u(x) = (ul(x), u2(x)) или исходы, игры.
О
 |
|
Рис. 13-4 |
Запишите нормальную форму данной игры G и подыгры Gz, соответствующей случайному выбору правой альтернативы.
Определение. Ситуация ц = (pa, a E A) называется совершенным подыгровым равновесием, игры G, ести для каждой вершины z E X ситуация ~pz = (~pa,a E A), где ~paz — сужение стратегии ~pa на подыгру
r(GZ), явдяется равновесием по Нэшу в игре r(GZ),
Алгоритм определения совершенного подыгрового равновесия (алгоритм Куна)
Алгоритм Куна состоит из последовательных редукций игры G.
Шаг 1, Рассмотрим множество Z\ предфинальных вершин, для которых все последующие вершины являются финальными: Z\ = {x | o-1(x) С T}, Для каждой вер шины x E Z1 действуем следующим образом.
1) Если в данной вершине ходит игрок а ? A(x ? Z1 ПХ0), то находим его наилучший выбор в этой вершине
д“(х) ? Arg max ua(y)
yea-1 (x)
и доопределяем вектор выигрышей игроков в вершине u(x) = (ub(x), b ? A) =f(ub(pa(x)), b ? A).
2) Если в данной вершине ходит случай (x ? Z1 ПХ0), то приписываем этой вершине среднее значение вектора выигрышей среди возможных альтернатив
u(x) = Е p(y|x)u(y).
yea-1(x)
В результате получили редуцированную игру с множеством финальных вершин Zi.
Шаг 2, Для этой игры аналогично шагу 1 находим множество нефинальных вершин Z2, для которых все последующие вершины в новом дереве являются финальными: Z2 = {x | a-1(x) C T U Z1}, Для каждой вершины x этого множества аналогично пунктам 1) и 2) определяем выборы pa(x) при x ? Xa и вектор выигрышей u(x).
Далее аналогично продолжаем этот процесс для множеств
Z3 = {x | a-1(x) C T U Z1 U Z2},
Z4 = {x | a-1(x) C T U Z1 U Z2 U Z3}
и t,д,, пока очередное множество Z\ не будет состоять только из начальной вершины x0. При этом полученная ситуация Д = (Д3, а ? A) будет совершенным подыгровым равновесием исходной игры G. Таким образом, доказано следующее утверждение.
Теорема 13.1. В любой конечной позиционной игре с полной информацией существует совершенное подыгровое равновесие. Соответствующие стратегии и выигрыши игроков задаются алгоритмом Куна,
Упражнение 13.3. Найти совершенное подыгровое равновесие в позиционной игре G, изображенной на рис, 13,4,
Пример 13.1. Модель внутриведомственного экологического контроля, Пусть первый игрок — предприятие, имеющее две стратегии: 1 — применять экологически чистый способ производства и 2 — применять "грязный", но более дешевый способ. Второй игрок — контролирующий орган, принадлежащий тому же ведомству, что и предприятие. Он имеет две стратегии: 1 — штрафовать за применение "грязного"способа производства, 2 — пропускать экологическое нарушение ("закрывать глаза").
|
1 |
 |
|
Рис. 13.5 |
(1
(-5, -2) (2,-1)
Вначале ходит первый игрок, а затем — второй, зная выбор первого. На рис, 13,5 изображено дерево игры, В финальных вершинах дерева указаны условные выигрыши игроков. Например, если оба игрока применяют вторые стратегии, то первый выиграет 2, а второй проиграет 1, поскольку при этом произошло загрязнение окружающей среды.
Легко видеть, что совершенным подыгровым равновесием в данном случае является набор ц = (2, 2), приводящий к исходу (2, —1), Однако, в этой игре существует равновесие по Нэшу, более выгодное для второго игрока : он может использовать "стратегию наказания"(см, §11) и при выборе первым игроком второй стратегии выбирать стратегию "штрафовать", что приводит к исходу (—5, —2) (несмотря на то, что это ему не выгодно), Тогда первый игрок, чтобы не получить —5, предпочтет выбрать первую стратегию, В итоге получится ситуация равновесия ц = (1,1), которая не является совершенным подыгровым равновесием. Отметим, что ситуацию (2, 2) можно также получить исключением доминируемых стратегий в игре r(G) с матрицами
штр проп
|
штр проп |
1 1
-5 2 |  |

Нетрудно видеть, что стратегия 1 второго игрока слабо доминируется стратегией 2, Если ее вычеркнуть, то получается игра, где стратегия 2 первого игрока строго доминирует стратегию 1, В результате исключения доминируемых стратегий останется ситуация (2,2), которая обычно и возникает при внутриведомственном контроле, В этом примере игра r(G) разрешима по доминированию.
Вообще для игр с полной информацией типична ситуация, когда совершенное подыгровое равновесие одно, а прочих равновесий по Нэшу, связанных со стратегиями наказания, много.
Рассмотрим следующее возмущение игры G: пусть в каждой позиции с некоторой достаточно малой вероятностью е > 0 все игроки ошибаются, В каждой позиции игрока а с вероятноетыо 1 — е реализуется намеченная им альтернатива, а с вероятностью е происходит ход случая и равновероятно реализуется любая другая альтернатива. Обозначим через G? указанную возмущенную игру. Очевидно, что множества стратегий остаются такими же, как в игре G, и любая вершина исходной игры в возмущенной игре G? реализуется с положительной вероятностью при любых стратегиях игроков.
Теорема 13.2. Пусть в исходной игре G существует единственное совершенное подыгровое равновесие. Тогда для любого достаточно малого е > 0 в игре G? существует единственное равновесие по Нэшу, совпадающее с совершенным подыгровым равновесием исходной игры.
Доказательство повторяет схему алгоритма Куна, В любой предфинальной позиции х Е Z1 П Ха существует единственный наилучший выбор Ца(х) игрока а, отвечающий совершенному подыгровому равновесию, В любой ситуации равновесия ц при достаточно малых е > 0 Ца(х) = ца(х), поскольку вероятность осуществления позиции х положительна и любой другой выбор приведет к строго меньшему выигрышу. Далее рассматриваются вершины из Z2, Z3,..., проводятся аналогичные рассуждения по индукции и доказывается, что ц = ц. ¦
Следствие. Пусть G — позиционная игра, для которой существует единственное совершенное подигровое равновесие ц. Тогда игра в нормальной форме r(G) разрешима по доминированию, а выигрыши игроков иа(ц), а Е A, задаются алгоритмом Куна,
В следующем примере (рис, 13,6) совершенное подыгровое равновесие строго хуже для игроков, чем другая ситуация,
1

§ 14. Позиционные игры общего вида
Основное отличие позиционных игр с неполной информацией от игр с полной информацией состоит в том, что игрок в момент принятия решения не знает точно состояние игры, то есть не различает некоторые вершины между собой. Отметим, что неточная информация о текущем состоянии типична для реальных конфликтов. Общее понятие позиционной игры (с неполной информацией) отличается от данного выше определения игры с полной информацией в следующем отношении. Для каждого игрока а вводится дополнительное разбиение множества его позиций на информационные множества. Информационное множество — это совокупность состояний позиционной игры, которые игрок не различает между собой. Необходимым условием для всех позиций одного информационного множества является одинаковое число альтернатив, т.е. последующих позиций, в каждой такой вершине. Кроме того, информационное множество не должно содержать двух позиций, принадлежащих одному пути, соединяющему начальную вершину с некоторой финальной. Занумеруем эти множества для каждого игрока и обозначим информационное множество с номером j игрока а ? A через Zaj.
Как и в игре с полной информацией, в произвольной позиционной игре
G = (а, (X,a), ua(x),x ? T, а ? A; X\Т = Д Xa U X0,
' aeA
V x ? X0 3 p(x'\x), x' ? a-1(x)^,
заданы
• A — множество игроков;
• (X, а) — конечное дерево (ориентированный граф без циклов), где X — множество позиций (вершин) с начальной вершиной x0 и а : X ^ X — отображение, сопоставляющее каждой вершине дерева (X, а) ее ближайшего предшественника, причем
1) a(xo) = xo,
2) найдется целое l > 0, что а1 (x) = x0 V x ? X; наименьшее такое l называется длиной дерева (X, а);
• T = {x ? X \ a-1(x) = 0} — множество финальных вершин;
• R = {Xa, а ? A, X0} — разбиение множества X\Т на попарно непересекающиеся подмножества;
• Xa — множество личных позиций, в которых делает ход игрок а ?
A;
• X0 — множество позиций, в которых "делает ход"елучай;
• ua : T ^ E1 — функция выигрыша игрока а;
• для каждого x Е X0 заданы вероятности
p(x'\x) > 0, p(x'\x) = 1,
x'?a—1(x)
перехода из позиции х в позиции x' Е a-1(x).
Кроме того, для каждого а Е A задано разбиение
Xa = у Zaj
jeJa
на информационные множества Zaj, j Е Ja, включающие позиции с одинаковым числом альтернатив, равным k(j), Альтернативы каждой позиции x Е Zaj пронумерованы слева направо числами от 1 до k(j). Игрок а делает ход, не различая позиции из Zaj между собой. Чтобы отразить это обстоятельство, обозначим через Alaj = {1 ,...,k(j)} множество номеров альтернатив для информационного множества Zaj игрока а Е A. Во всех позициях x Е Zaj множеетво Alaj изоморфно множеству позиций a-1(x). Обозначим через ?(x, k) вершину, следующую за x и соответствующую альтернативе с номером k Е Alaj при указанном изоморфизме.
Определение. Чистой стратегией игрока а Е A называется отображение цф определяющее для каждого информационного множества Zaj альтернативу pa(Zaj) Е Alaj, которую игрок выбирает в любой из вершин этого множества. Набор таких стратегий ц = (pa, а Е A) называется ситуацией.
Вероятность попасть в позицию x Е X, непосредственно следующую за вершиной a(x) Е Zaj при использовании ситуации ц, определяется по формуле p(x\p<) = p(a(x)^)p(x|a(x),ц), где
p(x\a(x), ц)
1, если x = ?(a(x),цa(Zaj)), 0 в противном случае.
Если же a(x) Е X0 — позиция стучая, то вероятность p(x\a(x), ц) = p(x\a(x)) задана условиями игры. Таким образом, для любой ситуации ц для каждого игрока а Е A определено среднее значение функции выигрыша
U» = E (ua(x)^) = p(x\ц)ua(x).
xeT
Определение. Смешанной стратегией na ^^ока а Е A называется вероятностное распределение на множестве {ц0,} его чистых стратегий, ставящее в соответствие каждой стратегии ца вероятность ее выбора.
Ситуация п = (na, а ? A) в смешанных стратегиях определяет вероятностное распределение на множестве T финальных позиций:
P(x\n) = ^ ( П пі“)P(xH V x ? T•
f-i a?A
Ожидаемый выигрыш игрока а в ситуации п определяется как математическое ожидание
па(п) = E(ua(x)\p) = p(x\n)ua(x).
хет
Указанный способ введения смешанных стратегий аналогичен случаю игр в нормальной форме. Однако в данном классе игр он, как правило, неэффективен, поскольку даже для небольших деревьев число возможных чистых стратегий может быть очень велико. Более эффективным является следующий подход, связанный с понятием стратегии поведения.
Рассмотрим ситуацию, когда игрок выбирает вероятностное распределение на альтернативах для каждого своего информационного множества и, в случае своего выбора, проводит рандомизацию, пользуясь этим распределением. При этом предполагается, что случайный выбор альтернатив в различных информационных множествах производится независимо.
Определение. Стратегией поведения в игрока а называется отображение, которое каждому информационному множеству Zaj, j ? Ja, сопоставляет набор
Кз)
(Pk , к = ^ k(j)) : ^pi3 = \,p°a > 0, к = ^ k(j),
к=1
причем рк3 - вероятность выбора альтернативы к ? Alaj в любой позиции множества Zaj.
Любая ситуация в = (Pa, а ? A) в стратегиях поведения определяет вероятностное распределение на множестве позиций следующим образом:
a(x) ? Zaj, x = ?(a(x),k), к ? Alaj ^ p(x\e) = p(a(x)\e)рк3;
а(х) Е X0 ^ р(х\в) = р(ст(х)\в)р(х\а(х)).
Ожидаемый выигрыш иа(в) игрока а в ситуации в = (вa, а Е А) определяется как математическое ожидание иа(в) = Y1 р(х\в)иа(х).
хёг
Таким образом, мы определили два смешанных расширения игры
r(G): ^
r(G) = (A, {па}, иа(п), а Е А) и r(G) = (A, {ва}, иа(в), а Е А).
Как они между собой соотносятся? Изучим этот вопрос, используя следующие понятия.
Определение. Позиция х Е Ха игрока а называется возможной для смешанной стратегии па (чистой стратегии ца), если существует такая ситуация п (ц), содержащая па (ца), что р(х\п) > 0 (р(х\ц) > 0),
Определение. Информационное множество Хаа игрока а называется существенным для смешанной стратегии па (чистой стратегии ца), если некоторая позиция х Е возможна для па (ца).
Обозначим множество позиций, возможных для стратегии ца, через PosspA а семейство информационных множеств, существенных для ца, через Rel ца, Аналогично вводятся множество Poss па и семейство Rel па.
Обозначим через [х0, х] путь, ведущий го начальной вершины х0 дерева в вершину х.
Упражнение 1^.1. Пусть ца — чистая стратегия игрока а Е A. Покажите, что х Е Poss ца тогда и только тогда, когда стратегия ца в любой вершине х' Е [х0,х] П Xа, х' = х, выбирает альтернативу, принадлежащую пути [х0, х]. В частности, если х Е Xа П — первая позиция, где игрок а делает ход, то х Е Poss ца и Е Re 1 ца для любой чистой
стратегии ца.
Для смешанной стратегии пА информационного множества Zа' и альтернативы к Е АІа' положим
р(паз)= Е , рк(па,п = ? д..
^a.Zaj \^а ^a:Zaj бКв 1 Щ, /Ua(Z aj ) = k
Здесь P(па, j) — вероятность выбора чистой стратегии ца, для которой множество Z^7 возможно, а Pk(па, j) — вероятность выбора аналогичной стратегии ца с дополнительным условием ца^а') = к. Нетрудно видеть,
что
k(j)
P(na,j) = Y pk(na,j).
k=1
Определение. Стратегией поведения fia, соответствующей смешанной стратегии па игрока а, называется стратегия поведения, определяемая следующим образом:
( Рк(na,j)/P(na,j), если Zaj е Ее1па,
pk = I ^ п“а, если Zaj е Relna. (14-1)
y^a:^a(Z aj )=k
Из последних формул вытекает, что каждая смешанная стратегия однозначно определяет соответствующую стратегию поведения. Обратно, каждой стратегии поведения соответствует много смешанных стратегий. Но одну из них всегда можно задать следующим образом.
Лемма, 14-1. Если дана стратегия поведения ^игрока а и смешанная стратегия na определена по формуле
a
да
Пр
jeJа
где ya(Zaj) = ij е Alaj V j е Ja, то fta есть стратегия поведения, соответствующая na.
Доказательство. Любая чистая стратегия ya игрок а а определяется набором значений
ia = (ij | ya(Zaj) = ij е Alaj, j е Ja).
Поэтому
k(j)
Y пуа = ЕП = П YPaj = 1
да ia jeJа jeJа ij=1
Пусть Zaj е Relna. Тогда для k е Alaj
„a
Pk (na,j) = y,
Щ:ЯаeRel^, ^(Z^)=k
= ( 52 П Ра^лл)Pk = dkPk .
aa.zajeRela“, aa(zaj)=k l^Ja\{j}
Величина dk от k G Alaj не зависит, поскольку она представляет собой сумму одинакового числа слагаемых, не зависящих от к. Отсюда
k(j) k(j)
Pk. (na,j )/P (na ,j).
P(^a,j) = ^ pkipa,j) = ^ dkPta = dk ^ Pla
k=i k=i
Пусть Zaj G Rel na. Тогда
|
paa(zal) |  |
E
aa:aa(zaj)=k ieJa\{j}
„a
naa
aa:aa(zaj )=k
= П 5] Pa'a(Za1)Pkj = P^ . ¦
ieJa\{j} aa:aa(zaj)=k
Приведенная лемма утверждает, что мы можем получить каждую стратегию поведения из некоторой смешанной стратегии.
Пример 14-1. Игра с партнером, В этой антагонистической игре игрок 1 состоит из двух агентов, называемых Играющий и Партнер, Две карты, "старшая"и "младшая", сдаются Играющему и игроку 2, Оба возможных расклада карт считаются равновероятными. Игрок со старшей картой получает доллар от игрока с младшей картой и имеет альтернативы либо закончить, либо продолжить партию. Если партия продолжается, Партнер, не зная расклада (и полученной суммы), может посоветовать Играющему поменяться картой с игроком 2 или сохранить свою карту. Снова имеющий старшую карту получает доллар от агента, имеющего младшую (см, рис, 14,1, где в каждой финальной позиции записан выигрыш игрока 1),

Здесь X1 = Z11 U Z12, X2 = Z21. Поэтому д1 = (p\Zlv),p1(Z12)) ид2 = (^2(Z21)). Матрица ожидаемых выигрышей п1(ц1,ц2) первого игрока есть
(1)
закончить (1,1)/ 0 (1, 2)
(закончить, оставить) (закончить, меняться) (продолжить, оставить) (2,1) (продолжить, меняться) (2, 2)
0
1/2 V -1/2
(2)
продолжить -1/2 \
1/2 0 0
|
п1 ((1, 1), 1) = |
1/2 |
1 + 1/2 |
( |
|
п1((1,1), 2) = |
1/2 |
1 + 1/2 |
( |
|
п1 ((1,2), 1) = |
1/2 |
1 + 1/2 |
( |
|
п1 ((1,2), 2) = |
1/2 |
1 + 1/2 |
0 |
|
п1 ((2,1), 1) = |
1/2 |
2 + 1/2 |
( |
|
п1((2,1), 2) = |
1/2 |
2 + 1/2 |
( |
|
п1 ((2, 2), 1) = |
1/2 |
0 + 1/2 |
( |
|
п1 ((2, 2), 2) = |
1/2 |
0 + 1/2 |
0 |
|
Решение матричной игры |
(П |
0;
1/2;
1/2;
0;
-1/2;
0.
обеспечивает игроку 1 ожидаемый выигрыш 1/4, а игроку 2 — ожидаемую потерю, не превышающую 1/4, С другой стороны, сели взять етра-
1 11 1 11 12 тегию поведения ИГроКа is = Р11, 1 — s = Р11 и r = p12,
получим, что ожидаемый выигрыш игрока 1 равен
1 — r = p22; т0
I s/2 + 2((1 - s)r/2) + 0 - 1/2 = (s - 1)(1/2 - r), если р2 = (1),
[в/2 + 2((1 - s)r/2) + 0 + (-2)r/2 + 0 = s(1/2 - г)^ли р2 = (2).
Для любых s и r игроку 1 гарантирован только минимум из этих двух значений. Следовательно, максимальная сумма, которую игрок 1 может себе обеспечить, равна
max min[(s - 1)(1/2 - r),s(1/2 - r)] = 0
0<s,r<1
и достигается при r = 1/2. Таким образом, стратегии поведения могут дать худший результат, чем смешанные стратегии. Заметим, что смешанная стратегия п = (п^ 1), п(1 2), п(2 1), п(2 2)) имеет соответствующую стратегию поведения в1 = (s,r) = (п^ 1) + п^ 2), п^ 1) + п12 1)), Следовательно, если мы рассмотрим оптимальную смешанную стратегию (0,1/2,1/2, 0) игрока 1, соответствующей стратегией поведения будет s = r = 1/2, и, в то время как оптимальная смешанная стратегия обеспечивает первому игроку выигрыш 1/4, даже соответствующая стратегия поведения дает ему только 0, Это расхождение объясняется, конечно, независимостью, содержащейся в природе стратегии поведения. Чтобы получить положительные результаты при использовании стратегий поведения, надо наложить ограничение на информационное разбиение.
Определение. Игра G называется игрой с полной памятью для игрока а, если из Zaj Е Relpa и x Е Zaj следует x Е Posspa для всех Zaj, x и д“.
Из определения вытекает, что в игре с полной памятью для игрока а любая позиция из существенного информационного множества является возможной. Термин "полная память "означает, что игрок может точно восстановить, какие альтернативы он выбирал во всех своих предыдущих ходах (см, упражнение 14,1),
В примере 14,1 игра G не является игрой с полной памятью для игрока 1, Действительно, информационное множество Z12 существенно для стратегии р1 = (1,2), поскольку, если игрок 2 использует стратегию р2 = (2), то позиция у Е Z12 реализуется с вероятноетыо 1/2. Однако другая позиция x Е Z12 те является возможной для стратегии р, так как Играющий, получив старшую карту, заканчивает игру.
Игра с полной памятью для всех игроков превращается в игру с полной информацией, если все ее информационные множества содержат по одной вершине.
Пусть w Е T — финальная позиция, а игроку а принадлежит некоторая позиция пути [x0,w]. Предположим, что его последняя позиция x Е Zaj П [x0, w] имеет альтернативу с номером t Е Alaj, также принадлежащую пути [x0, w]. Положим
Sa(w) = {ца | Zaj Е Re1ца, pa(Zaa) = t}.
Наконец, пусть величина c(w) равна или произведению вероятностей альтернатив случая, принадлежащих пути [x0,w], или 1, если таковых нет. На рис, 14,1 для финальной вершины w c(w) = 1/2, S:(w) = {(1,1),(2,1)}.
Лемма 14-2. Пусть G — игра с полной памятью для всех игроков. Тогда для любой ситуации ц = (ца, а Е A) и для вс ex w Е T
, . . Ic(w), eoiHua Е Sa(w) V а Е A,
P(w|k4 = \ п
10 в противном случае.
Доказательство. Очевидно, достаточно показать, что если ца Е Sa(w), а Е A, то каждая стратегия ца выбирает альтернативы игрока а, принадлежащие пути [x0,w] (если таковые существуют). Но если ца Е Sa(w), то Zaj Е Re1ца и, так как G — игра с полной памятью, то x Е Poss ца. Поэтому ца выбирает все альтернативы игрока д, принадлежащие пути [x0,w] (см, упражнение 14,1), ¦
Следствие. Пусть G — игра с полной памятью для всех игроков. Тогда для любой ситуации в смешанных стратегиях п = (па, а Е A) позиция w Е T возникает с вероятностью
p(w|n) = ?П p(w|^) = ^ п c(w). (14.2)
Г- a€A ^:^aESa(w),aEA a€A
Лемм,а, 14-3. Пусть G — игра с полной памятью для игрока а. Позиции z Е Za1, ?(z, k) и x Е Za1 принадлежат пути [x0,w], w Е T, причем x следует за z.1 Тогда множества Si = {ца | Za1 Е Пе1ца, ца(Za1) = k} и S2 = {ца | Zaj Е Re 1ца} совпадают,
Доказательство. Пусть ja Е S\. Тогда Zal Е Rel/a, и, так как G — игра с полной памятью для игрока а, то z Е Poss ja. Следовательно, стратегия ja выбирает все альтернативы игрока а на пут и [0, z]. Но ja(Za1) = k, и, значит, /a выбирает все альтернативы игрока а на пути [0,x]. Следовательно, x Е Poss ja, Zaj Е Rel ja и ja Е S2.
Пусть ja Е S2. Тогда Zaj Е Rel ja, и, так как G — игра с полной памятью для игрока а, то x Е Poss ja. Следовательно (см, упражнение 14,1), z Е Poss ja и ja(Za1) = k, т.е, ja Е Si. ¦
Следующее утверждение показывает, что в играх с полной памятью можно ограничиться поиском равновесий по Нэшу в стратегиях поведения.
Теорема 14.1. Пусть в — ситуация в стратегиях поведения, соответствующая (по формулам (14,1)) произвольной ситуации п в смешанных стратегиях в игре G, в которой все позиции имеют по крайней мере две альтернативы. Тогда для того чтобы ua(P) = ua(n), а Е A, для всех п и для любых значений функций выигрыша ua(w), а Е A, w Е T, необходимо и достаточно, чтобы G была игрой с полной памятью для всех игроков.
Доказательство. Необходимость, Пусть G не является игрой с полной памятью для некоторого игрока а. Тогда должна существовать чистая стратегия ja и такие две позиции x и у в некотором информационном множестве Zaj, что x Е P°ss ja и у Е Poss ja. Выберем стратегию fia, для которой x Е Poss /Си ja(Zaj) = t = дa(Zaj). При этом существует такая позиция z Е [x0,x] П Za1, в которой k-ая альтернатива, принадлежащая [x0, x], стратегией ja выбирается, а стратегией /a — нет. Пусть д — такая ситуация, еодержащая ja, что p(x| д) > 0, а w Е T — финальная позиция, следующая за x, для шторой p(w|j) > 0. В игре G примера 14.1 (см, рис, 14,1) а =1, k = 2, t =1, l = 1,j = 2, j1 = (1, 2), д1 = (2,1), д2 = (1).
Положим na = (1/2) ja + (1/2) ja. Для соответствующей стратегии поведения вa выполнено pa1 = Vt = 1/2. Пусть ситуация в в стратегиях поведения соответствует ситуации п = j||na. Тогда p(w|e) < (1/4)c(w) < (1/2)c(w) = p(w|n). Определим для игрока а функцию выигрыша следующим образом:
ua(w')
1, w' = w,
0, w' Е T, w' = w.
Тогда из последнего неравенства следует, что ua(P) < ua(n) (противоречие).
Достаточность, Предположим, что G — игра с полной памятью для всех игроков. Тогда достаточно показать, что p(w|в) = p(w|п) для всех w Е T. Возьмем некоторую финальную позицию w.
Пусть x1 Е Zari, ...,xr(a) Е Zajr(a) — позиции игр ока а, расположенные в порядке следования вдоль пути [x0,w], а к1 Е Alari , ...,kr(a) Е Alajr(a) — номера соответствующих альтернатив, принадлежащих пути [x0,w]. Заметим, что Zari Е Relpa для всех ца (см, упражнение 14,1), Поэтому
P (na,j1)= ^ ^a = 1.
щ-.z aji GRe 1 щ
Без потери общности можно считать, что все информационные множества Zaj2,..., Zajr(a) существенны для стратегии na. Действительно, в противном случае p(w|e) = p(w|п) = 0.
В данных обозначениях
Sa(w) = [pa | Zajr(a) е Re 1 ца, pa(Zajr(a)) = kr(a)}
Из леммы 14,3 следует, что
Pkr-i (na,jr-1) = P (na,jr), r = 2,...,r(a).
Отсюда вытекает, что для соответствующей na стратегии поведения ea = (paj, к Е Alaj, j Е Ja) по формулам (14,1)
r(a)
r(a)
Pkr (na jr) _ „ , a
Pkr(a) (П ,jr(a) )
(14.3)
= P (na,jr )
r=1
^aesa(w)
Используя следствие леммы 14,2, получаем
(14.3)
r(a)
ajr v _!
r
p(w|e) = C(w)n ПPkr
aGA r=1
(14.3)
c(w) ^ П ^=p(w|n). ¦
^aeSa(w),aeA aGA
c(w)n
„a
aGA ^aGSa(w)
Упражнение 14-2. Изменим правила игры из примера 14,1, Первым делает ход игрок 2, Он выбирает вариант расклада двух карт (старшей и младшей) Играющему и себе. Играющий, не зная расклада, может оставить карты в прежнем положении, либо поменять их местами. Затем, Партнер, наблюдавший за действиями Играющего, также может выбрать одну из двух альтернатив: не трогать карты, либо поменять их местами. Игрок, имеющий в итоге старшую карту, получает от другого игрока доллар и дополнительную сумму, определяемую по следующему правилу. Если игрок 1 имеет старшую карту в результате одного (или двух) ее перемещений, то он получает от игрока 2 дополнительно два (или три) доллара, В аналогичной ситуации игрок 2 получает от игрока 1 дополнительно один доллар (или два доллара). Если после раздачи, карты не перемещались, то дополнительные выплаты не производятся. Установить, что описанная антагонистическая игра G является игрой с полной памятью для обоих игроков. Найти оптимальные стратегии поведения и значение игры,
§ 15. Кооперативные игры
Кооперативные игры относятся к пестратегическим играм, в которых игроки делят некоторое количество (денежного дохода, ресурса и т.п.), используя какой-либо принцип оптимальности.
Пример 15.1. Игра "джаз-оркестр". Владелец ночного клуба в Париже обещает $1000 певцу, пианисту и ударнику (игроки 1,2 и 3) за совместную игру в его клубе. Выступление дуэта певца и пианиста он расценивает в $800, ударника и пианиста — в $650 и одного пианиста — в $300, Дуэт певец—ударник зарабатывает $500 за вечер в одной станции метро, певец зарабатывает $200 за вечер в открытом кафе. Ударник один ничего не может заработать. Какое распределение дохода в $1000 следует считать разумным, учитывая описанные возможности игроков?
Пусть A — множество номеров игроков. Подмножества K С A в кооперативной теории называются коалициям,и. Функция v, сопоставляющая каждой коалиции K те доход v(K), называется характеристической. Характеристическая функция v называется супераддитивной, если v(K U T) > v(K) + v(T) для любых неперееекающихея коалиций K и T. Условие супераддитивности означает, что при K П T = 0 доход коалиции K U T те меньше суммы доходов коалиций K и T, В дальнейшем вместо v({i, j,...,l}) будем писать v(ij...l).
В примере 15,1 A = {1,2, 3}, а характеристическая функция v принимает следующие значения: v(1) = 200, v(2) = 300, v(3) = 0, v(12) = 800, v(23) = 650, v(13) = 500, v(123) = 1000, Нетрудно видеть, что v супераддитивна. Если бы условие супераддитивности здесь нарушалось (скажем, при v(1) = 400), то собрать весь состав музыкантов за $1000 было бы трудно, если только к совместной игре их не привлекают другие стимулы.
Определение. Кооперативной игрой ( или игрой в форме характеристической функции) называется пара K = (A,v).
Установим связь между играми в нормальной форме и кооперативными играми. Предположим, что в игре Г = ^A, Sa, ua(s), a Е A множества стратегий игроков конечны, а выигрыши — денежные. Игроки могут осуществлять побочные платежи, т,е, перераспределять между собой полученные выигрыши. Определим характеристическую функцию, Для коалиции A естественно положить v(A) = max ua(s). Для
seS aeA
любой коалиции K = A и ситуации s обозначим
sK = (sa, a Е K) Е SK = 0 Sa.
a€K
Теперь ситуацию s можно записать в виде s = (sK, sA\K). Пусть игра Г имеет постоянную сумму, т.е,
ua(s) = const.
aeA
Для таких игр v(K) можно определить как значение антагонистической игры коалиции K против ее дополнения A\K
rK = (SK ,SA\K ,uK (sK ,sA\K) = ? ua(sK ,sA\K)-.
a€K
Упражнение 15.1. Докажите, что для игры Г с постоянной суммой характеристическая функция v супераддитивна и
v(K)+ v(A\K)= v(A) VK c A. (15.1)
Определение. Говорят, что кооперативная игра K = (A, v) имеет постоянную сумму, если для нее выполнено условие (15,1),
Пример 15.2. Рассмотрим две пары матриц
5 6 5 7 -2)
(—4 3
(2 35
И V
7 -1 2 3
A1 A2 --
, B1--, B2
Первый игрок выбирает номер строки г, второй — номер столбца j, а третий игрок выбирает номер пары r ? {1, 2}. Выигрыш первого игрока равен aj, второг о — bj, а третье го — cj = 10 — aj — . Игр а Г имеет постоянную сумму v(123) = 10. Найдем v(1). Первый игрок играет против коалиции {2, 3} в игру с матрицей
(1,1) (1, 2) (2,1) (2, 2)
1 / 2 7 3 —1
2 I 4 2 1 3
Вычеркивая первый и второй столбцы и решая игру 2 х 2, находим значение игры v(1) = 5/3. Из условия постоянства суммы v(23) = 10 — v(1) = 25/3.
Упражнение 15.2. В условиях примера 15,2 найдите значения характеристической функции v(2), v(13), v(3) и v(12).
Определение. Дележом, называется вектор y = (ya, a ? A), удовлетворяющий условиям
^ ya = v(A), ya > v(a) V a ? A.
aeA
Дележ y задает распределение выигрыша v(A), удовлетворяющее условию индивидуальной разумности ya > v(a) V a ? A. Пусть Y — множество всех дележей.
Из свойства супераддитивности характеристической функции v вытекает неравенство Е v(a) < v(A).
aeA
Определение. Кооперативная игра K = (A,v) называется несущественной, если Е v(a) = v(A).
aeA
В несущественной игре дележ y = (v(a),a ? A) — единственный, В дальнейшем будем рассматривать только существенные игры.
Определение. Две кооперативные игры K = ^A,v) и K' = (A,v') называются эквивалентными, если найдутся такие числа c > 0 и da, a е A, что v'(K) = cv(K) + ^ da V K C A.
аек
Переход от игры K к эквивалентной игре K' можно связать с изменением в c раз денежной единицы. Положительная величина da интерпретируется как дополнительная выплата игроку a. Если же величина da отрицательна, то — da можно рассматривать как плату игрока a за участие в игре. Дележ у игры K переходит в дележ z игры K' с компонентами za = cya + da V a е A.
Определение. Говорят, что кооперативная игра K' имеет (0 — 1)-редуцированную форм,у, если v'(A) = 1, v'(a) = 0 V a е A.
Для кооперативной игры K эквивалентная игра K' имеет (0 — 1)-редуцированную форму, если
c = (v(A) — v(a))-1 и da = —cv(a), Va е A.
a€A
Упражнение 15.3. Для игры "джаз-оркестр"найти эквивалентную игру в (0 — 1)-редуцированной форме,
В кооперативной теории нет единого понятия "разумного"де. іежа. Более того, различные соображения "оптимальности"приводят к разным множествам "разумных"де.іежеіі. Рассмотрим два подхода, основанные на понятиях ядра и вектора Шепли.
Определение. Множество дележей
C = {у е Y | Y, ya - v(K) V K = A}
a€K
называется ядром (или c-ядром от английского ”core”).
Дележ у, принадлежащий ядру, удовлетворяет условию "групповой разумности": выигрыш v(K) любой коалиции K не превосходит ее доли ya то дележу у.
a€K
Займемся выводом условия существования ядра, т.е. когда C = 0. Положим
C = {у е E|A| | Е ya - v(K) V K = A}.
a€K
Упражнение 15.4- Докажите, что ядро C существует тогда и только
тогда, когда
X
aeA
(15.2)
ya < v(A).
min
yea
В условии (15,2) min Уа запишем с помощью двойственной задачи
УеС aeA
линейного программирования
min у if yec> ^ у aeA
X AKv(K),
K=A
max
xeA
где
Л = (A = (AK, K = A) \ AK = 1 Va e A, AK > 0 V K = A}.
K:aeK
Последний максимум можно брать только по множеству Л0 крайних точек (вершин) многогранника Л (см, упражнение 5,5), Окончательно необходимое и достаточное условие существования ядра записывается в виде
^2 AKv(K) < v(A) V A e Л0. (15.3)
K=A
Векторы из множества Л называются сбалансированными покрытиями множества A, а векторы из множества Л0 — приведенными (или минимальными) сбалансированными покрытиями. Для коалиции K С A определим вектор
1, a e K, 0, a e K.
x(K) e E|a| : xa(K)
Эти векторы являются столбцами матрицы системы уравнений, задающей множество Л.
Для того чтобы сбалансированное покрытие A было приведенным, необходимо и достаточно, чтобы система векторов (x(K) \ AK > 0} была линейно независимой. Этот факт доказывается аналогично упражнению 5.5.
Определение. Семейство B коалиций называется сбалансированным, если найдется такое приведенное сбалансированное покрытие A, что B = (K \ AK > 0}.
Примером сбалансированного семейства коалиций является разбиение B множеетва A на попарно неперееекающиеея подмножества. Для соответствующего приведенного сбалансированного покрытия Л компоненты Лк = 1, K е B. Отметим, что для такого покрытия неравенство из (15,3) выполняется "автоматически", в силу супераддитивности характеристической функции. Поэтому приведенные сбалансированные покрытия, отвечающие разбиениям множества A, в дальнейшем не рассматриваются, Справедлив и более общий результат.
Упражнение 15.5. Пусть для приведенного ебаланеированного покрытия Л найдутся та,кие коалиции T и L, что T П L = 0, Лт > Ль > 0. Покажите, что покрытие д с компонентами
Дт - ЛД K = T,
0, K = L,
ЛД K = T U L,
Дк, K = T, L, T U L,
является приведенным сбалансированным и
? Лкv(K) < ? дкv(K). (15.4)
K=A к=А
Из (15,4) вытекает, что неравенства (15,3) достаточно проверять только для существенных приведенных сбалансированных покрытий Л, для которых не существуют неперееекающихея коалиций T и L с положительными Лт и ЛД
Найдем необходимое и достаточное условие существования ядра в кооперативной игре трех лиц. Компоненты вектора Л е Л0 упорядочим следующим образом: Л = (Л1, Л2, Л3, Л23, Л13, Л12). Перечислим все приведенные сбалансированные покрытия множества A:
Л(1) = (1,1,1, 0, 0, 0), Л(2) = (1,0,0,1, 0, 0), Л(3) = (0,1, 0, 0,1, 0),
Л(4) = (0, 0,1, 0, 0,1), Л(5) = (0, 0, 0,1/2,1/2,1/2).
С учетом результата упражнения 15,5 существенным покрытием является только Л(5) и условие существования ядра записывается в виде v(23) + v(13) + v(12) < 2v(123).
Упражнение 15.6. Для кооперативной игры "джаз-оркеетр"проверьте, что ядро С существует. Изобразите проекцию ядра на плоскость (y1, у2) и найдите его вершины.
В таблице 15.1 перечислены все существенные приведенные сбалансированные покрытия множества A игры четырех лиц.
Табл. 15.1
|
B |
AK , K G B |
|
A\{a}, a = 1, 2, 3, 4 {1,2,3},{1,2,4}, {3,4} {1,2,3},{1,4}, {2,4},{3,4} {1,2,3},{1,4}, {2,4},{3} |
1/3,1/3,1/3,1/3 1/2,1/2,1/2 2/3,1/3,1/3,1/3 1/2,1/2,1/2,1/2 |
Остальные существенные покрытия отличаются от указанных перестановками номеров игроков.
Рассмотрим частный случай кооперативной игры, когда условие существования ядра может быть записано в простой форме.
Определение. Кооперативная игра K = (A,v) называется симметричной, если характеристическая функция v зависит только от числа игроков в коалиции: v(K) = v|#| V K С A.
Упражнение 15.7. Покажите, что для симметричной кооперативной игры K ядро С тогда и только тогда существует, когда выполнены неравенства
IKI
V|KI < -щV|A| V K С A. (15.5)
Недостатком ядра является тот факт, что оно может не существовать. Докажем, что С = 0, если кооперативная игра K = (A,v) имеет постоянную сумму. Действительно, если у G С, то
^yb > v(A\{a}) = v(A) - v(a), уа > v(a).
b=a
Последние два неравенства могут выполняться только как равенства. Отсюда ya = v(a) V a G A и ya < v(A) (противоречие).
aeA
Указанным недостатком не обладает вектор Шепли. Определим его, используя вероятностную интерпретацию. Положим v(0) = 0.
Определение. Для игрока a ? K величина v(K)—v(K\{a}) называется вкладом игрока в коалицию K.
Пусть коалиция А образуется в результате следующего случайного процесса. Сначала с вероятностью 1/|А| выбирается игрок ai, затем из оставшихся |А| — 1 игроков с вероятностью 1/(|А| — 1) выбирается игрок a2 и присоединяется к игроку a1 и т.д. В результате с вероятностью 1/|А|! будет выбрана перестановка игроков a1,..., a|A|. Можно подсчитать вклад игрока ai в коалицию {a1, ...,ai}. Таким образом, для каждого игрока a его вклад (в такую-то коалицию K) будет случайной величиной, принимающей значение v(K) — v(K\{a}) (где a ? K) с вероятностью (|K | — 1)!(|A| — |K |)!/|А|!.
Определим теперь специальный дележ р — вектор Шепли, Его компонента pa равна математическому ожиданию вклада игрока a, т.е.
_ Е ( I K I- 1)!А А I-I K I )! (v(K) — v(K\{a})).
K:aeK | |!
Проверим, что
(|K| — 1)! (|А| — |K|)! |А|!
Е
K :a€K
(15.6)
1.
Действительно,
Е м
K:a€K
1)! (|А| — |K|)! _ Д (l — 1)! (|А| — 1)!
|А|! 2^ 2^ |А|!
1 1 l=1 K:a€K, |K|=l 1 1
Число коалиций, содержащих / игроков и среди них игрока a, равно
,i-1 _ (|А| — 1)!
|A|-1 (1 — 1)! (|А| — 1)!.
Поэтому в последней двойной сумме при любом I внутренняя сумма равна 1/1А|. Отсюда и следует (15,6),
Упражнение 15.8. Покажите, что вектор Шепли р _ (pa, a ? А) является дележом кооперативной игры.
Упражнение 15.9. Выпишите явные формулы для подсчета вектора Шепли в игре трех лиц. Найти вектор Шепли для кооперативной игры "джаз-оркестр"и показать его принадлежность ядру. Проверить, что если v(123) уменьшить на $3 , то вектор Шепли ядру не принадлежит.
Упражнение 15.10. Показать, что для симметричной кооперативной игры вектор Шепли р = (v|A|/|A|,..., V|A|/|A|).
Комментарий и библиография к главе III
§ 12, Определение ситуации равновесия для игры многих лиц принадлежит Дж, Нэшу [76], Теорема 12,1 доказана С, Какутани [47] и использована для доказательства теоремы 2,3 о вогнуто-выпуклой функции, Теорема существования ситуации равновесия в играх с конечными множествами стратегий доказана Дж, Нэшем [76], Там же приведены свойства ситуаций равновесия в смешанных стратегиях. Пример 12,1 принадлежит Н,Н, Воробьеву [34], Определение игры, разрешимой по доминированию, введено Э, Му. юном [71],
§ 13, Основные понятия теории позиционных игр определены Дж, фон Нейманом и О, Моргенштерном в [72], Полная формализация этих игр проведена Г.У. Куном [58], Определение совершенного подыгрового равновесия принадлежит Р, Селтену [98], Теорема 13,1 о существовании ситуации равновесия в позиционной игре с полной информацией доказана Г,У, Куном [58], Концепция возмущенной игры, в которой игроки могут ошибаться при выборе своих стратегий, введена Р, Селтеном [99],
§ 14, Пример 14,1 и теорема 14,1 об эквивалентности смешанных стратегий соответствующим стратегиям поведения в играх с полной памятью принадлежит Г.У. Куну [58], Другие результаты по теории позиционных игр см, в сборнике [82], С моделями многошаговых неантагонистических игр можно ознакомиться в [22, 23, 71, 91],
§ 15, Основы кооперативной теории заложены Дж,фон Нейманом и О, Моргенштерном в [72], Пример кооперативной игры "джаз-оркестр" принадлежит Г.П. Янгу (см. [71]). Понятие ядра определено Д. Джил-лисом в [44], Необходимое и достаточное условие существования ядра с использованием новых комбинаторных объектов — приведенных сбалансированных покрытий — получено О.Н, Бондаревой в 1962 году в [13], где, в частности, описаны приведенные сбалансированные покрытия для игр трех и четырех лиц, ().!’. Меньшикова в кандидатской диссертации (факультет ВМиК МГУ, 1978 год) перечислила все приведенные сбалансированные покрытия для игр пяти и шести лиц. Результат упражнения 15,5 взят из [109], Теорию двойственности линейного программирования см, в [5], Р, Думай [7] определил понятие ядра для игры в нормальной форме. Ряд результатов в этом направлении получен А, А, Васиным (см.
[22], где имеется также обзор работ по теории ядра). В,В, Морозов и М.Х. Аъзамхужаев ввели дискретные кооперативные игры, в которых значения характеристической функции и компоненты дележей — целые числа. Для таких игр поиск дележа из ядра сводится к задаче целочисленного линейного программирования, В [68] предложен эффективный алгоритм ее решения для игр шести лиц.
Вектор Шепли был определен в [102], где имеется аксиоматическое его обоснование (см, также [31]), С другими концепциями оптимальности в кооперативной теории (решением фон Неймана-Моргенштерна, и-ядром Шмайдлера и др.) можно ознакомиться в [55, 31, 78], Фундаментальный обзор результатов по теории игр см, в [93],
ГЛАВА IV. ВВЕДЕНИЕ В МАТЕМАТИЧЕСКУЮ ЭКОНОМИКУ
В этой главе рассматриваются простейшие математические модели производства, распределения и потребления,
§ 16. Модели нерегулируемых рынков
Важную роль в экономической теории играет понятие рынка. Рынок — это механизм обмена товарами, включающий два типа агентов: производители (продавцы) и потребители (покупатели). Каждый агент самостоятельно принимает решение об участии в обмене, исходя из своих интересов и предлагаемых условий. Обычно каждый продавец назначает условия обмена в виде цены на свой товар, а покупатели выбирают, сколько и какого товара купить. Но существуют и другие варианты рынков,
В этой главе рассматриваются три основных модели рынка одного товара:
1) рынок в условиях совершенной конкуренции, или конкурентный рынок, на котором много мелких агентов-производителей и потребителей;
2) монополизированный рынок, на котором один производитель-монополист взаимодействует с большим числом мелких потребителей;
3) олигополия, то есть рынок, на котором несколько фирм конкурируют, взаимодействуя с множеством мелких потребителей,
У читателя с математическим складом ума здесь возникают вопросы: что означает "мелкий "агент, "большое число мелких потребителей "и т.п.? Следует отметить, что достаточно полных и точных ответов на подобные вопросы не получено до настоящего времени. Некоторые подходы и оценки изложены в параграфе, посвященном олигополии. Указанные характеристики служат некоторым обоснованием сформулированных далее предположений о поведении агентов.
Конкурентный рынок одного товара
Рассмотрим рынок однородного (т.е. не различающегося по качеству) товара, такого как нефть или мука. Предположение, лежащее в основе модели конкурентного рынка, состоит в следующем: на рынке складывается единая цена p на товар и ни один производитель или потребитель
не может повлиять на нее индивидуальными действиями, т.е. каждый агент приспосабливается к рыночной цене р.
Начнем е описания поведения производителей товара. Предполагается, что каждый из них стремится максимизировать прибыль от производства товара. Обозначим через A множество предприятий, поставляющих товар на рынок, В простейшем случае конкретное предприятие а ? A характеризуется максимальным объемом выпуска, или производственной мощностью, Va и удельной себестоимостью продукта (в расчете на единицу) ca. При этом стратегией предприятия является объем выпуска V, Формально поведение продавца а характеризуется функцией предложения Sa(p), которая указывает оптимальный объем производства в зависимости от цены. Рассмотрим, как определяется Sa(р) в данном случае:
0, если p < ca,
Sa(p) = Arg max [V (р — ca)]
4 ' VCVa
[0, Va], если p = ca, Va, если p > ca,
где V(p — ca) — функция прибыли.
Отметим, что функция предложения является точечно-множественным отображением, т.е, одному значению аргумента может соответствовать целое множество значений функции. Общая характеристика рынка со стороны производителей — это суммарная функция предложения S (p) = Sa(p). Эта функция указывает общее количество товара, по-
aeA
ставляемое на рынок в зависимости от цены. Упорядочим предприятия по возрастанию удельных себестоимостей, т.е, пусть c1 < c2 < ... Тогда график функции предложения для случая трех производителей выглядит следующим образом:
S (P )
V1 + V2 + V3------------------
V1 + V2-----------т-
V1------1- !
Рис. 16.1
В качестве примера более общей модели производства рассмотрим предприятие, на котором имеются три вида производственных мощностей (станков) для выпуска товара. Каждый вид характеризуется величинами удельной себестоимости сг и максимального объема выпуска Vг, где i = 1,2, 3 и с1 < с2 < с3. При выполнении заказа на выпуск V единиц товара предприятие стремится минимизировать издержки производства. Выясним, как зависит полная себестоимость C(V) от объема выпуска при оптимальной загрузке мощностей. Очевидно, что предприятие в первую очередь использует мощности е минимальной удельной себестоимостью выпуска. Если их не хватит, то будут задействованы мощности второго, а затем третьего типа. Таким образом, график C(V) имеет следующий вид:

В общем случае предприятие а характеризуется функцией Ca(V) себестоимости выпуска в объеме V на данном предприятии. Далее предполагается, что эта функция задает общие издержки. Прежде, чем сформулировать свойства функции издержек, напомним определение выпуклой (вогнутой) функции (см, §2),
Определение. Функция C(V) называется выпуклой (вогнутой), если для любых двух точек V1 и V2 и любого числа 0 < t < 1 справедливо неравенство C(tV1 + (1 — t)V2)) < (>)tC(V1) + (1 — t)C(V2).
Отметим некоторые свойства выпуклых функций, известные из курса математического анализа.
Выпуклая функция C(V), определенная на полуоси V > 0, непрерывна в любой точке V > 0.
Выпуклая и неубывающая функция C(V) непрерывна и в точке V = о/
Для выпуклой функции C (V) в любой точке V существуют левосторонняя C-(V) и правосторонняя C+(V) производные. Причем, если
V < V', то C+(V) < C_(V').
Для дифференцируемой функции C(V) необходимым и достаточным условием выпуклости является неубывание по V производной C(V).
Для дважды дифференцируемой функции аналогичным условием является неотрицательность второй производной C7(V).
Будем предполагать, что функция издержек C(V) обладает следующими свойствами:
C1 монотонно возрастает по V ;
C 2 C (0) = 0;
C3 является выпуклой функцией;
C4 C_(V) ^ го при V ^ го.
Обсудим свойства C1-C4 с практической точки зрения.
Первое свойство очевидно: чем больше объем выпуска, тем больше общие издержки.
Второе условие кажется ограничительным, так как у предприятия могут быть постоянные издержки. Однако эти издержки не играют роли при расчете функции предложения (см, ниже), а инвестиционные процессы мы не рассматриваем.
Третье и четвертое свойства означают, что удельные издержки C+(V) растут и стремятся к бесконечности с увеличением объема выпуска, В то же время из производственной практики известно, что при переходе от опытного производства к массовому выпуску возникает эффект масштаба, т.е. удельные издержки убывают с ростом объема выпуска. Однако, данный эффект возникает тогда, когда предприятие меняет структуру основных фондов. Рассматриваемая здесь модель отражает работу предприятия в стационарных условиях.
Дадим формальное обоснование свойства C3, Отметим, что рассматриваемые величины (максимальный объем выпуска, реальный объем, издержки) относятся к некоторому фиксированному периоду времени. Рассмотрим две технологии, характеризующиеся объемами выпуска Vi и V2, Будем чередовать эти технологии (пусть доля времени t используется одна технология, а доля времени (1 — t) — другая). Таким образом, мы выпустим объем tV1 + (1 — t)V2 с издержками tC(V1) + (1 — t)C(V2), Следовательно, C(tV1 + (1 — t)V2)) < tC(V1) + (1 — t)C(V2).
Упражнение 16.1. Какие реальные факторы не учтены в этом рассуждении?
Для функции себестоимости Ca(V ^удовлетворяющей условиям C1-C4, функция предложения предприятия определяется как
Sa(p) = Argmax(pV - Ca(V)),
гдер?—Ca(V) — функция прибыли. Заметим, что здесь нет ограничения сверху на объем V выпускаемого товара.
Утверждение 16.1. Если функция Ca(V) удовлетворяет свойствам C1 — C4, то функция Sa(p) удовлетворяет следующим свойствам:
51 Sa( 0) = 0;
52 для каждого p множество Sa(p) выпукло и ограничено, а график отображения Sa(p) Gr(Sa(p)) = {(p, V) | p > 0, V G Sa(p)} замкнут;
53 Sa(p) те убывает no p , т.е. для любых p < p' и для любых V G Sa(p), V' G Sa(p') выполнено неравенство V < V'.
Доказательство. S1. Очевидно, поскольку при нулевой цене производство товара не выгодно,
52. Функция pV — линейная по V, а Ca(V) — выпуклая, следовательно, функция pV — Ca(V) является вогнутой. Множество точек максимума у вогнутой функции выпукло, Sa(p) есть множество точек максимума непрерывной функции pV — Ca(V), Следовательно, множество Sa (p) замкнуто, По свойству C4 функция издержек C (V) растет быстрее любой линейной функции. Поэтому при любом p > 0 найдется такая величина V(p), что pV — Ca(V) < 0 V V > V(p). Отсюда вытекает ограниченность множества Sa(p).
53. Возьмем p < p' и зафиксируем произвольные V G Sa(p),
V' G Sa(p'). Если V' = 0, то необходимо C+(0) > p' > p. Следовательно, Sa(p) = {0} и утверждение доказано, Пусть V > 0, V' > 0. Тогда из условия максимума функции прибыли вытекают неравенства
C- (V) < p < C+ (V), C- (V') < p' < C+ (V').
Отсюда с учетом p < p' находим C^ (V) < С+ (V'), Из выпуклости функции Ca(V) следует теравенетво V < V', ¦
Графический метод построения функции предложения
1) Пусть Ca(V) — гладкая функция. Если максимум прибыли достигается во внутренней точке V* > 0, то p = Ca(V*) ^ V* = (C'a)-1(p) = Sa(p), Если максимум достигается в нуле, то p < C7a(0). При p = C7a(0) Sa(p) = [0, Sa+], где?+ = sup{V | Ca(V) = C7a(0)}.
Строим график обратной функции (Ca)-1(p). Для этого отобразим график функции Ca(V) симметрично относительно биссектрисы. На оси p соединим ноль с точкой C7a (0) и получим график функции Sa(p).
2) С негладкой функцией поступаем аналогично: скачкам функции Ca(V) будут соответствовать горизонтальные отрезки на графике функции S a(p).
Пример 16.1. Функция издержек задана следующим образом:
 |
|
Рис. 16.3 |
C a(V)
V
Требуется построить функцию предложения Sa(p).
1) Строим функцию Ca(V):
|
[1/2, |
0 < V < |
|
C a(V) = 11, |
2 < V < |
|
1 V /3, |
V > 3. |
|
S а(р) |
|
0, |
0 < р < 1/2, |
|
[0, 2], |
р =1/2, |
|
2, |
1/2 <р < 1, |
|
[2, 3], |
Р = 1 |
|
3, |
1 < р < 3, |
|
.?3^ |
Р > 3. |
|

Упражнение 16.2. Найдите функцию предложения Sа(р) по заданной функции издержек Ca(V) = max[V, V2].
Функция спроса
Мы описали поведение производителей. Обратимся теперь к другой стороне рынка и рассмотрим поведение второй группы агентов, действующих на рынке, — потребителей.
Пусть B — множество потребителей товара; b ? B — конкретный потребитель, который характеризуется функцией спроса, Db(p), указывающей, какой объем товара готов купить потребитель b по цене р. Общей характеристикой поведения всего множества присутствующих на рынке потребителей является суммарная функция спроса, которая определяется следующим образом: D(p) = Db(p). Для начала рассмотрим
ьев
несколько примеров функции спроса отдельного потребителя.
Пример 16.2. Пусть Kb — денежный капитал потребителя b. Потребитель тратит весь капитал на покупку товара, тогда Db(p) = Kb/p.
Пример 16.3. Как и в предыдущем примере, потребитель b характеризуется размером имеющегося у него денежного капитала Kь. Отличие состоит в том, что потребитель может потратить свой капитал не только на этом рынке товара, но у него есть возможность покупать тот же товар в другом месте по фиксированной цене rb, которая называется резервной ценой для данного потребителя. Смысл этой величины состоит в том, что потребителю невыгодно покупать товар на рассматриваемом рынке, если цена превышает rb, т.е. при р > rb покупка не производится.
Функция спроса для такой модели имеет вид
{Kb/p, p < rb,
[О ,K b/p], p = rb,
0, p > rb.
Дадим альтернативную интерпретацию понятия резервной цены: у данного товара существует заменитель, цена на который фиксирована и равна rb. Поэтому в случае, когда цена продукта превышает rb, потребитель b покупает заменитель.
До сих пор мы предполагали, что весь денежный капитал потребителя расходуется на приобретение товара. Однако на практике количество денег, которое расходуется на данный товар, может меняться в зависимости от цены. Объем потребления предметов первой необходимости (основных продуктов питания, необходимой одежды и т.п.) обычно слабо зависит от цены. Например, даже при значительном росте цены на хлеб, люди будут потреблять то же самое количество хлеба, С другой стороны, есть товары типа предметов роскоши (драгоценности, предметы искусства и т.д.), спрос на которые сильно зависит от колебаний цены. Это происходит отчасти потому, что при росте цен на одни предметы роскоши люди, как правило, предпочитают покупать другие предметы, которые подорожали в меньшей степени. Свойство функции спроса изменяться в зависимости от цены называется эластичностью спроса. Формальное определение будет дано позже, С содержательной точки зрения эластичность характеризует степень зависимости объема спроса от цены на товар.
Пример 16.4- Рассмотрим пример неэластичной функции спроса:
Г Vb, p < rb,
Db(p)= < [0,Vb], p = rb,
[o, p > rb.
Во всех приведенных выше примерах функция спроса Db(p) — это точечно-множественное отображение, удовлетворяющее следующим свойствам:
D1 выпуклозначность ( значением функции спроса Db(p) для любого p является либо точка, либо отрезок);
D2 замкнутость (график отображения Db(p)
Gr(Db(p)) = {(p, V) | 0 < p < то, V ? Db(p)} является замкнутым);
D3 монотонное невозрастание ( при любых p < p и любых V ? Db(p), V' ? Db(p') выполнено неравенетво V > V');
D4 Db(p) ^ 0 при p ^ то (при неограниченном возрастании цены спрос стремится к нулю).
Обсудим подробнее свойство монотонного невозрастания (свойство D3), Это свойство говорит о том, что при росте цены на товар спрос на него не увеличивается (а иногда и убывает, если учесть дополнительно свойство D4), Возникает вопрос: для всех ли товаров выполнено это свойство? В экономике известно несколько экзотических примеров товаров, спрос на которые не удовлетворяет, по крайней мере в определенные промежутки времени, свойству монотонного невозрастания.
Пример 16.5. Известно, что в Ирландии в голодные годы, когда цена на картошку сильно повышалась, объем ее потребления тоже возрастал, С чем это было связано? В обычные годы в рацион основной массы населения входили картошка и мясо. Когда цена на картошку значительно повышалась, денег на мясо уже не хватало, и люди переходили на питание одной картошкой. Поэтому картошки требовалось больше, чем обычно.
Пример 16.6. Традиционная японская водка — саке. Есть несколько сортов саке, причем как хорошего качества, так и плохого. Известен следующий факт: когда цена на низкокачественный саке растет, то объем его потребления в этот момент тоже увеличивается. Дело в том, что определенная группа лиц, страдающая алкогольной зависимостью, нуждается в определенной дозе чистого алкоголя. Они, конечно, предпочли бы пить хороший саке, но когда цена на саке сильно растет, им для получения своей суточной нормы алкоголя приходится отказываться от хорошего саке в пользу плохого. Однако приведенные примеры достаточно редки и нетипичны, а для большинства товаров свойство монотонного невозрастания функции спроса выполняется.
Принцип конкурентного равновесия
Итак, мы описали поведение двух групп агентов на рынке (производителей товара и потребителей) в зависимости от цены на товар. Для получения полного представления о модели конкурентного рынка одного товара осталось выяснить, как определяется цена p на рынке.
На конкурентном рынке цена товара определяется из принципа конкурентного равновесия.
Принцип конкурентного равновесия Вальраса. В условиях совершенной конкуренции на рынке устанавливается цена р, которая балансирует спрос и предложение на товар и называется ценой конкурентного равновесия (или вальрасовской ценой). Формально эта цена определяется из условия D(p) П S(р) = 0, где S(р) — функция суммарного предложения, a D(p) — функция суммарного спроса.
Таким образом, цена конкурентного равновесия обладает тем свойством, что существует объем товара, который может быть предложен по этой цене и может быть потреблен по этой цене. Если функции спроса и предложения — однозначные функции, то принцип конкурентного равновесия можно сформулировать проще: по равновесной цене спрос равен предложению.
Полная формулировка принципа начинается словами: "в условиях совершенной конкуренции,,,". Что понимается под условиями совершенной конкуренции! Содержательно Вальрас охарактеризовал их как наличие большого числа близких по своим характеристикам производителей и потребителей, каждый из которых не может влиять на рыночную цену (т.е. все они малы по сравнению с общими объемами рынка). Кроме того, все производители и потребители располагают полной информацией о рынке и могут свободно выбирать себе партнеров для заключения сделки. Ясно, что такое описание не является конструктивным. Возьмем конкретный рынок, на котором действуют 20 производителей продукции и 500 потребителей, характеризующихся определенными параметрами. Используя определение Вальраса, нельзя сказать, находится ли этот рынок в состоянии совершенной конкуренции, так как это определение чисто качественное и не дает количественных критериев.
Свойства равновесной цены
Будем использовать запись D(p) — S(р) > 0, если V > V' при всех
V Е D(p), V' Е S(р). Аналогично, будем писать D(p) — S(р) < 0, если
V < V' при всех V Е В(р), V Е S(р).
Утверждение 16.2. Пусть функция предложения Sa (р) каждого производителя а Е A удовлетворяет условиям S1-S3, а функция спроса Db(j>) каждого потребителя b Е B — уровням D1-D4, Тогда равновесная цена всегда существует.
Доказательство. Заметим, что функция предложения S(p) = Sa(p)
aeA
удовлетворяет условиям S1-S 3, а функция ей роса D(p) = Da(p) —
ъев
условиям D1-D4.
Поскольку S(0) = 0, то из монотонности функции S(p) и замкнутости ее графика вытекает, что S (p) = 0 в некоторой малой полуокрестности точки 0. С другой стороны, функцию спроса D(p) в этой полуокрестности можно считать положительной. Поэтому разность D(p) — S(p) > 0 при малых p.
Для достаточно больших p функция S(p) положительна (достаточно взять p > Ca(0) для некоторого производителя а ? A) и не убывает, а D(p) ^ 0 при p ^ то, Значит, D(p) — S (p) < 0 при болыних p ,
Воспользуемся аналогом теоремы о промежуточном значении непрерывной функции, известной из математического анализа: если непрерывная функция принимает противоположные по знаку значения на концах некоторого отрезка, то внутри этого отрезка существует точка, в которой функция обращается в ноль.
Как уже говорилось, свойство замкнутости аналогично свойству непрерывности, Так как D(p) и S(p) — замкнутые функции, следовательно, их разность D(p) — S(p) тоже замкнутая функция. Поэтому существует точка p , в которой эта разность принимает нулевое значение, в том смысле, что 0 ? D(p) — S(p), ¦
Утверждение 16.3. Пусть p1, p2 — две цены конкурентного равновесия, Тогда любая цена p ? [p^p2] тоже является равновесной, т,е,
S(p) П D(p) = 0.
Доказательство. Функция D(p) — S(p) монотонно не возрастает. Так как эта функция принимает значение 0 в точках p1 и p2, то и во всех промежуточных точках она принимает то же значение. Следовательно, D(p) П S (p) = 0 для любо го p ? [pSp2]. ¦
Покажем, что на самом деле возможны ситуации, когда равновесная цена определяется не единственным образом, В таких случаях из утверждения 16,3 будет следовать, что существует целый отрезок равновесных цен.
Пример 16.7. Пусть на рынке есть всего три потребителя с неэластичными функциями спроса. Резервные цены для этих потребителей равны r1, г2 и г3 соответственно, В этом случае суммарная функция епро-са будет иметь ступенчатый вид. Пусть, кроме того, на рынке сеть два предприятия-производителя е фиксированными удельными себестоимостями с1, с2 и максимальными объемами производетва V 1,V2 соответственно, Следовательно, суммарное предложение также является ступенчатой функцией. Тогда возможна следующая ситуация, изображенная на рис, 16,6, где получился целый отрезок равновесных цен р.
V/
¦t
Рис. 16.6 Рис. 16.7
Заметим, что возможна и другая ситуация, когда равновесная цена р единственна, но не единственным образом определяется равновесный объем П (ем, рис, 16,7),
Из приведенных выше утверждений можно сделать вывод, что множество равновесных цен — это либо точка (единственная цена р), либо существует отрезок равновесных цен [р1 ,р2],
Заметим, что случаи, проиллюстрированные на рисунках 16,6-7, нетипичны и носят вырожденный характер, так как при малом возмущении параметров модели графики смещаются и пересечение по целому отрезку превращается в пересечение в точке. При этом возможна одна из изображенных на следующем рис, 16,8 ситуаций:
|
3 V |
|
|
_____ У |
|
|
J |
|
|
1
1
1 ^-
1
1
--^—> - |
|
р р р р
Рис. 16.8
В типичных случаях (или, иными словами, в условиях общего положения) равновесная цена и равновесный объем определяются единственным образом, что и предполагается в дальнейшем,
§ 17. Монополизированный рынок
Рассмотрим ситуацию, когда на рынке присутствует лишь одна фирма-производитель, Как и раньше, производитель характеризуется себестоимостью товара, т.е. функцией издержек C(V), которая показывает, сколько денег необходимо затратить, чтобы произвести товар в объеме V,
Потребители на этом рынке полагаются мелкими. Их поведение характеризуется суммарной функцией спроса D(p), показывающей, какой объем товара будет куплен при заданной цене р, Фирма-монополист устанавливает цену на товар р и объем его производства V, Таким образом, стратегией монополии является пара (р, V),
Поиск оптимальной стратегии монополии
Обсудим задачу поиска оптимальной стратегии монополии. Она состоит в выборе цены на товар р* и объема производства V*, максимизирующих прибыль монополии. Задача решается при следующих ограничениях: цена неотрицательна, а объем выпуска неотрицателен и не превосходит спроса (производителю нет смысла производить больше товара, чем потребители готовы купить). Формально эта задача сводится к нахождению оптимальной стратегии
(p*,V*) е Arg max (pV - C(V)). (17.1)
(p,V): p“0, 0<V<D(p)
Будем записывать функцию спроса в виде D(p) = [D-(p),D+(p)], где D-(p),D+(p) — нижняя и верхняя грани цы для D(p). Аналогичная запись будет использоваться и для функции предложения:
S (р) = [S-(p),S +(р)].
Решение оптимизационной задачи (17,1) проведем в два этапа.
Этап 1, Оптимизация по объему при фиксированной цене
Фиксируем любую цену р и определим оптимальное значение V*(р).
Заметим, что для монополизированного рынка можно так же, как и для конкурентного рынка, ввести формально функцию предложения S(р) = Argmax^V — C(V)) и найти равновесную цену р, такую, что
S(р) П D(p) = 0.
Утверждение 17.1. Если р —равновесная цена, то
{S (p), p<p,
s(р) п [0^+(рф р = p,
D+(p), р>р.
Доказательство. Пусть р < р. Заметим, что если отбросить в задаче (17,1) ограничение на объем, то ее решение при фиксированном р совпадает со значением функции предложения S^) в точке р, Следовательно, так как S (р) является решением задачи оптимизации на более широком множестве, то значение оптимизируемого функционала в S(р) не меньше, чем в точке V* (р). Однако при р < р функция предложения S (р) удовлетворяет ограничению на объем, т.е. S + (р) < D-(j>). Это условие выполняется, так как функция S(р) монотонно не убывает, a D^) монотонно не возрастает и, следовательно, для любого р < р разноеть D^) — S(р) > 0 (см, рис, 17,1), Следовательно, в этом случае V*(р) Е S(р).


Пусть р = р. В этом случае надо взять оптимальный объем производства, но такой, который потребитель в состоянии купить. Следовательно, в этом случае V*(р) Е S(p) П [0^+(р)].
Наконец, пусть р > р. Оптимизируемая в задаче (17,1) функция представляет собой разность линейной и выпуклой функций и, следовательно, сама является вогнутой функцией. Причем, как было замечено в предыдущем пункте доказательства, максимум ее достигается в S(р), Значит, рассматриваемая функция возрастает на отрезке [0, S-(р)]. При р > р в силу ограничения на объем предложения максимально допустимым объемом производства будет D+(p), так как в этом случае D+Д) < S-(p) (см, рис, 17,1 и рис, 17,2), Следовательно, в этом случае V *(р) = D+(P).U “
Этап 2, Оптимизация по цене
Итак, мы определили оптимальный объем для каждой фиксированной цены. Теперь найдем оптимальную монопольную цену.
Утверждение 17.2. 1) Монополия всегда назначает цену р* не ниже равновесной, т.е. р* > р.
2) Если функция спроса D (р) — однозначная и гладкая в окрестности точки р, то монополия назначает цену р* выше равновесной, т.е, р* > р.
Доказательство. 1) Сначала покажем, что цена монополии не ниже, чем р. Берем любую цену р < р. В силу предыдущего утверждения 17,1 оптимальное значение объема V*(р) Е S(р). Рассмотрим альтернативную стратегию (р, V*(р)). Нам известно, что D(j>) П S(р) = 0. Тогда из монотонности функций спроса и предложения следует, что D(j>) > S(р) V р < р . Следовательно, стратегия (р , V*(р)) допустима, т.е, тот же объем товара V* (р) может бытъ реализован по болыней цене р , Заметим, что издержки при этом не изменятся, так как объем выпуска остался тем же. Значит общая выручка производителя от продажи по цене р будет выше, чем от продажи по цене р < р , Итак, монополист всегда назначает цену р* те ниже р ,
2) Покажем, что для однозначной и гладкой в окрестности точки р функции спроса D(^) монополист назначит цен у выше р , Из утверждения 17,1 следует, что V*(р) = D(^) при р > р , а при р = р максимально возможный объем V*(р) Е S(р) П [0,D(j>)] равен D(p). Следовательно, задача оптимизации прибыли монополиста при р > р принимает вид max^D^) — C (D(^))).
p>p
Вычислим производную функции прибыли W(р) = pD(p) — C(D(^))
1Й(р) = Dfr) + і)(р)(р — Ср(р))). (17.2)
При р = р ее значение равно 1Ё(р ) = D(j>) + D(j>)(р — C^D^ ))), Поскольку D(j>) Е S(р ), a S(р ) является решением задачи оптимизации, то р = C7(D(^)) и второе слагаемое выражения (17,2) равно нулю. Откуда следует, что 1П(р) = D(j>) > 0. Мы показали, что функция прибыли W (р) возрастает в точке р , Значит, монополист назначит цену выше цены конкурентного равновесия, ¦
Упражнение 17.1. Пусть функция издержек фирмы-монополиста C (V) равна функции Ca(V) из примера 16.1, а функция спроса D(^) = 3/р2. Найдите оптимальную монопольную цену р*.
Замечание. Насколько монополист завысит цену по сравнению с ценой конкурентного равновесия, будет зависеть от конкретного вида функции спроса, точнее, от скорости ее убывания после равновесной цены. Если происходит резкое убывание, то монопольная цена будет мало отличаться от конкурентной, если же убывание функции спроса происходит медленно, то разница между ценой, назначенной монополистом, и равновесной будет значительной.
Определение. Функция спроса D(p) называется .медленно убывающей на отрезке [pbP2], если P2D(p2) > pD(rp) V p Е [PbP2], т.е, спрос в денежном выражении pD (p) достигает максимума в точке p2.
Пример 17.1. Пусть D(p) = K/p. Тогда спрос в денежном выражении равен постоянной величине K, Следовательно, такая функция является медленно убывающей, К этому классу относятся также функции вида D(p) = K/pa, 0 < а < 1.
Определение. Для гладкой функции спроса D(p) эластичностью называется величина
e(D(P))
|D(P)! |dD(P)/D(P)|
-P = -
D(p) dp/p
Она показывает, на сколько процентов изменится объем спроса при изменении цены на один процент.
Отметим, что если эластичность e(D(p)) = 1, то D(p) = K/p, Высокоэластичный спрос (на предметы роскоши) характеризуется значениями e(D(p)) > 1 , низко эластичный спрос (на предметы первой необходимости) — значениями e(D(p)) < 1, В экономической литературе, когда говорят об эластичном спросе, обычно подразумевают высокоэластичный спрос.
Утверждение 17.3. Если эластичность функции спроса e(D(p)) < 1 на отрезке [pi,p2], то D(p) медленно убывает на данном отрезке.
Упражнение 17.2. Докажите утверждение 17,3, Что можно сказать про поведение монополии в случае, когда спрос медленно убывает?
Утверждение 17.4- Пусть для некоторого значения p > p функция спроса D(p) медленно убывает на отрезке [p,p]. Тогда для оптимальной монопольной цены выполнено неравенство p* > p.
Поясним смысл утверждения: пока эластичность мала, монополии выгодно увеличивать цену.
Доказательство. Предположим от противного, что р* < р. Будем продавать товар по цене р, сохраняя объем выручки V = D(p*)p* /р. Тогда V < D(p*), издержки снизятся, а прибыль соответственно вырастет. Остается проверить, что можно продать объем V по цене р. Действительно, из условия медленного убывания D(p) > D(p*)p*/p, откуда V < D(p), т,е, такой объем продать можно. Следовательно, предположение неверно.
Мы показали, что монопольный рынок плох для потребителя, В следующем параграфе обсуждается, какой ущерб монополия наносит экономике в целом,
§ 18. Модель двухотраслевой экономики
Теорема об оптимальности конкурентного равновесия
Центральная роль понятия конкурентного равновесия в современной экономической теории определяется следующими свойствами. Во-первых, согласно гипотезе Вальраса, экономика в условиях совершенной конкуренции естественным путем приходит в состояние конкурентного равновесия. Во-вторых, это состояние является оптимальным в определенном смысле, В совокупности эти два свойства можно интерпретировать в том смысле, что рынок в условиях совершенной конкуренции является идеальным экономическим механизмом. Отсюда понятно то внимание, которое уделяет этой концепции традиционная экономическая теория.
Однако к такой интерпретации надо относится с осторожностью. Отметим две важные проблемы. Первая — это отсутствие теоретически обоснованного конструктивного определения условий совершенной конкуренции, о чем уже шла речь выше, вторая — неэффективность рынка при производстве особой группы товаров и услуг, называемых общественными благами. Последней проблемы мы коснемся в параграфе, посвященном налоговому регулированию, где обсуждаются причины существования государственного, или бюджетного, сектора экономики и приводятся модели, обосновывающие целесообразность государственного регулирования.
Несмотря на отмеченные сложности, теоремы об оптимальности конкурентного равновесия имеют большое значение, В этом параграфе мы докажем "теорему благоеоетояния"для двухотраслевой экспортноориентированной экономики.
Рассмотрим экономику, состоящую из двух отраслей. Первая отрасль с множеством предприятий A добывает ресурс (например, нефть). Каждое предприятие характеризуется максимальным объемом выпуска Va и удельными себестоимостями добытого ресурса ca. В этом случае функция предложения имеет вид
{0, если p < ca,
[0, Va], если p = ca,
Va, если p > ca.
Вторая отрасль занимается переработкой добытого ресурса. Каждое предприятие b второй отрасли характеризуется максимальным объемом переработки Wь, удельными затратами сырья на единицу готовой продукции db и прочими издержками на единицу конечного продукта сь. Предполагается, что конечный продукт продается на внешнем рынке и его цена q на этом рынке фиксирована.
Рассмотрим сначала ситуацию, когда обе отрасли являются конкурентными, т.е. там много небольших предприятий, и цена на сырье на внутреннем рынке складывается из условия равенства спроса и предложения, Определим спрос на сырье по цене p со стороны предприятия b. Обозначим через
Prb(p, W) = (q - cb)W/db - pW
прибыль предприятия b в зависимости от цены p и объема W переработанного сырья. Пусть предприятие стремится максимизировать свою прибыль. Тогда спрос на сырье определяется из условия максимизации этой прибыли:
Db(p) = Arg max Prb(p,W). w е[? ,w b]
Заметим, что функция прибыли Prb(p, W) линейна no W и все зависит от значения коэффициента при W, Обозначим через rb = (q — cb)/db резервную цену предприятия b, Если цена на сырье больше, чем rb, то предприятию не выгодно его перерабатывать. Окончательно получаем выражение для функции спроса
{0, если p < rb,
[0, Wb], если p = rb,
Wb, если p > rb.
Предположим, что предприятия добывающей отрасли упорядочены по возрастанию удельных себестоимостей, т.е. с1 < с2 < с3 < ..., а предприятия перерабатывающей отрасли упорядочены по убыванию резервных цен, т.е, r1 > г2 > .... Построим графики функций спроса и предложения и определим равновесную цену. Возможны два типа пересечения графиков, устойчивые к малым возмущениям параметров модели:

Здесь р — равновесная цена. Рассмотрим ситуацию, когда рынок является конкурентным. Тогда в производстве будут участвовать те предприятия добывающей отрасли, у которых са < р. При этом, если са < р, то будут полностью загружены производственные мощности данного предприятия, В случае равенства са = р мощности добывающего предприятия а могут быть загружены частично, чтобы сбалансировать равновесное предложение (случай б)). Из предприятий перерабатывающей отрасли будут заняты те, у которых rb > р, и если rb > р , то мощности предприятия будут загружены полностью, В случае равенства rb = р мощности перерабатывающего предприятия b могут быть загружены частично, что сбалансировать предложение (в случае а)).
Возможны также ситуации, когда цена или объем определяется неоднозначно (см, примеры 16,7 и 16,8), Однако, такие ситуации являются структурно неустойчивыми, поскольку сколь угодно малыми возмущениями параметров модели можно перейти к одному из двух ранее рассмотренных случаев. Далее предположим, что равновесные цена и объем определяются однозначно.
Выясним, какой будет прибыль предприятий обеих отраслей в ситуации конкурентного равновесия. Общая прибыль добывающей отрасли Y, (р — са)?а соответствует площади фигуры, ограниченной осью цен,
a:ca <p
верТИкальноц линиеи р = р^ соответстВуЮщеи равновесной цене, и гра-
фиком функции предложения S(р) (см, рис, 18,2),


Прибыль перерабатывающей отрасли Yl (гь — Р)Wb — это площадь
b:p<rb
фигуры образованной осью цен, вертикальной линией p = р, соответствующей равновесной цене, и графиком функции спроса D(p) (см, рис,
18.3) .
Общая площадь заштрихованных на рис, 18,2 и 18,3 фигур — это прибыль всей экономики в состоянии конкурентного равновесия (см, рис,
18.4) .


Обсудим, каким будет состояние этой экономики, если установится монополия в одной из отраслей, а другая отрасль останется конкурентной, Для определенности будем считать, что монополизирована добывающая отрасль. Тогда монополия в добывающей отрасли установит и объем, и цену на сырье, стремясь максимизировать свою прибыль.
Допустим, что функция спроса D(p) является медленно убывающей на отрезке [р, г2]. Согласно утверждению 17,4, оптимальная цена для монополии р* > г2. Пусть для определенности р* = г2. Тогда объем добычи составит D(r2) и прибыль монополии будет равна площади фигуры, ограниченной горизонтальной линией V = D(r2) , графиком функции предложения S(p), осью цен и вертикальной линией p = r2 (см, рис,
18.5).
Обсудим результаты господства монополии на рынке. Возникают два основных негативных эффекта: во-первых, для экономики в целом теряется часть прибыли, и во-вторых, установилась диспропорция, поскольку монополия захватила себе львиную долю прибыли в ущерб второй отрасли.
Допустим теперь, что обе отрасли монополизированы. Тогда цена, которая установится на рынке, будет определяться путем переговоров между этими монополиями. Скорее всего, ни одна монополия не согласится, чтобы другая монополия установила монопольную цену, и в результате переговоров установится промежуточная цена между их монопольными ценами. Вполне может быть, что они сговорятся о цене, близкой к конкурентному равновесию, что выгоднее для экономики в целом, чем предыдущий вариант. Реальная технологическая цепочка содержит не две отрасли, а несколько. Рассмотрим основные звенья:
1) добыча сырья;
2) транспортировка;
3) переработка;
4) оптовая торговля;
5) розничная торговля.
Для отклонения от конкурентного равновесия достаточно, чтобы хотя бы в одном из звеньев возникла монополия. В российской экономике возникновение таких монопольных структур часто связано с преступными группами. Ими, например, долгое время контролировался сбыт легковых автомобилей. Автомобили скупались на предприятиях по ценам, близким к себестоимости, и потом продавались в розничной сети по монопольным ценам.
Практический вывод из рассмотренных моделей состоит в том, что надо аккуратно относиться к демонополизации отраслей. Иногда более выгодно иметь монополии в нескольких отраслях, чем в одной. При этом по крайней мере общая прибыль для экономики будет выше, чем в случае одного монополиста. Присвоение им основной части прибыли на практике может привести к разрушению всей технологической цепочки.
Рассмотрим экономику с аналогичной технологической структурой, но в условиях централизованного планирования. Покажем, что для централизованно управляемой экономики оптимальный план соответствует состоянию конкурентного равновесия.
Рассматриваем ту же модель с двумя отраслями. Плановый орган устанавливает задание для каждого предприятия. Плановое задание для предприятия а добывающей отрасли обозначим как V , а для предприятия b перерабатывающей отрасли как W . Должен соблюдаться баланс, т.е. сумма добытого сырья должна равняться сумме переработанного сырья, а также должны соблюдаться ограничения на мощности:
? Wb = ? V“, Г < Va, а Е A, Wb < Wb,b E B. (18.1)
beB aeA
Набор (Va, а E A, Wb, b E B), удовлетворяющий системе (18,1), называется допустимым планом,.
Задача централизованного планирования — найти оптимальный план, т.е, допустимый план, макеимизирущий доход страны от производства и экспорта продукта. Доход, соответствующий допустимому плану (Vа, а Е A, Wb, b Е B), равен
W_
db
W b ~dF
?
ьев
? rbWb — ? caVa.
beB aeA
?c*Va — ?
aeA beB
Поскольку экономика — централизованная, то внутренних цен может и не быть.
Утверждение 18.1. Оптимальный план соответствует состоянию конкурентного равновесия, т.е, для каждого предприятия надо установить задание, которое соответствует объему выпуска этого предприятия в условиях конкурентного равновесия.
Доказательство. Зафиксируем цену p Е [c1,r1] и для допустимого плана (Va, а Е A, W , b Е B) запишем доход в виде
?(p — ca)Va + ?(rb — p)Wb. (18.1)
aeA beB
Без потери общности будем считать, что
? V1 > w (p) d==f ? W1.
l:p>cl l:p<rl
Определим целое к из условия
k k+1
^ V1 < W (р) < ^ V1. 1=1 1=1
о
Если к = 0, то условно полагаем V1 = 0 и первое (строгое) неравен-
і=і
ство здесь отсутствует. Тогда план, максимизирующий доход (18,1) при фиксированном р, определяется по формулам
|
0, |
|
р |
< |
га с , |
|
|
|
|
V °, |
|
р |
> |
са, |
а < |
к, |
|
|
|
k |
|
|
|
|
|
|
|
W (р) - |
-EV', |
р |
> |
са, |
а = |
к + |
1 |
|
|
і=і |
|
|
|
|
|
|
|
0, |
|
р |
> |
са с , |
а > |
к + |
1 |
|
W |
0, rb < р, Wb, rb > р.
Соответствующая величина дохода равна площади фигуры, ограниченной осью цен, горизонтальной линией V = W(р) и графиками функций спроса и предложения (см, рис, 18,5, где р = r2, W(р) = W1+ W2, к = 2). Площадь этой фигуры максимальная при р = р. ¦
Обсудим этот результат. Утверждение говорит о том, что в централизованно управляемой экономике максимальная общая прибыль такая же, как и в состоянии конкурентного равновесия. Возникает вопрос: зачем все эти переходы от капитализма к социализму и обратно, если и там и там наилучший результат одинаковый? Дело в том, что в условиях централизованного управления оптимальный план не удается реализовать на практике. Плановый орган должен иметь правдивую информацию об издержках и объемах производства. Но предприятие не заинтересовано в предоставлении правдивой информации. При плановой экономике снижается также качество продукции, а значит растут издержки производства в последующих звеньях технологической цепи.
Что касается рыночной экономики, то она может обеспечить оптимальный результат, если складывается конкурентное равновесие. Как мы показали, действия монополии, максимизирующей прибыль, приводят к значительным отклонениям от этого оптимального результата. Реальные рынки обычно не являются монопольными, в них участвуют несколько агентов с каждой стороны. Важная теоретическая проблема — оценка возможного отклонения от состояния конкурентного равновесия для таких рынков. Для ее исследования разработаны модели несовершенной конкуренции, или олигополии, рассматриваемые в следующем параграфе.
§ 19. Модели олигополии
Введенное выше понятие конкурентного равновесия характеризуется следующими свойствами,
1, Товар на рынке продается по единой цене,
2, Каждый производитель и потребитель определяет объем предложения (соответственно, спроса), максимизируя свою прибыль (полезность) при данной цене,
3, Цена устанавливается таким образом, что балансирует спрос и предложение.
Рассмотрим теперь модель рынка, на котором действует несколько производителей товара, каждый из которых обладает определенными возможностями влиять на рыночную цену и учитывает эти возможности при выборе своей стратегии. Потребителей по-прежнему считаем мелкими: отдельный потребитель не оказывает влияния на параметры рынка. Рынок с такой структурой называется олигополией. Цель исследования этой модели — ответить на следующие вопросы: При каких условиях на структуру отрасли-производителя товара рынок придет в состояние конкурентного равновесия? Как зависит отклонение от конкурентного равновесия (по цене и объемам выпуска) от структуры отрасли? Насколько эффективно антимонопольное законодательство и какие меры регулирования можно предложить для повышения эффективности рынка?
Модель олигополии по Курно
Рассматривается отрасль экономики, выпускающая однородный товар, В отрасль входит m предприятий-производителей, каждое из которых характеризуется постоянными удельными себестоимостями ca и максимальным объемом производства Va, a ? A = {1, ...,m}. Задана однозначная функция спроса на товар D(p), причем D(p) убывает по p и D(p) ^ 0 при p ^ <х>. Характерным примером функции спроса является функция вида
D(p) = K/pa, а > 0. (19.1)
Стратегией предприятия a ? A является объем выпуска va ? [0, Va], Цена на рынке устанавливается таким образом, чтобы фактическое предложение товара va соответствовало спросу на него. Обозначим через
аеА
v = (va, а ? А) вектор выпуска товара. Тогда цена на рынке будет равна
|
p(v) = D 1 |  |
(19.2)
Прибыль производителя а зависит от вектора выпусков v и определяется как
ua(v) = va(p(v) - ca). (19.3)
При выборе объема выпуска каждое предприятие стремится максимизировать свою прибыль. Получается, что е одной стороны, сели разность цены и удельной себестоимости положительна, т.е. p(v) — ca > 0, то прибыль возрастает с увеличением объема за счет первого сомножителя va. Но е другой стороны, цена убывает е увеличением объема выпуска в силу (19,2), Действительно, функция спроса D(p) предполагается убывающей и обратная к ней функция D-1(V) также убывает. Следовательно, прибыль может убывать е увеличением объема выпуска за счет второго сомножителя в (19,3),
Отметим, что в точке v = 0 функции ua(v) имеют особенность. Естественно определить ua(0) = 0.
Мы описали взаимодействие производителей в виде игры в нормальной форме:
Г = ІА, [0, Va], ua(v), v ? 0 [0, Va], а ? a),
' a€A '
где A — множество игроков (производитсяей товара), [0, Va] — множество допустимых стратегий игрока а (множество допустимых объемов выпуска), ua(v) — выигрыш (прибыль) игрока а.
Отметим, что сели lim D-1(V)V > 0, то функция
V^0+
ua(0||va) = va(D-1(va) — ca) разрывна в точке va = 0. В этом случае равновесие по Нэшу в игре Г может не существовать (см, ниже упражнение 19А).
Поиск равновесий по Нэшу для модели Курно
Найдем равновесия по Нэшу для этой игры, т.е, такой набор стратегий
v = (va, a G A), что каждое предприятие выпускает объем товара

(19.4)
Обозначим через u'va (v) частную производную функции ua(v) по переменной va в точке v.
Лемма 19.1. Если ? — равновесие по Нэш у, то v = 0 и выполнены следующие необходимые условия:
1) va = 0 ^ u'va (v) < 0;
2) va G (0,Va) ^ uVa (v) = 0;
3) va = Va ^ u'va (v) > 0.
Доказательство. Покажем, что ситуация равновесия ? не может быть нулевой. Действительно, предположим, что v = 0 — ситуация равновесия, В силу свойства D4 функции епроса, D-1(V) ^ то при V ^ 0 + . Поэтому при достаточно малом va > 0
ua(0||va) = va(D-1(va) — ca) > 0 = ua(0)
что противоречит определению ситуации равновесия.
Условия 1 )-.'>) является необходимыми условиями для точки максимума va дифференцируемой функции ua(v||va) одной переменной va на отрезке [0, Va] (см, задачу (19,4)), ¦
Вычислим производную функции прибыли по объему выпуска va как производную произведения:

(19.5)
Утверждение 19.1. Пусть с1 < с2 < ... < cm, т,е, предприятия упорядочены по возрастанию удельных себестоимостей, а функция спроса D(p) — дифференцируемая и убывающая. Тогда найдется такое предприятие к, что в равновесии по Нэшу va > 0, a = 1,2,..., k, va = 0, a = k + 1,..., m, причем ck+1 > ck.
Доказательство.
1) Пусть v — равновесие то Нэшу, По лемме 19,1 v = 0. Возьмем такое к, что vk > 0. Покажем, что тогда
D-1 Е vb - ck > 0. Согласно лемме 19,1 из vk > 0 следует
' beA '
Дк (v) > 0, Из формулы (19,5) получаем
D-1( ^ - ck > -vk/D(p(v)) > 0,
beA
поскольку D(p(v)) < 0.
2) Покажем, что ?а > 0 при a = 1,..., k — 1. Допустим от противного, что ?а = 0 для некоторого а G {1,..., k — 1}, Тогда
Да(?) = D-1( ^ vb) — ca + va/D(p(v)) = D-1( ^ vb) — ca >
beA beA
> D-1(^Vbj — ck > 0, beA
так как ca < ck при a < k. По лемме 19,1 из Да (v) > 0 следует Va > 0, Получили противоречие с предположением, что va = 0, Следовательно, va > 0 при a =1,..., k — 1,
3) Таким образом, найдется такое максимальное k, что
va > 0, a = 1, 2, ...,k va = 0, a = k + 1,...,m. Наконец, покажем, что ck+1 > ck ^ли ck+1 = ck, TO
uVk+i(v) = D-1( ^ vb) — ck+1 + vk+1/D(p(v)) = D-1( ^ — ck > 0.
beA beA
По лемме 19,1 из Дк+х(v) > 0 следует vk+1 > 0 (противоречие), ¦
Полученный результат имеет простой экономический смысл: если некоторому предприятию выгодно производить товар по данной цене, то предприятию с меньшей удельной себестоимостью тем более выгодно производить этот товар.
Случай с равными удельными себестоимостями
Рассмотрим случай, когда удельные себестоимости ca всех предприятий одинаковы и равны c. Из утверждения 19,1 следует, что тогда в равновесии по Нэшу va > 0 при всех a G A, т.е. каждый производитель выпускает положительное количество товара.
Рассмотрим сначала модем,ь без ограничений на объемы выпуска. Будем искать решение задачи (19,4), считая Va = то (производственные
мощности предприятий не ограничены). Тогда в точке максимума задачи (19,4) все производные u'va (v) = 0 и для поиска равновесия по Нэшу получаем следующую систему уравнений относительно неизвестных va, a = 1,..., m:
Uva(v) = D ^ ? vb) — c + va/D(p(v)) = 0, a e A.
(19.6)
beA
Суммируем уравнения (19,6) по всем a e A. Получаем
+ ? гд (d~i( ?
(19.7)
va) — mc
va ) ) = 0.
aeA
aeA
aeA
Выражение (19,7) представляет собой уравнение относительно одной неизвестной величины va. Разрешив данное уравнение и подставив най-
aeA
денную величину в уравнения (19,6), найдем значения va, a e A, которые, очевидно, одинаковы для всех a.
Продемонстрируем действие этого алгоритма на конкретной функции спроса. Пусть D(p) = K/p. Тогда p(v) = D-1( ^ va) = K/ va. Система
aeA aeA
(19,6) в этом случае принимает вид
К/ ? vA — c — vaK/ ? va)2 = 0, a e A, (19.6')
aeA aeA
а уравнение (19,7) преобразуется к виду:
K/?
(19.7')
0.
v — mc —
aeA
aeA
Из (19,7 ') получаем, что JO va = (m — 1)K/(mc). Подставляя это
aeA
выражение в (19,6'), находим равновесие по Нэшу для модели Курно
_a = v* = K(m — 1) у a e A. (19.8)
cm2
Для модели с ограничениями на объемы выпуска отметим два случая,
а) v* < min Vb. Тогда решение задачи с ограничениями на объемы
beA
выпуска совпадает с решением той же задачи без учета ограничений,
так как v* — решение задачи оптимизации по более широкому множеству и в то же время является допустимым объемом выпуска для задачи с ограничениями. Следовательно, в этом случае va задается формулой (19.8).
б) v* > min Vb. Упорядочим производителей по убыванию макеималь-ъел
ных объемов выпуска: V1 > V2 > ... > Vт. Тогда найдется такой производитель k, что
v*, a < к, Va, a > к.
(19.9)
va
Алгоритм поиска равновесия по Нэшу вида (19.9)
Фиксируем некоторое к. Тогда, переписав (19.6) для этого случая, получаем уравнение для нахождения v*(k):
K/( ^ Va + kv*)
a=k+1
и о 2
— c — v*K/( ^ Va + kv*)
a=k+1
(19.6 ")
0,
где выражение Va полагается равным нулю.
a=m+1
Начинаем поиск равновесия по Нэшу с k = т. Находим v*(m) и проверяем условие v*(m) < Vm. Если оно выполняется, то найденная ситуация v является равновесием по Нэшу, Иначе берем k = m — 1 и т.д. В результате за конечное число шагов найдем равновесие по Нэшу для этого случая.
Сравнение равновесий по Нэшу и по Вальрасу для модели Курно
Пусть D(p) = K/p, Va = V, ca = c, В этом случае равновесие по Нэшу v и цена р* определяется по формулам
a |v* = K(m — 1)/(cm2), если v* < V, w .
va = < v ’ ~ V a e A,
I V, если v* > V,
K/(mv*) = cm/(m — 1), если v* < V, K/(mV), если v* > V.
Чтобы найти равновесие по Вальрасу, надо найти пересечение функций спроса и предложения, причем
{О, p<c,
[О, mV ], p = c, mV, p > c.
Если K/c < mV, to p = c (см. рис. 19.1), иначе p = K/(mV) (cm, рис, 19,2),

В итоге получаем следующий результат.
Утверждение 19.2. Для данной модели возможны следующие соотношения равновесий по Нэшу и по Вальрасу,
1) Если V > К/(cm), то
p* = cm/(m — 1), v* = К(m — 1)/(cm2), p = c, va = K/(cm), , т.е. равновесная цена для олигополии p* превышает цену конкурентного равновесия p в m/(m — 1) раз (рис, 19,1),
2) Если К/(cm) > V > К(m — 1)/(cm2), то
p* = cm/(m — 1), v* = К(m — 1)/(cm2), p = К/mV, Va = V, т.е, цены отличаются в меньшей степени,
3) При V < К(m — 1)/(cm2) цены и объемы совпадают: p* = p = К/(mV), v* = Va = V. (см, рис, 19,2),
Таким образом, если ограничение объема выпуска несущественно (V > К/(cm)), то для малых m получаем следующие соотношения цен:
m = 2 ^ p = p*/2; m =3 ^ p=2p*/3; m = 4 ^ p=3p*/4.
Так как p = К/ va, , то соотношение объемов обратно пропорциональ-
aeA
но соотношению соответствующих цен, т.е, v*/v = 1 — 1/m, в частности, m = 2 ^ v = 2v*; m = 3 ^ v = 3v*/2; m = 4 ^ v = 4v*/3.
Модель Курно позволяет обосновать меры по антимонопольному регулированию, Из анализа этой модели вытекает, что если на рынке дей-етвует хотя бы четыре компании, то отклонение по объему от состояния конкурентного равновесия по Вальрасу составляет не более 25%, а отклонение по цене не более 33%, При этом объем выпуска на каждом из четырех предприятий, присутствующих на рынке, должен составлять v* = 3K/(16c) (т.е, 3/16 от равновесного по Вальрасу общего объема производства). Согласно антимонопольному законодательству США, к предприятию могут применяться антимонопольные меры, если оно контролирует более 30% рынка. Исходя из модели Курно, таким образом обеспечивается определенная степень близости к конкурентному равновесию.
Упражнение 19.1. Покажите, что равновесие по Нэшу для модели Курно не существует, если D(p) = K/pa, 0 < а < 1/m, ca = c.
Упражнение 19.2. Найдите равновесия по Нэшу для модели Курно и сравните их е конкурентным равновесием в следующих условиях:
1, D(p) = K/pa, а > 1/m, ca = c, Va = V.
2, D(p) = K/p, ca = c, V1 > V2 > ... > Vm.
3, D(p) = K/p, c1 < c2 < ... < cm, Va = V > K/c1.
Достоинства модели Курно:
а) проста для исследования;
б) согласуется с моделью конкурентного равновесия;
в) условия совершенной конкуренции и оценки отклонения от них легко формализуются.
Недостатки модели Курно:
а) неясно, какое отношение модель имеет к реальным рынкам, поскольку на практике нет таких механизмов ценообразования: производитель назначает и цену, и объем выпуска. Исследование соответствующей модели показывает, что найденное для модели Курно равновесие по Нэшу неустойчиво к изменению цен (см, следующий параграф);
б) видимо, модель не соответствует и экономической статистике. Например, по России доля торговой наценки в цене на мелкооптовых рынках превышает 50%, хотя количество продавцов каждого товара велико.
Модель ценовой конкуренции Бертрана-Эджворта
Рассмотрим другой вариант модели олигополии. Рынок предполагается прежним: A — множество производителей товара, ca и Va — постоянные удельная себестоимость и максимальный объем выпуска производителя a D(p) — функция спроса. Потребители — мелкие, они образуют континуум, каждый из них может купить одну единицу товара. Потребитель характеризуется резервной ценой r > 0. Он покупает, сели ему достается товар по цене p < r и не покупает в противном случае.
Ответы на поставленные вопросы относительно условий реализации конкурентного равновесия и оценки отклонения от него зависят от механизма взаимодействия между производителями и потребителями. В качестве примера такого механизма рассмотрим односторонний аукцион первой цены. Производители-продавцы одновременно и независимо назначают цены sa > ca на свой товар. Потребители-покупатели выстраиваются в очередь и покупают предложенный товар в порядке возрастания цены с учетом их резервных цен. При этом важен порядок прихода покупателей на рынок.
Пример 19.1. На рынке взаимодействуют два продавца и две группы покупателей со следующими параметрами: s1 = 5, V1 = 100; r1 = 6, D1 = 110; s2 = 7, V2 = 50; r2 = 8, D2 = 40, где sa — цена, назначенная продавцом a Va — предложенный по этой цене объем товара, rl — резервная цена для группы покупателей i, D1 — объем их спроса (который неэластичен при p < тл).
Если на рынок первыми приходят "бедные"покупатели (т.е. с низкой резервной ценой), то они покупают 100 единиц по цене 5, а потом "богатые "купят 40 единиц по цене 7. Если же на рынок первыми приходят "богатые", то они покупают 40 единиц по цене 5, а потом "бедные"покупают 60 единиц по цене 5. Очевидно, что прибыль второго продавца при этом существенно меняется.
Далее будем предполагать, что потребители с различными резервными ценами r распределены в соответствии с плотностью p(r) — неотрицательной функцией, интегрируемой на полупрямой [0, то). Это значит, что при заданной цене p < r и малом dr потребители с резервными ценами из отрезка [r, r + dr] купят товар в количеетве p(r)dr. Пусть имеется такое число M > 0, что плотность p(r) положительна на интервале (0, M), а потребители с резервными ценами r > M имеют дополнительную возможность приобрести товар на другом рынке по фиксированной цене M.
Тогда функция спроса имеет вид
p < M,
p = M, p > M.
( СО
J p(r)dr,
p
D(p)
СО
[0 J p(r)dr],
м
Отметим, что D(p) можно интерпретировать как общее число потребителей, желающих приобрести товар по цене p. Ясно, что функция D(p) — убывающая и дифференцируемая на интервале (0, M). Далее будем считать, что Е va > D+ (M).
a:ca<M
В сделанных предположениях равновесная цена р однозначно определяется из условия D(p) ? [S-(p),S + (p)], причем D(p) > 0.
Набор цен s = (sa, a ? A), установленных производителями, определяет вектор фактического предложения товара:
V(s) = (Vp(s), р ? P(s)), где Vp(s) = Е Va — количество товара,
a:sa=p
предложенное по цене р, a P(s) — множество назначенных цен,
В общем случае процесс продажи характеризуется функцией остаточного спроса. Функция остаточного спроса D(p,V) показывает, каков остаточный спрос по цене p посте продажи всех объемов ?ф по ценам p < p, p ? P(s). Рассмотрим три конкретных вида функций остаточного спроса, связанных с правилами рационирования, т.е, с порядком потребителей в очереди:
1, Приоритет потребителей с большей резервной ценой:
Dl(p, V) = max 0,D(p) — ^ ?ф . (19.10)
p'<p
2, Потребители равномерно распределены в очереди и остаточный спрос формируется по пропорциональному правилу:
D2(p, V) = D(p) max
(19.11)
0,1 — Y, Vp-/D(p')
p <p
3, Приоритет потребителей с низкой резервной ценой:
d(p) — y Vp
¦ p<p'<p
(19.12)
D3(p, V) = max
0, min
p<p
Упражнение 19.3. Докажите формулы (19,10-12),
При любом порядке потребителей в очереди справедливо соотношение D1(rp,V3) < D{p,V) < D3(p,V), означающее, что остаточный сирое убывает быстрее всего в случае 1 и медленнее всего — в случае 3,
Далее рассмотрим произвольный порядок потребителей в очереди, считая, что остаточный спрос характеризуется функцией D(p,V), удовлетворяющей следующим неравенствам:
D(p) — ? Vp < D(p,V) < max[0, D(p,V) — Vp ] V p < p. (19.13)
p'<p P<P'<P
Помимо этого, потребуем, чтобы функция D(p, V(s)) была непрерывна по любой переменной sa в интервале 0 < sa < p при фиксированных остальных переменных.
По функции остаточного спроса D(p, V) для любых стратегий sa производителей однозначно определяется максимальная продажная цепа p(s) = max{p Е P(s) | D(p,V(s)) > 0}, при которой остаточный спрос еще положителен.
Определим правило распределения величины D(p, V(s)) для производителей а, выбравших sa = p(s). Разобьем их на две группы:
A1 = {а Е A | ca < sa = p(s)}, A2 = {а Е A | ca = sa = p(s)}.
Если D(p(s),V(s)) < Y Va, то весь остаточный спрос распределяет-
aGAp
ся между производителями а Е A1 пропорционально их максимальным объемам предложения VУ При этом производитель а выпускает свой товар в количестве Vs = VaD(p(s), V(s))/ Y Va. В случае D(p(s), V(s)) >
aGAp
Y Va производители а Е A1 выпускают свой товар в количестве Va.
aGAp
~ ~ del
Величина остатка спроса D(p(s), V(s)) = max
0, D(p(s), V(s)) — E Va
aGAp
распределяется между производителями а Е A2 по аналогичному правилу.
Итак, при распределении остаточного спроса приоритетом пользуются фирмы, для которых себестоимости ниже продажной цены. Последнее условие вводится для технического удобства, поскольку определяемые ниже функции выигрыша разрывны, и данная модель описывает распределение покупателей при разности цен, близкой к нулю, В качестве
выигрыша производителя а рассмотрим его прибыль (sa — ca)Va,
sa < p(s), а G Ai,
a G A2,
sa > p(s).
(sa — ca)Va min[1 , D(p(s), V(s))/ ^ Vb],
beAi
(sa — ca)Vamin[1 ,D(p(s),V(s))/J2 Vb],
ua(s)
beA2
0,
V
Таким образом, описана модель ценовой конкуренции производителей как игра в нормальной форме Г = ^A, {sa | sa > ca},ua(s), a G A^, где
игроки a G A — фирмы, множества стратегий {sa | sa > ca} — множества цен, которые они могут назначить, функции выигрыша ua(s) определяют прибыли фирм.
Известные модели поведения в игре Г — это равновесие по Нэшу, решение по доминированию, модели игровой динамики (динамика наилучших ответов, адаптивные динамики).
Рассмотрим сначала необходимые условия для равновесия по Нэшу описанной игры.
Утверждение 19.3. Пусть s — равновесие по Нэшу, p — цена конкурентного равновесия. Тогда справедливо одно из следующих двух условий:
1) p(s) = p и для каждого производителя а, имеющего ca < p, выполнено sa = p.
2) p(s) > p и найдется единственный производитель а, для которого ca < p(s) = sa, при этом ca < p (см, рис, 19,3),

Доказательство. Заметим, что Va < S (p) < D(p). Отсюда и
a:ca <p
из первого неравенства (19,13) вытекает, что каждый производитель а,
для которого ca < р, сможет продать весь свой товар по цене р. Поэтому для ситуации равновесия s min sa > р ^ р(в) > р.
a?A
Пусть p(s) = р, Если ca < р < sa, то производитель а ничего не продаст. Ему выгодно отклониться и выбрать цену sa = р, получив положительную прибыль (противоречие). Итак, ca < р ^ sa = р.
Пусть р(в) > р. Предположим, что для некоторого производителя а выполнено ca < sa < р(в). По определению р(в) он продаст весь свой товар в объеме Va. Если от увеличит цену до sa = sa+е, то при малом е > 0 в силу свойства непрерывности остаточный спрос D(jo(~sllsa), V(s||sa)) останется положительным. Следовательно, производитель а продаст товар в объеме Va и увеличит прибыль (противоречие). Итак, ca < р(в) ^ sa = р(в). Далее, Va > D(f>) > D^s)). Поэтому, если производи-
a:ca <p(s)
телей а, для которых ca < р(~в), по меньшей мере двое, то они не смогут реализовать полностью свои объемы по цене р(в). Одному из них выгодно отклониться и назначить цену р(в) — е. В результате он увеличит свою прибыль, что противоречит определению ситуации равновесия, ¦
Следствие. Если найдутся два производителя а, для которых ca < р, и существует равновесие по Нэшу S, то р(в) = р (см, рис, 19,4),
Упражнение 19.4- В условиях предыдущего следствия дополнительно предположим, что S+(f)) > D(p) (см, рис, 19,5), Докажите, что для производителя а, имеющего удельную себестоимость ca = р, выполнено неравенство Va < S +(р) — D(p).


Теперь сформулируем достаточные условия существования равновесия по Нэшу,
Утверждение 19.4- Предположим, что
У Va — max Va > D(p). (19.14)
' ¦? a:ca <p
a:ca<p
Тогда любая ситуация s, удовлетворяющая условию: sa = p, если ca < p, является равновесием по Нэшу,
Доказательство. По условию p(s) = p. Производители а, для которых sa > ca > p, ничего не продадут. Отклоняться им от своих стратегий sa не имеет смысла, поскольку их прибыль останется нулевой. Рассмотрим теперь производителей а, для которых ca < p. Если один из них увеличит цену до sa = p + е, то ничего не продаст, так как по условию (19,14) другие представители этой группы полностью покроют спрос по цене p и остаточный спрос по цене p + е будет нулевым. Поэтому увеличивать цену производителю а невыгодно. Уменьшать ее (если ca < p) также не имеет смысла. Действительно, поскольку
? Va < S~(p) < D(p),
a:ca<p
производитель а сможет продать весь свой объем по цене p. Итак, s — равновесие по Нэшу, ¦
Введем обозначение: c = max ca.
a:ca <p
Утверждение 19.5. Предположим, что S + (p) = S-(p) = D(p) и существуют хотя бы два производителя аі и а2, для шторых max[cai, ca2] <p (см, рис, 19,4),
1) Пусть D(p)(p — c) < D(p)(p — c) при p E [p, M] и
D(p, V) < D(p)(1 — ? Vp/D(p')). (19.15)
p'<p
Тогда любая ситуация s, удовлетворяющая условию: sa = p, если ca < p, является равновесием по Нэшу,
2) Пусть в некоторой правой полуокрестности точки p выполнены неравенства D (p)(p — c) > D (p)(p — c) и
D(p, V) > D(p)(1 — ? Vp/D(p')), (19.16)
p'<p
при этом хотя бы одно из них строгое. Тогда в модели ценовой конкуренции не существует равновесия по Нэшу,
Доказательство. Из равенства S + (р) = S-(р) вытекает, что не существует производителей а, для которых ca = р. Далее, равенства S (р) = Va = D (р) означают, что спрос по цене р будет удовлетворен
a:ca <p
полностью. Поэтому производитель а, для которого sa > ca > р, ничего не продаст. Следовательно, р(в) = р.
1) Из условия следует, что D(p)(p — ca) < D(j>)(j) — ca) при р ? [р, M] для всех производителей а, имеющих удельную себестоимость ca < р. Действительно, при р > р из неравенства D(p)(p — c) < D(j>)(j) — c) получаем
D(p)p — D(p);p < c(D(r[j) — D(p)) < ca(D('[j) — D(p)).
Отсюда D(р)(р — ca) < D(р)(р — ca).
Рассмотрим производителя а ^^^ото, что ca < р. Ему невыгодно снижать цену sa = р, поскольку он продаст весь свой объем Va и то цене р. Ему невыгодно выбирать и более высокую цену sa > р, так как
ua(s||sa) = (sa — ca)D(sa,V(s||sa)) < (sa — ca)D(sa)(1 — Vp(s||sa)/D(p)) = = (sa — ca)D(sa)(l — ^ Vb/ ^ V^ =
beA\{a} beA
= (sa — ca)D(sa)Va/ ^ Vb < (р — ca)D(p)Va/ ^ Vb = ua(s).
beA beA
2) Предположим, что существует равновесие по Нэшу s. Рассмотрим производителя, имеющего удельную себестоимость ca = c < р. При назначении новой цены sa = р + е его прибыль будет равна
ua(s||sa)
(sa — c)D(sa,V(s||sa)) > (sa — c)D(sa)(1
Vp(sHsa )/D(p)) =
= (sa — c)D(sa)Va^Vb > (р — c)D(:V)Va^Vb = ua(s), beA beA
при этом одно из последних двух неравенств выполнено как строгое. Следовательно, получено противоречие с тем, что ситуация s является равновесием по Нэшу, ¦
Цену р* и набор объемов va, a G A, отвечающих равновесию по Нэшу в модели Курно, назовем исходом по Курно. Из доказательства утверждения 19,5 вытекает, что в его условиях исход по Курно не является равновесием по Нэшу в модели ценовой конкуренции, если можно одновременно менять цену и объем предлагаемого товара. Действительно, если D(p) = K/р, ca = c, Va = V < K(m — 1)/(cm2), то согласно утверждению 19,2, в модели Курно существует равновесие по Нэшу ? = (V,..., V) с ценой р* = р. Но по второй части утверждения 19,5 в модели ценовой конкуренции s = (р*, ...,р*) не является ситуацией равновесия.
Рассмотрим также модели с последовательным выбором цен и объемов, Пусть на первом этапе производители одновременно назначают цены sa > ca, а на втором определяют объемы выпуска va G [0, Va], зная цены sa, a G A. Покажем, что на втором этапе оптимальный выбор (решение по доминированию) соответствует объемам продаж в рассмотренной модели ценовой конкуренции. Действительно, заметим, что в этой модели функция выигрыша производителя a ua те убывает по параметру Va при фиксированных остальных переменных. Поэтому стратегия игрока a (sa, Va) слабо доминирует любую его стратегию (sa,va), где va < Va. Таким образом, данный случай двухэтапной игры эквивалентен модели ценовой конкуренции.
Предположим теперь, что цены и объемы выбираются в обратном порядке: на первом этапе производители устанавливают фиксированные объемы va G [0, Va], а на втор ом — цены sa > ca, зная объе мы va, a G A. Прибыль, получаемая производителем a равна vasa — cava, где va — объем реализованной продукции, определяемый (остаточным) спросом по цене sa. Заметим, что на втором этапе оптимизация этой прибыли не зависит от издержек cava ( объемы va были выбраны на первом этапе и не меняются) , Поэтому на втором этапе игроки фактически действуют в рамках модели ценовой конкуренции с нулевыми удельными себестоимостями. Тогда справедливо следующее утверждение.
Утверждение 19.6. 1) Пусть при достаточно малых р выполнено неравенство D(j>) > Va. Бел и в(И(р)) > 1 при р G [р, M ] и для
aeA
функции остаточного спроса выполнено условие (19,15), то совершенные подыгровые равновесия в рассматриваемой двухэтапной игре однозначно соответствуют равновесиям в модели Курно,
2) Пусть для функций спроса и остаточного спроса при р G [р, M] выполнены неравенства D(p)p > D(f>)f> и (19,16), причем хотя бы одно из них строгое. Тогда совершенного подыгрового равновесия в двухэтапной игре не существует.
Доказательство. Пусть выбраны va, a G A, Функция предложения определяется этими объемами. Поэтому цена конкурентного равновесия p(v) зависит от вектора v. Как отмечалось выше, на втором этапе удельные себестоимости можно считать нулевыми. Поэтому равновесная цена p(v) однозначно определяется из условия D(p) = va (см, рис, 19,6),
aeA
1) Условие e(D(p)) > 1 гарантирует выполнение неравенства D(p)p < D(p)p при p G [p,M]. Поэтому все условия первой части утверждения 19,5 выполнены. Из него вытекает, что в рассматриваемой подыгре существует единственное равновесие по Нэшу, соответствующее ситуации s, для шторой sa = p(va, a G A) V a G A. Таким образом, первый этап эквивалентен модели Курно,
2) Согласно второй части утверждения 19,5, равновесия по Нэшу на втором этапе не существует ни при каком выборе va G [0, Va], ¦
Таким образом, двухэтапная модель сводится к модели Курно, Для каких товаров выполнены условия последнего утверждения? Для тех, спрос на которые эластичен и производство которых нельзя осуществлять по мере поступления заказов, а также нельзя без значительных издержек долго держать их на складе, В качестве примера отметим импортные фрукты. Для большинства же товаров указанные условия не выполнены,
§ 20. Налоговое регулирование
Создание эффективно функционирующей системы налогообложения является одной из наиболее актуальных задач для стран, в которых развивается рыночная экономика. Бюджетный сектор экономики, существующий в основном за счет налоговых сборов, выполняет ряд важных функций. Прежде всего, он обеспечивает производство товаров и услуг, которые не может эффективно производить рынок. Некоторые из этих услуг необходимы для функционирования рыночной экономики, В частности, к ним относятся защита прав собственности и обеспечение выполнения заключенных сделок. Если эти условия не обеспечены, то эффективность экономического рынка резко снижается: большие ресурсы расходуются на захват чужой собственности и/или защиту от грабежа и обмана.
Бюджетный сектор производит также другие товары и услуги, относящиеся к так называемым общественным благам. Их специфика состоит в том, что невозможно или очень дорого распределять их е помощью рыночного механизма, т.е. продавая индивидуальным потребителям. Известными примерами общественных благ являются маяки, радио- и теле-транеляторы, дорожная инфраструктура, К другому типу общественных благ относятся услуги, которые целесообразно предоставить определенной части населения независимо от покупательной епоеобноети отдельных потребителей. Во многих странах в эту категорию входят определенный уровень образования, здравоохранение и информационного обеспечения населения. Целесообразный уровень обеспечения такими услугами определяется государственными органами, исходя как из экономических, так и внеэкономических соображений. Например, определенный уровень культуры и знаний населения может рассматриваться как самостоятельная ценность вне зависимости от потребностей экономического рынка. Основной источник доходов государства — налоги, В качестве примера рассмотрим структуру бюджета США за 1987г. Национальный доход США составил 4 трлн, 527 млрд, долларов. Доходы федерального бюджета: 854 млрд, долларов. Источники дохода: 46% — подоходный налог с физических лиц, 35% — начисление с зарплаты, 10% — налог на прибыль с корпораций, 4% — акцизы, 5% — таможенные сборы. Расходы: 1 трлн, 4 млрд, долларов. Статьи расходов: 40% — социальная помощь, 28% — национальная оборона, 14% — погашение государственного долга, 7% — государственное образование и медицинские учреждения, 7% — развитие транспортной сети, 4% — субсидии фермерам.
Рассмотрим основные виды налогов и их влияние на поведение производителей на конкурентном рынке.
Налог с продаж
Налог с продаж взимается с товаров, которые продаются конечному потребителю. Налог с продаж характеризуется ставкой ts е [0,1], показывающей, какая часть стоимости товара должна поступать в государственный бюджет. Посмотрим как налог с продаж влияет на функции прибыли и предложения.
Без налога с продаж
Pra(p, V) = pV — C(V) — функция прибыли,
Sa(p) = Argmax Pra(p, V) — функция предложения.
С налогом с продаж функции прибыли и предложения равны Pra (p,V,ts) = (l - ts)pV - C (V),
V> 0
Sa(p,ts) = ArgmaxPra(p, V,ts) = Sa(p(l - ts)).
Отсюда следует, что график функции предложения растягивается в по оси рв 1/(1 - ts) раз (см, рис, 20,1),

Поскольку функция Sa(p) монотонно те убывает по р, то Sa(p,ts) < Sa(p). То же самое справедливо для совокупной функции предложения отрасли S(p) = Sa(p) , т.е, S(p,ts) < S(p). Если собранные налоги не
aeA
влияют на функцию спроса, т.е, эти деньги идут на другие нужды, то равновесная цена не убывает по ts.
Акцизный налог
Акцизный налог берется не с объема выручки, а с каждой единицы товара (сигареты, спиртное и т.п.). Ставка акцизного налога te показывает, сколько надо заплатить в бюджет с каждой единицы проданной продукции. Рассмотрим влияние этого налога на функции прибыли и предложения
Pra(p,V,te) = (p - te) V - C (V),
Sa(p,te) = Argmax Pra (p, V, te) = Sa(p - te).
Таким образом, график функции предложения смещается вправо на te единиц.
Налог на прибыль
Ставка налога на прибыль tpr ? [0,1] показывает, какая часть прибыли должна поступить в бюджет. Функция прибыли меняется следующим
образом:
Pra(p, V, tpr) = (1 - tpr)(pV - C(V)) = (1 - tpr)Pra(p, V), а функция предложения останется неизменной:
Sa(p,tpr) = Argmax(1 - tpr)Pra(p, V) = Sa(p).
Это относится к краткосрочному анализу, в то же время в долгосрочном плане налог на прибыль может оказать существенное влияние на равновесие в отрасли. Этот налог делает менее выгодными инвестиции в строительство новых мощностей и поддержание старых мощностей, С течением времени функция предложения может начать уменьшаться, так как старое оборудование будет выходить из строя, а новое покупать будет невыгодно. Введение высокого налога на прибыль ведет к тому, что из отраслей, где легко взимать налог на прибыль, капитал перетекает в отрасли, где легче скрывать прибыль от налогов. Итак, введение высокого налога на прибыль способствует развитию теневой экономики.
Таким образом, в долгосрочном плане налог на прибыль оказывает влияние на функцию предложения, и даже в краткосрочном плане он ведет к перетеканию капитала в теневой сектор.
Налог на добавленную стоимость (НДС)
Когда рассчитывается налог на прибыль, то из выручки от продажи вычитаются все издержки, НДС отличается тем, что при расчете базы налогообложения вычитаются не все издержки. Рассмотрим подробнее структуру издержек предприятия. Их можно представить в виде C(V) = Ci(V) + C2(V), где Ci(V) - это расходы на приобретения сырья и прочих необходимых для производства товаров, выпущенных другими производителями, а C2 (V) - это внутренние затраты на данном предприятии, прежде всего - заработная плата (а также некоторые другие виды издержек, в частности, расходы на рекламу).
Когда рассчитывается база НДС, из выручки pV вычитаются издержки первого типа C1(V), Это гарантирует, что каждый произведенный в экономике товар облагается НДС только один раз. Величина НДС равна tv at (pV - C1(V)), где ty at €= [0,1] - ставка НДС, При этом прибыль предприятия составляет
Pra(p, V, tvAT) = pV - C (V) - ty at (pV - Ci(V)) = = (1 - tvAT)(pV - Ci(V)) - C2(V).
НДС занимает промежуточное положение между налогом е продаж и налогом на прибыль. Он оказывает определенное влияние на функцию предложения, снижая ее, но какое именно — зависит от соотношения Ci(V) и C2(V).
Подоходный налог
Этот налог в отличие от всех предыдущих относится не к производителям, а к потребителям. Предельная ставка подоходного налога ti(I) ? [0,1] показывает, какая часть дохода I должна быть уплачена в виде налога. Типичный вид налога соответствует кусочно-постоянной неубывающей предельной ставке налога (ем, рис, 20,2),

Здесь I1 — налогонеоблагаемый минимум. Сейчас в России действует более простая схема налогообложения: весь доход свыше I1 облагается по ставке 13% (ем, рис, 20,3),
В бюджете России, в отличие от США, подоходный налог дает небольшую долю (10%), а наиболее важными являются НДС, акцизы и налог на прибыль.
Расчет ставки налога
В настоящее время развитие рыночных отношений в России происходит в условиях резкого сокращения реальной заработной платы в важнейших бюджетных отраслях, В результате значительная часть наиболее энергичных и способных работников уходят из государственных систем образования, здравоохранения, науки и культуры. Этот процесс представляет серьезную угрозу для будущего России, Таким образом, повышение реальной заработной платы работников бюджетной сферы является весьма актуальной задачей. Источником для покрытия расходов бюджета могут служить налоговые поступления. Рассмотрим соответствующую задачу расчета ставки налога с продаж для модели однопродуктовой экономики. Пусть S(p) — функция предложения товара, D1(p)
— функция спроса части населения, относящейся к рыночному еекто-ру, Q2(p) — доходы населения, относящегося к бюджетному сектору, из внебюджетных источников, D2 — желательный объем потребления для этой части населения. Предположим, что функции S(p) и D1(p) — однозначные, Тогда в отсутствие налога равновесная цена определяется из условия S(p) = Di(p) + Q2(p)/p.
Необходимость введения налога возникает в случае, если Q2(p) < pD2. Пусть p(ts) — равновесная цена при ставке налога с продаж ts. Для расчета необходимой ставки получаем следующую систему уравнений:
S(p(ts)( 1 — ts)) = Di(p(ts)) + D2,
p(ts )D2 = Q2 (P(ts)) + tsS (p(ts)( 1 — ts))p(ts).
Эта система позволяет определить нужное значение ставки ts и соответствующую цену p(ts) в общих предположениях относительно параметров модели, В частности, если спрос рыночного сектора является неэластичным (D1(p) = D1), а внебюджетный доход бюджетников пропорционален цене (Q2(p) = Kp), то
ts = (D2 — K)/(Di + D2), p(ts) = S-1(Di + D2)/(1 — ts).
Упражнение 20.1. Построить и исследовать аналогичные модели для расчета ставок акцизного налога и налога на прибыль.
Однако на практике налоговых поступлений часто оказывается недостаточно, В этом случае традиционные методы регулирования рыночной экономики, разработанные Кейнсом и его последователями (см,[2]), предусматривают единственный способ решения: увеличение номинальной зарплаты. Связанный с этим рост бюджетных расходов ведет к усилению инфляции, спекулятивному характеру экономической активности.
Альтернативой является рост предложения дешевых потребительских товаров и снижение рыночных цен. Одна из возможностей регулирования предложения — это товарные интервенции. Государственные и региональные органы управления осуществляют их путем закупки товаров на внешнем рынке (либо по специальным договорам с местными предприятиями) и перепродажи потребителям по сниженным ценам. Другой путь
— выделение предприятиям субсидий или льготных кредитов для внедрения технологий с низкими себестоимостями. Следующая модель посвящена поиску оптимальной стратегии, позволяющей обеспечить некоторый фиксированный уровень потребления для людей, основной доход которых представляют выплаты из бюджета (зарплаты, стипендии, пенсии и т.п.). Оптимальное определение этого уровня представляет самостоятельную проблему, которая здесь не обсуждается. Мы рассматриваем стратегии, сочетающие оба указанных подхода: повышение номинальных доходов и дотирование производства более дешевых товаров — и определяем оптимальное их сочетание. При этом решается задача минимизации общих расходов бюджета. Такая постановка наиболее оправдана на региональном уровне, на который падает большая часть расходов по финансированию бюджетных отраслей. Именно для этого уровня формулируется и изучается описанная задача.
Рассмотрим следующий рынок с одним товаром. Пусть A — конечное множество фирм, поставляющих товар. Каждая фирма а располагает набором производственных мощностей I “.Мощное ть i е I “ характеризуется максимальным объемом Vi и постоянной удельной себестоимостью С единицы продукции. Каждая фирма стремится к максимальной прибыли, Все доступные мощности могут использоваться одновременно. Функция предложения Si (р) указывает количество товара, выпускаемого на мощности типа i в зависимости от цены р, и имеет вид
{0, р < Сі,
[0, Vi], р = Сі,
Vi, р > Сі.
Общий объем поставок товара на рынок задается функцией
S(Р) = Е Е Si(P).
aeA ieia
Население региона делится на две группы — независимую и зависимую — следующим образом. Индивидуумы первой группы относятся к частной сфере экономики и самостоятельно обеспечивают себя товаром. Для зависимых жителей региона основным источником дохода является бюджет, и задача администрации — обеспечить определенный уровень потребления этих жителей. Для упрощения модели зависимая группа предполагается однородной.
Пусть функция Di(p) определяет спрос на товар со стороны первой (независимой) группы. Доход зависимой группы из прочих источников, кроме регионального бюджета, задается функцией pD2 (р), Весь этот доход вместе с выплатами из бюджета, или субсидиями, расходуется на приобретение товара. Таким образом, спрос на товар со стороны зависимой группы составляет D2(Kyy) = D2 (р)+ К/р, где K — объем субсидий. Цена р(К) на рынке определяется из условия баланса спроса и предложения:
Di(p) + D2(K,p) е S(p). (20.1)
Функции спроса Di(p) и D2(p) предполагаются дифференцируемыми и невозрастающими.
Пусть D2 — желательный уровень потребления зависимой группы, В отсутствие субсидий, т, е, при K = 0, равновесная цена p(0) удовлетворяют условию D2(p(0)) < D2 (в противном случае указанный уровень потребления достигается без вмешательства администрации).
Обозначим через Qi(p) = pDi(p) спрос в денежном выражении по цене p для /-ой группы населения, l = 1,2, а через KD(p) объем субсидий, необходимых для того, чтобы зависимая группа могла приобрести товар в количестве D2 по цене p. Тогда
(20.2)
Kd (p) = (D 2 — D2 (p))p = D2p — Q2(p).
Пусть ps — цена , для которой D1(ps) + D2 е S(ps) (рис, 20,4),

S (p)
Di(p) + D 2 Di(p) + D2 (p)
pD pps q(p) = Cj(p) p
Pwc.
Для того, чтобы обеспечить за счет субсидий желательный уровень потребления зависимой группы, следует выделить их в объеме
Kd (ps) = (D2 — D2(ps))ps
Другой путь повышения уровня потребления зависимой группы связан с изменением предложения товара на рынке.
Рассмотрим некоторую цену p < ps. Если администрация обеспечит дополнительное предложение товара в объеме D1(p) + D2 — S(p) по этой цене и одновременно выделит субсидии зависимой группе в размере KD(p), то p окажется новой равновесной ценой. Общее значение спроса и предложения составит D1 (p) + D2 и будет достигнут желаемый уровень потребления зависимой группы. Дополнительное предложение можно обеспечить, заключая е предприятиями договоры, предусматривающие выпуск продукции на мощностях, для которых еебеетоимоеть Сі > p. При этом оплата осуществляется по себестоимости. (Она фактически и определена выше как минимальная цена, обеспечивающая прибыльность использования данной мощности). Практически, договор может предусматривать, например, доплату за работу в вечерние и ночные часы или выходные. Отметим, что при реализации такого договора необходим контроль, исключающий возможность фактического выпуска поставляемого товара на мощностях е низкими себестоимостями.
Возможный вариант — закупка администрацией товара на внешнем рынке. В этом случае еебеетоимоеть включает расходы на доставку. Предполагается, что функция предложения S (p) отражает все указанные возможности.
Определим, какова минимальная величина Ks(p) расходов администрации на дополнительное предложение товара по цене p в количестве Di(p) + D2 — S(p). Пусть технологии перенумерованы в порядке возрастания себестоимости: c1 < c2 < ... < cm а мощности i(p),j(p) определяются из условий
i(p) = max{i | Сі < p}, ? Vi < Di(p) + D2 < ? Vi.
i<j(p) i<j(p)
Тогда следует заключить договоры на полную загрузку мощностей i(p) + 1,...,j(p) — 1, а на мощно ети j (p) — обеспечить выпуск в количестве
Vj(p)(p) = Di (p) + D2 — ? Vi
i<j(p)
(см. рис. 20.4). Размер необходимых дотаций составит
j(p)
Ks(p) = ? V i(p)(ci — p),
i=i(p) + 1
где Vi(p) = Vi, i = i(p) + 1,...,j(p) — 1.
Введя обозначение q(p) = Cj(p), можно переписать это выражение в интегральной форме
q(p)
Ks(p) = J (Di(p) + D2 — S(p))dp =
p
ч(р)
= (Di(p) + D2)(q(p) - p) — J S{p)dp. (20.3)
p
Отметим, что q(p) — кусочно-постоянная невозрастающая функция, имеющая разрывы в точках pk, получаемых из уравнений
к
Di(p) + D2 = ^ Vi, k = 1 ,...,m.
i=1
Далее, D1(p) + D2 — S(p) > 0 при p E [p,q(p)). Отсюда следует, что функция Ks(p) непрерывная и убывающая.
Обозначим через pD цену, по которой зависимая группа в состоянии без субсидий приобрести товар в количестве D2, т.е, D2(pD) = D2, Администрации, очевидно, нет смысла поддерживать новую равновесную цену ниже pD. Таким образом, любая рациональная стратегия финансирования зависимой группы полностью определяется выбором цены p E [pD ,ps], которую администрация региона поддерживает как равновесную, Задача выбора оптимальной стратегии сводится к поиску
p* E Arg min K(p), (20.4)
pe[PD ,ps]
где K(p) = KD(p) + Ks(p), a KD(p) и Ks(p) определяются согласно (20,2) и (20.3).
Отметим, что функция K(p) имеет производную
ІОД = S (p) + D1 (p)(q(p) — p) — Di(p) — Q 2(p) (20.5)
всюду, за исключением точек p = ci, i = 1, ...,m, и точек скачков функции q(p). В этих точках p производная имеет разрывы первого рода, причем K + (p) > KA(p). В дальнейшем будем более коротко говорить, что функция K (p) определена почти всюду.
Упражнение 20.2. Покажите, что если для суммарного спроса D(p) = D1(p) + D2(p) + K/p эластичность e(D(p)) = |pD(p)/D(p)| < 1, то Qi(p) + Q2(p) > 0 всех p E [pd,ps].
Упражнение 20.3. Покажите, что если D 1(p) > 0^, Q2(p) < 0, to функция K(p) и условие ее минимума K_(p*) <
0, К +(p*) > 0 является также и достаточным условием.
Теорема 20.1, Любое решение р* задачи (20,4) удовлетворяет неравенству р* < ps. В зависимости от функций спроса Dl(j>), D2(p) оптимальная цена р* обладает следующими свойствами,
1) Пусть спрос Dl(p) на отрезке [рп,ps] постоянен. Если денежный спрос Q2(p) на этом отрезке также постоянен, то оптимальная цена р* совпадает с ценой равновесия р для рынка с одной (независимой) группой потребителей и определяется из условия Dl Е S(р), Если функция Q2(j>) возрастает на отрезке [рп ,рф то р* > р, а если бывает, то р* < р.
2) Пусть спрос каждой группы складывается из постоянной и убывающей составляющих: Dl(j)) = Ai + Bi/р, l = 1, 2, р Е [рп,рф Тогда оптимальная цена определяется из условия
Ai + A2 + Я(р*)ві/(р*)2 Е S(р*).
Доказательство, Поскольку S+(ps) > Dl(ps) + D2 > Dl(r[js) + D2(ps), q^s) = р^ то го соотношения (20,5) следует, что К(р) > 0 в правой полуокрестности точки р,3, откуда р* < р,. Если Dl(p) = Dl, то из (20,5)
следует равенство К(р) = S(р)-Dl — Q2(р) почти всюду, откуда вытекает утверждение 1), В условиях 2) функция К(р) = S(р) — Al — A2 — q(p)Bl/p2 определена почти всюду и монотонно возрастает на области определения, Рассмотрим соответствующее ей отображение К(р), р Е [рп ,рф определяя его значение в каждой точке разрыва как отрезок от левого до правого предела, В силу монотонности функции К (р) найдется единственная точка р*, для штор ой 0 Е К(р*). Эта точка и будет решением задачи (20,4), ¦
Отметим, что оптимальное сочетание субсидий населению и дотаций промышленности может существенно сократить общие расходы бюджета по сравнению с ситуацией, когда из бюджета финансируется только спрос зависимой группы, В примере, изображенном на рис, 20,5, предполагается, что Dl(p) = Dl, D2(p) = 0.
a) V Dl + D Dl
6) V Dl + D2| Di
 |
р
Ps р |
Ps р
IP
Рис. 20.5
Площади заштрихованных областей на графиках а) и б) показывают затраты бюджета при оптимальной стратегии p* = p и при p* = ps соответственно,
Рассмотрим теперь другую возможность изменения предложения — предоставление дотаций для создания новых мощностей. Каждая потенциальная мощность i характеризуется следующими параметрами: максимальным объемом производства Vi, удельной себестоимостью производства ci и капиталоемкоетыо ki. Для простоты мы предполагаем, что необходимые капиталовложения пропорциональны вводимому в действие объему Vi < V и еоетавляют Viki.
Поскольку целью администрации является минимизация текущих расходов бюджета, то оптимальным является смешанное финансирование новой мощности. Определим необходимый размер дотации, обеспечивающий "рыночную"норму п прибыли на вложение частного капитала. Пусть ki — объем дотаций на единицу вводимой мощности, p — цена на товар. Тогда минимальный размер дотации определяется из соотношения (p — Cj + ki)/ki = п, откуда Д = ci + kiп — p.
Таким образом, полагая для потенциальных мощностей ci = ci + kin, мы формально сводим задачу выбора оптимальной стратегии к рассмотренной выше задаче (20,4), Исходя из этого, ниже мы рассматриваем в моделях только реальные мощности. Следует, однако иметь в виду, что на практике при конкуренции реальных и потенциальных мощностей существенными могут оказаться и другие критерии, помимо минимизации бюджетных расходов,
§21. Модели организации налоговой инспекции
В этом параграфе изложено несколько теоретико-игровых моделей, построенных для изучения проблем уклонения от уплаты налогов и коррупции в налоговой инспекции. Рассматривается взаимодействие налогоплательщиков, имеющих случайный доход, и центра. Считается, что в конце каждого отчетного периода налогоплательщик подает налоговую декларацию. Декларированный доход облагается налогом в соответствии с действующей системой налогообложения. При этом налогоплательщик может попробовать уклониться от уплаты налога, декларируя меньшую сумму, чем его реальный доход, В случае проверки налоговой декларации факт попытки уклонения всегда определяется инспектором. Пойманный нарушитель оплачивает недостающую часть налоговой суммы и наказывается штрафом.
Предполагается, что налоговая проверка требует определенных издержек и что центр заинтересован в максимизации чистого налогового сбора (т.е. средств, полученных за счет сбора налогов и штрафов за вычетом издержек на проверки). Для однородной группы налогоплательщиков центр располагает лишь информацией, полученной из налоговых деклараций, и в зависимости от нее определяет оптимальную вероятность проверок налоговых деклараций. Задачей является нахождение оптимального правила проверки.
Модель налогообложения с двумя уровнями дохода
Рассмотрим модель с двумя возможными уровнями дохода Il и Ін, где II < Ін. Налогоплательщики получают низкий и высокий доходы Il и Ін с вероятностями ди 1 — q соответственно. Низкий доход не облагается, а с высокого берется налог T, Таким образом, налогоплательщик е высоким доходом имеет стимул декларировать низкий доход. Чтобы предотвратить такие действия налогоплательщика, налоговая инспекция с вероятностью p проверяет налогоплательщиков, декларирующих низкий доход. Если налогоплательщик е высоким доходом декларирует низкий доход Il и его декларация проверяется, то факт уклонения от уплаты налога всегда обнаруживается, и налогоплательщик должен выплатить штраф F, включающий неуплаченный налог. Стоимость проверки равна с. Задача руководства налоговой инспекции состоит в том, чтобы найти оптимальную вероятность p проверки деклараций, указывающих низкий доход Il, При этом максимизируется чистый налоговый сбор R, т.е, все поступления от налогов и штрафов за вычетом затрат на проверки.
Опишем поведение налогоплательщика. Он выбирает свою стратегию из множества {Il , Ін} при получении высокого дохода. Предполагается, что налогоплательщику известна стратегия p налоговой инспекции, и он максимизирует свой ожидаемый доход, сравнивая доход при честном поведении Ін — T и уклонении от налога Ін — pF, Таким образом, ес-
,def
ли вероятность проверки удовлетворяет неравенству p < p = i/F, то все налогоплательщики е высоким доходом уклоняются, и чистый налоговый доход государства в расчете на одного налогоплательщика равен R(p) = p(qF — с). Если p > p, уклонения не происходит, и доход имеет вид R(p) = qT — p(1 — q)c (рис, 21,1),
R(p)
 |
|
p = T/F 1 |
Рис. 21.1
При вероятности проверки p = p налогоплательщику безразлично — уклоняться или нет, В этом случае считается, что он не уклоняется. Таким образом, p — пороговая вероятность, т.е. минимальная вероятность проверки, обеспечивающая честное поведение налогоплательщиков. Отметим, что данная модель является примером иерархической игры Гі, определенной в § 11,
Утверждение 21.1. Оптимальная вероятность проверки p* = p, если qF > (1 — q)c. При этом максимальный чистый налоговый доход государства R* положителен и равен qT — p(1 — q)c, В противном случае p* = 0, R* = 0, т.е, эту группу налогоплательщиков нет смысла проверять.
Упражнение 21.1. Докажите утверждение 21,1,
Модель, учитывающая случайные ошибки
Теперь предположим, что налогоплательщики с высоким доходом могут непреднамеренно ошибаться и определяют свой доход как низкий с вероятностью m, Такие ошибки не меняют пороговую вероятность проверки, которая поощряет честное поведение налогоплательщиков, оценивших свой доход как высокий: они декларируют высокий доход при P > p = T/F,
Обозначим средний доход налогоплательщика с учетом ошибки через Іср, а чистый итоговый доход государства через R(p). Тогда
I [(1 — q)IL + q(IH — pf ), p<p
СР 1(1 — q)lL + q(lH — (1 — m)T — mpF), p > p,
R(p)
P(qF — c), P<p,
q[(1 — m)T + pm(F — c)] — (1 — q)pc, p > p.
Следующее утверждение определяет оптимальную стратегию государства.
Утверждение 21.2. 1) Пусть qF — c > 0, Тогда если штраф за уклоне_def
ние F > F = (qm +1 — q)c/ (qm), то оптимальная стратегия государства р* = 1. Если F < F, то оптимальная стратегия государства p* = р.
2) Пусть qF — c < 0, Тогда оптимальная стратегия государства
* I0, Fq < c(qm +1 — q),
р = <
I р, Fq > c(qm +1 — q).
Доказательство. Вначале заметим, что в точке р значение R(p) = qT — f>c(mq + 1 — q) больше левого предельного значения R-(p) = qT — f>c. При F > F доход R^) возрастает по р как на полупитервале [0,р), так и на отрезке [р, 1]. Таким образом, функция R^) возрастает на отрезке [0,1] и р* = 1, При F 6 (c/q,F) разница состоит лишь в том, что R^) убывает на отрезке [р, 1] и поэтому р* = р. Наконец при 0 < F < c/q доход убывает на обоих интервалах, так что максимум достигается на одном из левых концов: при F > mF р* = р, R* = R(j3) > 0, при F < mF р* = 0, R* = 0. Наконец, при F = mF р* 6 {р, 1}, R* = 0. ¦
Упражнение 21.2. Найдите оптимальную стратегию государства в следующих случаях: 1) F = F; 2) F = c/q.
Модели с учетом коррупции
Рассмотрим модели, в которых принимается во внимание возможность подкупа инспектора пойманным плательщиком. Исследуем случай двух возможных доходов и /я (/ь < Ія), получаемых с вероятностями 1 — q и q соответственно. Как и в предыдущей модели, предполагается, что низкий доход не облагается налогом, а высокий доход облагается налогом T. Таким образом, у налогоплательщиков с доходом /я есть стимул декларировать доход /ь. Декларация, содержащая низкий доход, может быть проверена налоговой инспекцией. Проверка всегда выявляет реальный доход, ее стоимость равна c. Штраф за уклонение F включает неуплаченную сумму налога. Инспектор, обнаруживший уклонение, может быть подкуплен пойманным плательщиком, в этом случае он скрывает результат проверки. Центр проверяет иногда инспекторов, подтверждающих низкие доходы, и наказывает их, если выясняется, что факт уклонения от уплаты налога был скрыт, (Инспекторов наказывают за плохую работу, а не за взятку, так как ее сложно доказать.) Вероятности р и рс проверки и перепроверки, проводимой центром, являются его стратегией. Некачественная проверка наказывается денежным штрафом F. Повторная проверка стоит с. Центр максимизирует чистый доход в бюджет, состоящий из налогов и штрафов за вычетом издержек на все проверки. Найдем оптимальные значения вероятностей p и pc и проведем сравнительный анализ дохода в зависимости от размеров штрафов. Сначала рассмотрим, как определяется размер взятки b в случае, когда неплательщик пойман инспектором. Подкуп выгоден налогоплательщику и инспектору, если b + pcF < F и b > pcF соответственно. Таким образом, подкуп возможен, если F(1 — pc) > pcF или
Pc <Pc = F/(F + F). (21.1)
Допустим, что в этом случае b = 7F(1 — pc) + (1 — 7)pcF, 7 G (0,1), где параметр 7 характеризует близость взятки b к максимуму, В частности, Y « 1 означает, что размер взятки диктует инспектор, 7 ~ 0 показывает, что он довольствуется малым. Налогоплательщик с высоким доходом уклоняется, если p(b+pcF) < T. Если соотношение (21,1) не выполняется, a p < р, то налогоплательщик уклоняется, но не дает взятки в случае поимки. Среди возможных значений пар (p,pc) рассмотрим следующие области (рис, 21,2),
Pc
Рис. 21.2
a) Pc <Pc, p(b + PcF) = p(yF + pc(1 — 7)(F + F)) < T.
В этом случае налогоплательщик уклоняется, инспекторы берут взятки, и чистый налоговый сбор в расчете на одного налогоплательщика составляет R(p,pc) = p[pc(q(F + F) — с) — c].
b) Pc > Pc, P< p.
В этом случае налогоплательщики уклоняются, но инспекторы не берут взятки и R(p,pc) = P[qF — c — Pc(1 — q)c]. c1) Pc > Pc, P>P.
c2) Pc < Pc, P(b + PcF) = p(yF + Pc(1 — y)(F + F)) > T.
В условиях c1) и c2) налогоплательщик не уклоняется и R(p,Pc) = qT — (1 - q)p(c + pcc).
Справедливо следующее утверждение.
Утверждение 21.3. Пусть штрафы F и F подобраны таким образом, что выполнено неравенство
pc(q(F + F) — С) — c > 0. (21.2)
Тогда в области а) доход в бюджет R(p,pc) стремится к верхней грани Ra при pc ^ pc и p ^ р. Верхние грани Rb и Rc1 в областях b) и cl)
реализуются на тех же последовательностях вероятностей, более того, Ra < Rb < Rc1. В области c2) те же последовательности вероятностей реализуют верхнюю грань дохода в бюджет Rc2 = Rci = qT — p(c + (1 — q)pcC)a, если
pc < c(1 — 7)/(C7), (21.3)
в противном случае при p ^ T/ (7F) и pc = 0 доход стремится к верхней грани Rc2 = qT — (1 — q)cT/(7F),
Замечание 1. При оптимальных вероятностях налогоплательщики выплачивают одну и ту же сумму в виде налога в случаях a), b) и c1). Однако издержки на проверки и перепроверки сокращаются при переходе системы из области равновесия а) в b) и из b) в c1).
Замечание 2. Неравенство (21,3) выполняется, в частности, при
Y ^ 0, т.е. в случае когда налогоплательщик диктует размер взятки. При
Y ^ 1, т.е, в случае когда инспектор диктует размер взятки, оптимально не проверять инспекторов и увеличить в 1/7 вероятность аудиторской проверки. Таким образом, чистый налоговый сбор при оптимальной стратегии аудита составляет
c c c '
F + F + F ,YF-
q — (1 — q) min
R*
C учетом этого соотношения сравнительный анализ чистого налогового сбора в зависимости от размера штрафов и налогов дает ясные результаты: R возрастает по T и F, а также по F , если выполняется соотношение
F >_С_,
F c(1/y — 1) 1 — 1
и не зависит от F, если это соотношение не выполняется.
Если вероятности p и pc фиксированы, то сравнительный анализ усложняется, Хотя в каждой из областей а), b), сі) и с2) налоговый сбор R монотонен по штрафам и налогу (что соответствует здравому смыслу), переходы из одной области в другую могут внести неожиданные изменения, Рассмотрим два примера,
1) Пусть p < p, pc = pc. Увеличим слегка штраф F : F' = F + dF. В результате система переходит из области Ь) в область а) и налоговый сбор R падает,
2) Пусть pc = pc, p = p, В этом случае небольшое увеличение налога влечет переход системы из области еі) в область Ь) и, как следствие, сокращение налогового сбора R.
Комментарий и библиография к главе IY
§ 16, Концепция конкурентного равновесия лежит в основе современной экономической теории. Согласно известным "теоремам о благосостоянии", конкурентное равновесие является оптимальным состоянием экономики, и отклонение от него связано со снижением ее эффективности. Однако, известное качественное описание условий совершенной конкуренции (см. Л, Вальрас [19], Д, Гейл [35]) не является конструктивным в том смысле, что не позволяет определить для конкретного рынка, выполнены ли эти условия, и если нет, то на сколько могут отклоняться цены от равновесных по Вальрасу, Значительная доля реальных рынков относится к олигополиям: в то время, как любой отдельный потребитель, по-видимому, не обладает рыночной властью и его доля в общем объеме продаж составляет доли процента, наиболее крупный производитель на таких рынках обеспечивает не менее 10% от общего потребления. Поэтому исследования математических моделей и оценки ожидаемого отклонения от состояния конкурентного равновесия для различных типов олигополии представляют большой интерес,
§18, Утверждение 18,1 показывает, что в состоянии конкурентного равновесия достигает максимума национальный доход (суммарная прибыль экономики). Состояние конкурентного равновесия является также оптимальным по Парето и, более того, соответствует ядру кооперативной игры (см, [85]), Подробнее о трудностях плановой экономики СССР см. [80].
§ 19, Типичным подходом к оценке ожидаемого отклонения от равновесия по Вальрасу является сравнение конкурентного равновесия с решением игры, описывающей олигополистическую конкуренцию. Обычной концепцией решения в этом случае является равновесие по Нэшу в чистых стратегиях. Вопросы существования такого равновесия и его свойств в модели олигополии по Курно рассматривались во работах В, Новчека [77], Н,С, Кукушкина [56], Р, Амира [3] и др. Показано, что при довольно общих условиях существует единственное равновесие по Нэшу, Для симметричной олигополии отклонение равновесного по Нэшу исхода от исхода по Вальрасу убывает и стремится к нулю, когда число производителей возрастает и стремится к бесконечности. Таким образом, модель хорошо соответствует концепции конкурентной экономики по Вальрасу, Она также может являться теоретическим обоснованием антитрестовских законов, ограничивающих максимальную долю продаж на рынке для каждого производителя (см, [64]),
Проблема заключается в том, что в модели Курно на поведение производителей накладываются крайне строгие ограничения. Предполагается, что каждый производитель товара всегда предлагает фиксированный объем товара независимо от сложившейся цены. На практике у каждого производителя имеется больше возможностей влиять на цену. Либо производитель прямо устанавливает цену своей продукции (как на аукционе первой цены), либо стратегиями являются функции предложения, которые определяют цену отсечения (как в случае аукциона заявок). Тем не менее, упомянутые результаты, касающиеся модели Курно, являются важными. Для нескольких типов рынков с ценовой конкуренцией или с конкуренцией функций предложения доказано, что исходы, соответствующие совершенному подыгровому равновесию, совпадают с исходом по Курно, Д, Крепе и Дж, Шейнкман [54] показали это для двухэтапной модели, в которой сначала устанавливаются объемы выпуска, а затем производители действуют в рамках модели ценовой конкуренции, Д, Морено и Л, Убеда [69] получили аналогичный результат для отрасли, где фирмы е идентичной технологией сначала выбирают производственные мощности, а затем конкурируют, устанавливая резервные цены, которые определяют простейшие функции предложения.
Следует отметить, что на большей части реальных рынков каждый производитель может назначить как цену, так и объем выпуска товара. Первая модель такого типа предложена Ж, Бертраном [10] и рассматривает фирмы-производители с одинаковыми и постоянными удельными себестоимостями и неограниченными производственными мощностями.
Предполагается, что продавцы одновременно и независимо назначают цены на предлагаемый товар, а покупатели раскупают его в порядке возрастания цен: сначала продукцию фирм, назначивших минимальную цену, затем, сели спрос еще не удовлетворен, продукцию фирм, назначивших следующую по возрастанию цену, и т.д. Выпуск товара производится в соответствии с поступившими заявками, В модели Бертрана равновесные цены по Вальрасу и по Нэшу совпадают между собой и с предельными издержками. Фирмы получают нулевую прибыль. На этом основании модель критиковалась как не соответствующая реальному поведению игроков (см. Б, Ален и М, Хельвиг [2]), Действительно, она не учитывает много важных аспектов, в частности динамического характера торгов, возможности сговора агентов и т.д. Заметим, однако, что эти аргументы никак не могут служить основанием в пользу выбора модели Курно,
Э, Эджворт [ПО],Ален и Хельвиг [2], а также X, Вивс [32] рассматривали модель, отличающуюся от предыдущей лишь тем, что каждая фирма характеризуется ограниченной производственной мощностью, Эджворт получил следующее достаточное условие существования равновесия по Нэшу: если суммарная мощность всех производителей за исключением продавца с максимальной производственной мощностью превышает объем спроса по цене, равной удельной себестоимости, то равновесная по Нэшу цена совпадает с ценой конкурентного равновесия и равна удельной себестоимости, В противном случае свойства модели существенно зависят от порядка, в котором потребители получают доступ к предлагаемому товару. Каждый потребитель характеризуется резервной ценой: пока доступная цена на товар не превышает резервную, его спрос постоянен, а по более высоким ценам он не хочет приобретать товар, Исход обмена существенно зависит от того, какие потребители (с более высокими или с более низкими резервными ценами) имеют приоритет при покупке товара. Порядок потребителей определяет функцию остаточного спроса, указывающую спрос на товар в зависимости от цены и от фактического предложения товара по меньшим ценам,
В литературе порядок потребителей часто задается в виде "правила рационирования", Ален и Хельвиг [2] рассматривают "пропорциональное правило рационирования", согласно которому товар по очередной цене предлагается случайной выборке потребителей, и их распределение по резервным ценам совпадает с распределением во всем множестве потребителей, Если в этом случае общая мощность производителей, дейетвую-щих на рынке, ниже, чем спрос по цене, равной удельной еебеетоимоети, то равновесия по Нэшу в чистых стратегиях в общих предположениях не существует, Ален и Хельвиг [2] также рассматривают равновесие по Нэшу в смешанных стратегиях. Они характеризуют спектр этого равновесия и показывают, что монопольная цена входит в него е положительной вероятностью. Этот результат подтверждает, что продажные цены в данном случае могут существенно отклоняться как от равновесия Вальраса, так и от равновесия Курно, Отметим, однако, что применение смешенных стратегий на товарных рынках представляется малоправдоподобным, Развернутую критику по этому поводу можно найти в работе Дж, Фридмана [90], В работе [32] Виве рассматривал "правило максимизации прибыли потребителя", согласно которому покупатели обслуживаются в порядке убывания резервной цены, В этом случае равновесие по Нэшу, соответствующее конкурентному равновесию, существует при достаточно эластичном спросе.
Указанные результаты показывают, что в довольно общих предположениях в моделях ценовой конкуренции не существует равновесий по Нэшу в чистых стратегиях. А, А, Васин [23] и Т, Борджес [14] рассматривали другой подход к оценке ожидаемого состояния рынка и отклонения от конкурентного равновесия. Он связан с последовательным исключением доминируемых стратегий и исследованием адаптивной динамики цен, в частности, динамики наилучших ответов. Полученные результаты означают, что традиционный подход к оценке степени конкурентности рынка (имеется в виду антимонопольное законодательство — оно гласит, что рынок является конкурентным, если отдельный производитель контролирует небольшую долю продаж) далеко не всегда является адекватным с точки зрения потенциального отклонения рынка от состояния конкурентного равновесия. Во многих случаях на самом деле важно то, насколько быстро растет функция предложения после прохождения цены конкурентного равновесия. Один из результатов заключается в том, что рынок, в котором равновесие устанавливается при максимальной загрузке производственных мощностей, обладает тенденцией к существенному отклонению от состояния конкурентного равновесия, даже если каждый отдельный производитель контролирует небольшую долю рынка. Для некоторых товаров более адекватным описанием рыночной конкуренции считаются модели с последовательным выбором цен и объемов выпуска [90].
Утверждение 19,6 дополняет результат Д, Крепса и Дж, Шейнкмана
[54] о соответствии совершенного подыгрового равновесия исходу Курно в случае приоритета потребителей с большими резервными ценами,
§ 20, Модели оптимального выбора налоговых ставок рассматриваются экономикой общественного сектора (см. А, Аткинсон и Дж, Стиглиц [4], Г, Майлс [62], С.М, Мовшович и др, [66]) В работах А,А, Васина и К.II. Пановой [24], А,А, Васина и 11. А. Васиной [26], А,А, Васина и др, [27] показано, что уклонение от налогов существенно влияет на оптимальный выбор налогов и налоговых ставок,
§21, Основной результат, относящийся к оптимальному аудиту прямых налогов, принадлежит И, Санчес и Дж, Собелю [86], Они рассмотрели группу налогоплательщиков со случайным распределением дохода, заданным положительной плотностью в интервале [l,h]. Для любого дохода I налог определяется зависимостью T(I), устанавливаемой правительством. Налог строго возрастает по I. Руководство инспекции устанавливает вероятность проверки p(I) в зависимости от продекларированного дохода I. В случае обнаружения непродекларированного дохода штраф пропорционален недоплаченному налогу с коэффициентом 1 + п > 1 (так как штраф включает недоплаченный налог). Для задачи максимизации чистого налогового дохода работа [86] показывает, что оптимальная стратегия проверок всегда относится к классу "пороговых правил":

для некоторого I ? [l, h]. Итак, каждый продекларированный доход I < I проверяется с вероятностью 1/(1 + п) — минимальной вероятностью, при которой невыгодно декларировать I для любого реального дохода I' > I.
Ф, Коуэлл и Г, Гордон [51] сравнивают различные доступные стратегии проверок при сборе косвенного налога. Авторы моделируют уклонение от уплаты налогов следующим образом. Фирма-налогоплательщик делает выбор между налогооблагаемой деятельностью и деятельностью в теневом секторе экономики. Если фирма подвергается проверке и выявляется ее деятельность в теневом секторе, то ее обязывают выплатить недостающий налог и наказывают штрафом. Вероятность проверки зависит от декларации по правилу "отсечения", т.е. фирмы, декларирующие доход меньше, чем определенная величина, всегда проверяются. Устанавливаются условия, при которых оптимальный случайный аудит более эффективен, чем оптимальное правило отсечения, и наоборот.
Связь между уклонением от уплаты налогов и коррупцией исследовалась во многих работах (см,, например, П, Чандлер и Л, Уайльд [108], А,А, Васин и О,Б, Агапова [25], Л.Е. Соколовский [87]),
Чандлер и Уайльд [108] описывают взаимодействие налоговых инспекторов (аудиторов) и налогоплательщиков так, как это сделано в последнем § 21, Отличие от нашего подхода состоит в том, что вероятность аудиторской проверки определяется равновесными по Нэшу стратегиями игроков, в то время, как вероятность повторной проверки предполагается фиксированной, В нашем подходе (называемом в западной литературе "principal-agent") вероятности проверок (т.е. стратегия центра) не фиксированы и определяются в результате решения иерархической игры Г 1,
§ 22. Решение упражнений
2.1, Не может, поскольку число 7 не представимо в виде произведения к ¦ l двух натуральных чисел k, l < 3.
2.2, При фиксированном x график функции F(x,y) представляет собой параболу ветвями вниз. Поэтому функция минимума
W(x) = min F(x,y) = F(x, y(x)) = min[F(x, —1),F(x, 2)]. -i<y<2
Функция наилучшего ответа второго игрока
2, —1 < x < 7/4,
-1, 7/4 < x < 3.
2, F(x, —1) > F(x, 2) -1, F(x, —1) < F(x, 2)
y(x)
Функция минимума
W (x)
F(x, 2) = —x2 + 11x — 24, —1 < x < 7/4,
F (x, —1) = —x2 — x — 3, 7/4 <x < 3.
Отсюда x0 = 7/4 и v = W(x0) = —125/16.
Далее, функция максимума M(y) = max F(x, y) = F(x(y), y). Функция наилучшего ответа первого игрока
— 1 < y < 3/4, 3/4 < y < 2,
x = (4y + 3)/2, 3,
x(y)
Следовательно,
M(y) = F(x'y)' -1 < y < 3/4
I F(3, y), 3/4 <y < 2.
Отсюда
11/4, y0 = -1.
v = min M (y)
-i<y<2 vy'
min[F(x[y=-i, -1), F(3, 2)]
2.3, Докажем, что (x0,y0) — е-еедловая точка функции F(x,y). Для любого y ? Y имеем
F(x0,y) > v =
= inf F(x0, y) = v — е = sup F(x, y0) — е > F(x0, y0) — е. yeY x?X
Отсюда F(x0,y0) < F(x0,y) + e Vy ? Y. Второе неравенство из определения е-еедловой точки доказывается аналогично,
2.4, Пусть выполнено равенство (2,4), Положим v = v = v. Для любого е > 0 возьмем x? ,y? — е-макеиминную и е-минимакеную стратегии, т,е.
v — е < inf F (x?, y),
yeY
sup F(x, y?) < v + е. xex
Отсюда v — е < F(x?, y?) < v + е и при любом x ? X
F(x,y?) < v + е < F(x?,y?) + 2е ^ F(x,y?) — 2е < F(x?,y?).
Аналогично доказывается неравенство
F(x?,y?) < F(x?,y) + 2е Vy ? Y.
Таким образом, пара (x?,y?) — 2е-еедловая точка функции F(x,y).
Обратно, пусть пара (x?,y?) — точка функции F(x,y).
Тогда
F(x, y?) — е < F(x?, y?) < F(x?, y) + е Vx ? X, Vy ? Y. Отсюда следуют неравенства
v — е < v — е < sup F(x, y?) — е < inf F(x?, y)+ е < v + е < v + е xex y?Y
и x?,y? — 2е-макеиминная и 2е-минимакеная стратегии. Кроме того, v < v < v + 2е. ^^ж)льку е > 0 произвольно, получаем, что v = v.
2,5, Возьмем любые две точки z(1) = z(2) G Em и любое число Л G (0,1). Тогда неравенство
(22.1)
(az(1) + (1 - Л)42)) < A(z(1)) + (1 - Л) (z(2))
эквивалентно неравенству
Д) J2)
0 < Л(1 - Л)
Последнее выполняется как строгое, если z(1) = z(2) .Суммируя по i неравенства (22,1), получим
Д2)
Е (Az.(1) + (1 - ЛД'2)) < л ? (Д) +(1 - Л) ?
г=1 г=1 г=1
что и означает строгую выпуклость функции z2.
i=1
2,6, Пусть строго выпуклая функция h(z) достигает минимума в точках z(1) = z(2) выпуклого комп акта Z С Em. Тогда (z(1) + z(2))/2 G Z и го строгой выпуклости функции h(z)
h((z(1) + z(2))/2) < (h(z(1)) + h(z(2)))/2 = min h(z),
что противоречит определению минимума,
3.1, Докажем, что р0 = q0 = (1/2,1/2) - оптимальные смешанные стратегии игроков, a v = 0 - значение игры. Действительно, для любых р G P, q G Q
^ q0) = Е (Е q°) рг =0 = A(p^ q0) = A(p^ q)
г=1 Vj=1 /
и тройка (p0,q0, 0) - решение в смешанных стратегиях,
3.2, L (аЩ ...amn; ЛОТ ...,pmpn).
3.3, Заметим, что для любой лотереи L u(L) G [0,1],а из аксиом V///
и V вытекает, что L ~ (A1, ; u(L), 1 - u(L)),
Возьмем две произвольные лотереи L1 и L2, Имеем Li ~ (A1, ; u(Li), 1 - u(Li)), i =1, 2. Если u(L^ = m(L2), то L1 ~ L2, a
если u(L1) > u(L2), то to лемме 3,3 L1 >- L2.
Пусть v(L) — другая функция, удовлетворяющая свойствам 1)—3), сформулированным в теореме 3,4, Подберем константы c, Ь, исходя из равенств v(Ai) = cu(Ai) + Ь, v(Ak) = cu(Ak) + Ь. Отсюда, используя равенства u(A1) = 1, u(Ak) = 0, неодим, что c = v(A1) — v(Ak) > 0,
Ь = v(Ak).
Для любого I = 2,...,k — 1 имеем Aj ~ rJA1 + (1 — ri)Ak. Следовательно, для произвольной лотереи L = (A1,...,Ak; x1,...,xk)
v(L) = ^ xjv(Aj) = ^ xi (ri v(A1) + (1 — ri )v(Ak)) =
xj(rj(c + Ь) + (1 — rj)b) = cxj rj + Ь = cu(L) + b.
4.1, Необходимость, Пусть (p0,q0,v) — решение в смешанных стратегиях игры с матрицей A. Тогда выполнены неравенства
A(p, q0) < A(p0, q0) = v < A(p0, q) Vp G P, Vq G Q.
В частности, они справедливы для любых чистых стратегий игроков
A(i,q0) < v < A(p0,j), г ^..^m j = 1,...,n. (*)
Достаточность, Пусть для тройки (p0,q0,v) выполнено условие (*). Возьмем любую смешанную стратегию p первого игрока, домножим неравенства A(i, q0) < v на pj и сложим их, В результате получим
m
A(p, q0) < v^2pi = v. Аналогично, для любой смешанной стратегии q
j=1
второго игрока выполнено неравенство v < A(p0,q). Итак, A(p,q0) < v < A(p0, q) Vp G P, Vq G Q.
Полагая здесь p = p0,q = q0, получим A(p0,q0) = v и (p0,q0,v) — решение в смешанных стратегиях,
4.2, Пусть (p0,q0,v) — решение в смешанных стратегиях игры с матрицей A. Тогда по уеловию (*)
A(i,q0) < v < A(p0,j), г ^..^m j = 1,...,n.
Далее, B(i, q0) = A(i, q0) + c, B(p0, j) = A(p0, j) + c. Отсюда
B(i,q0) < v + c < B(p0г = O.^m j = 1,...,n
и (p°,q°,v + c) — решение игры с матрицей B.
4,3, По определению выравнивающей стратегии ф0
F(х,ф0) = v ^ F(у,ф0) = v = F(у°,ф°) < F(у0уф) Уф е {ф}.
Отсюда тройка (у0,ф0,?) — 4,4, В игре е матрицей
решение в смешанных стратегиях,
3 1 0\
0 і з I смешанная стратегия второго игрока q0 = (1/2, 0,1/2) является выравнивающей, но не оптимальной,
4,5, Найдем выравнивающую смешанную стратегию q0 второго игрока, Из соображений симметрии положим q1 = q°, q° = q°. Тогда получим систему уравнений
q°i + aq° = aq° + q° + aq°
q°i + q0
1/2.
Отсюда q0 = 0.5(2 — a)-1, q° = (1 — a)q°, v = (1 + a — a2)q°. Поскольку матрица A — симметричная, смешанная стратегия p0 = q0 первого игрока также является выравнивающей. Следовательно, стратегии р0 и q0 оптимальны, а v — значение игры,
4,6, Поскольку X С {у} и Y С {ф},
v = max min F(x,y) < max min F(y,y) = v = xex yeY ve{v] yeY
= min max F(х,ф) < min max F(x,y) = v. ye{y] yeY xex
4.7, Возьмем любое e > 0 и отрезок [a', b'] длины, меньшей e, и содержащий внутри себя точку х0. Пусть х0 — точка, в которой функция у(х) имеет скачок величины 5 > 0. Тогда в силу ее монотонности справедливо неравенство у(Ь') — у (a') > 5 > 0.
Пусть в точке х0 функция у(х) дифференцируема и у'(х0) > 0. Тогда у(Ь') — у (a') > 0. Действительно, функция у(х) не убывает и по определению производной найдется такая точка х' > х0, близкая к х0, что у(х') > у(х0).
4.8, Пусть тройка (p0,q0, v) — решение в смешанных стратегиях игры с матрицей A. Докажем утверждение 1), По условию (*)
A(i,q0) < v, i = 1,...,m. (22.2)
Предположим противное. Тогда найдется такая чистая стратегия il первого игрока, что > 0 и A(i^q0) < v. Домножим обе части і-го неравенства (22,2) на p0 и сложим неравенства. Поскольку неравенство с номером il после домноження на p0 останется строгим, получим A(p0,q0) <v = A(p0,q0) (противоречие).
Утверждение 2) доказывается аналогично,
5,1, Пусть строка il матрицы A слабо доминирует строку i2. Если стратегия i2 — макеиминная, то стратегия il также является максимин-ной как для матрицы A, так и для редуцированной матрицы с вычеркнутой і2-ой строкой. При этом нижнее значение игры после исключения строки не меняется.
Аналогичное замечание справедливо и для случая, когда столбец jl слабо доминируется столбцом j2, а стратегия j2 является минимаксной. После исключения слабо доминируемых строк и слабо доминирующих столбцов в распоряжении игроков остаются макеиминная и минимаксная стратегии игроков исходной ( и редуцированной) игры, образующие седловую точку.
5,2, Выпишем матрицу игры
(2.0) |
(1,1) |
(0, 2) |
|
(3,0) |
( 1 |
2 |
3 |
|
A = (2 1 |
1 |
1 |
2 |
|
A (1,2) |
2 |
1 |
1 |
|
(0,3) |
^ 3 |
2 |
1 |
Строка 2 слабо доминируется строкой 1, а строка 3 — строкой 4, После вычеркивания слабо доминируемых строк, замечаем, что столбец 2 равен пол?е?мме столбцов 1 и 3 и поэтому его можно вычеркнуть, В результате
(2,0) (0,2)
(3, 0) (0,3)
получается матрица B
. Отсюда находим решение исходной игры: р° = (1/2, 0, 0,1/2), q0 = (1/2, 0,1/2), v = 2. Отметим, что чистая стратегия 2 второго игрока также оптимальна,
5,3, Здесь /l(pl) = 3pl, 12(pl) = 1 и 1з(pl) = 3(1 — pl). Функция
min j(pl) достигает максимума в точках отрезка [1/3,2/3], Поэтому множество всех оптимальных смешанных стратегий первого игрока имеет вид P0 = {p0 6 P | 1/3 < pl < 2/3}. Второй игрок имеет единственную оптимальную чистую стратегию 2,
5,4, Предположим, что точка z0 не является крайней точкой множества Z и представима в виде z0 = Az' + (1 — A)z'', z' = z" G Z, 0 < A < 1. Поскольку функция |z|2 строго выпукла на множестве Z (ем, упражнение 2,4),
|z0|2 = |Az' + (1 — A)z''|2 < A|z'|2 + (1 — A)|z'f < max |z|
что противоречит определению точки z .
5.5, Множество Z* = Argmax h(z) — выпуклый компакт. Пусть z0
— его крайняя точка. Покажем, что z0 — крайняя точка множества Z. Пусть, напротив, найдутся такие точки z' = z" множества Z и такое число 0 < A < 1, что z0 = Az' + (1 — A)z''. Тогда по крайней мере одна из точек z 'или z'' не принадлежат множеству Z *. Поэтому h(z0) =
Ah(z') + (1 — A)h(z'') < maxh(z) (противоречие с определением z°),
5.6, Пусть оптимальная стратегия р0 первого игрока удовлетворяет системе уравнений (5,3), где v — значение игры, а матрица B = (аігjt)kxk
— невырожденная. Покажем, что р0 — крайняя оптимальная смешанная стратегия. Предположим противное, т.е. р0 представимо в виде р0 = Ap' + (1 — A)p'', где р' = р'' G P0, 0 < A < 1. Из равенств
р0 = 0 = + (1 — фр" ?і = ф / = 1,..., ф
следует, что рі = р" = 0 ?і = іі, l = 1,..., k. Поскольку р',р'' — оптимальные смешанные стратегии,
(22.3)
А(р',ф) > А А(р'',jt) > v, t =1,...,ф.
Покажем, что неравенства (22,3) могут выполняться только как равенства, Предположим, что найдется такой номер ti,
что А(р', jtl) > v, А(р'',jtl) > v. Умножая первое неравенство на A, а второе на 1 — A и складывая их, получим А(р0, jtl) > v (противоречие). Итак,
k
Жр'фі) = А(р'', ) ^ ^(ріг — р")aiijt = ° t = 1,..., ф.
і=і
Из невырожденности матрицы B получим, что рі = рі', l = 1,..., k ^ р' = р'' (противоречие).
. Тогда матрица системы (5.3) и ее раеши-
5.7. Пусть B ренная матрица
/—1 0 -1 | 0\ I 01 -1 |01
V 1 1 0 і у
имеют ранги 2 и 3 соответственно. Следовательно, по теореме Кронекера-Капелли система (5.3) не имеет решения.
5.8. Проделаем 8 шагов по алгоритму Брауна.
Продолжение таблицы 5.1.
|
к |
ik |
Сі() |
С2() |
сз() |
?і() |
jk |
До |
d2() |
бз() |
?2() |
|
11 |
3 |
10 |
8 |
П |
17/11 |
2 |
13 |
И |
9 |
9/11 |
|
12 |
3 |
10 |
11 |
14 |
7/6 |
3 |
12 |
14 |
6 |
1/2 |
|
13 |
3 |
10 |
14 |
11 |
14/13 |
3 |
и |
17 |
3 |
3/13 |
|
14 |
2 |
10 |
п |
8 |
17/14 |
3 |
13 |
17 |
6 |
3/7 |
|
15 |
2 |
10 |
20 |
5 |
4/3 |
3 |
15 |
17 |
9 |
3/5 |
|
16 |
2 |
10 |
23 |
2 |
23/16 |
3 |
17 |
17 |
12 |
3/4 |
|
17 |
2 |
10 |
26 |
-1 |
26/17 |
3 |
19 |
17 |
15 |
15/17 |
|
18 |
2 |
10 |
29 |
-4 |
29/18 |
3 |
21 |
и |
18 |
17/18 |
Отсюда ?Д18) = 1, ?Д18) = 17/18 ^ е = 1/18. Далее, t = 8, t2 = 18, p(18) = (1/9,11/18, 5/18), q(8) = (1/8,5/8,1/4).
6.1. Пусть Da = [aa,ba], a E L — семейство отрезков, любые два из которых имеют непустое пересечение. Докажем, что найдется точка х0 E Da V a E L. Заметим, что из условия теоремы aa < be V а, в E L.
Следовательно, a = sup aa < b = inf b^. Любая точка x° E [a, b] является
aex
искомой.
6.2. Положим y1 = (0, 0), y2 = (0,1), y3 = (1, 0), y4 = (1,1). По аналогии с примером 6.1 покажем, что
4
(х°цф°,v) = ((1/2,1/2)^0 Iyj/4,1/2) — решение в смешанных етратеги-
j=і
ях. Проверим условие (*). Функция
4 1
F(x, ф0) = ^2 4[1 — (хі — yj)2 — (х2 — у2)2] j=і 4
строго вогнута по x = (x^x2). Имеем
FXi = - ^(i- yj) = ° FX2 = - ^(2 - yj) = о.
j=i j=i
Отсюда следует, что max F(x, ф°) достигается в точке x0 = (1/2,1/2) и
xGX
равен 1/2. Далее,
min F (x0,y) = F (x^y1) = 1/2 = max F (x,^0)
yGY xGX
и условие (*) выполнено,
6,3, Для нормального распределения
F(x, c) = a2c2l/n + (c1 — 1)2x2 + 2c2(c1 — 1)x + c^
Стратегия статистика y0(z) = c°{z + c°J будет выравнивающей, если cl = 1. При этом значение функции риска будет минимальным, если c2 = 0. Если c1 = 1, то sup F(x,c) = +то. Следовательно, найденная решающая
x>0
функция y0(z) = z — минимаксная стратегия статистика,
7.1, Заметим, что sup F(x,d0) = sup p1(x) = 1 и стратегия y = d0
0<x<do 0<x<do
не может быть минимаксной. Пусть 0 < y < d0. Тогда
sup F(x, y) =
0<x<do
= max[ sup (1 — P2(y))P1(x), sup p1 (x)] = max[1 — P2(y),P1(y)].
0<x<y y<x<do
Функция 1 — p2(y) возрастает, а функция p1(y) убывает no y. Следовательно, функция max[1 — p2(y),p^y)] достигает минимума в точке y = d*. Итак, v = p1(d*).
8.1, Положим
w = max min max min ••• max min F(xT,yT).
xiGUi yi&Vi x2GU2(xi,yi) y2GV2(xi,yi) xtGUt(ат) УТGVT(вт)
Определим стратегию x0 = (x0, t = 1,...,T) первого игрока: при любых t = C...,T и at = (xt-1,yt-1)
Тогда для любой стратегии у второго игрока
0 0 def X0
F(Х ,у) > min F{x ,уТ-1,ут) =
ут GVt (вт)
= max _ min хт GUt (ат) XT GVT (вт)
Следовательно,
F(Х01,...,Х<Т-1,Хт,у1,...,ут-1,Ут) > ••• > w
min F(Х0, y) > w.
yGY
С другой стороны для стратегии у* = (у*, t = 1,...,T) второго игрока, определяемой условиями: при любых t = 1, ...,T и
A =(xt-1,yt-1) &ГО Е
Е Arg min max ••• min F (Х0,..., Х0, xt+1, ..xT ,yT),
ytGVt(Pt) xt+iGUt+i(at+i) утGVt(вт)
выполнено равенство F(Х0,у*) = w. Отсюда w = v. Формула для v выводится аналогично,
8,2, Положим
F11(a, в) = max min ац, F?(a, в) = min max ац, а, в = 1, 2.
^ iGMa jGMp J1 1 jGMp iGMa j ’
При этом
(0'(а,в))'2x2 =(3 0) . (Ц(а,в)Ьх2 =(5 3)
И
v = max min F/(a, в)) = 2, v = min max F?(a, в)) = 3.
а= 1,2 в= 1,2 в= 1,2 а= 1,2
9.1, Определение седловой точки (ж0, у0) функции F(ж, у) на X х Y можно записать следующим образом:
F(ж0,у0) = maxF(x,y0), -F(x0,у0) = max(-F(ж0,уА
xGX yGY
что совпадает с определением ситуации равновесия,
9.2, Пусть в игре возникла ситуация (1,1). Тогда выгодно отклониться первому игроку и возникнет ситуация (2,1), Теперь выгодно отклониться второму игроку, возникнет ситуация (2,1) и т.д. по схеме (1,1) ^ (2,1) ^
(2,2) J (1,2) ^ (1,1).
9.3, Если игроки одновременно применяют правило правой руки (левой руки), то первый (второй) игрок проедет и "получит" 1, а второй (первый) его пропустит и получит 0, Если первый применяет правило правой руки, а второй — левой, то произойдет столкновения и оба проиграют по 10. Если — наоборот, то оба будут стоять и проиграют по 1.
9.4, В игре Г два равновесия по Нэшу: (1,1) и (2,2),
9.5, В игре Г единственное равновесие по Нэшу: (1,1).
9.6, Пусть (x°,y°) — произвольная ситуация в антагонистической игре, Предположим, что ситуация (x0, y0) не является оптимальной по Парето, Тогда найдется ситуация (x',y'), для которой выполнены неравенства F(x',y') > F(x0,y0), — F(x/,y/) > — F(x0,y0) и при этом хотя бы одно из них выполнено как строгое. Складывая эти неравенства, получим 0 > 0 (противоречие),
9.7, Пусть функция f : [0,1] ^ [0,1] непрерывна. Тогда для функции g(x) = f (x) — x g(0) > 0 и g( 1) < 0. По теореме математического анализа о промежуточных значениях найдется точка x0, для шторой g(x0) = 0.
9.8, 1) f (x) = x + 1, x E [0, +ro);
2) f (x) = ж/2, x E (0,1];
3) f(x) =
x +1/2, x E [0,1/2), x — 1/2, x E [1/2,1].
10,1, Пусть (p0,q0) — ситуация равновесия и стратегия q0 при некотором v1 удовлетворяет системе (см, (10,1))
2q0 + q0 = q0 + 2q2
q2 + 2q0
v1, q0 + q0 + q0
1.
Отсюда q0 = (1/3,1/3,1/3).
Предположим, что q0 удовлетворяет системе
2q0 + q3 < q0 + 2q2
q2 + 2q0
q0 + q° + q°
1.
v1;
Pi
Тогда q0 = 1/3^,q0 > 1/3. По свойству дополняющей нежесткости = 0, p0 + 2p0 = = v2. Отсюда pi = p00 = pj = 0 (противоречие).
Наконец, разберем случай, когда
2q0 + q0, q0 + 2q0 < q00 + 2q0 = vi, q0 + q0 + q00 = 1.
Тогда q0 > 1 /3, а то свойству дополняющей нежесткости pi = p2 = 0 ^ p3 = 1^ ^.2) следует, что v2 = B(p0, 3) > B(p0, 2) или 1 > 2
(противоречие),
Другие случаи реализации системы (10,1) получаются из разобранных перестановкой координат, поскольку матрицы An B — циклические. Аналогично доказывается, что р0 = (1/3,1/3,1/3).
10,2, Доказательство теоремы 10,4, 1) Пусть множества
Z = С Zk-1 С ••• С Zi = Z, Z = Xt x_Y, l = 1, ...,k,
отвечают определению строгого доминирования Z У Z.
Возьмем i G X1\X2. Тогда найдется такая стратегия р G P, что р У i на Y1 = Y. Отсюда A(p,j) > aij, j = 1,..., n. Умножая j-e неравенство на qj0 и складывая все неравенства, получим A(p,q0) > A(i,q0). Если р0 > 0, то из системы (10.1) вытекают неравенства A(i,q0) = v1 > A(i1,q0), i1 = 1,..., m. Умножая эти неравенства на величины pi1 и складывая их, получим A(i, q0) > A(p, q0) (противоречие), Отеюда р0 = 0 V i G X1\X2. Аналогично доказывается, что qj1 = 0 V j G Y1\Y2.
Пусть векторы р2 и q2 получены из р0 и q0 отбрасыванием нулевых компонент с номерами из множеств X1\X2 и Y1\Y2 соответственно. Нетрудно показать, что (р2, q2) — ситуация равновесия в редуцированной игре с матрицами A2 и B2, полученными из матриц An B вычеркиванием строк с номерами из X1\X2 и столбцов е номерами из Y1\Y2. Поэтому рассуждения можно повторить для редуцированной игры и получить, что р0 = 0 V i G X2\X3, qj = 0 V j G Y2\Y3 и т.д,
2) Пусть множества
Z = Zk С Zk-1 С ••• С Z1 = Z, Zi = Xi х Y, l = 1,..., k, отвечают определению слабого доминирования Z У Z.
Пусть Ak-1 и Bk-1 — подматрицы матриц ДіВс номерами строк из Xk-1 и номерами столбцов из Yk-1, Рассмотрим вектор р^1, полученный из вектора р добавлением нулевых компонент с номерами из Xk-1\X. Аналогично, вектор qk-1 получается из вектора q добавлением нулевых компонент с номерами из Yk-1\Y^ ^^тм, что (р^1^-1) — ситуация равновесия в игре с матрицами Ak-1 и Bk-1. Для этого проверим условие (*) для ситуации (р^1^-1). Имеем
Ak-1(i,qk-1) = A(i,q) < A(p, q) = Ak-1(pk-1, qk-1) V i G X.
Пусть i G Xk-1 \ X. Тогда найдется такая стратегия р, что р У i на Yk-1 ирі1 = 0 V i1 G X. Определим вектор р = (ріх, i1 G X). Тогда
Ak-1(i,qk-1) = Y, aij qk-1 < jeYk-1
< E ( E_aiij-ріі)Qj = Жр'Д) < Жр^ = Ak-1(pk-1,qk-1).
jeY iiex
В результате доказали неравенства
Ak 1(i,qk 1) < Ak 1(pk 1,qk V i G Xk 1.
Аналогично доказывается вторая группа неравенств из условия (*)
Bk- 1(pk -1, j) < Bk- 1(pk -1, qk-1) V j G Yk-1.
Итак, (pk-1, qk-1) — ситуация равновесия игры с матрицами Ak-1 и Bk-1.
Рассуждения можно продолжить, аналогичным образом ввести ситуацию (pk-2,qk-2) и доказать, что она является равновесием по Нэшу игры с матрицами Ak-2 и Bk-2 и т.д.
10.3, Пусть C — сумма матриц Ah B, Как отмечалось, C = (cj )mxn = (fj + gi)mXn. Поскольку f1 = 0, разность j-го и 1-го столбцов матрицы C можно записать в виде fjе, где e = (1,..., 1) G Em. Отсюда fj = c1j — С11, j = 1,..., пи aj = aij — fj = aij — — bj + an + bn V i,j.
10.4, Заметим, что для любой смешанной стратегии q второго игрока
(22.4)
A(i,q) = A'(i,q) + Yl fjqj, i = 1,
Поэтому неравенства A(i,q0) < A(p0,q0) равносильны неравенствам A'(i,q°) < A'(p0,q0), i = 1, ...,m. Аналогично показывается, что для любой смешанной стратегии p первого игрока
m
B(p,j) = —A'(p,j) + ^giPi, j = 1,...,n, (22.5)
i= 1
и что неравенства B(p0,j) < B(p0,q0) равносильны неравенствам A'(p0,j) > A!(p0,q0), j = 1,..., п. Отсюда вытекает, что для ситуации (p0, q0) условие (*) в е матрицей A' ^^^^ема 4,1') эквивалентно усло
вию (*) в игре Г (лемма 10,1),
10,5, Из формул (22,4) и (22,5) следует, что
Arg max A(i,q(k)) = Arg max A'(i,q(k)),
1 <i<m 1 <i<m
Arg max B(p(k),j) = Arg min A'(p(k),j).
1<j<n 1<j<n
Поэтому последовательности стратегий игроков {ik}, {jk} в процессе Брауна для игры с матрицей A' и в аналогичном процессе для игры Г можно взять совпадающими. По теореме 5,3 любая предельная точка (p0, q0) последовательности {(p(k), q(k))} является седловой точкой в смешанных стратегиях и, следовательно, смешанным равновесием по Нэшу игры Г.
11.1, Заметим, что УДД) = {g | g(x?) = y?}. Следовательно,
W(fD = inf F(fi(9),9) = F(x?,V?) > K' — e
geY-Kff)
11.2, Возьмем произвольную стратегию f\ G {f} и докажем, что W(fi) < max[K', F1]. Пусть {g*} — множество всех функций наилучшего ответа второго игрока. Имеем
sup G(fi(g),g) > sup inf G(x,g) >
ge{g} ge{g}
> sup inf G(x,g*) = min max G(x,y) = G3. g*e{g*} xex xex yeY
Рассмотрим два случая,
1) sup G(f1(g),g) > G3. Тогда найдется такая функция ge{g}
g? g Y1*(f1), пара (x',y') = (f1(g?),g?(x')) принадлежит множеству
D'. В этом случае
W(/1) = inf F(h(g).g) < F(h(g').g') = F(x',y') < K'.
geY1*(fi)
2) sup G(f1(g),g) = G3. Покажем, что {g*} C Y1*(f1). g?{g}
Действительно, для всякой функции наилучшего ответа g*
G3 = min max G(x,y) = min G(x,g*) <
x€X y€Y x€X
< G(f1(g*),g*) < sup G(f1(g),g) = G3.
ge{g}
В последних неравенствах крайние члены совпадают. Следовательно, все неравенства выполнены как равенства и {g*} C Y1*(f1). Определим g0 G {g*} :
g0(x) G Arg min F(x,y) Vx G X
yeY (x)
— функцию наилучшего ответа второго игрока, наименее благожелательного по отношению к первому. Тогда
W (f1) = inf F (f1(g),g) < F fg0 ),g0) <
geYi*(fi)
< sup F(x,g0(x)) = sup min F(x,y) = F1. xex xexyeY (x)
11,3, Зададим стратегию д* второго игрока условием
g*(x) Е Arg max F(x,y) Ух E X.
У&(x)
Она аналогична стратегии первого игрока f *, определенной перед леммой 11,1, Из этой леммы следует, что функция F(х,д*(х)) полунепрерывна сверху на X. Возьмем х* Е Arg max F(х,д*(х)). Тогда (х*,д*) —
x€X
ситуация равновесия игры Гь
11.4, Если первый игрок в игре Г3 использует стратегии-константы f 1 (д) = х, то он может обеспечить себе такой же результат, как и в игре Гі. Следовательно, F1 < F3. Аналогично показывается, что F1 < F2. Далее, K' < K, поскольку D' С D. Поэтому F3 = max[K/,F1] < F2 = max[K, M].
11.5, При a =1 функция наилучших ответов второго игрока имеет вид
У(х)
у^х/^ — х, 0 < х < K/c2,
0, K/c2 < х < K/c1.
Оценка эффективности W(х) стратегии х равна
W (х) = F (х, у(х))
\JKc2X — с1х, 0 < х < K/c2,
K — ^х, K/c2 < х < K/c1, оптимальная стратегия
Kc2/(4Kc2)), c2 < 2c1, K/c2, c2 > 2c1
и наилучший гарантированный результат для первого игрока
Kc2/(4c1), c2 < 2c1,
(c2 — c1)K/c2, c2 > 2c1.
F1 = max W (х) = W (х*)
0<x<K/ci
Во втором случае у(х*) = 0 и первая фирма вытесняет вторую с рынка, В обоих случаях F1 > F(х0,у0) = Kc1c2/(c1 + c2)-2, где (х0,у0) = (Kc2(c1 + c2)-2,Kc1(c1 + c2)-2) — ситуация равновесия в игре Г при k =1.
11,6, Равновесие по Штакельбергу в примере 11,1 (i0, j0) = (2,1), а в примере 11,2 (х0,у0) = (1/2,1).
12.1, Необходимость, Пусть функция h(z) квазивогнута. Докажем, что множество Лебега Z + (z0) выпукло для произвольного z0 ? Z. Возьмем любые две точки z',z" ? Z+(z0) и любое число 0 < А < 1. Тогда h(Az' + (1 — A)z'') > min[h(z'), h(z'')] > h(z0).
Достаточность, Пусть множества Лебега Z + (z0) выпуклы при всех z0 ? Z. Возьмем любые две точки z' ,z" ? Z и любое чиело 0 < А < 1. Без потери общности можно считать, что h(z') < h(z"). Тогда z',z" ? Z+ (z') и в силу выпуклости множества Z+(z') точка Az' + (1 — A)z" также принадлежит Z+(z'), т.е, h(Az' + (1 — A)z'') > h(z') = min[h(z'), h(z'')]. Следовательно, функция h(z) квазивогнута на Z.
13.1, p(i, Д) = 0, i =1, 2,4, 6, p(3, Д) = 1/4, p(5, Д) = 3/4.
13.2, Игрок 1 имеет стратегии д1 = (к,1) ? {(1,1), (1, 2), (2,1), (2, 2)}, где къ I — номера альтернатив его левой и правой личной позиции (см, рис, 13,4), Аналогичный вид имеют стратегии второго игрока. Нормальная форма игры G задается матрицами
|
A |
|
/1/2 |
2 |
1 |
5/2 \ |
|
/ |
— 2 |
— 1/2 |
— 11/4 |
—1/4\ |
|
1/2 |
— 1 |
1 |
1/2 |
в = |
|
— 2 |
7/4 |
— 11/4 |
2 |
|
1/4 |
7/4 |
1/4 |
7/4 |
, в = |
|
-7/4 |
— 1/4 |
— 7/4 |
— 1/4 |
|
\1/4 |
—5/4 |
1/4 |
—5/4/ |
|
1 |
-7/4 |
2 |
— 7/4 |
2 ) |
|
а нормальная форма подигры Gz — матрицами
Bz
1 3
1 -1
13.3. Д =((1,1), (1, 2)).
14.1, Пусть x ? РоээдС Если в некоторой позиции
x' ? [x0, x] П Xa, x' = x стратегия д“ выбирает альтернативу, не принадлежащую пути [x0, x], то вероятность попасть в вершину x равна нулю (противоречие),
Обратно, пусть в каждой вершине x' ? [x0,x] П Xa, x' = x, стратегия да выбирает альтернативу, принадлежащую пути [x0,x]. Покажем, что в этом случае x ? Poss да. Действительно, определим стратегии дь, b ? A\{a}, других игроков таким образом, чтобы эти стратегии выбирали в каждой вершине x' ? [x0,x] П Xb, x' = x„ альтернативы принадлежащие пути [x0,x]. Если x' ? [x0,x] П X0, x' = x, то вероятность выбора такой альтернативы положительна. Следовательно, рДІд) > 0.
14.2, На рис, 22,1 изображено дерево игры. Игрок 1 имеет полную память, поскольку Партнер наблюдает за действиями Играющего, Игрок 2 ходит только один раз и поэтому также имеет полную память. Запишем стратегию поведения игрока 1 в виде в1 = (h,r, t), где 0 < h,r,t < 1 — вероятности выбора первой альтернативы в множествах Z 11,Z 12 и Z13

Ожидаемый выигрыш игрока 1 равен Г hr — 2h(1 — r) — 2(1 — h)t + 4(1 — h)(1 — t), если д2 = (1),
[ — hr + 3h(1 — r) + 3(1 — h)t — 3(1 — h)(1 — t), если д2 = (2),
или
fh(3r — 2) + (1 — h)(2 — 6t), если д2 = (1),
[h(3 — 4r) + (1 — h)(6t — 3), если д2 = (2).
Поэтому максимальный гарантированный выигрыш игрока 1 равен
v = max min[h(3r — 2) + (1 — h)(2 — 6t), h(3 — 4r) + (1 — h)(6t — 3)].
0<h,r,t<1
Его можно записать как max v(r,t), где v(r,t) — значение игры rrt c
0<r,t<1
матрицей
/3r — 2 3 — 4r\
^4 — 6t 6t — 3) .
Игрок 2, применяя смешанную стратегию 1/2(1)+1/2(2) не позволит игроку 1 выиграть в игре rrt больше, чем 1/2 ^^и любых r, t. Но игрок 1, используя стратегию в = (7/12,0, 0), обеспечивает себе выигрыш 1/2, Следовательно, указанные стратегии оптимальны и значение игры v = 1/2.
14,3, В процессе Брауна ht = ((ik,jk), k = 1,..., t^ и p1(j|ht) =
|{k|jk = j, 1 < k < t}|/t ^ 0 при t ^ то, если стратегия j игрока 2 в траектории ((it, jt), t =1, 2,...) применялась конечное число раз.
15.1. Возьмем две неперееекающиеея коалиции K и T. Пусть PK — множество смешанных стратегий pK коалиции K. Нетрудно видеть, что PKuT d PK х PT. Отсюда
v(K U T)= max min uKuT(pKuT, sA\(KuT)) >
pKuTepKUT sA\(KuT)egA\(KuT)
A\(KuT)) +
uK (pK ,sA\K) +
> max max min [uK (p ,p ,s
pKepK pTepT sA\(KUT)eSA\(KuT)L
pKepK pTepT LsA\kesA\K
+ min uT (pT ,sA\T )"| = v(K)+ v(T).
Докажем равенство (15.1).
v(K)= max min uK(pK, sA\K) =
= max min [v(A) — uA\K(pK, sA\K)] =
pKepK sA\kesA\KL
= v(A) — min max uA\K(pK, sA\K) =
pKepK sA\kesA\K
= v(A) — max min uA\K(pA\K, sK) = v(A) — v(A\K).
pA\KepA\K sKesK
15.2. v(2) = 1, v(13) = 9, v(3) = 4, v(12) = 6.
15.3. c = 1/500, b1 = —2/5, b2 = —3/5, b3 = 0, v'(12) = v'(13) = 3/5, v'(23) = 7/10.
15.4. Заметим, что множество C' те пусто, а функция ya ограниче-
aeA
на на нем снизу величиной v(a). Отсюда следует, что задача ЛИНеЙ-
aeA
ного программирования в (15.2) имеет оптимальное решение z. Пусть za < v(A). Возьмем такой вектор h Е C', что ha > v(A). Тогда
aeA aeA
выпуклая комбинация Az + (1 — A)h, где А Е (0,1] определяется из уравнения
A Y + (1 — A) Y ha = v(A),
aeA aeA
принадлежит ядру C. Обратно, допустим, что ядро C не пусто. Тогда
(15.2) следует из включения множеств C С C'.
15.5, Пусть Л — заданное в условии приведенное сбалансированное покрытие, Тогда ЛтuL = 0, поскольку в противном случае векторы х(Т), x(L) и x(T U L) были бы линейно зависимыми. Имеем
Лт х(Т) + Льх(Ь) = (Лт — Ль)х(Т) + Ль(х(Г) + x(L)) =
= дтх(Т)+ дтиЬх(Т U L).
Поэтому
? Д х(К) = ? Лкх(К) = х(А),
K=A K=A
а система векторов
{х(К) | дк > 0} = {х(К) | Лк > 0} U {х(Т U L)}\{х(L)}
линейно независима. Таким образом, вектор д — приведенное сбалансированное покрытие. Далее,
Лтv(T) + Л^Д) = (Лт — ЛЬД(Т) + Ль(?(Т) + v(L)) <
< (Лт — Ль)?(Т) + Ль?(Т U L) = дт?(Т) + дтиЬ?(Т U L).
Отсюда вытекает неравенство (15,4),
15.6, Проекция ядра C на плоскоеть (y1 , y2) имеет вид
{(У\У2) 1 v(12) < y1 + y2 < v(123) — v(3),
v(1) < y1 < v(123) — v(23), v(2) < y2 < v(123) — v(13)} =
= {(y1,y2) | 800 < y1 + y2 < 1000, 200 < y1 < 350, 300 < y2 < 500}. Вершины множества C:
y(1) = (300,500, 200), y(2) = (350, 450, 200), y(3) = (350, 500,150).
15.7, Необходимость, Возьмем дележ y(0) из ядрa C. Обозначим через y(k), k =1,..., |A| — 1, дележи, полученные из y(0) циклическим сдвигом на k компонент вправо. Тогда дележ
|A|-1
z = ? y(k)/|A| = (v|A|/|A|,...,v|A|/|A|)
k=0
принадлежит ядру и, следовательно,
= -КД > v|K| ? К с A * (15.5).
аек 1 1
Достаточность, Пусть выполнены неравенства (15,5), Тогда указанный вектор z принадлежит ядру С.
15,8, Проверим равенство ^ДеА ра =
= Е Е (|K| - 1)!Г1 - |Kl)!(v(K) - v(K\{а})) = v(A). (22.6)
аеА K:aeK 1 І!
Возьмем коалицию K = A и подсчитаем в последней двойной сумме коэффициент cK = cK + cK при v(K). Он включает сумму cK положительных слагаемых, встречающихся при вкладах в коалицию K и сумму cK отрицательных слагаемых, встречающихся при вкладах в коалицию K U {а}, где а ф K. Поскольку каждый из игроков коалиции K имеет свой вклад в K,
ck = K (|K |- 1)!(|A|-|K |)!= C |K| c+ = |K | |A|! = CA.
Аналогично,
|K |!(|A|-|K |- 1)! |A|!
|K| |A| .
(|A|-|K |)
Отсюда cK = 0 . Если K = Адое+ = CjAj = 1 и равенство (22,6) доказано.
Осталось проверить условие ра > v(a), V а ф A. Действительно, из свойства супераддитивности характеристической функции и равенства
(15.6)
е (|K|- 1)!(|AMK|)! (v(K)
v(K\{a})) > = v(a).
|A|!
K :a?K
> Е ( |K I- ШИ |-l K | )! v(a)
|A|!
K :a?K
15.9.
Ц = 3(v(123) - v(23)) + 1(v(12) - v(2)) + 1(v(13) - v(3)) + 3v(1), Р2 = 1(v(123) - v(13)) + 1(v(12) - v(1)) + 1(v(23) - v(3)) + 1 v(2),
У = 3(v(123) - v(12)) + 1(v(13) - v(1)) + 1(v(23) - v(2)) + 3v(3).
В игре "джаз-оркестр"вектор Шепли р = (350, 475,175). Если v(123) = 997, то р = (349,474,174) и р2 + р3 < v(23) = 650.
15.10. В симметричной игре все компоненты вектора Шепли равны между собой.
16.1. Не учтены затраты на хранение продукции. Пусть, например, предприятие должно поставлять ежедневно 5 изделий. Затраты на хранение возникают, если через день используется технология, дающая 10 изделий.
|
0, |
0 < p < 1 |
|
[0,1], |
p =1 |
|
1, |
1 <p < 2 |
|
p/2, |
p > . |
16.2. Sa(p)
17.1. Функция спроса D(p) = 3/p2 и функция предложения Sa(p) (рис. 16.5) пересекаются в точке p = 1. Поэтому функция прибыли имеет вид
W(p) = pD(p) - C(D(p))
3/p - (3/p2 - 1), 1 < p <V3/2,
3/p - 3/(2p2), p> \fbf2.
Ее максимум на полуинтервале [1, то) достигается при p* = 1.
17.2. Функция pD(p) является неубывающей на отрезке [pi,p2], поскольку ее производная D(p) + pD(p) = D(p)(1 - e(D(p))) > 0. Поэтому функция спроса D(p) - медленно убывающая. Функция прибыли W(p) = pD(p) - C(D(p)) возрастает и оптимальная стратегия монополии на отрезке [p1,p2] равнa p* = p2.
19.1. Имеем
D(p) = K/pa, D-1(V) = K 1/a/V1/a, D(D-1 (V)) = -aV 1+1/a/K1/a. Пусть v - ситуация равновесия. По утверждению 19.1 va > 0 V a G A. Отсюда по лемме 19.1 выполнены неравенства u'va (v) > 0 V a G A или (ем. формулу 19.5)
1+1/a
/(Z Ф1/a - c - к 1/ar/(„( ? V)
K1/0
> 0 V a G A.
beA
beA
Складывая эти неравенства, получим
K 1/a(ma - 1)/(a^ Z v^ j- cm > 0,
beA
что невозможно при 0 < a < 1/m.
19,2, Выпишем вторую частную производную функции выигрыша ua(v) по перемен ной va :
u"ava(v) = К1/a ( - 2(^ ?ь) + (1 + 1/a)v^) /(a[ ^ v^ 1 у
ъел ъел
Отсюда видно, что при a > 1 функция ua(v) вогнута, а при 1/m < a < 1 она имеет единственную точку максимума по переменной va на полупрямой [0, +то) ( при фиксированных пер сменных vb, b G A\(a}), Отсюда следует, что необходимые условия для ситуации равновесия v, сформулированные в лемме 19,1, являются также и достаточными условиями,
1, Если V > K/(cam), то
p = c, va = K/(cam), p* = acm/(ma — 1), va = v* =f K/(m(p*)a). Если K/(cam) > V > v*, to
p = K/(mVa), va = V, p* = acm/(ma — 1), va = v*.
Если V < v*, то p = p* = K/(mVa), va = va = V.
m
2. Положим v = c/K, ti = Va, l = 0,1, ...,m — 1, tm = 0.
a=l+1
Пусть найдется целое k G {1,..., m}, удовлетворяющее условию tk < 1/v < tk-1. го уравнения 19,6 " находим
v*(k) = (k — 1 — 2Vktk + \/ (k — 1)2 + 4 сЫк) / (2vk2).
Поскольку vtfc < 1 < vtfc-i, то v*(k) < (k — 1 — 2vktk + k + 1)/(2vk2) < Vk.
a > k, a < k.
V a, v*(k),
ситуация равновесия, Соответетву-
Поэтому v : va
ющая ей цена равна
p* = K/(tk + kv*(k)) = 2VkK/(k — 1 + \/(k — 1)2 + 4vktk) > c = p.
Пусть 1/v > t0. ^^^гда va = Va V a G Hip* = p = K/t0.
k
3, Положим n = K(k — 1)/ cb. ситуация равновесия v имеет
b=1
вид
П — n2ca/K, a = 1,...,k,
0, a = k + 1, ...,m,
і
где k = max{ | cb > (l — 1)cl}. Соответствующая ей цена равна
b= 1
rp* = cb/(k — 1) > p = c1
b= 1
19,3, 1, Объемы VP', где p < p, приобретают сначала потребители с резервной ценой r > p. Для покупки товара по цене p число таких
0,D(p)
max Vp
p'<p
потребителей станет равным max
2, Пусть P(s) = {pi} — упорядоченное множество цен p1 < p2 < ... < pk < p < pk+1 < .... Поскольку D(p1) покупателей товара по цене p1 равномерно распределены в очереди, число покупателей по цене p1, имеющих резервную цену r > p, составит величину VPiD(p)/D(p1), а аналогичное их число с r Е [p1,p) равно VPi (D(p1) — D(p))/D(p1). Поэтому после продажи товара по цене p1 чисто покупателей по цене p2, имеющих резервную цену r > p, станет равным D(p)(1 — Vpi/D(p1)), т.е. оно уменьшится пропорционально коэффициенту 1 — Vpi /D(p1). Аналогичное уменьшение произойдет и с покупателями, имеющими резервную цену r > p2. Продолжая рассуждения, придем к выводу, что после покупки товара по цене p2 чисто покупателей по цене p3, имеющих резервную цену r > p, составит величину
Vpi
D(p1)
VPi
D(p1)
Vp2
_VP2__'\
D(p2)/
D(p^1
D(p) (1
D (p2 )(1 — )
И Т.Д.
3, Пусть P (s) = {pi} — упорядоченное множес тво цен p1 < p2 < ... < pk < p < pk+1 < .... Тогда нетрудно видеть, что
D(p1, V) = D(p1), D(p2, V) = max[min[D(p2), D(p1) — 1Д], 0],
D(p3,V) = max[min[D(p3),D(p2) — VP2 ,D(p1) — VPi — VP2], 0]
И Т.Д.
19,4, В силу следствия к утверждению 19,3 для равновесия по Нэшу s выполнено p(s) = p. I Іуе і ь mn'i ie н-я производитель b, для которого Vb > S +(p) — D(p) = ^ Va — D(p) и cb = p. Тогда при малом e > 0
a:ca<p
выполнено D(p + e) — Va > 0 и no (19,13) остаточный спрос
a:ca<p,a=b
по цене p + e будет положительным. Следовательно, производителю b выгодно отклониться и выбрать цену sb = p + e (противоречие).
20.1, Для акцизного налога
te = S 1(D1 + D2)(D2 — K )/(D1 + K), P(te) = te + S 1(D1 + D2^
для налога на прибыль
p(tPr) = S-1(Di + D2), tpr = p(tPr)(D2 - K)/Pr, где величина прибыли равна
P(tpr )
Pr = J (D1 + D2 - S(p))dp.
0
20.2, По условию
e(D(p)) = -p(D 1(p) + D2(p) - K/p2)/(D1(p) + D2(p) + K/p) < 1. Отсюда
Q 1(p) + 0?2 (p) = D1(p) + D2(p) + p(D 1(p) + D2 (p)) > 0.
20,3, Функция K(p) непрерывна и на отрезках, где она дифференцируема, ее вторая производная K(p) = D 1(p)(q(p) — p) — 2D 1(p) — Q2(p) неотрицательна. Функция іб (p) в точках своего разрыва имеет положительные скачки. Следовательно, функция K(p) выпукла на всем отрезке \pd pps].
21.1, Заметим, что
lim R(p) = T(qF — c)/F = qT — Tc/F < R(p) = qT — T(1 — q)c/F.
p^p-
Если qF > (1 — q)c, to R(p3) > 0, R* = max R(p) = R(p), p* = p3.
Если qF < (1 — q)^o R(p) < 0, R* = p* = 0.
21.2, 1) Из условия следует, что Fq > c. Поэтому функция R(p) возрастает на полуинтервале [0,p) и постоянна на отрезке \p, 1]. Из R(p) > 0 получаем p* G [p3,1].
2) Имеем F = c/q < F = (qm +1 — q)c/(qm). Поэтому функция R(p) равна нулю та полуинтервале [0,p) и убывает на отрезке [p, 1]. Из R(p) > 0 ^^^чаем p* = p3.
Приложение
П1. Теорема об отделяющей гиперплоскости
Теорема П.1. Пусть A и B — два выпуклых неперееекающихея компакта в Em. Тогда найдется гиперпл ос кость ^a,x) = b, строго отделяющая множества A и B, т.е.
(a,x) < b < (a, y) Vx Е A, ?у Е B.
Доказательство. Рассмотрим на A х B функцию |х — y|2, где х Е A, у Е B, и пусть па pa (x0,y0) — точка ее минимума. Тогда |х0 — у0| > 0. Покажем, что гиперплоскость ^a,x) = b при a = у0 — x0, b = 1 (|у012 — |x012) является искомой.
Докажем, что (a,x) < b Vx Е A. Предположим противное. Тогда найдется такая точка x' Е A, что ^a,x') > b. Рассмотрим функцию g(t) = |у0 — (1 — t)x0 — tx'|2, t Е [0,1]. Имеем
g'(0)
2(у0 — x0,x0 — x') = 2(у0 — x0,x0) — 2(a,x') <
< 2(у?) — 2|x0|2 — 2b = 2<у0щ0) — |x012 — |у0|2 = —|x0 — у0|2 < 0.
Следовательно, при положительных и близких к нулю t g(t) < g(0), лто противоречит определению пары Д0,у0). Второе неравенство b < (a, у) ?у Е B доказывается аналогично, ¦
П2. Доказательство теоремы 6.1
Теорема очевидна для E0. Пусть она верна для Em-1. Рассмотрим семейство выпуклых компактов Da, а Е L из Em, каждые m +1 из которых имеют непустое пересечение.
Докажем сначала, что любое конечное подсемейство семейства Da,a Е L имеет непустое пересечение. Предположим противное. Тогда найдется минимальное целое k > m + 1, для которого найдется такое
k k—1
подсемейство Da., i = 1,...,k, что P| Dai = 0, P| Da. = 0. Положим
i=1 i=1
k—1
A = Dafc, B = P| Dai. Выпуклые компакты A и B не пересекаются и
i=1
найдется строго отделяющая их гиперплоскость H (ем, П1.) Пусть C — пересечение каких-либо m множеств из Dai , ...,Dafc_ 1. Тогда B С Си по условию С П A = 0, Возьмем x0 Е С П Пі у0 Е B. Тогда отрезок [x0,y0] принадлежит C и пересекается с H. Следовательно, C П H = 0, Итак, любые m множеств из Dai П H, ...,Dak_ 1 П H имеют непустое
к-1
пересечение. По индуктивному предположению П Dai П H = B П H = 0,
І=1
что противоречит построению гиперплоскости H.
Завершим доказательство теоремы. Предположим , что
Р| Da = 0. Пусть X = Da> — некоторый компакт из семейства «ет
Da, а Е L Определим новое семейство D« = Da П X, а Е L. Тогда
П D« = 0 и множества Da = Em\D« образуют открытое покрытие ком-«ет
пакта X, го которого можно выделить конечное подпокрытие D ,..., Da .
р р
Отсюда вытекает, что Q D«. = Р| Dai П Da = 0. По доказанному любое
І=1 1 І=1
конечное подсемейство семейства Da, а Е L имеет непустое пересечение (противоречие), ¦
ПЗ. Функция Минковского и гомеоморфизм выпуклых компактов
Пусть A — выпуклый комп акт в Em, содержащий внутри себя нуль вместе с ?0-окреетноетыо нуля О?0 .Определим на Em функцию Минковского множества A
Pa(x) = inf
Рассмотрим ее свойства. Очевидно, что Pa(0) = 0, а при x = 0 Pa(x) > 0 и нижняя грань достигается, поскольку множество A ограничено и замкнуто, Кроме того, pa(x) < 1 ^ x Е A. Функция pA(x) положительно однородна, т.е. для любого А > 0
Ax
— Е A t
А> 0
Pa( Ax) = А inf
Аpa (x) Vx Е Em.
Докажем, что функция pA(x) субаддитивна, т.е,
Pa(x + y) < pa(x) + pa(y) Vx,y Е Em. (П.1)
Действительно, возьмем x,y = 0. Вектор
x + Ра(У)
Pa (x) pa (x) + Ра(у)
Pa(x)
Pa (x) + Ра(У)
x + y
Pa(x)+Ра(У)
У
Ра(У)
принадлежит множеству A, поскольку является выпуклой комбинацией векторов из A. Отсюда получаем неравенство (П.1).
Докажем, что функция Минковского непрерывна. Действительно, для любого x Е ??0
, |x|
> ?0 ^ Pa(x) < —.
?0
x
Pa(x)
to.
Pa(x)
Отсюда следует, что pa(x) непрерывна в нуле. Непрерывность функции Pa(x) в любой точке x0 вытекает из неравенства ( субаддитивность ) |pA(x) — pA(x0)| < max[pA(x — x0),pA(x0 — x)] и ее непрерывности в нуле.
Теорема П.2. Пусть выпуклые компакты A и B в Em содержат внутренние точки. Тогда найдется взаимно однозначное и непрерывное отображение (гомеоморфизм) A на B.
Доказательство. Без потери общности будем считать, что нуль содержится в A П B вместе со своей окрестностью О?0, Определим отображение
Pa(x) Pb (x) x
т : A ^ B, т(О) = 0, т(x)
где Pa(x),Pb(x) проверить, что
функции Минковского множеств A и B. Нетрудно
т 1(у)
Pb (у) Ра(У) У
— отображение, обратное к т. Поскольку функции Pa(x),pb(x) непрерывны, отображение т(x) непрерывно при x = 0. Проверим непрерывность т(x) в нуле. Множество B ограничено и поэтому найдется такое число а, что для всех x Е B |x| < а. Поекольк? Х , Е B, |x|. < а. Для любого
вектора x Е О?0 выполнено неравенетво pa(x) < (см. выше доказательство непрерывности функции pa(x)). Следовательно, для всякого x Е О?0
|т (x)|
Pa(x) , , а |x |
—x-|x| < -
Pb (x) ?0
П4. Симплексы и теорема о неподвижной точке
Пусть {x1,..., xn+1) — множество векторов из Em(n < m), выпуклая оболочка которого
П+1 П+1
1,...,п + 1}
1, Лі > 0, i
K = {x Е Em | х = ^ \гх\ ^ Лг
і=1 i=1
имеет размерность п. Тогда множество K называется симплексом, порожденным вершинами х1,..., хп+1. Для симплекса K будем также использовать обозначение K = х1 ¦ ¦ ¦ хп+1. Размерность п означает линейную независимость векторов хп+1 — х1,...,хга+1 — хп. Отсюда вытекает, что для всякого х Е K коэффициенты Лі(х), i = 1,..., n + 1, в разложении х по хі определены однозначно и являются непрерывными функциями на K.
Всякое множество, содержащее r < п + 1 вершин, порождает (г — 1)-мерный симплекс, называемый гранью симплекса K. Вершины х1,..., хп+1 являются нульмерными гранями, n-мерная грань совпадает с K. Одномерные грани xixj, i = j, называются ребрами симплекса K. Диаметр симплекса K определяется как максимальная длина его ребер. Подмножество K0 симплекса K вида
K0 = {х Е Em | х = ^ Ліхі, ^ Лі = 1, Лі > 0, i = 1,..., n +1}
i=1 і=1
называется открытым симплексом, порожденным вершинами х1,..., хп+1. Для открытого симплекса будем также использовать обозначение K0 = х1 ••• хп+1. Нульмерные симплексы являются открытыми. Открытые ребра будем обозначать через хіх^'.
Пусть симплекс K таким образом разбит на открытые попарно непе-ресекающиеся симплексы K1,..., Kp , что любая открытая грань каждого симплекса Kj принадлежит разбиению. Такое разбиение называется сим-плициалъпым. Симплексы Kj, принадлежащие K0, образуют разбиение открытого симплекса.
На рис, П,1 приведен пример еимплициального разбиения двумерного симплекса K на два двумерных, пять одномерных и четыре нульмерных открытых симплекса.
Рис. П.1
Соответствующий открытый симплекс K0 разбит на два двумерных и один одномерный открытых симплекса. Если удалить из разбиения нульмерный симплекс у, а ребра х2у и ух3 заменить на ребро х2х3, то получим пример нееимплициального разбиения. Для еимплициального разбиения п через 5(п) обозначим максимальный диаметр симплексов, входящих в п.
П+1
Точка Y1 х называется бармцентрсш симплекса K. Определим
І= 1
еимплициальное разбиение, называемое барицентрическим, каждое ребро которого соединяет барицентры грани и некоторой ее подграни симплекса K. Для симплекса хх2 оно состоит из вершин х, х2, его барицентра Ь = 1 (х + х2) и двух открытых ребер хЬ и Ьх2. Предположим, что барицентрическое разбиение определено для любого симплекса размерности k < n — 1.
Определим его для симплекса K размерности n с барицентром Ь. Пусть Я — семейство открытых симплексов, входящих в барицентрические разбиения всех (n — 1)-мерных граней симилекса K. Возьмем произвольный симплекс K' = у ¦¦¦ у, l < n из Я. Предположим по индукции, что каждое его ребро yyj соединяет барицентры некоторой грани и ее подграни симплекса K. Нетрудно видеть, что аналогичным свойством обладает и симплекс у ¦ ¦ ¦ уЬ. Совокупность всех таких симплексов у ¦ ¦ ¦ у Ь и барицентр Ь добавим к семейству Я. В результате получим барицентрическое разбиение п1 симплекса K.
Покажем, что ^(п1) < n+цd, где d — диаметр еимплекеа K. Действительно, возьмем любое ребро Ь'Ь" разбиения п1, где без потери общности
|
2 |
 |
|
s+1 |
1
s + 1 |  |
Ъ" |
|
i= 1 |
Ь'
Тогда
s+1
E(x‘
b")
|b' - b"|
i= 1
s+1 r+1
EE^
s(r + 1)d nd
< (s + 1)(r + 1) < n +1 ’
xj)
i=1 j = 1
Итак, ^(n1) < n+1 d. Если каждый симплекс, принадлежащий разбиению п1, подвергнуть барицентрическому разбиению, получим симпли-циальное разбиение п2, для которого Дп2) < (n+ц )2d. Повторяя аналогичную процедуру к раз, пол?чим симплициальное разбиение пк с S(nk) < ()kd. " " "
Теорема П.З (лемма Шпернера). Пусть п — симплициальное разбиение n-мерного симплекса K = х1 ¦¦¦ xn+1, а функция ? : K ^ {х1, ...,xn+1} удовлетворяет условию
?(х) Е {xi | Ai(x) > 0} Vx Е K.
Тогда найдется такой n-мерный симплекс у1 ¦ ¦ ¦ yn+1 разбиения п, что ?(yi) = xi, i = 1,..., n +1. Число таких симплексов нечетно.
Доказательство. Для n = 0 утверждение теоремы очевидно. Предположим, что она справедлива для (n — 1)-мерных симплексов. Пусть K1,..., Kp — открытые симплексы, входящие в разбиение п. Бу
дем говорить, что (n— 1)-мерная грань у1 ¦ ¦ ¦ yn симплекса Kj = у1 ¦ ¦ ¦ yn+1 отмечена, если ?(yi) = xi, i = 1, ...,n.
Если симплекс Kj удовлетворяет утверждению теоремы, то, ввиду равенств ?(yi) = xi, i = 1,...,n + 1, он имеет ровно одну отмеченную грань. Действительно, любая другая (n — 1)-мерная грань симилекса Kj содержит вершину y^1. Но ? (yn+1) = xn+1 и эта грань не является отмеченной, Пусть симплекс Kj не удовлетворяет утверждению теоремы и имеет отмеченную грань y1 ¦ ¦ ¦ yn. Тогда он имеет ровно две отмеченные грани. Действительно, по предположению ?(yi) = xi, i = 1,...,n и без потери общности ? (yn+1) = x1 .Тогда (n — 1)-мерные грани y1 ¦¦¦ yn и y2 ¦ ¦ ¦ ynyn+1 являются отмеченными.
Пусть aj — чисто отмеченных граней симплекеа Kj. По доказанному Oj Е {0,1, 2} и a = 1 только в том случае, когда симплекс Kj удовлетворяет утверждению теоремы. Поэтому осталось доказать, что общее
p
число отмеченных граней х = Eaj нечетно, В этом случае обязательно
j=1
найдется симплекс Kj, удовлетворяющий утверждению теоремы.
Пусть V = у1 • • • уп — какая-либо (п — 1)-мерная отмеченная открытая грань симплекса Kj .Если V С K\К 0, то V принадлежит некоторой (п — 1)-мерной грани еимплекса К и является гранью единственного п-мерного симплекса разбиения п. При этом из равенств ? (уг) = хг, i =
def_
1,..., п, следует, что V С W = х1 • • • хп. Действительно, если бы грань V принадлежала другой грани симплекса К, стажем, х2 • • • хп+1, то по определению функции ? равенство ?(у1) = х1 было бы невозможно. Пусть V С К\К0. Тогда V является общей гранью ровно двух n-мерных симплексов, входящих в разбиение п и в сумме х она учитывается дважды. Следовательно, число х сравнимо то модулю 2 с числом (п — 1)-мерных симплексов V = у1 • • • уп С W, для которых ?(уг) = хг, i = 1,..., п. По индуктивному предположению, примененному к (п — 1)-мерному симплексу W, это чисто нечетно. Поэтому число х также нечетно. ¦
Теорема П.4 (Кнастер, Куратовский, Мазуркевич). Пусть замкнутые подмножества C1,..., Сп+1 симплекса К = х1 • • • хп+1 удовлетворяют условию
х71 • • • х7 С ur=1Cjv V 1 < j1 < j2 < ... < js < п + 1.
Тогда множества C1,..., Сп+1 имеют непустое пересечение.
Доказательство. Рассмотрим последовательность {пк} построенных ранее еимплициальных разбиений симплекса К, для которой lim Дпк) =
к^ж
0. Определим отображение ? : К ^ {х1,..., хп+1} следующим образом. Для любого х ? К пусть
{х 1 Aj(х) > 0} = {хЛ^..^}, j1 < j2 < ... < js.
Тогда по условию х ? US=1Cjr. Положим ? (х) = х74, где t — минимальное число, для которого х ? иГ=1С7г. Отметим, что х ? иГ=11С7г и, следовательно, х ? Cjt. По предыдущей теореме существует симплекс у1 (к) • • • уп+1(к) разбиения пк, для которого ?(уг(к)) = хг, i = 1,..., п + 1. Заметим, что для каждого вектора уг(к) то определению отображения ? jt = i и поэтому уг(к) ? Сг, i = 1,...,п + 1. Поскольку К — компакт, без потери общности можно считать, что последовательности {уг(к)} сходятся. Но lim Дпк) = 0. Поэтому при к ^ то диаметр симплекса
к^ж
у1 (к) ••• уп+1(к) стремится к нулю. Следовательно, lim уг(к) = у*, i =
к^ж
1, ...,п + 1. Поскольку при всех i уг(к) ? Сг, а множества Сг замкнуты,
п+1
имеем у* ? П Сг .¦
г=1
Уточним формулировку теоремы 9,1, Пусть Z — выпуклый компакт в Em и y1 • • • yn+1 — содержащийся в нем симплекс максимальной размерности, Тогда число n < m называется размерностью множества Z. Выпуклый компакт Z максимальной размерности m имеет внутреннюю точку (например, барицентр симплекса у1 • • • ym+1), Обратно, если Z имеет внутреннюю точку, то его размерность максимальна. Предположим, что Z имеет размерность n < m и содержит нуль. Тогда можно считать, что yn+1 = 0. При этом Z является подмножеством евклидова пространства En с базиеом у1, ...,yn.
Из сказанного вытекает, что в теореме 9,1 без потери общности можно предположить, что выпуклый компакт Z имеет максимальную размерность m.
Доказательство теоремы 9.1 (Брауэра). Пусть K = х1 • • • xm+1 — m-мерный симплекс в Em. По теореме П,2 (см, ПЗ) найдется гомеоморфизм т : Z ^ К. Отображение т о f о т-1 переводит то чку y G Кв точку т(f (т-1(y))) G К и является непрерывным. Если y0 G К — неподвижная точка отображения т о f о т-1, то х0 = т-1(y0) — неподвижная точка отображения f : Z ^ Z. Поэтому без потери общности можно считать, что Z = К.
Положим
Ci = {х G К | Aj(f (х)) < Aj(x)}, i = 1,..., m + 1.
Поскольку отображение f и функции Ai(x) непрерывны на К, множества Ci замкнуты, Покажем, что множества Ci удовлетворяют условию предыдущей теоремы. Пусть х G xj1 • • • xjs. Тогда
s s
Aj(x) = 0 Vj G {xj1 ,...,xjs} ^ ^ j (x) = 1 > ^ j (f (x)).
r= 1 r=1
Следовательно, найдется номер r, при котором Ajr(х) > Ajr(f (x)) и x G Cjr. По предыдущей теореме найдется
х* G Q Ci ^ Ai(x*) > Ai(f (х*)), i = 1, ...,m + 1.
i= 1
Ho
m+1 m+1
^ Ai(x*) = ^ Ai(f (x*)) = 1
i=1 i=1
Поэтому
Xi(x*) = Xi(f (ж*)), i = 1, ...,m + 1 ^ x* = f (ж*). ¦
Доказательство теоремы 12.1 (Какутани). Как и при доказательстве теоремы Брауэра, без потери общности можно считать, что выпуклый компакт Z имеет максимальную размерность m.
Пусть K = х1 • • • xm+1 — m-мерный симплекс в Em. По теореме П.2 (ем. ПЗ) найдется гомеоморфизм ^ : K ^ Z. Рассмотрим последовательность {Лк} симплициальных разбиений симплекеа K, для которой lim 6(пк) = 0. Для произкольного к определим следующее непрерывное
к^-ж
отображение Фк : K ^ Z. Для любой вершины х из {пк} выберем точку Фк(х) G Ф(^(х)) и затем продолжим отображение линейно на каждый из симплексов, входящих в {пк}, т.е. если
m+1 m+1
Х =^2 Xjх, ^Xj = 1, Xj > 0, j = 1,...,m + 1 j=1 j=1
— точка симплекса x1 • • • xm+1 G {nk}, то полагаем
m+1
Фк (x) = ^ Фк (xj).
j=1
Очевидно, что последнее равенство определяет непрерывное отбраже-ние Фк : K ^ Z. Тогда fк = ^-1Фк : K ^ K является непрерывным отображением и имеет неподвижную точку xk .Пусть xk принадлежит симплексу x1k • • • xm+1k G {nk}, т.е.
m+1 m+1
xk = ^ Xkxjk, ^ Xj = 1, Xj > 0, j = 1,..., m + 1. j=1 j=1
He умаляя общности, можно считать, что последовательности {xk}, {xjk},{Xj},{Фк(xjk)}, j = 1,... , m + 1, сходятся при к ^ то. Поскольку диаметры симплексов x1k • • • xm+1k стремятся к нулю, последовательности {xk} и {xjk} должны иметь общий предел x* G K. Пусть
lim Xj
X*, lim Фк(xjk)
1, ...,m + 1.
Имеем
<^(хк) = Фк (хк) = ? ЛкФк (xjk) (П.2)
j=i
и lim ^(xjk) = ^(х*), lim ^(хк) = ^(х*) в силу непрерывности отбраже-
к^-ж к^-ж
ния <^. Переходя в равенстве (П.2) к пределу при к ^ то, получим
Ш+1 Ш+1
'Ах*) = ? Л*?, ? Л* = 1, Л* > 0, j = 1,...,т + 1. j=i j=i
Из замкнутости отображения Ф вытекает, что
nj Е Ф(^(х*)), j = 1,...,m + 1. Поскольку множество Ф(^(х*)) выпукло, точка ^(х*) ему принадлежит и является искомой, ¦
Список литературы
[1] Activity analysis of production and allocation ( Cowles Commission Monograph Ж0- 13, ed, Koopmans T.C.). — N.Y.: J,Wiley, 1951,
[2] Allen B,, Hellwig M, Bertrand-Edgeworth oligopoly in large markets, Eewiew of Economic Studies, 1986, v. 53, p, 175-204,
[3] Amir E, Cournot oligopoly and the theory of supermodular games. Games and Economic Behavior, 1996, v, 15, p, 132-148,
[4] Atkinson A.B., Stiglitz J.E, Lectures on public economics, — London: McGraw-Hill, 1980,
[5] Ашманов C.A, Линейное программирование, — M,: Наука, 1981,
[6] Ашманов С,А,, Тимохов А,В, Теория оптимизации в задачах и упражнениях, — М,: Наука, 1991,
[7] Aumann E.J, The core of a cooperative game without side payments, Trans, Amer, Math, Soe,, 1961, v,98, № 3, p, 539-552,
[8] Беленький В.З., Волконский В.А., Иванков С.А., Поманский А,Б,, Шапиро А.Д. Итеративные методы в теории игр и программировании, — М,: Наука, 1974,
[9] Бесконечные антагонистические игры, Сб, статей под ред, Н.Н,Воробьева, — М,: Физматгиз, 1963,
[10] Bertrand J, Review de theorie mathematique de la riehesse soeiale, Reeherehes sur les prineipes mathematique de la theorie des riehesses. Journal des Savants, 1883, p, 499-508,
[11] Б. іек?ч i Д., Гиршик M, Теория игр и статистических решений, — М,: Иностранная литература, 1958,
[12] Боненблает Х.Ф.. Карлин С,, Шепли Л,С, Игры е непрерывной функцией выигрыша, В еб, [9], е, 337-352,
[13] Бондарева О,И, Некоторые применения методов линейного программирования к теории кооперативных игр. Проблемы кибернетики. 1963, вып.10, е. 119-140.
[14] Borges Т, Iterated elimination of dominated strategies in a Bertrand-Edgeworth model, Rewiew of Economic Studies, 1992, v, 59, p. 163-176.
[15] Borel E, 1) The theory of play and integral equations with skew symmetric kernels, 2) On games that involve chance and skill of the players, 3) On system of linear forms of skew symmetric determinants and the general theory of play, Eeonometriea, 1953, v. 21, № 1, p. 97-117.
[16] Borel E, Application aux jeux de hasard, Traite du ealeul des probabilites et des ses applications, Applications des jeux hasard, E,Borel et eollab, — Paris: Gauthier — Villars, 1938, v, IV, fasc, 2,
p. 122.
[17] Brown G.W, Iterative solutions of games by fictitious play. In collected book [1], p, 374-376,
[18] Brouwer L.E.J. On continuous vector disributions of surfaces, Amsterdam Proe,, 1909, v, 11, continued in 1910, v, 12,13,
[19] Walras L, Elements d’economie politique pure, — Lausanne, 1874,
[20] Wald A, Contributions to the theory of statietieal estimation and testing hypotheses, Ann, Math, Stat,, 1939, v. 10, № 4, p, 299-326,
[21] Вальд А, Статистические решающие функции, В еб, [65], е, 300522.
[22] Васин А,А, Модели процессов с несколькими участниками, — М,: Изд-во Моек, ун-та, 1983,
[23] Васин А,А, Модели динамики коллективного поведения, — М,: Изд-во Моек, ун-та, 1989,
[24] Васин А,А,, Панова Е.И. Собираемость налогов и коррупция в налоговых органах, — М,: Российская программа экономических исследований, 2000, Сер, "научные доклады", JV 99/10,
[25] Васин А,А,, Агапова О,Б, Математическая модель оптимальной организации налоговой инспекции, В сб, "Программноаппаратные средства и математическое обеспечение выечиели-тельных систем", — М,: Изд-во Моек, ун-та, 1993, с, 167-186,
[26] Васин А,А, , Васина И,А, Оптимизация налоговой системы в условиях уклонения от налогов. Роль ограничений на штраф, — М,: Российская программа экономических исследований, 2002, Сер, "научные доклады", № 01/09,
[27] Васин А,А, , Васина И,А,, Мархуэнда Ф.Х, Налоговое принуждение для неоднородных фирм,/ Препринт JV 2001/025, — М,: Российская экономическая школа, 2001,
[28] Ватель И,А,, Ерешко Ф.ІI. Математика конфликта и сотрудничества, — М,: Знание, 1974,
[29] Вентцель Е,С, Исследование операций, — М,: Советское радио, 1981.
[30] Ville J, Sur la theorie generale des jeux oh intervient l’abilite des jeueurs, Traite du ealeul des probabilites et des ses applications, Applications des jeux hasard, E.Borel et eollab, — Paris: Gauthier — Villars, 1938, V. IV, fasc. 2, p. 105-113.
[31| Вилкас Э.Й. Оптимальность в играх и решениях, — М,: Наука, 1990.
[32] Vives X. Rationing rules and Bertrand-Edgeworth equilibria in large markets. Economic Letters, 1986, v. 21, p, 113-116,
[33] Wolfovitz J, Minimax estimates of the mean of normal distribution with known variance, Ann, Math, Stat,, 1950, v. 21, Ж0- 2, p, 218-230,
[34] Воробьев H,H, Основы теории игр. Бескоалиционные игры, — М,: Наука, 1984,
[35] Гейл Д, Теория линейных экономических моделей, — М,: ИЛ,1963.
[36] Гермейер Ю.Б, Введение в теорию исследования операций, — М,: Наука, 1971,
[37] Гермейер Ю.Б, Игры с непротивоположными интересами, — М,: Наука, 1976,
[38] Гермейер Ю.Б, Об играх двух лиц с фиксированной последовательностью ходов. ДАН, 1971, ?. 198, № 5, с. 1001-1004.
[39] Горелик В,А, Теория игр и исследование операций, — М: Изд-во МИНГП, 1978.
[40] Грень Е, Статистические игры и их применение, — М,: Статистика, 1975,
[41] Давыдов Э.Г, Исследование операций, — М,: Высшая школа, 1990.
[42] Данцер Л,, Грюнбаум Б,, Кли В, Теорема Хелли, — М,: Мир, 1968.
[43] Dantzig G.B, A proof of the equivalence of the programming problem and the problem. In collected book [1], p, 330-335,
[44] Gilles D.B, Solutions to general non-zero-sum games. Contributions to the theory of games, IV (Kuhn H.W., Tucker A.W, eds,), Ann, Math, Studies, JV 40, — Princeton: Princeton Univ, Press, 1959, p. 47-86.
[45] Дрешер М, Стратегические игры. Теория и приложения, — М,: Советское радио, 1964,
[46] Дюбин Г. 11.. Суздаль В,Г, Введение в прикладную теорию игр, — М,: Наука, 1981,
[47] Kakutani S, A generalisation of Brower’s fixed point theorem, Duke Math. J., 1941, v. 8, № 3, p. 457-459.
[48] Карлин С, Математические методы в теории игр, программировании и экономике, — М,: Мир, 1964,
[49] Кини Р.Л., Райфа X, Принятие решений при многих критериях. Предпочтения и замещения, — М,: Радио и связь, 1981,
[50] Колмогоров А.Н., Фомин С,В, Элементы теории функций и функционального анализа, — М,: Наука, 1972,
[51] Cowell F,, Gordon G.F, Auditing with "ghosts". In book "The Economies of Organized Crime". 1995, p. 184-198.
[52] Кононенко А.Ф., Новикова 11.\I. Обзор развития игр Гермейе-ра, В еб, "Программное оборудование и вопросы принятия решений", — М,: Изд-во Моек, ун-та, 1989, с, 201-210,
[53] Knaster В,, Kuratowski С,, Masurkieviez S, Ein Beweis des Fixpunktsatzes fur n-dimensionale Simplexe, Fund, Math,, 1929, B. 14, S. 132-137.
[54] Kreps D,, Seheinkman J, Quantity preeommitment and Bertrand competition yield Cournot outcomes. The Bell J, of Economies, 1983, v. 14, p. 326-337.
[55] Кукушкин H.C., Морозов В,В, Теория неантагониетичееких игр, — М,: Изд-во Моек, ун-та, 1984,
[56] Kukushkin N, A fixed point theorem for decreasing mappings. Economic Letters, 1999, v. 46, p, 23-26,
[57] Кукушкин H,C, Роль взаимной информированности сторон в играх двух лиц с непротивоположными интересами, — ЖВМ и МФ, 1972, т. 12, № 4, е. 1029-1034.
[58] Кун Г,У, Позиционные игры и проблема информации, В еб, [82], е. 13-40.
[59] Cournot A.A. Reeherehes sur les prineipes mathematic de la theorie des riches, — Paris, 1838,
[60] Lemke C.E., Howson J,J,,Jr, Equilibrium points of bimatrix games, Proe, Nat, Acad, Sei, U.S.A., 1961, v. 47, p, 1657-1662,
[61] .1 ыос P, и Райфа X, Игры и решения. Введение и критический обзор, — М.: Иностранная литература, 1961,
[62] Myles G, Public economies, Cambridge, 1996,
[63] Мак-Кинси Дж, Введение в теорию игр, — М,: Физматгиз, I960,
[64] МакКоннелл К.Р., Брю С,Л, Экономике, — М,: ИНФРА-М,2003,
[65] Матричные игры, Сб, статей под ред, Н,Н,Воробьева, — М,: Физматгиз, 1961,
[66] Мовшович С.М., Богданова М.С., Крупенина Г.А. Рационализация структуры налогов в переходной экономике России, — М,: Российская экономическая школа, 1997,
[67] Морозов В,В,, Сухарев А,Г,, Федоров В,В, Исследование операций в задачах и упражнениях, — М,: Высшая школа, 1986,
[68] Морозов В,В,, Аъзамхужаев М.Х, О поиске дележей дискретной кооперативной игры, В сб, "Применение вычислительных средств в научных исследованиях и учебном процессе,"— М,: Изд-во Моек, ун-та, 1992, с. 49-62.
[69] Moreno D,, Ubeda L, Capacity precommitment and price competition yield Cournot outcomes, Universudad Crlos 3 de Madrid, Economic Series, 2001, 08 WP 01-44,
[70] Moukiih T.C.,Райфа X,, Томпсон Дж, Л,, Тролл Р.М. Метод двойного описания, В сб, [65], с, 81-109,
[71] Му. іен Э, Теория игр, С примерами из математической экономики. — М.: Мир, 1985.
[72] Нейман Дж, фон, , Моргенштерн О, Теория игр и экономическое поведение, — М,: Наука, 1970,
[73] Нейман Дж, фон, К теории стратегических игр, В еб, [65], е, 174204.
[74] Neumann J, von, Uber ein okonomisches Gleiehungssvstem und eine Verallgemeinerung des Browersehen Fixpunktsatzes, Erg, Math, Kolloqu,, 1937, B. 8, S. 73-83.
[75] 11 пкаіі. го X,, Иеода К, Заметка о бескоалиционных выпуклых играх, В еб. [9], е. 449-458.
[76] Нэш Дж, Бескоалиционные игры, В еб, [65] , е, 205-221,
[77] Novehek W, On the existence of Cournot equilibrium. Review of Economic Studies, 1985, v, 52, p, 85-98,
[78] Оуэн Г, Теория игр, — М,: Мир, 1971,
[79] Партхаеаратхи Т,, Рагхаван Т, Некоторые вопросы теории игр двух лиц, — М,: Мир, 1974,
[80] Петров А,А,Б, Поспелов И,Г,, Шананин А,А, Опыт математического моделирования экономики, — М,: Энергоатомиздат, 1996,
[81] Петросян Л,А,, Зенкевич Н.А., Семина Е.А. Теория игр, — М,: Высшая школа, 1998,
[82] Позиционные игры, Сб, статей под ред, Н,Н,Воробьева, — М,: Наука, 1967,
[83] Radon J, Mengen konvexer Korper, die einen gemeinsam Punkt enthalten. Math, Ann,, 1921, B, 83, S, 113-115,
[84] Робинсон Дж, Итеративный метод решения игр, В еб, [65], е, ПО-118.
[85] Розенмюллер Н, Кооперативные игры и рынки, — М,: Мир, 1974,
[86] Sanchez I,, Sobel J, Hierarchical design and enforcement of income tax polices, J, of Public Economies, 1985, v, 26, p, 1-18,
[87] Соколовский Л.Е. Подоходный налог и экономическое поведение, Экономика и математические методы, 1989, т, 25, вып, 4,
[88] Теория игр. Аннотированный указатель публикаций по 1968 г, — Л,: Наука, 1976,
[89] Теория игр. Аннотированный указатель публикаций отечественной и зарубежной литературы за 1969 — 1974 гг, — Л,: Наука, 1980.
[90] Friedman J, On the strategic importance of prices versus quantities, Rand J, of Economics, 1986, № 4, p, 607-622,
[91] Fundenberg D,, Tirole J, Game Theory, — Cambridge, Mass,: The MIT Press, 1996,
[92] Harsanyi J.C, Games with incomplete information played by Bayesian players. Management Science, 1968-69, v. 1 I. p, 159-182, 320-334, 486-502.
[93] Handbook of Game Theory with economic applications, Vol, I and II, ( R.J, Aumann and S, Hart eds,),— Amsterdam — Lausanne — New York — Oxford — Shannon — Tokyo: Elsevier, 1994,
[94] Холли Э, О совокупности выпуклых тел с общими точками, УМН, 1936, вып. 2, с. 80-81.
[95] Но Y,, Lull Р,, Muralindharan R, Information structure, Staekelberg games and incentive controllability, — IEEE Trans, Aut. Contr., 1981, v.26, № 2, p. 454-460.
[96] Hodges J.L., Lehmanm E.L, Some problems in Minimax Point Estimation, Ann, Math, Stat,, 1950, v, 21, № 2, p, 182-192,
[97] Цермело Э, О применении теории множеств к теории шахматной игры. В сб. [65], с. 167-172.
[98] Selten R, Spieltheoretisehe Behandlung eines Oligopolmodells mit Naehfragetragheit, Zeitsehrift fiir die gesamte Staatswissensehaft, 1965, № 12, s. 301-324.
[99] Selten Е, Reexamination of the perfectness concept for equilibrium points in extensive games. International J, of the Game Theory, 1975, № 4, p. 25-55.
[100] Шапиро Г.Н. Замечание о вычислительном методе в теории игр, В еб. [65], е. 118-127.
[101] Shapley L.S., Snow R.N. Basie solutions of discrete games. Contributions to the theory of games, I (Kuhn H.W., Tucker A.W, eds,), Ann, Math, Studies, M°- 24, — Princeton: Princeton Univ, Press, 1953, p. 51-73.
[102] Shapley L.S, A value for n-person games. Contributions to the theory of games, II (Kuhn H.W., Tucker A.W, eds,), Ann, Math, Studies, № 28, — Princeton: Princeton Univ, Press, 1953, p, 307-317,
[103] Shapley L.S, Some topics in two-person games. Advances in game theory (Dresher M,, Shapley L.S,, Tucker A.W, eds,), Ann, Math, Studies, M°- 52, Princeton, 1964,
[104] Shiftman M, On the equality of minmax=maxmin, and the theory of games, the RAND Corporation, RM-243, 1949,
[105] Шикин E.B. От игр к играм, — М,: Эдиториал, 1997,
[106] Шнирельман Л,Г, О равномерных приближениях, Изв, АН СССР, сер, матем,, 1938, Ж0- 1, с, 53-60,
[107] Sperner Е, Neuer Beweis fur die Invarianz der Dimensionzahl und Gebietes, Abh, Math, Sem, Univ, Hamburg, 1928, B, 6, № 3/4, S, 265-272.
[108] Chandler P,, Wilde L, A general charachterization of optimal income ta[ enforcement, Rewiew of Economics Studies, 1987, v, 65, p. 165-189.
[109] Charnes A,, Kortanek K, On balanced sets, cores and programming, — Cah, Centre etudes reeh, operat,, 1967, v, 9, JY 1, p, 32-43,
[110] Edgeworth E.Y, The pure theory of monopoly. In Edgeworth Papers Ralating to Political Economy,-N.Y.: Brut Franklin, 1925, v, 1, p. 111-142.
Указатель обозначений
Em — m-мерное евклидово пространство векторов х = (xi,...,xm) со
m I-
скалярным произведением (x,y) = У ХіУі и нормой |x| = у (х,х);
Argmax f (х) = {X G X | f (х') = max f (х)} — множество точек мак-
симума функции f, определенной на множестве X;
Argminf (х) = {х' G X | f (х') = minf (х)};
{ak} — последовательность эле ментов ak, k = 1, 2,...;
EX, V arX — математическое ожидание и дисперсия случайной величины X;
e — вектор, все компоненты которого равны 1;
в1 — вектор, 1-а.н компонента которого равна 1, а остальные компоненты — нулевые;
2s — множество всех подмножеств множества S;
IS| — чисто элементов конечного множеетва S;
СП — число сочетаний из m по п;
def I! I!
= — равно по определению ;
V 3 ^ ^ — кванторы "для всякого", "найдется", логические
связки "следует"и "тогда и только тогда, когда";
0 — пустое множество;
¦ — конец доказательства.

277
Этому неравенству можно дать следующую интерпретацию: "лучше быть плохим среди хороших, чем хорошим среди плохих".
Недостаточно подготовленный читатель здесь и далее может заменить выражение "компакт метрического пространства"на выражение "замкнутое ограниченное множество евклидова пространства".
Здесь использовано следующее свойство компакта метрического пространства: из любой последовательности элементов компакта Y можно выделить подпоследовательность, сходящуюся к некоторому элементу из Y. Считаем, что {ykl} и есть соответствующая выделенная подпоследовательность.
Замкнутом ограниченном множестве.
Пусть X — выпуклый компакт евклидова пространства. Здесь примером смешанной стратегии может служить вероятностная мера, еоере-
Полковник Блотто — анекдотический персонаж, действующее лицо многих иллюстративных примеров из области антагонистических игр.
где дисперсия а статистику известна, а математическое ожидание x — нет: x G X = Е1.
Показать, что классическая решающая функция z является выравнивающей и минимаксной стратегией статистика.
— x, 0 < y < x < 1,
(1 — x)y, 0 < x < y < 1.
Предположим, что оптимальные смешанные стратегии игроков p0(x) и ^0(y) имеют совпадающие спектры Sp(p0) = Sp(^0) = [0,а], где а < 1 — параметр, подлежащий определению. Пусть на отрезке [0, а] функции распределения p0(x) и ^0(y) непрерывны и имеют производные (плотности распределения) f (x) и g(y).
По свойству дополняющей нежесткости (теорема 4,3)
F(р0, y) = v V y G [0, а] или
Если партия заканчивается раньше, то игроки делают необходимое число фиктивных ходов, не влияющих на исход игры.
Дерево изображено в перевернутом виде, поскольку так его удобнее рисовать.
Шнирельман доказал теорему 6.2 в терминах выпуклых множеств, не используя понятие вогнутой функции.
Множества X0 и Y0 содержат равное число элементов.
В противном случае переходим к другой паре ji,j2-
Даже для более общих игр с конечными множествами стратегий игроков (см. главу III)
В частности, x может совпасть с ?(z,k).
Строим функцию Sa(p) как обратную к Ca(V):
0(at) G Arg max min ••• max min F(xT, yT).
xteUt(at) yteVt(et) xtGUt(ат) УтGVt(вт)
r+1
- У х2, r < s < n.
r + 1 ^ j=1
Экономика: Знания - Циклы - Макроэкономика