Некооперативная теория игр

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис
(перенаправлено с «Некооперативная игра»)

Некооперативная игра — термин теории игр. Некооперативной игрой называется математическая модель взаимодействия нескольких сторон (игроков), в процессе которого они не могут формировать коалиции и координировать свои действия.

Некооперативная игра в нормальной форме

Некооперативной игрой в нормальной форме называется тройка [math]\displaystyle{ \Gamma = \left\langle I,\left\{ S_i\right\}_{i\in I},\left\{ H_i\right\}_{i\in I}\right\rangle }[/math], где [math]\displaystyle{ \ I }[/math] — множество участников игры (сторон, игроков); [math]\displaystyle{ \ S_i }[/math] — множество стратегий участника [math]\displaystyle{ \ i \in \ I }[/math]; [math]\displaystyle{ \ H_i }[/math] — функция выигрыша участника [math]\displaystyle{ \ i }[/math], определенная на множестве ситуаций [math]\displaystyle{ \ S = \prod_{i \in I} S_i }[/math] и отображающая его во множество действительных чисел.

Некооперативная игра в нормальной форме предполагает следующий порядок разыгрывания.

1. Игроки одновременно и независимо друг от друга выбирают из множеств [math]\displaystyle{ \ S_i }[/math] свои стратегии. Вектор стратегий [math]\displaystyle{ \ s=(s_1, s_2, ..., s_n) }[/math] всех игроков представляет собой ситуацию в игре.

2. Каждый игрок получает выигрыш, определяемый значением функции [math]\displaystyle{ \ H_i(s) }[/math], на этом взаимодействие между ними прекращается.

Нормальная форма игры описывает статическое взаимодействие игроков, не предусматривая возможности последовательных ходов, накопления информации о действиях соперника и повторяющегося взаимодействия. Для моделирования этих аспектов используется развернутая форма игры.

Некооперативная игра в развернутой форме

Некооперативная игра в развернутой форме с множеством игроков [math]\displaystyle{ \ I }[/math] представляется с использованием ориентированного дерева (дерева игры) следующим образом.

Вершины дерева представляют собой состояния (позиции), в которых может оказываться игра, ребра — ходы, которые могут использовать игроки. Предполагается, что в каждой позиции может совершать ход не более одного игрока. Выделяется три вида позиций в игре:

  • начальная, представляемая корнем дерева (вершиной, не имеющей входящих ребер);
  • промежуточные, имеющие входящие и выходящие ребра;
  • терминальные, имеющие только входящие ребра.

Начальная и промежуточные позиции образуют множество нетерминальных позиций.

Для каждой вершины дерева [math]\displaystyle{ \ v }[/math], соответствующей нетерминальной позиции, определен игрок [math]\displaystyle{ \ i }[/math], совершающий в ней ход и множество ходов этого игрока [math]\displaystyle{ \ S_v }[/math]. Каждому ходу [math]\displaystyle{ \ s \in \ S_v }[/math] соответствует ребро, выходящее из вершины [math]\displaystyle{ \ v }[/math].

Для учёта несовершенства информации, имеющейся у игроков, нетерминальные вершины могут объединяться в информационные множества.

Для каждой вершины [math]\displaystyle{ \ v }[/math], соответствующей терминальной позиции, определены функции выигрыша всех игроков [math]\displaystyle{ \ H_i(v) }[/math].

Игра предполагает следующий порядок разыгрывания:

1. Игра начинается из начальной позиции.

2. В любой нетерминальной позиции [math]\displaystyle{ \ v }[/math] игрок, имеющий в ней право хода, выбирает ход [math]\displaystyle{ \ s \in \ S_v }[/math], в результате чего игра попадает в следующую позицию, в которую входит ребро, соответствующее ходу [math]\displaystyle{ \ s }[/math]. Если эта позиция является нетерминальной, то повторяется п. 2.

3. Если игра попадает в терминальную позицию [math]\displaystyle{ \ v }[/math], то все игроки получают выигрыши [math]\displaystyle{ \ H_i(v) }[/math], и игра завершается.

Принципы оптимальности

Основным принципом оптимальности стратегий для некооперативных игр в нормальной форме является равновесие Нэша, основанное на невозможности отклонений участников от выбранных стратегий. К настоящему времени разработано семейство принципов, основанных на равновесии Нэша, и называемых очищениями равновесия Нэша (Nash equilibrium refinements), наиболее часто используемыми среди которых являются:

Менее универсальными, используемыми в отдельных классах некооперативных игр, являются следующие принципы:

Для некооперативных игр в развернутой форме также используются принципы оптимальности, основанные на равновесии Нэша, но учитывающие специфику динамического взаимодействия игроков. К основным из них относятся:

Примеры

См. также

Литература

  • Петросян Л. А., Зенкевич Н.А., Семина Е.А. Теория игр: Учеб. пособие для ун-тов. — М.: Высш. шк., Книжный дом «Университет», 1998. — С. 304. — ISBN 5-06-001005-8, 5-8013-0007-4.
  • Васин А. А., Морозов В. В. Теория игр и модели математической экономики. — М.: Макс-пресс, 2005. — 272 с. — ISBN 5-317-01388-7.
  • Васин А.А. Некооперативные игры в природе и обществе. М.: Макс Пресс, 2005, 412 с. ISBN 5-317-01306-2.