《戦略形ゲーム》
【せんりゃくけいげーむ (game in strategic form) 】
ゲームに参加するプレイヤーの集合を$N$, 各プレイヤー$i$のとりうる戦略の全体を$S_i$, および$S=S_1 \times \cdots \times S_n$ 上で定義された各プレイヤー$i$ のフォンノイマン・モルゲンシュテルン効用関数 (von Neumann-Morgenstern utility function) を$u_i$ とするとき,
G=(N; S_1, \ldots , S_n; u_1, \ldots , u_n)
を戦略形ゲーム (game in strategic form) または標準形ゲーム (game in normal form) という. $N$ と$S_i$ がすべて有限集合であるとき, $G$ を有限ゲームという. 効用関数$u_i$ は, また利得関数 (payoff function) ともいい, その値を利得という.
戦略形で書かれたゲームは, 特にことわらない限り非協力ゲームである. 戦略の数が有限な2人ゲームは次のような利得双行列 (payoff bimatrix) で表現することができるので, 双行列ゲーム (bimatrix game) ということがある.
\begin{array}{@{\ }c|ccc@{\ }} & 1 & \ldots & n \\ \hline 1 & a_{11}, b_{11} & \ldots & a_{1n}, b_{1n} \\ \vdots & \vdots & \ddots & \vdots \\ m & a_{m1}, b_{m1} & \ldots & a_{mn}, b_{mn} \end{array}
ここに, 縦の$1, \ldots, m$はプレイヤー1の戦略, 横の$1, \ldots, n$はプレイヤー2の戦略であり, $a_{ij}, b_{ij}$ は, プレイヤー1, \2が各々戦略$i, \ j$をとったときの, プレイヤー1, \ 2の利得である. $a_{ij}$を成分とする行列を$A$, $b_{ij}$を成分とする行列を$B$と表し, 利得双行列を簡単に$(A, B)$と表す. すべての$i, \ j$について, $a_{ij} + b_{ij} = 0$となる場合が2人ゼロ和ゲーム (two-person zerosum game) の戦略形である. 行列$B$は$A$の符号を変えたものであり, 行列$A$だけでゲームを記述できるので2人ゼロ和ゲームを行列ゲーム (matrix game) ということもある.
双行列ゲーム$(A, B)$において, 各プレイヤーの混合戦略 (mixed strategy) を各々$p=(p_1, \ldots , p_m)$, $q=( q_1, \ldots , q_n) $とすると, 各プレイヤーの利得の期待値 (期待利得) は各々 $pAq^{\top}$ および $pBq^{\top} $で与えられる. $q^{\top}$は$q$の転置ベクトルを表す. また, 混合戦略に対してもとの戦略を純戦略 (pure strategy) という. ナッシュ均衡 $(p^*, q^*)$は, 非協力ゲーム理論の項で述べた定義によって,
p^*Aq^{*\top} \ge pAq^{*\top}, \ p^*Bq^{*\top} \ge p^*Bq^{\top}, \ \mbox{ for all } p, \ q
をみたす混合戦略の組である. とくに, ゼロ和ゲームでは, $B=-A$であるから
pAq^{*\top} \le p^*Aq^{*\top} \le p^*Aq^{\top} , \ \ \mbox{ for all } p, \ q
となり, これからミニマックス定理 (minimax theorem)
\mbox{ max}_{p} \mbox{min}_{q}\ pAq^{\top}\ =\ \mbox{min}_{q} \mbox{max}_{p}\pAq^{\top}
が導かれ, さらにこの値は$p^*Aq^{*\top}$に等しい. 左辺の値をマックスミニ値 (maxmin value), 右辺の値をミニマックス値(minimax value), さらに, この共通の値をゲームの値 (value of a game) という. また, このときの戦略$p^*, \ q^*$を各々マックスミニ戦略 (maxmin strategy), ミニマックス戦略 (minimax strategy) という. 次に示すのは, 左が囚人のジレンマ (prisoner's dilemma), 右が逢い引きのジレンマ (battle of the sexes) という名で知られる有名な双行列ゲームである.
\begin{array}{@{\ }c|ccc@{\ }} & c & d \\ \hline c & 3, 3 & 0, 4 \\ d & 4, 0 & 1, 1 \end{array} \ \ \ \ \ \ \ \ \ \ \ \ \ \ \begin{array}{@{\ }c|ccc@{\ }} & a & b \\ \hline a & 2, 1 & 0, 0 \\ b & 0, 0 & 1, 2 \end{array}
囚人のジレンマでは, 純戦略の組\ $(d, \d)$のみが, また, 逢い引きのジレンマでは, 純戦略の組\ $(a, \ a)$および$(b, \ b)$と, 混合戦略の組\ $((2/3, 1/3)$, $(1/3, 2/3))$がナッシュ均衡である. とくに, 囚人のジレンマのナッシュ均衡では, 戦略$d$は相手のすべての戦略に対する最適反応 (best reply) となっている. このようなナッシュ均衡を, 支配戦略均衡 (dominant strategy equilibrium) ということがある. 逢い引きのジレンマには支配戦略は存在しない. また, 逢い引きのジレンマでは, 混合戦略ナッシュ均衡における利得の組$(2/3, \ 2/3)$は, たとえば純粋戦略ナッシュ均衡$(a, \ a)$における利得の組$(2, \ 1)$に対して各プレイヤーについて劣っている. このとき, 利得の組$(2/3, \ 2/3)$は$(2, \ 1)$にパレート支配 (Pareto dominate) されるという.
戦略形ゲームにおいて, もし, 各プレイヤーが共通の偶然機構にもとづいて戦略を選ぶことが許されているならば, 各プレイヤーは互いに相関した行動をとることができる. このような戦略を相関戦略 (correlated strategy) という. たとえば, 逢い引きのジレンマで, コインを投げて表が出たら戦略の組$(a, \ a)$, 裏が出たら$(b, \ b)$とすることに2人が合意したとしよう. つまり, 2人とも, 表が出たら$a$をとり, 裏が出たら$b$をとるという相関戦略をとるものとする. このような合意がナッシュ均衡になるとき, すなわち, 相関戦略の組がナッシュ均衡となっているとき, これを相関均衡 (correlated equilibrium) という. 上に述べた相関戦略の組は相関均衡であり, 2人の期待利得はともに$3/2$となることが容易にわかる. また, 混合戦略均衡は互いに独立な相関戦略からなる相関均衡にほかならない. 相関均衡の正式な定義については, たとえば [3 など参照.
以上のゲームでは, 戦略形$G$についての知識がすべてのプレイヤーの間で共有知識 (common knowledge) であると仮定されており, これらは完備情報ゲーム (game with complete information) といわれている. 他方, 不完備情報ゲームはハルサーニ(J. C. Harsanyi) [2] の定式化によって分析できるようになった. たとえば, 利得関数$u_i$に関する情報が不完備な場合は, まず有限個のパラメター$t_{i1}, t_{i2}, \ldots, t_{ik} \in T_i$を導入し, プレイヤー$i$の利得関数は, そのタイプによって, 有限個の利得関数$u_i(\cdot|t_{i1}), u_i(\cdot| t_{i2}), \ldots, u_i(\cdot| t_{ik})$(以下, まとめて$u_{i}(\cdot|t_{i})$と表す. )のうちのどれか1つに定まる, と定式化し直すことにより, $u_{i}$に関する不完備情報を表現する. この$t_i \in T_i$をプレイヤー$i$のタイプという. 各プレイヤー$i$は自分はどのタイプであるかを知っているが, 他のプレイヤーのタイプは知らない. ただし, 他のすべてのプレイヤーのタイプ$t_{-i} = (t_1 , \ldots, t_{i-1}, t_{i+1}, \ldots , t_n )$について条件付き確率$p_i(t_{-i}|t_i)$によって$t_{-i}$を推測することができるとする. こうして, 新たな戦略形ゲーム
G'= (N, S_1, \ldots , S_n;
p_1, \ldots , p_n; T_1, \ldots, T_n; u_1(\cdot|t_1), \ldots , u_n(\cdot|t_n))
がえられる. これをベイジアンゲーム (Bayesian game) という. また, 関数$s_i : T_i \rightarrow S_i$をベイジアンゲームの戦略という. すなわち, プレイヤー$i$は, 自分のタイプを知ってはいるが, どのタイプであったとしてもそのもとでの行動を指定しておくことがこの場合の戦略である. するとナッシュ均衡は, すべてのプレイヤー$i$とタイプ$t_i$および$a_{i} \in S_{i}$ について次の条件をみたす戦略の組$s^*=(s^*_1, \ldots , s^*_n)$である. この戦略の組を, ベイジアンナッシュ均衡 (Bayesian Nash equilibrium) という.
\sum_{t_{-i} \in T_{-i}} u_i(s^*(t)|t_i)p_i(t_{-i}|t_i) \ \ge\ \sum_{t_{-i} \in T_{-i}} u_i(s^*_{-i}(t_{-i}), a_i | t_i)p_i(t_{-i}|t_i)
ただし, $s^*(t)=(s^*_{-i}(t_{-i}), s^*_i(t_i))=(s^*_1(t_1), \ldots, s^*_n(t_n))$である. ベイジアンゲームは, 80年代以降, 情報経済学や産業組織論などの新しい分野の発展に大きく貢献している. これについてはたとえば, [1] を参照.
参考文献
[1] R. Gibbons, Game Theory for Applied Economists, Princeton University Press, 1992.
[2] J. C. Harsanyi, "Games with Incomplete Information Played by `Bayesian' Players, parts I, II and III", Management Science, 14 (1967-8), 159-182, 320-334, 486-502.
[3] M. J. Osborne and A. Rubinstein, A Course in Game Theory, MIT Press, 1994.