「戦略形ゲーム」の版間の差分

2008年4月4日 (金) 10:29時点における最新版

【せんりゃくけいげーむ (strategic form game)】

概要

プレイヤーの集合, 各プレイヤーのとりうる戦略の集合, および, 各プレイヤーの利得関数を記述することによりゲームを表現する形式. 標準形ゲームともいう.

詳説

　ゲームに参加するプレイヤーの集合を構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle N\, } , 各プレイヤー $i\,$ のとりうる戦略の全体を $S_{i}\,$ , および $S=S_{1}\times \cdots \times S_{n}\,$ 上で定義された各プレイヤー $i\,$ のフォンノイマン・モルゲンシュテルン効用関数 (von Neumann-Morgenstern utility function) を構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle u_i\, } とするとき,

構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G=(N; S_1, \ldots , S_n; u_1, \ldots , u_n)\, }

を戦略形ゲーム (game in strategic form) または標準形ゲーム (game in normal form) という. 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle N\, } と構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle S_i\, } がすべて有限集合であるとき, $G\,$ を有限ゲームという. 効用関数構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle u_i\, } は, また利得関数 (payoff function) ともいい, その値を利得という.

　戦略形で書かれたゲームは, 特にことわらない限り非協力ゲームである. 戦略の数が有限な2人ゲームは次のような利得双行列 (payoff bimatrix) で表現することができるので, 双行列ゲーム (bimatrix game) ということがある.

　ここに, 縦の構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle 1, \ldots, m\, } はプレイヤー1の戦略, 横の構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle 1, \ldots, n\, } はプレイヤー2の戦略であり, $a_{ij},b_{ij}\,$ は, プレイヤー1, 2が各々戦略構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle i, \ j\, } をとったときの, プレイヤー1, 2の利得である. 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle a_{ij}\, } を成分とする行列を $A\,$ , 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle b_{ij}\, } を成分とする行列を構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle B\, } と表し, 利得双行列を簡単に構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (A, B)\, } と表す. すべての構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle i, \ j\, } について, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle a_{ij} + b_{ij} = 0\, } となる場合が2人ゼロ和ゲーム (two-person zerosum game) の戦略形である. 行列 $B\,$ は $A\,$ の符号を変えたものであり, 行列構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle A\, } だけでゲームを記述できるので2人ゼロ和ゲームを行列ゲーム (matrix game) ということもある.

　双行列ゲーム構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (A, B)\, } において, 各プレイヤーの混合戦略 (mixed strategy) を各々構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle p=(p_1, \ldots , p_m)\, } , 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle q=( q_1, \ldots , q_n)\, } とすると, 各プレイヤーの利得の期待値 (期待利得) は各々構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle pAq^{\top}\, } および構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle pBq^{\top}\, } で与えられる. $q^{\top }\,$ は構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle q\, } の転置ベクトルを表す. また, 混合戦略に対してもとの戦略を純戦略 (pure strategy) という. ナッシュ均衡構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (p^*, q^*)\, } は, 非協力ゲーム理論の項で述べた定義によって,

構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle p^*Aq^{*\top} \ge pAq^{*\top}, \ p^*Bq^{*\top} \ge p^*Bq^{\top}, \ \mbox{ for all } p, \ q \, }

をみたす混合戦略の組である. とくに, ゼロ和ゲームでは, $B=-A\,$ であるから

構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle pAq^{*\top} \le p^*Aq^{*\top} \le p^*Aq^{\top} , \ \ \mbox{ for all } p, \ q \, }

となり, これからミニマックス定理 (minimax theorem)　

構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mbox{max}_{p} \mbox{min}_{q} \ pAq^{\top} \ =\ \mbox{min}_{q}\mbox{max}_{p}\ \ pAq^{\top} \, }

が導かれ, さらにこの値は構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle p^*Aq^{*\top}\, } に等しい. 左辺の値をマックスミニ値 (maxmin value), 右辺の値をミニマックス値(minimax value), さらに, この共通の値をゲームの値 (value of a game) という. また, このときの戦略構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle p^*, \ q^*\, } を各々マックスミニ戦略 (maxmin strategy), ミニマックス戦略 (minimax strategy) という. 　次に示すのは, 左が囚人のジレンマ (prisoner's dilemma), 右が逢い引きのジレンマ (battle of the sexes) という名で知られる有名な双行列ゲームである.

囚人のジレンマでは, 純戦略の組構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (d, \ d)\, } のみが, また, 逢い引きのジレンマでは, 純戦略の組構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (a, \ a)\, } および構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (b, \ b)\, } と, 混合戦略の組構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle ((2/3, 1/3)\, } , 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (1/3, 2/3))\, } がナッシュ均衡である. とくに, 囚人のジレンマのナッシュ均衡では, 戦略構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle d\, } は相手のすべての戦略に対する最適反応 (best reply) となっている. このようなナッシュ均衡を, 支配戦略均衡 (dominant strategy equilibrium) ということがある. 逢い引きのジレンマには支配戦略は存在しない. また, 逢い引きのジレンマでは, 混合戦略ナッシュ均衡における利得の組構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (2/3, \ 2/3)\, } は, たとえば純粋戦略ナッシュ均衡構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (a, \ a)\, } における利得の組構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (2, \ 1)\, } に対して各プレイヤーについて劣っている. このとき, 利得の組構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (2/3, \ 2/3)\, } は構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (2, \ 1)\, } にパレート支配 (Pareto dominate) されるという.

　戦略形ゲームにおいて, もし, 各プレイヤーが共通の偶然機構にもとづいて戦略を選ぶことが許されているならば, 各プレイヤーは互いに相関した行動をとることができる. このような戦略を相関戦略 (correlated strategy) という. たとえば, 逢い引きのジレンマで, コインを投げて表が出たら戦略の組構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (a, \ a)\, } , 裏が出たら構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (b, \ b)\, } とすることに2人が合意したとしよう. つまり, 2人とも, 表が出たら構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle a\, } をとり, 裏が出たら構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle b\, } をとるという相関戦略をとるものとする. このような合意がナッシュ均衡になるとき, すなわち, 相関戦略の組がナッシュ均衡となっているとき, これを相関均衡 (correlated equilibrium) という. 上に述べた相関戦略の組は相関均衡であり, 2人の期待利得はともに構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle 3/2\, } となることが容易にわかる. また, 混合戦略均衡は互いに独立な相関戦略からなる相関均衡にほかならない. 相関均衡の正式な定義については, たとえば [3] など参照. 　

　以上のゲームでは, 戦略形構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G\, } についての知識がすべてのプレイヤーの間で共有知識 (common knowledge) であると仮定されており, これらは完備情報ゲーム (game with complete information) といわれている. 他方, 不完備情報ゲームはハルサーニ(J. C. Harsanyi) [2] の定式化によって分析できるようになった. たとえば, 利得関数構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle u_i\, } に関する情報が不完備な場合は, まず有限個のパラメター構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle t_{i1}, t_{i2}, \ldots, t_{ik} \in T_i\, } を導入し, プレイヤー構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle i\, } の利得関数は, そのタイプによって, 有限個の利得関数構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle u_i(\cdot|t_{i1}), u_i(\cdot| t_{i2}), \ldots, u_i(\cdot| t_{ik})\, } (以下, まとめて構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle u_{i}(\cdot|t_{i})\, } と表す. )のうちのどれか1つに定まる, と定式化し直すことにより, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle u_{i}\, } に関する不完備情報を表現する. この構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle t_i \in T_i\, } をプレイヤー構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle i\, } のタイプという. 各プレイヤー構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle i\, } は自分はどのタイプであるかを知っているが, 他のプレイヤーのタイプは知らない. ただし, 他のすべてのプレイヤーのタイプ構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle t_{-i} = (t_1 , \ldots, t_{i-1}, t_{i+1}, \ldots , t_n )\, } について条件付き確率構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle p_i(t_{-i}|t_i)\, } によって構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle t_{-i}\, } を推測することができるとする. こうして, 新たな戦略形ゲーム

構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G'= (N, S_1, \ldots , S_n; p_1, \ldots , p_n; T_1, \ldots, T_n; u_1(\cdot|t_1), \ldots , u_n(\cdot|t_n))\, }

がえられる. これをベイジアンゲーム (Bayesian game) という. また, 関数構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle s_i : T_i \rightarrow S_i\, } をベイジアンゲームの戦略という. すなわち, プレイヤー構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle i\, } は, 自分のタイプを知ってはいるが, どのタイプであったとしてもそのもとでの行動を指定しておくことがこの場合の戦略である. するとナッシュ均衡は, すべてのプレイヤー構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle i\, } とタイプ構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle t_i\, } および構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle a_{i} \in S_{i}\, } について次の条件をみたす戦略の組構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle s^*=(s^*_1, \ldots , s^*_n)\, } である. この戦略の組を, ベイジアンナッシュ均衡 (Bayesian Nash equilibrium) という.

構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \sum_{t_{-i} \in T_{-i}} u_i(s^*(t)|t_i)p_i(t_{-i}|t_i) \ \ge\ \sum_{t_{-i} \in T_{-i}} u_i(s^*_{-i}(t_{-i}), a_i | t_i)p_i(t_{-i}|t_i)\, }

ただし, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle s^*(t)=(s^*_{-i}(t_{-i}), s^*_i(t_i))=(s^*_1(t_1), \ldots, s^*_n(t_n))\, } である. ベイジアンゲームは, 80年代以降, 情報経済学や産業組織論などの新しい分野の発展に大きく貢献している. これについてはたとえば, [1] を参照.

参考文献

[1] R. Gibbons, Game Theory for Applied Economists, Princeton University Press, 1992. /福岡正夫, 須田伸一, 『経済学のためのゲーム理論入門』, 創文社, 1995.

[2] J. C. Harsanyi, "Games with Incomplete Information Played by `Bayesian' Players, parts I, II and III", Management Science, 14 (1967-8), 159-182, 320-334, 486-502.

[3] M. J. Osborne and A. Rubinstein, A Course in Game Theory, MIT Press, 1994.

@@ 1行目: / 1行目: @@
 '''【せんりゃくけいげーむ (strategic form game)】'''
+=== 概要 ===
 プレイヤーの集合, 各プレイヤーのとりうる戦略の集合, および, 各プレイヤーの利得関数を記述することによりゲームを表現する形式. 標準形ゲームともいう.
-詳しくは[[《戦略形ゲーム》|基礎編：戦略形ゲーム]]を参照.
+=== 詳説 ===
+　ゲームに参加する[[プレイヤー]]の集合を<math>N\, </math>, 各プレイヤー<math>i\, </math>のとりうる[[戦略 (ゲーム理論における)|戦略]]の全体を<math>S_i\, </math>, および<math>S=S_1 \times \cdots \times S_n\, </math> 上で定義された各プレイヤー<math>i\, </math> の[[フォンノイマン・モルゲンシュテルン効用関数]] (von Neumann-Morgenstern utility function) を<math>u_i\, </math> とするとき,
+<center>
+<math>G=(N; S_1, \ldots , S_n; u_1, \ldots , u_n)\, </math>
+</center>
+を[[戦略形ゲーム]] (game in strategic form) または[[標準形ゲーム]] (game in normal form) という. <math>N\, </math> と<math>S_i\, </math> がすべて有限集合であるとき, <math>G\, </math> を有限ゲームという. 効用関数<math>u_i\, </math> は, また[[利得関数]] (payoff function) ともいい, その値を利得という.
+　戦略形で書かれたゲームは, 特にことわらない限り[[非協力ゲーム]]である. 戦略の数が有限な2人ゲームは次のような[[利得双行列 (ゲームの)|利得双行列]] (payoff bimatrix) で表現することができるので, [[双行列ゲーム]] (bimatrix game) ということがある.
+<center>
+[[画像:sk-0071-a-g-03-1.png]]
+</center>
+<!--
+\[ \begin{array}{@{\ }c|ccc@{\ }}
+          & 1             & \ldots   & n                \\  \hline
+    & a_{11}, b_{11}    & \ldots   & a_{1n}, b_{1n}    \\
+   \vdots & \vdots            & \ddots   & \vdots           \\
+     m    & a_{m1}, b_{m1}    & \ldots   & a_{mn}, b_{mn}
+   \end{array}
+\]
+-->
+　ここに, 縦の<math>1, \ldots, m\, </math>はプレイヤー1の戦略, 横の<math>1, \ldots, n\, </math>はプレイヤー2の戦略であり, <math>a_{ij}, b_{ij}\, </math> は, プレイヤー1, 2が各々戦略<math>i, \ j\, </math>をとったときの, プレイヤー1, 2の利得である. <math>a_{ij}\, </math>を成分とする行列を<math>A\, </math>, <math>b_{ij}\, </math>を成分とする行列を<math>B\, </math>と表し, 利得双行列を簡単に<math>(A, B)\, </math>と表す. すべての<math>i, \ j\, </math>について, <math>a_{ij} + b_{ij} = 0\, </math>となる場合が[[2人ゼロ和ゲーム]] (two-person zerosum game) の戦略形である. 行列<math>B\, </math>は<math>A\, </math>の符号を変えたものであり, 行列<math>A\, </math>だけでゲームを記述できるので2人ゼロ和ゲームを[[行列ゲーム]] (matrix game) ということもある.
+　双行列ゲーム<math>(A, B)\, </math>において, 各プレイヤーの[[混合戦略]] (mixed strategy) を各々<math>p=(p_1, \ldots , p_m)\, </math>, <math>q=( q_1, \ldots , q_n)\, </math> とすると, 各プレイヤーの利得の期待値 (期待利得) は各々 <math>pAq^{\top}\, </math> および  <math>pBq^{\top}\, </math> で与えられる. <math>q^{\top}\, </math>は<math>q\, </math>の転置ベクトルを表す. また, 混合戦略に対してもとの戦略を[[純戦略]] (pure strategy) という. [[ナッシュ均衡]] <math>(p^*, q^*)\, </math>は, [[非協力ゲーム理論]]の項で述べた定義によって,
+<center>
+<math>p^*Aq^{*\top} \ge pAq^{*\top}, \  p^*Bq^{*\top} \ge p^*Bq^{\top}, \ \mbox{ for all } p, \ q \, </math>
+</center>
+をみたす混合戦略の組である. とくに, ゼロ和ゲームでは, <math>B=-A\, </math>であるから
+<center>
+<math>pAq^{*\top} \le p^*Aq^{*\top} \le p^*Aq^{\top} , \ \ \mbox{ for all } p, \ q \, </math>
+</center>
+となり, これから[[ミニマックス定理 (ゲーム理論における)|ミニマックス定理]] (minimax theorem)
+<center>
+<math>\mbox{max}_{p} \mbox{min}_{q} \ pAq^{\top} \ =\ \mbox{min}_{q}\mbox{max}_{p}\ \ pAq^{\top} \, </math>
+</center>
+が導かれ, さらにこの値は<math>p^*Aq^{*\top}\, </math>に等しい. 左辺の値をマックスミニ値 (maxmin value), 右辺の値をミニマックス値(minimax value), さらに, この共通の値を[[ゲームの値]] (value of a game) という. また, このときの戦略<math>p^*, \ q^*\, </math>を各々[[マックスミニ戦略]] (maxmin strategy), [[ミニマックス戦略]] (minimax strategy) という.
+　次に示すのは, 左が囚人のジレンマ (prisoner's dilemma), 右が逢い引きのジレンマ (battle of the sexes) という名で知られる有名な双行列ゲームである.
+<center>
+[[画像:sk-0071-a-g-03-2.png]]
+</center>
+<!--
+\[ \begin{array}{@{\  }c|ccc@{\  }}
+           & c       & d                \\  \hline
+      c    & 3, 3    & 0, 4    \\
+      d    & 4, 0    & 1, 1
+    \end{array}
+    \ \ \ \ \ \ \ \ \ \ \ \ \ \
+    \begin{array}{@{\  }c|ccc@{\  }}
+           & a       & b                \\  \hline
+      a    & 2, 1    & 0, 0    \\
+      b    & 0, 0    & 1, 2
+    \end{array}
+\]
+-->
+囚人のジレンマでは, 純戦略の組 <math>(d, \ d)\, </math>のみが, また, 逢い引きのジレンマでは, 純戦略の組 <math>(a, \ a)\, </math>および<math>(b, \ b)\, </math>と, 混合戦略の組 <math>((2/3, 1/3)\, </math>, <math>(1/3, 2/3))\, </math>がナッシュ均衡である. とくに, 囚人のジレンマのナッシュ均衡では, 戦略<math>d\, </math>は相手のすべての戦略に対する[[最適反応 (ゲーム理論における)|最適反応]] (best reply) となっている. このようなナッシュ均衡を, [[支配戦略]]均衡 (dominant strategy equilibrium) ということがある. 逢い引きのジレンマには支配戦略は存在しない. また, 逢い引きのジレンマでは, 混合戦略ナッシュ均衡における利得の組<math>(2/3, \ 2/3)\, </math>は, たとえば純粋戦略ナッシュ均衡<math>(a, \ a)\, </math>における利得の組<math>(2, \ 1)\, </math>に対して各プレイヤーについて劣っている. このとき, 利得の組<math>(2/3, \ 2/3)\, </math>は<math>(2, \ 1)\, </math>に[[パレート支配]] (Pareto dominate) されるという.
+　戦略形ゲームにおいて, もし, 各プレイヤーが共通の偶然機構にもとづいて戦略を選ぶことが許されているならば, 各プレイヤーは互いに相関した行動をとることができる. このような戦略を[[相関戦略]] (correlated strategy) という. たとえば, 逢い引きのジレンマで, コインを投げて表が出たら戦略の組<math>(a, \ a)\, </math>, 裏が出たら<math>(b, \ b)\, </math>とすることに2人が合意したとしよう. つまり, 2人とも, 表が出たら<math>a\, </math>をとり, 裏が出たら<math>b\, </math>をとるという相関戦略をとるものとする. このような合意がナッシュ均衡になるとき, すなわち, 相関戦略の組がナッシュ均衡となっているとき, これを[[相関均衡]] (correlated equilibrium) という. 上に述べた相関戦略の組は相関均衡であり, 2人の期待利得はともに<math>3/2\, </math>となることが容易にわかる. また, 混合戦略均衡は互いに独立な相関戦略からなる相関均衡にほかならない. 相関均衡の正式な定義については, たとえば [3] など参照.
+　以上のゲームでは, 戦略形<math>G\, </math>についての知識がすべてのプレイヤーの間で[[共有知識]] (common knowledge) であると仮定されており, これらは[[完備情報ゲーム]] (game with complete information) といわれている. 他方, 不完備情報ゲームはハルサーニ(J.  C. Harsanyi) [2] の定式化によって分析できるようになった. たとえば, 利得関数<math>u_i\, </math>に関する情報が不完備な場合は, まず有限個のパラメター<math>t_{i1}, t_{i2}, \ldots, t_{ik} \in T_i\, </math>を導入し, プレイヤー<math>i\, </math>の利得関数は, そのタイプによって, 有限個の利得関数<math>u_i(\cdot|t_{i1}), u_i(\cdot| t_{i2}), \ldots, u_i(\cdot| t_{ik})\, </math> (以下, まとめて<math>u_{i}(\cdot|t_{i})\, </math>と表す. )のうちのどれか1つに定まる, と定式化し直すことにより, <math>u_{i}\, </math>に関する不完備情報を表現する. この<math>t_i \in T_i\, </math>をプレイヤー<math>i\, </math>のタイプという. 各プレイヤー<math>i\, </math>は自分はどのタイプであるかを知っているが, 他のプレイヤーのタイプは知らない. ただし, 他のすべてのプレイヤーのタイプ<math>t_{-i} = (t_1 , \ldots, t_{i-1}, t_{i+1}, \ldots , t_n )\, </math>について条件付き確率<math>p_i(t_{-i}|t_i)\, </math>によって<math>t_{-i}\, </math>を推測することができるとする. こうして, 新たな戦略形ゲーム
+<center>
+<math>G'= (N, S_1, \ldots , S_n;
+                        p_1, \ldots , p_n; T_1, \ldots, T_n;
+                        u_1(\cdot|t_1), \ldots , u_n(\cdot|t_n))\, </math>
+</center>
+がえられる. これを[[ベイジアンゲーム]] (Bayesian game) という. また, 関数<math>s_i : T_i \rightarrow S_i\, </math>をベイジアンゲームの戦略という. すなわち, プレイヤー<math>i\, </math>は, 自分のタイプを知ってはいるが, どのタイプであったとしてもそのもとでの行動を指定しておくことがこの場合の戦略である. するとナッシュ均衡は, すべてのプレイヤー<math>i\, </math>とタイプ<math>t_i\, </math>および<math>a_{i} \in S_{i}\, </math> について次の条件をみたす戦略の組<math>s^*=(s^*_1, \ldots , s^*_n)\, </math>である. この戦略の組を, [[ベイジアンナッシュ均衡]] (Bayesian  Nash equilibrium) という.
+<center>
+<math>\sum_{t_{-i} \in T_{-i}} u_i(s^*(t)|t_i)p_i(t_{-i}|t_i)
+     \   \ge\   \sum_{t_{-i} \in T_{-i}} u_i(s^*_{-i}(t_{-i}), a_i
+                        | t_i)p_i(t_{-i}|t_i)\, </math>
+</center>
+ただし, <math>s^*(t)=(s^*_{-i}(t_{-i}), s^*_i(t_i))=(s^*_1(t_1), \ldots, s^*_n(t_n))\, </math>である. ベイジアンゲームは, 80年代以降, 情報経済学や産業組織論などの新しい分野の発展に大きく貢献している. これについてはたとえば, [1] を参照.
+----
+'''参考文献'''
+[1] R. Gibbons, ''Game Theory for Applied Economists'', Princeton University Press, 1992. /福岡正夫, 須田伸一, 『経済学のためのゲーム理論入門』, 創文社, 1995.
+[2] J. C. Harsanyi, "Games with Incomplete Information Played by `Bayesian' Players, parts I, II and III", ''Management Science'', '''14''' (1967-8), 159-182, 320-334, 486-502.
+[3] M. J. Osborne and A. Rubinstein, ''A Course in Game Theory'', MIT Press, 1994.
+[[category:ゲーム理論|せんりゃくけいげーむ]]

「戦略形ゲーム」の版間の差分

2008年4月4日 (金) 10:29時点における最新版

概要

詳説

案内メニュー

検索