「戦略形ゲーム」の版間の差分
(新しいページ: ''''【せんりゃくけいげーむ (strategic form game)】''' プレイヤーの集合, 各プレイヤーのとりうる戦略の集合, および, 各プレイヤーの...') |
Tetsuyatominaga (トーク | 投稿記録) |
||
(2人の利用者による、間の2版が非表示) | |||
1行目: | 1行目: | ||
'''【せんりゃくけいげーむ (strategic form game)】''' | '''【せんりゃくけいげーむ (strategic form game)】''' | ||
+ | |||
+ | === 概要 === | ||
プレイヤーの集合, 各プレイヤーのとりうる戦略の集合, および, 各プレイヤーの利得関数を記述することによりゲームを表現する形式. 標準形ゲームともいう. | プレイヤーの集合, 各プレイヤーのとりうる戦略の集合, および, 各プレイヤーの利得関数を記述することによりゲームを表現する形式. 標準形ゲームともいう. | ||
+ | |||
+ | === 詳説 === | ||
+ | ゲームに参加する[[プレイヤー]]の集合を<math>N\, </math>, 各プレイヤー<math>i\, </math>のとりうる[[戦略 (ゲーム理論における)|戦略]]の全体を<math>S_i\, </math>, および<math>S=S_1 \times \cdots \times S_n\, </math> 上で定義された各プレイヤー<math>i\, </math> の[[フォンノイマン・モルゲンシュテルン効用関数]] (von Neumann-Morgenstern utility function) を<math>u_i\, </math> とするとき, | ||
+ | |||
+ | |||
+ | <center> | ||
+ | <math>G=(N; S_1, \ldots , S_n; u_1, \ldots , u_n)\, </math> | ||
+ | </center> | ||
+ | |||
+ | |||
+ | を[[戦略形ゲーム]] (game in strategic form) または[[標準形ゲーム]] (game in normal form) という. <math>N\, </math> と<math>S_i\, </math> がすべて有限集合であるとき, <math>G\, </math> を有限ゲームという. 効用関数<math>u_i\, </math> は, また[[利得関数]] (payoff function) ともいい, その値を利得という. | ||
+ | |||
+ | 戦略形で書かれたゲームは, 特にことわらない限り[[非協力ゲーム]]である. 戦略の数が有限な2人ゲームは次のような[[利得双行列 (ゲームの)|利得双行列]] (payoff bimatrix) で表現することができるので, [[双行列ゲーム]] (bimatrix game) ということがある. | ||
+ | |||
+ | |||
+ | <center> | ||
+ | |||
+ | [[画像:sk-0071-a-g-03-1.png]] | ||
+ | |||
+ | </center> | ||
+ | |||
+ | <!-- | ||
+ | \[ \begin{array}{@{\ }c|ccc@{\ }} | ||
+ | |||
+ | & 1 & \ldots & n \\ \hline | ||
+ | 1 & a_{11}, b_{11} & \ldots & a_{1n}, b_{1n} \\ | ||
+ | \vdots & \vdots & \ddots & \vdots \\ | ||
+ | m & a_{m1}, b_{m1} & \ldots & a_{mn}, b_{mn} | ||
+ | \end{array} | ||
+ | \] | ||
+ | --> | ||
+ | |||
+ | |||
+ | ここに, 縦の<math>1, \ldots, m\, </math>はプレイヤー1の戦略, 横の<math>1, \ldots, n\, </math>はプレイヤー2の戦略であり, <math>a_{ij}, b_{ij}\, </math> は, プレイヤー1, 2が各々戦略<math>i, \ j\, </math>をとったときの, プレイヤー1, 2の利得である. <math>a_{ij}\, </math>を成分とする行列を<math>A\, </math>, <math>b_{ij}\, </math>を成分とする行列を<math>B\, </math>と表し, 利得双行列を簡単に<math>(A, B)\, </math>と表す. すべての<math>i, \ j\, </math>について, <math>a_{ij} + b_{ij} = 0\, </math>となる場合が[[2人ゼロ和ゲーム]] (two-person zerosum game) の戦略形である. 行列<math>B\, </math>は<math>A\, </math>の符号を変えたものであり, 行列<math>A\, </math>だけでゲームを記述できるので2人ゼロ和ゲームを[[行列ゲーム]] (matrix game) ということもある. | ||
+ | |||
+ | 双行列ゲーム<math>(A, B)\, </math>において, 各プレイヤーの[[混合戦略]] (mixed strategy) を各々<math>p=(p_1, \ldots , p_m)\, </math>, <math>q=( q_1, \ldots , q_n)\, </math> とすると, 各プレイヤーの利得の期待値 (期待利得) は各々 <math>pAq^{\top}\, </math> および <math>pBq^{\top}\, </math> で与えられる. <math>q^{\top}\, </math>は<math>q\, </math>の転置ベクトルを表す. また, 混合戦略に対してもとの戦略を[[純戦略]] (pure strategy) という. [[ナッシュ均衡]] <math>(p^*, q^*)\, </math>は, [[非協力ゲーム理論]]の項で述べた定義によって, | ||
+ | |||
+ | |||
+ | <center> | ||
+ | <math>p^*Aq^{*\top} \ge pAq^{*\top}, \ p^*Bq^{*\top} \ge p^*Bq^{\top}, \ \mbox{ for all } p, \ q \, </math> | ||
+ | </center> | ||
+ | |||
+ | |||
+ | をみたす混合戦略の組である. とくに, ゼロ和ゲームでは, <math>B=-A\, </math>であるから | ||
+ | |||
+ | |||
+ | <center> | ||
+ | <math>pAq^{*\top} \le p^*Aq^{*\top} \le p^*Aq^{\top} , \ \ \mbox{ for all } p, \ q \, </math> | ||
+ | </center> | ||
+ | |||
+ | |||
+ | となり, これから[[ミニマックス定理 (ゲーム理論における)|ミニマックス定理]] (minimax theorem) | ||
+ | |||
+ | |||
+ | <center> | ||
+ | <math>\mbox{max}_{p} \mbox{min}_{q} \ pAq^{\top} \ =\ \mbox{min}_{q}\mbox{max}_{p}\ \ pAq^{\top} \, </math> | ||
+ | </center> | ||
+ | |||
+ | |||
+ | が導かれ, さらにこの値は<math>p^*Aq^{*\top}\, </math>に等しい. 左辺の値をマックスミニ値 (maxmin value), 右辺の値をミニマックス値(minimax value), さらに, この共通の値を[[ゲームの値]] (value of a game) という. また, このときの戦略<math>p^*, \ q^*\, </math>を各々[[マックスミニ戦略]] (maxmin strategy), [[ミニマックス戦略]] (minimax strategy) という. | ||
+ | 次に示すのは, 左が囚人のジレンマ (prisoner's dilemma), 右が逢い引きのジレンマ (battle of the sexes) という名で知られる有名な双行列ゲームである. | ||
+ | |||
+ | |||
+ | <center> | ||
+ | |||
+ | [[画像:sk-0071-a-g-03-2.png]] | ||
+ | |||
+ | </center> | ||
+ | |||
+ | <!-- | ||
+ | \[ \begin{array}{@{\ }c|ccc@{\ }} | ||
+ | & c & d \\ \hline | ||
+ | c & 3, 3 & 0, 4 \\ | ||
+ | d & 4, 0 & 1, 1 | ||
+ | \end{array} | ||
+ | \ \ \ \ \ \ \ \ \ \ \ \ \ \ | ||
+ | \begin{array}{@{\ }c|ccc@{\ }} | ||
+ | & a & b \\ \hline | ||
+ | a & 2, 1 & 0, 0 \\ | ||
+ | b & 0, 0 & 1, 2 | ||
+ | \end{array} | ||
+ | \] | ||
+ | --> | ||
+ | |||
+ | |||
+ | 囚人のジレンマでは, 純戦略の組 <math>(d, \ d)\, </math>のみが, また, 逢い引きのジレンマでは, 純戦略の組 <math>(a, \ a)\, </math>および<math>(b, \ b)\, </math>と, 混合戦略の組 <math>((2/3, 1/3)\, </math>, <math>(1/3, 2/3))\, </math>がナッシュ均衡である. とくに, 囚人のジレンマのナッシュ均衡では, 戦略<math>d\, </math>は相手のすべての戦略に対する[[最適反応 (ゲーム理論における)|最適反応]] (best reply) となっている. このようなナッシュ均衡を, [[支配戦略]]均衡 (dominant strategy equilibrium) ということがある. 逢い引きのジレンマには支配戦略は存在しない. また, 逢い引きのジレンマでは, 混合戦略ナッシュ均衡における利得の組<math>(2/3, \ 2/3)\, </math>は, たとえば純粋戦略ナッシュ均衡<math>(a, \ a)\, </math>における利得の組<math>(2, \ 1)\, </math>に対して各プレイヤーについて劣っている. このとき, 利得の組<math>(2/3, \ 2/3)\, </math>は<math>(2, \ 1)\, </math>に[[パレート支配]] (Pareto dominate) されるという. | ||
+ | |||
+ | 戦略形ゲームにおいて, もし, 各プレイヤーが共通の偶然機構にもとづいて戦略を選ぶことが許されているならば, 各プレイヤーは互いに相関した行動をとることができる. このような戦略を[[相関戦略]] (correlated strategy) という. たとえば, 逢い引きのジレンマで, コインを投げて表が出たら戦略の組<math>(a, \ a)\, </math>, 裏が出たら<math>(b, \ b)\, </math>とすることに2人が合意したとしよう. つまり, 2人とも, 表が出たら<math>a\, </math>をとり, 裏が出たら<math>b\, </math>をとるという相関戦略をとるものとする. このような合意がナッシュ均衡になるとき, すなわち, 相関戦略の組がナッシュ均衡となっているとき, これを[[相関均衡]] (correlated equilibrium) という. 上に述べた相関戦略の組は相関均衡であり, 2人の期待利得はともに<math>3/2\, </math>となることが容易にわかる. また, 混合戦略均衡は互いに独立な相関戦略からなる相関均衡にほかならない. 相関均衡の正式な定義については, たとえば [3] など参照. | ||
+ | |||
+ | |||
+ | 以上のゲームでは, 戦略形<math>G\, </math>についての知識がすべてのプレイヤーの間で[[共有知識]] (common knowledge) であると仮定されており, これらは[[完備情報ゲーム]] (game with complete information) といわれている. 他方, 不完備情報ゲームはハルサーニ(J. C. Harsanyi) [2] の定式化によって分析できるようになった. たとえば, 利得関数<math>u_i\, </math>に関する情報が不完備な場合は, まず有限個のパラメター<math>t_{i1}, t_{i2}, \ldots, t_{ik} \in T_i\, </math>を導入し, プレイヤー<math>i\, </math>の利得関数は, そのタイプによって, 有限個の利得関数<math>u_i(\cdot|t_{i1}), u_i(\cdot| t_{i2}), \ldots, u_i(\cdot| t_{ik})\, </math> (以下, まとめて<math>u_{i}(\cdot|t_{i})\, </math>と表す. )のうちのどれか1つに定まる, と定式化し直すことにより, <math>u_{i}\, </math>に関する不完備情報を表現する. この<math>t_i \in T_i\, </math>をプレイヤー<math>i\, </math>のタイプという. 各プレイヤー<math>i\, </math>は自分はどのタイプであるかを知っているが, 他のプレイヤーのタイプは知らない. ただし, 他のすべてのプレイヤーのタイプ<math>t_{-i} = (t_1 , \ldots, t_{i-1}, t_{i+1}, \ldots , t_n )\, </math>について条件付き確率<math>p_i(t_{-i}|t_i)\, </math>によって<math>t_{-i}\, </math>を推測することができるとする. こうして, 新たな戦略形ゲーム | ||
+ | |||
+ | |||
+ | <center> | ||
+ | <math>G'= (N, S_1, \ldots , S_n; | ||
+ | p_1, \ldots , p_n; T_1, \ldots, T_n; | ||
+ | u_1(\cdot|t_1), \ldots , u_n(\cdot|t_n))\, </math> | ||
+ | </center> | ||
+ | |||
+ | |||
+ | がえられる. これを[[ベイジアンゲーム]] (Bayesian game) という. また, 関数<math>s_i : T_i \rightarrow S_i\, </math>をベイジアンゲームの戦略という. すなわち, プレイヤー<math>i\, </math>は, 自分のタイプを知ってはいるが, どのタイプであったとしてもそのもとでの行動を指定しておくことがこの場合の戦略である. するとナッシュ均衡は, すべてのプレイヤー<math>i\, </math>とタイプ<math>t_i\, </math>および<math>a_{i} \in S_{i}\, </math> について次の条件をみたす戦略の組<math>s^*=(s^*_1, \ldots , s^*_n)\, </math>である. この戦略の組を, [[ベイジアンナッシュ均衡]] (Bayesian Nash equilibrium) という. | ||
+ | |||
+ | |||
+ | <center> | ||
+ | <math>\sum_{t_{-i} \in T_{-i}} u_i(s^*(t)|t_i)p_i(t_{-i}|t_i) | ||
+ | \ \ge\ \sum_{t_{-i} \in T_{-i}} u_i(s^*_{-i}(t_{-i}), a_i | ||
+ | | t_i)p_i(t_{-i}|t_i)\, </math> | ||
+ | </center> | ||
+ | |||
+ | |||
+ | ただし, <math>s^*(t)=(s^*_{-i}(t_{-i}), s^*_i(t_i))=(s^*_1(t_1), \ldots, s^*_n(t_n))\, </math>である. ベイジアンゲームは, 80年代以降, 情報経済学や産業組織論などの新しい分野の発展に大きく貢献している. これについてはたとえば, [1] を参照. | ||
+ | |||
+ | |||
+ | |||
+ | ---- | ||
+ | '''参考文献''' | ||
+ | |||
+ | [1] R. Gibbons, ''Game Theory for Applied Economists'', Princeton University Press, 1992. /福岡正夫, 須田伸一, 『経済学のためのゲーム理論入門』, 創文社, 1995. | ||
+ | |||
+ | [2] J. C. Harsanyi, "Games with Incomplete Information Played by `Bayesian' Players, parts I, II and III", ''Management Science'', '''14''' (1967-8), 159-182, 320-334, 486-502. | ||
+ | |||
+ | [3] M. J. Osborne and A. Rubinstein, ''A Course in Game Theory'', MIT Press, 1994. | ||
+ | |||
+ | [[category:ゲーム理論|せんりゃくけいげーむ]] |
2008年4月4日 (金) 10:29時点における最新版
【せんりゃくけいげーむ (strategic form game)】
概要
プレイヤーの集合, 各プレイヤーのとりうる戦略の集合, および, 各プレイヤーの利得関数を記述することによりゲームを表現する形式. 標準形ゲームともいう.
詳説
ゲームに参加するプレイヤーの集合を, 各プレイヤーのとりうる戦略の全体を, および 上で定義された各プレイヤー のフォンノイマン・モルゲンシュテルン効用関数 (von Neumann-Morgenstern utility function) を とするとき,
を戦略形ゲーム (game in strategic form) または標準形ゲーム (game in normal form) という. と がすべて有限集合であるとき, を有限ゲームという. 効用関数 は, また利得関数 (payoff function) ともいい, その値を利得という.
戦略形で書かれたゲームは, 特にことわらない限り非協力ゲームである. 戦略の数が有限な2人ゲームは次のような利得双行列 (payoff bimatrix) で表現することができるので, 双行列ゲーム (bimatrix game) ということがある.
ここに, 縦のはプレイヤー1の戦略, 横のはプレイヤー2の戦略であり, は, プレイヤー1, 2が各々戦略をとったときの, プレイヤー1, 2の利得である. を成分とする行列を, を成分とする行列をと表し, 利得双行列を簡単にと表す. すべてのについて, となる場合が2人ゼロ和ゲーム (two-person zerosum game) の戦略形である. 行列はの符号を変えたものであり, 行列だけでゲームを記述できるので2人ゼロ和ゲームを行列ゲーム (matrix game) ということもある.
双行列ゲームにおいて, 各プレイヤーの混合戦略 (mixed strategy) を各々, とすると, 各プレイヤーの利得の期待値 (期待利得) は各々 および で与えられる. はの転置ベクトルを表す. また, 混合戦略に対してもとの戦略を純戦略 (pure strategy) という. ナッシュ均衡 は, 非協力ゲーム理論の項で述べた定義によって,
をみたす混合戦略の組である. とくに, ゼロ和ゲームでは, であるから
となり, これからミニマックス定理 (minimax theorem)
が導かれ, さらにこの値はに等しい. 左辺の値をマックスミニ値 (maxmin value), 右辺の値をミニマックス値(minimax value), さらに, この共通の値をゲームの値 (value of a game) という. また, このときの戦略を各々マックスミニ戦略 (maxmin strategy), ミニマックス戦略 (minimax strategy) という.
次に示すのは, 左が囚人のジレンマ (prisoner's dilemma), 右が逢い引きのジレンマ (battle of the sexes) という名で知られる有名な双行列ゲームである.
囚人のジレンマでは, 純戦略の組 のみが, また, 逢い引きのジレンマでは, 純戦略の組 およびと, 混合戦略の組 , がナッシュ均衡である. とくに, 囚人のジレンマのナッシュ均衡では, 戦略は相手のすべての戦略に対する最適反応 (best reply) となっている. このようなナッシュ均衡を, 支配戦略均衡 (dominant strategy equilibrium) ということがある. 逢い引きのジレンマには支配戦略は存在しない. また, 逢い引きのジレンマでは, 混合戦略ナッシュ均衡における利得の組は, たとえば純粋戦略ナッシュ均衡における利得の組に対して各プレイヤーについて劣っている. このとき, 利得の組はにパレート支配 (Pareto dominate) されるという.
戦略形ゲームにおいて, もし, 各プレイヤーが共通の偶然機構にもとづいて戦略を選ぶことが許されているならば, 各プレイヤーは互いに相関した行動をとることができる. このような戦略を相関戦略 (correlated strategy) という. たとえば, 逢い引きのジレンマで, コインを投げて表が出たら戦略の組, 裏が出たらとすることに2人が合意したとしよう. つまり, 2人とも, 表が出たらをとり, 裏が出たらをとるという相関戦略をとるものとする. このような合意がナッシュ均衡になるとき, すなわち, 相関戦略の組がナッシュ均衡となっているとき, これを相関均衡 (correlated equilibrium) という. 上に述べた相関戦略の組は相関均衡であり, 2人の期待利得はともにとなることが容易にわかる. また, 混合戦略均衡は互いに独立な相関戦略からなる相関均衡にほかならない. 相関均衡の正式な定義については, たとえば [3] など参照.
以上のゲームでは, 戦略形についての知識がすべてのプレイヤーの間で共有知識 (common knowledge) であると仮定されており, これらは完備情報ゲーム (game with complete information) といわれている. 他方, 不完備情報ゲームはハルサーニ(J. C. Harsanyi) [2] の定式化によって分析できるようになった. たとえば, 利得関数に関する情報が不完備な場合は, まず有限個のパラメターを導入し, プレイヤーの利得関数は, そのタイプによって, 有限個の利得関数 (以下, まとめてと表す. )のうちのどれか1つに定まる, と定式化し直すことにより, に関する不完備情報を表現する. このをプレイヤーのタイプという. 各プレイヤーは自分はどのタイプであるかを知っているが, 他のプレイヤーのタイプは知らない. ただし, 他のすべてのプレイヤーのタイプについて条件付き確率によってを推測することができるとする. こうして, 新たな戦略形ゲーム
がえられる. これをベイジアンゲーム (Bayesian game) という. また, 関数をベイジアンゲームの戦略という. すなわち, プレイヤーは, 自分のタイプを知ってはいるが, どのタイプであったとしてもそのもとでの行動を指定しておくことがこの場合の戦略である. するとナッシュ均衡は, すべてのプレイヤーとタイプおよび について次の条件をみたす戦略の組である. この戦略の組を, ベイジアンナッシュ均衡 (Bayesian Nash equilibrium) という.
ただし, である. ベイジアンゲームは, 80年代以降, 情報経済学や産業組織論などの新しい分野の発展に大きく貢献している. これについてはたとえば, [1] を参照.
参考文献
[1] R. Gibbons, Game Theory for Applied Economists, Princeton University Press, 1992. /福岡正夫, 須田伸一, 『経済学のためのゲーム理論入門』, 創文社, 1995.
[2] J. C. Harsanyi, "Games with Incomplete Information Played by `Bayesian' Players, parts I, II and III", Management Science, 14 (1967-8), 159-182, 320-334, 486-502.
[3] M. J. Osborne and A. Rubinstein, A Course in Game Theory, MIT Press, 1994.