「《戦略形ゲーム》」の版間の差分

提供: ORWiki
ナビゲーションに移動 検索に移動
 
(5人の利用者による、間の7版が非表示)
4行目: 4行目:
  
  
:<math>G=(N; S_1, \ldots , S_n; u_1, \ldots , u_n)\, </math>  
+
<center>
 +
<math>G=(N; S_1, \ldots , S_n; u_1, \ldots , u_n)\, </math>
 +
</center>
  
  
12行目: 14行目:
  
  
:[[スタイル検討#戦略形ゲーム (0071-a-g-03-1)|スタイル検討]]
+
<center>
 +
 
 +
[[画像:sk-0071-a-g-03-1.png]]
 +
 
 +
</center>
 +
 
 +
<!--
 +
\[ \begin{array}{@{\ }c|ccc@{\ }}
 +
 
 +
          & 1            & \ldots  & n                \\  \hline
 +
    1    & a_{11}, b_{11}    & \ldots  & a_{1n}, b_{1n}    \\
 +
  \vdots & \vdots            & \ddots  & \vdots          \\
 +
    m    & a_{m1}, b_{m1}    & \ldots  & a_{mn}, b_{mn}
 +
  \end{array}
 +
\]
 +
-->
  
  
20行目: 37行目:
  
  
:<math>p^*Aq^{*\top} \ge pAq^{*\top}, \  p^*Bq^{*\top} \ge p^*Bq^{\top}, \ \mbox{ for all } p, \ q \, </math>  
+
<center>
 +
<math>p^*Aq^{*\top} \ge pAq^{*\top}, \  p^*Bq^{*\top} \ge p^*Bq^{\top}, \ \mbox{ for all } p, \ q \, </math>
 +
</center>
  
  
26行目: 45行目:
  
  
:<math>pAq^{*\top} \le p^*Aq^{*\top} \le p^*Aq^{\top} , \ \ \mbox{ for all } p, \ q \, </math>  
+
<center>
 +
<math>pAq^{*\top} \le p^*Aq^{*\top} \le p^*Aq^{\top} , \ \ \mbox{ for all } p, \ q \, </math>
 +
</center>
  
  
32行目: 53行目:
  
  
:<math>\mbox{max}_{p} \mbox{min}_{q} \ pAq^{\top} \ =\ \mbox{min}_{q}\mbox{max}_{p}\ \ pAq^{\top} \, </math>
+
<center>
 +
<math>\mbox{max}_{p} \mbox{min}_{q} \ pAq^{\top} \ =\ \mbox{min}_{q}\mbox{max}_{p}\ \ pAq^{\top} \, </math>
 +
</center>
  
  
39行目: 62行目:
  
  
:[[スタイル検討#戦略形ゲーム (0071-a-g-03-2)|スタイル検討]]
+
<center>
 +
 
 +
[[画像:sk-0071-a-g-03-2.png]]
 +
 
 +
</center>
 +
 
 +
<!--
 +
\[ \begin{array}{@{\  }c|ccc@{\  }}
 +
          & c      & d                \\  \hline
 +
      c    & 3, 3    & 0, 4    \\
 +
      d    & 4, 0    & 1, 1
 +
    \end{array}
 +
    \ \ \ \ \ \ \ \ \ \ \ \ \ \
 +
    \begin{array}{@{\  }c|ccc@{\  }}
 +
          & a      & b                \\  \hline
 +
      a    & 2, 1    & 0, 0    \\
 +
      b    & 0, 0    & 1, 2
 +
    \end{array}
 +
\]
 +
-->
  
  
50行目: 92行目:
  
  
:<math>G'= (N, S_1, \ldots , S_n;
+
<center>
 +
<math>G'= (N, S_1, \ldots , S_n;
 
                         p_1, \ldots , p_n; T_1, \ldots, T_n;
 
                         p_1, \ldots , p_n; T_1, \ldots, T_n;
 
                         u_1(\cdot|t_1), \ldots , u_n(\cdot|t_n))\, </math>
 
                         u_1(\cdot|t_1), \ldots , u_n(\cdot|t_n))\, </math>
 +
</center>
 
   
 
   
  
58行目: 102行目:
  
  
:<math>\sum_{t_{-i} \in T_{-i}} u_i(s^*(t)|t_i)p_i(t_{-i}|t_i)  
+
<center>
 +
<math>\sum_{t_{-i} \in T_{-i}} u_i(s^*(t)|t_i)p_i(t_{-i}|t_i)  
 
     \  \ge\  \sum_{t_{-i} \in T_{-i}} u_i(s^*_{-i}(t_{-i}), a_i
 
     \  \ge\  \sum_{t_{-i} \in T_{-i}} u_i(s^*_{-i}(t_{-i}), a_i
 
                         | t_i)p_i(t_{-i}|t_i)\, </math>
 
                         | t_i)p_i(t_{-i}|t_i)\, </math>
 +
</center>
  
  
70行目: 116行目:
 
'''参考文献'''
 
'''参考文献'''
  
[1] R. Gibbons, ''Game Theory for Applied Economists'', Princeton University Press, 1992.  
+
[1] R. Gibbons, ''Game Theory for Applied Economists'', Princeton University Press, 1992. /福岡正夫, 須田伸一, 『経済学のためのゲーム理論入門』, 創文社, 1995.
  
 
[2] J. C. Harsanyi, "Games with Incomplete Information Played by `Bayesian' Players, parts I, II and III", ''Management Science'', '''14''' (1967-8), 159-182, 320-334, 486-502.  
 
[2] J. C. Harsanyi, "Games with Incomplete Information Played by `Bayesian' Players, parts I, II and III", ''Management Science'', '''14''' (1967-8), 159-182, 320-334, 486-502.  
  
 
[3] M. J. Osborne and A. Rubinstein, ''A Course in Game Theory'', MIT Press, 1994.
 
[3] M. J. Osborne and A. Rubinstein, ''A Course in Game Theory'', MIT Press, 1994.
 +
 +
[[category:ゲーム理論|せんりゃくけいげーむ]]

2007年8月9日 (木) 14:50時点における最新版

【せんりゃくけいげーむ (game in strategic form) 】

 ゲームに参加するプレイヤーの集合を, 各プレイヤーのとりうる戦略の全体を, および 上で定義された各プレイヤーフォンノイマン・モルゲンシュテルン効用関数 (von Neumann-Morgenstern utility function) を とするとき,



戦略形ゲーム (game in strategic form) または標準形ゲーム (game in normal form) という. がすべて有限集合であるとき, を有限ゲームという. 効用関数 は, また利得関数 (payoff function) ともいい, その値を利得という.

 戦略形で書かれたゲームは, 特にことわらない限り非協力ゲームである. 戦略の数が有限な2人ゲームは次のような利得双行列 (payoff bimatrix) で表現することができるので, 双行列ゲーム (bimatrix game) ということがある.


Sk-0071-a-g-03-1.png


 ここに, 縦のはプレイヤー1の戦略, 横のはプレイヤー2の戦略であり, は, プレイヤー1, 2が各々戦略をとったときの, プレイヤー1, 2の利得である. を成分とする行列を, を成分とする行列をと表し, 利得双行列を簡単にと表す. すべてのについて, となる場合が2人ゼロ和ゲーム (two-person zerosum game) の戦略形である. 行列の符号を変えたものであり, 行列だけでゲームを記述できるので2人ゼロ和ゲームを行列ゲーム (matrix game) ということもある.

 双行列ゲームにおいて, 各プレイヤーの混合戦略 (mixed strategy) を各々, とすると, 各プレイヤーの利得の期待値 (期待利得) は各々 および で与えられる. の転置ベクトルを表す. また, 混合戦略に対してもとの戦略を純戦略 (pure strategy) という. ナッシュ均衡 は, 非協力ゲーム理論の項で述べた定義によって,



をみたす混合戦略の組である. とくに, ゼロ和ゲームでは, であるから



となり, これからミニマックス定理 (minimax theorem) 



が導かれ, さらにこの値はに等しい. 左辺の値をマックスミニ値 (maxmin value), 右辺の値をミニマックス値(minimax value), さらに, この共通の値をゲームの値 (value of a game) という. また, このときの戦略を各々マックスミニ戦略 (maxmin strategy), ミニマックス戦略 (minimax strategy) という.  次に示すのは, 左が囚人のジレンマ (prisoner's dilemma), 右が逢い引きのジレンマ (battle of the sexes) という名で知られる有名な双行列ゲームである.


Sk-0071-a-g-03-2.png


囚人のジレンマでは, 純戦略の組 のみが, また, 逢い引きのジレンマでは, 純戦略の組 およびと, 混合戦略の組 , がナッシュ均衡である. とくに, 囚人のジレンマのナッシュ均衡では, 戦略は相手のすべての戦略に対する最適反応 (best reply) となっている. このようなナッシュ均衡を, 支配戦略均衡 (dominant strategy equilibrium) ということがある. 逢い引きのジレンマには支配戦略は存在しない. また, 逢い引きのジレンマでは, 混合戦略ナッシュ均衡における利得の組は, たとえば純粋戦略ナッシュ均衡における利得の組に対して各プレイヤーについて劣っている. このとき, 利得の組パレート支配 (Pareto dominate) されるという.

 戦略形ゲームにおいて, もし, 各プレイヤーが共通の偶然機構にもとづいて戦略を選ぶことが許されているならば, 各プレイヤーは互いに相関した行動をとることができる. このような戦略を相関戦略 (correlated strategy) という. たとえば, 逢い引きのジレンマで, コインを投げて表が出たら戦略の組, 裏が出たらとすることに2人が合意したとしよう. つまり, 2人とも, 表が出たらをとり, 裏が出たらをとるという相関戦略をとるものとする. このような合意がナッシュ均衡になるとき, すなわち, 相関戦略の組がナッシュ均衡となっているとき, これを相関均衡 (correlated equilibrium) という. 上に述べた相関戦略の組は相関均衡であり, 2人の期待利得はともにとなることが容易にわかる. また, 混合戦略均衡は互いに独立な相関戦略からなる相関均衡にほかならない. 相関均衡の正式な定義については, たとえば [3] など参照.  


 以上のゲームでは, 戦略形についての知識がすべてのプレイヤーの間で共有知識 (common knowledge) であると仮定されており, これらは完備情報ゲーム (game with complete information) といわれている. 他方, 不完備情報ゲームはハルサーニ(J. C. Harsanyi) [2] の定式化によって分析できるようになった. たとえば, 利得関数に関する情報が不完備な場合は, まず有限個のパラメターを導入し, プレイヤーの利得関数は, そのタイプによって, 有限個の利得関数 (以下, まとめてと表す. )のうちのどれか1つに定まる, と定式化し直すことにより, に関する不完備情報を表現する. このをプレイヤーのタイプという. 各プレイヤーは自分はどのタイプであるかを知っているが, 他のプレイヤーのタイプは知らない. ただし, 他のすべてのプレイヤーのタイプについて条件付き確率によってを推測することができるとする. こうして, 新たな戦略形ゲーム



がえられる. これをベイジアンゲーム (Bayesian game) という. また, 関数をベイジアンゲームの戦略という. すなわち, プレイヤーは, 自分のタイプを知ってはいるが, どのタイプであったとしてもそのもとでの行動を指定しておくことがこの場合の戦略である. するとナッシュ均衡は, すべてのプレイヤーとタイプおよび について次の条件をみたす戦略の組である. この戦略の組を, ベイジアンナッシュ均衡 (Bayesian Nash equilibrium) という.



ただし, である. ベイジアンゲームは, 80年代以降, 情報経済学や産業組織論などの新しい分野の発展に大きく貢献している. これについてはたとえば, [1] を参照.



参考文献

[1] R. Gibbons, Game Theory for Applied Economists, Princeton University Press, 1992. /福岡正夫, 須田伸一, 『経済学のためのゲーム理論入門』, 創文社, 1995.

[2] J. C. Harsanyi, "Games with Incomplete Information Played by `Bayesian' Players, parts I, II and III", Management Science, 14 (1967-8), 159-182, 320-334, 486-502.

[3] M. J. Osborne and A. Rubinstein, A Course in Game Theory, MIT Press, 1994.