「《展開形ゲーム》」の版間の差分

提供: ORWiki
ナビゲーションに移動 検索に移動
(新しいページ: '【てんかいけいげーむ (game in extensive form) 】  展開形ゲーム (game in extensive form) はプレイヤーの手番の系列をゲームの木 (game...')
 
1行目: 1行目:
 
【てんかいけいげーむ (game in extensive form) 】
 
【てんかいけいげーむ (game in extensive form) 】
  
 [[展開形ゲーム]] (game in extensive form) はプレイヤーの手番の系列を[[ゲームの木]] (game tree) を用いて表現するモデルである. ゲームの木 $K$ はグラフ理論でいう有向木で, 木の分岐点はプレイヤーが選択肢を選ぶ手番, 枝は[[プレイヤー]]の選択肢あるいは行動を表す. 木の始点から終点までの経路をゲームの1つのプレイという.  
+
 [[展開形ゲーム]] (game in extensive form) はプレイヤーの手番の系列を[[ゲームの木]] (game tree) を用いて表現するモデルである. ゲームの木 <math>K\, </math> はグラフ理論でいう有向木で, 木の分岐点はプレイヤーが選択肢を選ぶ手番, 枝は[[プレイヤー]]の選択肢あるいは行動を表す. 木の始点から終点までの経路をゲームの1つのプレイという.  
  
 プレイヤー分割 $P=[P_{0}, P_{1}. \cdots, P_{n}]$ は, ゲームの木 $K$ の分岐点の全体を $n+1$ 個の部分集合に分割する. $P_{i}\ (i=1, 2, \cdots, n)$ はプレイヤー $i$ の手番の集合を表す. $P_{0}$ に含まれる手番は偶然手番とよばれ, プレイヤーの意思とは無関係な偶然機構によって枝が選択される. 天候やトランプゲームでランダムにカードを配るなどは, 偶然手番の典型的な例である. 偶然手番に対しては枝の選択を行なう確率分布 $p$ が付与される.  
+
 プレイヤー分割 <math>P=[P_{0}, P_{1}. \cdots, P_{n}]\, </math> は, ゲームの木 <math>K\, </math> の分岐点の全体を <math>n+1\, </math> 個の部分集合に分割する. <math>P_{i}\ (i=1, 2, \cdots, n)\, </math> はプレイヤー <math>i\, </math> の手番の集合を表す. <math>P_{0}\, </math> に含まれる手番は偶然手番とよばれ, プレイヤーの意思とは無関係な偶然機構によって枝が選択される. 天候やトランプゲームでランダムにカードを配るなどは, 偶然手番の典型的な例である. 偶然手番に対しては枝の選択を行なう確率分布 <math>p\, </math> が付与される.  
  
 ゲームの情報分割 $U=[U_{0}, U_{1}, \cdots, U_{n}]$ は,プレイヤー分割 $P$ の細分割である.各 $i=1, 2, \cdots, n$ に対して $U_{i}=[u_{i1}, u_{i2}, \cdots, u_{im_{i}}]$はプレイヤー $i$ の手番の集合 $P_{i}$ $m_{i}$ 個の非空な部分集合に分割する. $U_{i}$ に属する部分集合 $u_{ij}\ (j=1, 2, \cdots, m_{i})$ をプレイヤー $i$ の[[情報集合]] (information set)  という.プレイヤーは行動を選択するとき,自分の手番がどの情報集合に属するかは知っているが,情報集合の中のどの分岐点であるかは知らない.  
+
 ゲームの情報分割 <math>U=[U_{0}, U_{1}, \cdots, U_{n}]\, </math> は,プレイヤー分割<math>P\, </math> の細分割である.各 <math>i=1, 2, \cdots, n\, </math> に対して <math>U_{i}=[u_{i1}, u_{i2}, \cdots, u_{im_{i}}]\, </math>はプレイヤー <math>i\, </math> の手番の集合 <math>P_{i}\, </math> <math>m_{i}\, </math> 個の非空な部分集合に分割する. <math>U_{i}\, </math> に属する部分集合 <math>u_{ij}\ (j=1, 2, \cdots, m_{i})\, </math> をプレイヤー <math>i\, </math> の[[情報集合]] (information set)  という.プレイヤーは行動を選択するとき,自分の手番がどの情報集合に属するかは知っているが,情報集合の中のどの分岐点であるかは知らない.  
  
 ゲームの[[利得関数]] $h$ は,ゲームの木 $K$ の各終点 $z$ に対してプレイヤーの[[利得 (ゲームの)|利得]]ベクトル $h(z)=(h_{1}(z), h_{2}(z), \cdots, h_{n}(z))$ を対応させる.  
+
 ゲームの[[利得関数]] <math>h\, </math> は,ゲームの木 <math>K\, </math> の各終点 <math>z\, </math> に対してプレイヤーの[[利得 (ゲームの)|利得]]ベクトル <math>h(z)=(h_{1}(z), h_{2}(z), \cdots, h_{n}(z))\, </math> を対応させる.  
  
 形式的には, 展開形ゲーム $\Gamma$ は以上の5つの要素の組 $(K, P, p, U, h)$ によって定義される. これらの5つの構成要素をゲームのルールという.  
+
 形式的には, 展開形ゲーム <math>\Gamma\, </math> は以上の5つの要素の組 <math>(K, P, p, U, h)\, </math> によって定義される. これらの5つの構成要素をゲームのルールという.  
  
  
\begin{figure}[ht]
+
図1:展開形ゲーム
\begin{center}
 
\includegraphics[scale=1.0, bb=174pt 330pt 387pt 484pt, clip]{0072-a-g-04f1-mof.eps}
 
\end{center}
 
\caption{展開形ゲーム} \label{a-g-04-f1}
 
\end{figure}
 
  
  
 展開形ゲームの例として図\ref{a-g-04-f1}を考える.プレイヤー1と2の情報分割はそれぞれ $U_{1}=[u_{1}], U_{2}=[u_{21}, u_{22}]$ である.図1では最初にプレイヤー1がRとLの2つの行動のうち1つを選択する.次に, プレイヤー2はプレイヤー1の選択を知った上で,RとLのうちから1つの行動を選択する.ゲームは4つの終点をもち, 終点に付与されている利得ベクトルは上の数字がプレイヤー1の利得, 下の数字がプレイヤー2の利得を表す.  
+
 展開形ゲームの例として図1を考える.プレイヤー1と2の情報分割はそれぞれ <math>U_{1}=[u_{1}], U_{2}=[u_{21}, u_{22}]\, </math> である.図1では最初にプレイヤー1がRとLの2つの行動のうち1つを選択する. 次に, プレイヤー2はプレイヤー1の選択を知った上で, RとLのうちから1つの行動を選択する.ゲームは4つの終点をもち, 終点に付与されている利得ベクトルは上の数字がプレイヤー1の利得, 下の数字がプレイヤー2の利得を表す.  
  
 
 図1のゲームのように, プレイヤーのすべての情報集合がただ1つの分岐点から成るゲームを[[完全情報ゲーム]] (game with perfect information) といい, そうでないゲームを不完全情報ゲーム (game with imperfect information) という. 完全情報ゲームでは, すべての手番においてプレイヤーはゲームの過去のプレイの経過を完全に知った上で行動を選択できる. チェスや将棋は完全情報ゲームである.  
 
 図1のゲームのように, プレイヤーのすべての情報集合がただ1つの分岐点から成るゲームを[[完全情報ゲーム]] (game with perfect information) といい, そうでないゲームを不完全情報ゲーム (game with imperfect information) という. 完全情報ゲームでは, すべての手番においてプレイヤーはゲームの過去のプレイの経過を完全に知った上で行動を選択できる. チェスや将棋は完全情報ゲームである.  
  
 展開形ゲームの部分木でそれ自身が展開形ゲームの構造をもつものを部分ゲームという. 図1のゲームは, 情報集合 $u_{21}$ $u_{22}$ から始まる2つの部分ゲームをもつ.  
+
 展開形ゲームの部分木でそれ自身が展開形ゲームの構造をもつものを部分ゲームという. 図1のゲームは, 情報集合 <math>u_{21}\, </math> <math>u_{22}\, </math> から始まる2つの部分ゲームをもつ.
 +
 
 +
 プレイヤー <math>i\, </math> の各情報集合 <math>u\in U_{1}\, </math> に対して <math>u\, </math> における選択肢の集合上の1つの確率分布 <math>b_{i}(u)\, </math> を対応させる関数 <math>b_{i}\, </math> をプレイヤー <math>i\, </math> の[[行動戦略]] (behavior strategy) という. 特に, すべての情報集合に対して1つの選択肢を確定的に対応させる行動戦略を[[純戦略]]という.  
  
 プレイヤー $i$ の各情報集合 $u\in U_{1}$ に対して $u$ における選択肢の集合上の1つの確率分布 $b_{i}(u)$ を対応させる関数 $b_{i}$ をプレイヤー $i$ の[[行動戦略]] (behavior strategy) という. 特に, すべての情報集合に対して1つの選択肢を確定的に対応させる行動戦略を[[純戦略]]という.  
+
 例えば, 図1のゲームにおいて, プレイヤー1の純戦略 <math>\pi_{1}\, </math> はRとLの2通りであり, プレイヤー2の純戦略 <math>\pi_{2}\, </math> は, RR, RL, LR, LLの4通りである. ただし, 前の文字は情報集合 <math>u_{21}\, </math> でとる行動, 後の文字は情報集合 <math>u_{22}\, </math> でとる行動を表す. 図1の展開形ゲームから, プレイヤーの純戦略と利得の関係によって図2のような[[戦略形ゲーム]]を作ることができる.  
  
 例えば, 図1のゲームにおいて, プレイヤー1の純戦略 $\pi_{1}$ はRとLの2通りであり, プレイヤー2の純戦略 $\pi_{2}$ は, RR, RL, LR, LLの4通りである. ただし, 前の文字は情報集合 $u_{21}$ でとる行動, 後の文字は情報集合 $u_{22}$ でとる行動を表す. 図1の展開形ゲームから, プレイヤーの純戦略と利得の関係によって図2のような[[戦略形ゲーム]]を作ることができる.
+
図2:図1の展開形ゲームから作られた戦略形ゲーム
  
  
\begin{figure}[ht]
+
<math>\begin{figure}[ht]
 
\begin{center}
 
\begin{center}
 
\begin{tabular}{|c|cccc|}
 
\begin{tabular}{|c|cccc|}
 
\hline
 
\hline
 
& LL & LR & RL & RR\\ \hline
 
& LL & LR & RL & RR\\ \hline
R & $1, 1^{*}$ & $1, 1^{*}$ & $-2, 0$ & $-2, 0$\\ \hline
+
R & 1, 1^{*} & 1, 1^{*} & -2, 0 & -2, 0\\ \hline
L & $-1, 0$ & $0, 1$ & $-1, 0$ & $0, 1^{*}$\\ \hline
+
L & -1, 0 & 0, 1 & -1, 0 & 0, 1^{*}\\ \hline
 
\end{tabular}
 
\end{tabular}
 
\end{center}
 
\end{center}
\caption{図1の展開形ゲームから作られた戦略形ゲーム} \label{a-g-04-f2}
+
\end{figure}\, </math>
\end{figure}
+
 
  
 +
 プレイヤーの行動分析のための最も基本的なゲームの解の概念は, ナッシュ (J. F. Nash) によって定義された非協力均衡点である. 一般に[[ナッシュ均衡]]と呼ばれている. 展開形ゲームの行動戦略の組 <math>b^{*}=(b_{1}^{*}, b_{2}^{*}, \cdots, b_{n}^{*})\, </math> がナッシュ均衡であるとは,すべてのプレイヤー <math>i=1, 2, \cdots, n\, </math> のすべての行動戦略 <math>b_{i}\, </math> に対して,
  
 プレイヤーの行動分析のための最も基本的なゲームの解の概念は, ナッシュ (J. F. Nash) によって定義された非協力均衡点である. 一般に[[ナッシュ均衡]]と呼ばれている. 展開形ゲームの行動戦略の組 $b^{*}=(b_{1}^{*}, b_{2}^{*}, \cdots, b_{n}^{*})$ がナッシュ均衡であるとは,すべてのプレイヤー $i=1, 2, \cdots, n$ のすべての行動戦略 $b_{i}$ に対して,
 
  
 H_{i}(b^{*}) \ge H_{i}(b^{*}/b_{i})
+
:<math>H_{i}(b^{*}) \ge H_{i}(b^{*}/b_{i})\, </math>
 
 
 
 
が成り立つことである. ただし, $b^{*}/b_{i}$ は $b^{*}$ からプレイヤー $i$ だけが戦略を $b_{i}^{*}$ から $b_{i}$ に変更してできる行動戦略の組を表し, $H_{i}$ はプレイヤー $i$ の期待利得関数を表す.
 
  
 完全情報ゲームのナッシュ均衡は, 最初に, 終点に一番近い分岐点で, その手番のプレイヤーの利得を最大にする最適戦略を求め, 以下順次, ゲームの木を後向きに解くことによって計算できる. 例えば, 図1のゲームで情報集合 $u_{21}$ $u_{22}$ におけるプレイヤー2の最適戦略はそれぞれLとRである. このとき, 情報集合 $u_{1}$ におけるプレイヤー1の最適戦略はRであり, 純戦略の組 (R, LR) はゲームのナッシュ均衡である. このようなナッシュ均衡の計算方法を, ゲームの後向き帰納法という. キューン (H. Kuhn) は, $n$ 人完全情報ゲームは純戦略の範囲で少なくとも1つのナッシュ均衡をもつことを証明した [1].  
+
が成り立つことである. ただし, <math>b^{*}/b_{i}\, </math> は <math>b^{*}\, </math> からプレイヤー <math>i\, </math> だけが戦略を <math>b_{i}^{*}\, </math> から <math>b_{i}\, </math> に変更してできる行動戦略の組を表し, <math>H_{i}\, </math> はプレイヤー i の期待利得関数を表す.
 +
 
 +
 完全情報ゲームのナッシュ均衡は, 最初に, 終点に一番近い分岐点で, その手番のプレイヤーの利得を最大にする最適戦略を求め, 以下順次, ゲームの木を後向きに解くことによって計算できる. 例えば, 図1のゲームで情報集合 <math>u_{21}\, </math> <math>u_{22}\, </math> におけるプレイヤー2の最適戦略はそれぞれLとRである. このとき, 情報集合 <math>u_{1}\, </math> におけるプレイヤー1の最適戦略はRであり, 純戦略の組 (R, LR) はゲームのナッシュ均衡である. このようなナッシュ均衡の計算方法を, ゲームの後向き帰納法という. キューン (H. Kuhn) は, <math>n\, </math> 人完全情報ゲームは純戦略の範囲で少なくとも1つのナッシュ均衡をもつことを証明した [1].  
  
 
 図1のゲームは (R, LR) の他に図2の利得行列で*をつけたナッシュ均衡をもつ. しかし, これらのナッシュ均衡は均衡プレイ上にない分岐点ではプレイヤーの最適戦略を導かないという欠点をもつ. ゼルテン (R. Selten) はナッシュ均衡のこのような欠点を解消するために, より強い均衡概念として, すべての部分ゲーム上にナッシュ均衡を導く[[部分ゲーム完全均衡]] (subgame perfect equilibrium) を定義した [3].  
 
 図1のゲームは (R, LR) の他に図2の利得行列で*をつけたナッシュ均衡をもつ. しかし, これらのナッシュ均衡は均衡プレイ上にない分岐点ではプレイヤーの最適戦略を導かないという欠点をもつ. ゼルテン (R. Selten) はナッシュ均衡のこのような欠点を解消するために, より強い均衡概念として, すべての部分ゲーム上にナッシュ均衡を導く[[部分ゲーム完全均衡]] (subgame perfect equilibrium) を定義した [3].  
61行目: 59行目:
  
 
----
 
----
 
 
'''参考文献'''
 
'''参考文献'''
  

2007年7月8日 (日) 15:24時点における版

【てんかいけいげーむ (game in extensive form) 】

 展開形ゲーム (game in extensive form) はプレイヤーの手番の系列をゲームの木 (game tree) を用いて表現するモデルである. ゲームの木 はグラフ理論でいう有向木で, 木の分岐点はプレイヤーが選択肢を選ぶ手番, 枝はプレイヤーの選択肢あるいは行動を表す. 木の始点から終点までの経路をゲームの1つのプレイという.

 プレイヤー分割 は, ゲームの木 の分岐点の全体を 個の部分集合に分割する. はプレイヤー の手番の集合を表す. に含まれる手番は偶然手番とよばれ, プレイヤーの意思とは無関係な偶然機構によって枝が選択される. 天候やトランプゲームでランダムにカードを配るなどは, 偶然手番の典型的な例である. 偶然手番に対しては枝の選択を行なう確率分布 が付与される.

 ゲームの情報分割 は,プレイヤー分割 の細分割である.各 に対して はプレイヤー の手番の集合 個の非空な部分集合に分割する. に属する部分集合 をプレイヤー 情報集合 (information set) という.プレイヤーは行動を選択するとき,自分の手番がどの情報集合に属するかは知っているが,情報集合の中のどの分岐点であるかは知らない.

 ゲームの利得関数 は,ゲームの木 の各終点 に対してプレイヤーの利得ベクトル を対応させる.

 形式的には, 展開形ゲーム は以上の5つの要素の組 によって定義される. これらの5つの構成要素をゲームのルールという.


図1:展開形ゲーム


 展開形ゲームの例として図1を考える.プレイヤー1と2の情報分割はそれぞれ である.図1では最初にプレイヤー1がRとLの2つの行動のうち1つを選択する. 次に, プレイヤー2はプレイヤー1の選択を知った上で, RとLのうちから1つの行動を選択する.ゲームは4つの終点をもち, 終点に付与されている利得ベクトルは上の数字がプレイヤー1の利得, 下の数字がプレイヤー2の利得を表す.

 図1のゲームのように, プレイヤーのすべての情報集合がただ1つの分岐点から成るゲームを完全情報ゲーム (game with perfect information) といい, そうでないゲームを不完全情報ゲーム (game with imperfect information) という. 完全情報ゲームでは, すべての手番においてプレイヤーはゲームの過去のプレイの経過を完全に知った上で行動を選択できる. チェスや将棋は完全情報ゲームである.

 展開形ゲームの部分木でそれ自身が展開形ゲームの構造をもつものを部分ゲームという. 図1のゲームは, 情報集合 から始まる2つの部分ゲームをもつ.

 プレイヤー の各情報集合 に対して における選択肢の集合上の1つの確率分布 を対応させる関数 をプレイヤー 行動戦略 (behavior strategy) という. 特に, すべての情報集合に対して1つの選択肢を確定的に対応させる行動戦略を純戦略という.

 例えば, 図1のゲームにおいて, プレイヤー1の純戦略 はRとLの2通りであり, プレイヤー2の純戦略 は, RR, RL, LR, LLの4通りである. ただし, 前の文字は情報集合 でとる行動, 後の文字は情報集合 でとる行動を表す. 図1の展開形ゲームから, プレイヤーの純戦略と利得の関係によって図2のような戦略形ゲームを作ることができる.

図2:図1の展開形ゲームから作られた戦略形ゲーム


構文解析に失敗 (不明な関数「\begin{figure}」): {\displaystyle \begin{figure}[ht] \begin{center} \begin{tabular}{|c|cccc|} \hline & LL & LR & RL & RR\\ \hline R & 1, 1^{*} & 1, 1^{*} & -2, 0 & -2, 0\\ \hline L & -1, 0 & 0, 1 & -1, 0 & 0, 1^{*}\\ \hline \end{tabular} \end{center} \end{figure}\, }


 プレイヤーの行動分析のための最も基本的なゲームの解の概念は, ナッシュ (J. F. Nash) によって定義された非協力均衡点である. 一般にナッシュ均衡と呼ばれている. 展開形ゲームの行動戦略の組 がナッシュ均衡であるとは,すべてのプレイヤー のすべての行動戦略 に対して,


 

が成り立つことである. ただし, からプレイヤー だけが戦略を から に変更してできる行動戦略の組を表し, はプレイヤー i の期待利得関数を表す.

 完全情報ゲームのナッシュ均衡は, 最初に, 終点に一番近い分岐点で, その手番のプレイヤーの利得を最大にする最適戦略を求め, 以下順次, ゲームの木を後向きに解くことによって計算できる. 例えば, 図1のゲームで情報集合 におけるプレイヤー2の最適戦略はそれぞれLとRである. このとき, 情報集合 におけるプレイヤー1の最適戦略はRであり, 純戦略の組 (R, LR) はゲームのナッシュ均衡である. このようなナッシュ均衡の計算方法を, ゲームの後向き帰納法という. キューン (H. Kuhn) は, 人完全情報ゲームは純戦略の範囲で少なくとも1つのナッシュ均衡をもつことを証明した [1].

 図1のゲームは (R, LR) の他に図2の利得行列で*をつけたナッシュ均衡をもつ. しかし, これらのナッシュ均衡は均衡プレイ上にない分岐点ではプレイヤーの最適戦略を導かないという欠点をもつ. ゼルテン (R. Selten) はナッシュ均衡のこのような欠点を解消するために, より強い均衡概念として, すべての部分ゲーム上にナッシュ均衡を導く部分ゲーム完全均衡 (subgame perfect equilibrium) を定義した [3].

 ゼルテンの研究以後, 展開形ゲームの理論は大きく進展し, 現在, ゲーム状況におけるプレイヤーの戦略的行動を解明する基礎理論としてORや経済学を始め広範囲の分野に応用されている.

 展開形ゲームについて詳しくは, [2] を参照されたい.



参考文献

[1] H. W. Kuhn, "Extensive Games and the Problem of Information," in H. W. Kuhn and A. Tucker(eds.), Contributions to the Theory of Games, Vol. II, Annals of Mathematics Studies 28, Princeton University Press, 1953, 193-216.

[2] 岡田 章, 『ゲーム理論』, 有斐閣, 1996.

[3] R. Selten, "Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games," International Journal of Game Theory, 4 (1975), 25-55.