《ゲームと実験》
【げーむとじっけん (Games and Experiments) 】
被験者を集め, 実験室でゲーム理論のモデルで想定されている環境を再現して, ゲーム理論の予測の是非を検証する実験研究は1950年代頃から始まった. 特に1980年代以降, ゲーム理論の経済学への応用に関する実験研究が盛んになっている. 交渉ゲーム, 囚人のジレンマ・ゲーム, 調整ゲーム(coordination game), 入札ゲーム, 不確実性下の意思決定問題などに関して様々な実験が行われている(キャメラー [2], ケイゲル=ロス [8], 船木=大和 [14], 大和 [15]を参照). ここでは, 「調整ゲーム」, 「公共財供給ゲーム」及び「最後通牒ゲーム(ultimatum game)」の3種類のゲームに焦点を絞り, それらの実験結果を簡単に紹介する.
1. 調整ゲームの実験結果 二人のプレイヤーの戦略集合が同じで, 彼らが同じ純戦略を選んだ場合, 二人の利得はともに1だが, 他の場合には二人の利得はともに0であるような調整ゲームを考える. このゲームでは, 任意の純粋戦略に関して, 二人ともその同じ戦略を選ぶのがナッシュ均衡の一つである. 純粋戦略均衡は複数存在し, それらの利得はすべて同じである. どの均衡が選択されるかは通常のゲーム理論では予測できない.
ところが, このゲームに関する実験では, 一つの均衡が選択される傾向が観察されている(シェリング [12], メタ=スターマー=サグデン [9]). 戦略の集合が{表, 裏}である時, 86%の被験者が「表」を選び, わずか14の被験者しか「裏」を選択しない. 戦略の集合が色の種類であるとき, 59の人が「赤」を選択する. 戦略の集合が正の整数の時, 40の人が「1」を選択するなどである. 興味深い点は, 調整ゲームの実験結果に比べて, 被験者が単に選好を尋ねられた場合には, 人々の選択はばらついてしまったことである. 例えば, 88人の被験者が「月日をひとつ書け」と尋ねられた時, 彼らの答えは75通りに違っており, 12月25日(クリスマス)と書いた人はわずか6であった. これに対して, 調整ゲームの実験では, 被験者は他の人と同じ月日を選択しようとし, 44の人が12月25日を選んでいる. 通常のゲーム理論では, ゲームの解は戦略がどのようにラベル付けされるかに依存しないと仮定されている. しかし, 実験では, 被験者は戦略のラベルの意味を無視することはなく, ある特定の均衡が「フォーカル・ポイント(focal point)」となっている.
また, 複数の対称的な純粋ナッシュ均衡が, パレートの基準で順番を付けられような調整ゲームに関する実験も多く行われている. 相手がどの戦略を選ぶかに関するリスクを被験者が重視したため, パレート最適性を満たす均衡が選択されず, 調整の失敗が起こっていることが観察されている(ケイゲル=ロス [8], 第3章参照).
2. 公共財供給ゲームの実験結果 公共財供給ゲームにおいて, 各プレイヤーの公共財への支払い額を, 公共財の供給水準を と表そう. いま, 各プレイヤー の利得関数は線形で, で与えられるとする. なので, 各プレイヤー の支配戦略はを選択し, 完全にただ乗り(free-riding)をすることである. ところが, なので, 各プレイヤーがを選択する時, プレイヤーの利得の和は最大になる. よって, このゲームは囚人のジレンマ・ゲームの一種である. また, このゲームの有限回繰り返しゲームについては, 各回において, 全てのプレイヤーがを選択し, 完全にただ乗りするのが部分ゲーム完全均衡である.
公共財供給ゲームに関しては膨大な数の実験が行われている(ケイゲル=ロス [8], 2章を参照). 結果を要約すると, 1) 公共財供給ゲームを一回だけ行う実験では, 初期保有の40~60が公共財供給のために支払われる. 2) 同じ公共財供給ゲームを何回も繰り返す場合, 実験の初回では初期保有の約50前後が支払われるが, 回が進むにつれて支払い額が減少していき, 最後の回では, ときには約10以下しか支払われない. 3) 公共財の限界収益の値が大きくなるほど, 支払い額は増える. 4) 利得に関する情報が詳細になればなるほど, 支払い額は少なくなる.
また, ケイソン=西條=大和 [4] ,[5]は, 公共財への支払い額を決定する前に, 各プレイヤーが公共財投資に参加するか否かを同時に決定する2段階ゲームの実験を日本と米国で実施し, 国際比較を行っている. 米国の実験では, 投資の参加率は進化的安定戦略と等しかったが, 日本の実験では理論予測と異なる結果が観察された. 投資に参加した被験者の多くが, 自己の利得を犠牲にしてまでも, 不参加を選択した人の利得が下がるような支払い額を選んだのである. この報復的行動のため, 参加を選択した方がより高い利得を得られることが学習され, 参加率は上昇していった. いわば, 報復的行動が協力の源泉となったのである.
3. 最後通牒ゲームの実験結果 最後通牒ゲームにおいて, 1円がプレイヤー1の提案の最小値であるとすると, 二つの部分ゲーム完全均衡が存在する. a) プレイヤー1は円のうち円をプレイヤー2に与えることを提案し, プレイヤー2は提案を受け入れる. b) プレイヤー1は円のうち円をプレイヤー2に与えることを提案し, プレイヤー2は提案を受け入れる. このゲームについて, いろいろな異なる国で, 分配する金額の大きさや実験手続きを変えて, さまざまな実験研究が行われてきたが, 部分ゲーム完全均衡の予測とは異なる結果が観察されている(ケイゲル=ロス [8], 4章を参照). 要約すると, 1) 大部分の提案において, プレイヤー2の金額が全体に占める割合は40~50の間である. 2) プレイヤー2の金額が全体の20を下回るような提案はほとんどない. 3) プレイヤー2の金額が全体に占める割合が小さい提案ほど拒否されやすい.
また, 最後通牒ゲームの変形で, プレイヤー1の提案をプレイヤー2が必ず受託せねばならず拒否することができない「独裁者ゲーム(dictator game)」に関する実験も行われている. 独裁者ゲームでは, プレイヤー1が全額を取るのがナッシュ均衡である. このゲームの実験で観察された提案の大部分では, プレイヤー2の金額が全体に占める割合は0~30の間で, 最後通牒ゲームの実験結果に比べてその割合は平均的に低くなっている.
4. 実験結果を説明する新たな理論の構築 多くのゲームに関して実験結果は理論予測とは異なってはいるが, それらの異なり方はランダムではなくある一定の傾向を持っている. そこで, 実験結果のもっともらしい説明を考察し, それらを取り入れてゲーム理論を拡張し新たな理論を構築しようという研究が生まれてきている. 一つのアプローチは, 各プレイヤーの効用は彼自身の金銭利得だけではなくと他のプレイヤーの金銭利得にも依存するが, 各プレイヤーは期待効用を最大化する合理的なプレイヤーであると仮定したモデルを用いて実験結果を説明しようとするものである. 例えば, 最後通牒ゲームの実験結果に関して, もしプレイヤー2の効用が自分自身の金銭利得よりも分配の公平性に大きく依存しているならば, プレイヤー2は合理的な選択を行っているであろう. また, 独裁者ゲームの結果が示唆している様に, プレイヤー1の効用が分配の公平性より自分の金銭利得に大きく依存している場合でも, プレイヤー1はプレイヤー2に不公平な分配を拒否されるという危険性を考慮に入れた上で, 合理的に行動していると言えるであろう. ボルトン=オッケンフェル [1] とフェー=シュミッド [6] は自分の金銭利得と他人の金銭利得の違いにどのように反応するかは各人で異なり, 私的情報であると仮定し, 最後通牒ゲームだけでなく他の様々なゲームに関する実験結果を一つのモデルで説明することに成功している.
もうひとつ別のアプローチは, 各プレイヤーは必ずしも合理的ではないと仮定することである. これに関しては, 人々が期待効用を最大にする戦略を選ぶとは限らず, 間違いを起こす可能性を認めたマッケルビィ=パルフレィ [10] のモデルやゲームにおける学習モデルを用いる研究などが行われている.
また, 最後通牒ゲームを行う被験者の脳をスキャンして調べる研究も行われている(サンフィ [11] ). ゲーム理論や経済学だけではなく, 心理学, 社会学, 進化学, 神経科学などの手法も採用して, 行動ゲーム理論(Behavioral Game Theory)や神経経済学(Neuroeconomics)などが誕生して来ている(キャメラー [2], [3], ギンティス [7] , ザック [13]). 実験研究を通じて, 諸科学の統合化が始まったのである.
参考文献
[1] G. E. Bolton and A. Ockenfels, "ERC: A Theory of Equity, Reciprocity and Competition," American Economic Review, 90 (2000), 166-193.
[2] Camerer, C. F., Behavioral Game Theory: Experiments in Strategic Interaction, Princeton University Press, 2003.
[3] Camerer, C. F., G. Loewenstein, and D. Prelec, "Neuroeconomics: How Neuroscience Can Inform Economics," Journal of Economic Literature, XLIII (2005), 9-64. Reprint in Sistemi Intelligenti, 2004, XVI(3), 337-48.
[4] Cason, T., T. Saijo, and T. Yamato, "Voluntary Participation and Spite in Public Good Provision Experiments: An International Comparison," Experimental Economics, 5 (2002), 133-153.
[5] Cason, T., T. Saijo, T. Yamato, and K. Yokotani, "Non-Excludable Public Good Experiments," Games and Economic Behavior, 49 (2004), 81-102.
[6] E. Fehr and K. M. Schmidt, "A Theory of Fairness, Competition, and Cooperation," Quarterly Journal of Economics, 114, (1999), 817-868.
[7] Gintis, H., "Towards a Unity of the Human Behavioral Sciences," Poilitics, Philosophy, and Economics, 3 (2004), 37-57.
[8] J. H. Kagel and A. E. Roth, eds., The Handbook of Experimental Economics, Princeton University Press, 1995.
[9] J. Mehta, C. Starmer and R. Sugden, "The Nature of Salience: An Experimental Investigation of Pure Coordination Games," American Economic Review, 84 (1995) , 658-673.
[10] R. D. McKelvey and T. R. Palfrey, "Quantal Response Equilibria of Normal Form Games," Games and Economic Behavior, 10 (1995), 6-38.
[11] Sanfey, A. G., Rilling, J. K., Aaronson, J. A., Nystrom, Leigh E., and Cohen, J. D., "The Neural Basis of Economic Decision Making: An fMRI Investigation of the Ultimatum Game," Science 300 (5626) (2003), 1755-58.
[12] T. Schelling, The Strategy of Conflict, Harvard University Press, 1960.
[13] Zak, P. J. "Neuroeconomics," Philosophical Transactions of the Royal Society B, 359 (2004), 1737-1748.
[14] 船木由喜彦, 大和毅彦, 「経済学における実験アプローチの役割」, 『ESP』, 2002年12月, 47-51.
[15] 大和毅彦, 「経済実験におけるスパイト行動」, 『彦根論叢』, 357号, 2006年, 47-65.