「仮想プレイ」の版間の差分

2007年7月11日 (水) 22:15時点における版

【かそうぷれい (fictitious play)】

戦略形ゲームが $t=1,2,\dots \,$ の各期にプレイされるとする. $t+1\,$ 期に, 他のプレイヤーは $1\,$ 期から $t\,$ 期に選択した比率(経験分布)に等しい確率で各純戦略を選択する, という「予測」のもと, 各プレイヤーがそれに対する最適反応戦略を選択する動学モデル. 各プレイヤーの経験分布がある極限分布に収束するとき, 極限分布からなる戦略の組はナッシュ均衡となる. 2人ゼロ和ゲームなどでは収束するが, 収束しない例も知られている.

2007年7月10日 (火) 12:10時点における版 (ソースを閲覧) Orsjwiki (トーク \| 投稿記録) (新しいページ: ''''【かそうぷれい (fictitious play)】''' 戦略形ゲームが $t=1,2,\dots$ の各期にプレイされるとする. $t+1$ 期に, 他のプレイヤーは $1$ 期か...')		2007年7月11日 (水) 22:15時点における版 (ソースを閲覧) 124.144.188.143 (トーク) 新しい編集 →
1行目:		1行目:
	'''【かそうぷれい (fictitious play)】'''		'''【かそうぷれい (fictitious play)】'''

−	戦略形ゲームが $t=1,2,\dots$ の各期にプレイされるとする. $t+1$ 期に, 他のプレイヤーは $1$ 期から $t$ 期に選択した比率(経験分布)に等しい確率で各純戦略を選択する, という「予測」のもと, 各プレイヤーがそれに対する最適反応戦略を選択する動学モデル. 各プレイヤーの経験分布がある極限分布に収束するとき, 極限分布からなる戦略の組はナッシュ均衡となる. 2人ゼロ和ゲームなどでは収束するが, 収束しない例も知られている.	+	戦略形ゲームが <math>t=1,2,\dots \,</math> の各期にプレイされるとする. <math>t+1 \,</math> 期に, 他のプレイヤーは <math>1 \,</math> 期から <math>t \,</math> 期に選択した比率(経験分布)に等しい確率で各純戦略を選択する, という「予測」のもと, 各プレイヤーがそれに対する最適反応戦略を選択する動学モデル. 各プレイヤーの経験分布がある極限分布に収束するとき, 極限分布からなる戦略の組はナッシュ均衡となる. 2人ゼロ和ゲームなどでは収束するが, 収束しない例も知られている.

「仮想プレイ」の版間の差分

2007年7月11日 (水) 22:15時点における版

案内メニュー

検索