「仮想プレイ」の版間の差分
ナビゲーションに移動
検索に移動
Albeit-Kun (トーク | 投稿記録) |
|||
(他の1人の利用者による、間の1版が非表示) | |||
2行目: | 2行目: | ||
戦略形ゲームが <math>t=1,2,\dots \,</math> の各期にプレイされるとする. <math>t+1 \,</math> 期に, 他のプレイヤーは <math>1 \,</math> 期から <math>t \,</math> 期に選択した比率(経験分布)に等しい確率で各純戦略を選択する, という「予測」のもと, 各プレイヤーがそれに対する最適反応戦略を選択する動学モデル. 各プレイヤーの経験分布がある極限分布に収束するとき, 極限分布からなる戦略の組はナッシュ均衡となる. 2人ゼロ和ゲームなどでは収束するが, 収束しない例も知られている. | 戦略形ゲームが <math>t=1,2,\dots \,</math> の各期にプレイされるとする. <math>t+1 \,</math> 期に, 他のプレイヤーは <math>1 \,</math> 期から <math>t \,</math> 期に選択した比率(経験分布)に等しい確率で各純戦略を選択する, という「予測」のもと, 各プレイヤーがそれに対する最適反応戦略を選択する動学モデル. 各プレイヤーの経験分布がある極限分布に収束するとき, 極限分布からなる戦略の組はナッシュ均衡となる. 2人ゼロ和ゲームなどでは収束するが, 収束しない例も知られている. | ||
+ | |||
+ | [[category:ゲーム理論|かそうぷれい]] |
2008年11月7日 (金) 15:27時点における最新版
【かそうぷれい (fictitious play)】
戦略形ゲームが の各期にプレイされるとする. 期に, 他のプレイヤーは 期から 期に選択した比率(経験分布)に等しい確率で各純戦略を選択する, という「予測」のもと, 各プレイヤーがそれに対する最適反応戦略を選択する動学モデル. 各プレイヤーの経験分布がある極限分布に収束するとき, 極限分布からなる戦略の組はナッシュ均衡となる. 2人ゼロ和ゲームなどでは収束するが, 収束しない例も知られている.