「確率ゲーム」の版間の差分
ナビゲーションに移動
検索に移動
Albeit-Kun (トーク | 投稿記録) |
|||
(他の1人の利用者による、間の1版が非表示) | |||
2行目: | 2行目: | ||
状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和 <math>n \,</math>人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである. | 状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和 <math>n \,</math>人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである. | ||
+ | |||
+ | [[category:ゲーム理論|かくりつげーむ]] |
2008年11月7日 (金) 15:11時点における最新版
【かくりつげーむ (stochastic game)】
状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和 人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである.