「確率ゲーム」の版間の差分

提供: ORWiki
ナビゲーションに移動 検索に移動
("確率ゲーム" を保護しました。 [edit=sysop:move=sysop])
 
2行目: 2行目:
  
 
状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和 <math>n \,</math>人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである.
 
状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和 <math>n \,</math>人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである.
 +
 +
[[category:ゲーム理論|かくりつげーむ]]

2008年11月7日 (金) 15:11時点における最新版

【かくりつげーむ (stochastic game)】

状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和 人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである.