「確率ゲーム」の版間の差分

提供: ORWiki
ナビゲーションに移動 検索に移動
 
(他の1人の利用者による、間の1版が非表示)
2行目: 2行目:
  
 
状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和 <math>n \,</math>人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである.
 
状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和 <math>n \,</math>人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである.
 +
 +
[[category:ゲーム理論|かくりつげーむ]]

2008年11月7日 (金) 15:11時点における最新版

【かくりつげーむ (stochastic game)】

状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle n \,} 人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである.