「確率ゲーム」の版間の差分

提供: ORWiki
ナビゲーションに移動 検索に移動
(新しいページ: ''''【かくりつげーむ (stochastic game)】''' 状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲー...')
 
1行目: 1行目:
 
'''【かくりつげーむ (stochastic game)】'''
 
'''【かくりつげーむ (stochastic game)】'''
  
状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和$n$人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである.
+
状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和 <math>n \,</math>人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである.

2007年7月11日 (水) 20:55時点における版

【かくりつげーむ (stochastic game)】

状態変数の推移確率がプレイヤーの行動に依存する確率過程として定式化される多段階ゲーム. 2人ゼロ和確率ゲームの最適定常戦略の存在は1953年にシャープレイ(L.S. Shapley)によって証明され, その後, 非ゼロ和 人確率ゲームのナッシュ均衡の数学的性質や計算アルゴリズムの研究が行なわれている. 確率動的計画やマルコフ意思決定問題を複数の意思決定主体が存在するゲーム状況に拡張したモデルである.