「マルコフ決定過程」の版間の差分

2007年7月20日 (金) 10:58時点における版

【まるこふけっていかてい (Markov decision process)】

状態遷移にマルコフ性をもつ確率システムの動的最適化のための数学モデル. 1960 年にハワードの著書が出版されたことで, 広く知られるようになり, その後, 理論・応用両面で様々な研究がなされている. 最適政策を求める計算アルゴリズムに関しても, 政策反復法, 値反復法(逐次近似法), 線形計画問題として定式化し単体法を用いる解法など, かなり大規模な問題にも耐え得るアルゴリズムが開発されている.

「マルコフ決定過程」の版間の差分

2007年7月20日 (金) 10:58時点における版

案内メニュー

検索

2007年7月16日 (月) 19:20時点における版 (ソースを閲覧) 122.17.2.240 (トーク) ← 古い編集	2007年7月20日 (金) 10:58時点における版 (ソースを閲覧) Orsjwiki (トーク \| 投稿記録) 細 ("マルコフ決定過程" を保護しました。 [edit=sysop:move=sysop]) 新しい編集 →
(相違点なし)