「期待値最適化 (多段決定過程における)」の版間の差分
ナビゲーションに移動
検索に移動
(新しいページ: ''''【きたいちさいてきか (expectation optimizing)】''' 多段確率推移システム全段にわたる評価の期待値を最適化する問題. すなわち, 決...') |
Albeit-Kun (トーク | 投稿記録) |
||
(他の1人の利用者による、間の1版が非表示) | |||
2行目: | 2行目: | ||
多段確率推移システム全段にわたる評価の期待値を最適化する問題. すなわち, 決定を伴なうマルコフ推移法則の下で, 総利得そのものの期待値よりむしろ, 総利得の関数を通した評価の期待値を最適化する問題である. この関数を効用関数という. 期待効用最適化問題は一般政策のクラスで解決できる.不変埋没原理によるパラメータを含む再帰式を解いて,また多段確率決定樹表で解かれる. | 多段確率推移システム全段にわたる評価の期待値を最適化する問題. すなわち, 決定を伴なうマルコフ推移法則の下で, 総利得そのものの期待値よりむしろ, 総利得の関数を通した評価の期待値を最適化する問題である. この関数を効用関数という. 期待効用最適化問題は一般政策のクラスで解決できる.不変埋没原理によるパラメータを含む再帰式を解いて,また多段確率決定樹表で解かれる. | ||
+ | |||
+ | [[Category:動的・確率・多目的計画|きたいちさいてきか]] |
2008年11月7日 (金) 15:58時点における最新版
【きたいちさいてきか (expectation optimizing)】
多段確率推移システム全段にわたる評価の期待値を最適化する問題. すなわち, 決定を伴なうマルコフ推移法則の下で, 総利得そのものの期待値よりむしろ, 総利得の関数を通した評価の期待値を最適化する問題である. この関数を効用関数という. 期待効用最適化問題は一般政策のクラスで解決できる.不変埋没原理によるパラメータを含む再帰式を解いて,また多段確率決定樹表で解かれる.