「期待値最適化 (多段決定過程における)」の版間の差分

2008年11月7日 (金) 15:58時点における最新版

【きたいちさいてきか (expectation optimizing)】

多段確率推移システム全段にわたる評価の期待値を最適化する問題. すなわち, 決定を伴なうマルコフ推移法則の下で, 総利得そのものの期待値よりむしろ, 総利得の関数を通した評価の期待値を最適化する問題である. この関数を効用関数という. 期待効用最適化問題は一般政策のクラスで解決できる.不変埋没原理によるパラメータを含む再帰式を解いて,また多段確率決定樹表で解かれる.

2007年7月11日 (水) 13:17時点における版 (ソースを閲覧) 122.17.2.240 (トーク) (新しいページ: ''''【きたいちさいてきか (expectation optimizing)】''' 多段確率推移システム全段にわたる評価の期待値を最適化する問題. すなわち, 決...')		2008年11月7日 (金) 15:58時点における最新版 (ソースを閲覧) Albeit-Kun (トーク \| 投稿記録)
(他の1人の利用者による、間の1版が非表示)
2行目:		2行目:

	多段確率推移システム全段にわたる評価の期待値を最適化する問題. すなわち, 決定を伴なうマルコフ推移法則の下で, 総利得そのものの期待値よりむしろ, 総利得の関数を通した評価の期待値を最適化する問題である. この関数を効用関数という. 期待効用最適化問題は一般政策のクラスで解決できる.不変埋没原理によるパラメータを含む再帰式を解いて,また多段確率決定樹表で解かれる.		多段確率推移システム全段にわたる評価の期待値を最適化する問題. すなわち, 決定を伴なうマルコフ推移法則の下で, 総利得そのものの期待値よりむしろ, 総利得の関数を通した評価の期待値を最適化する問題である. この関数を効用関数という. 期待効用最適化問題は一般政策のクラスで解決できる.不変埋没原理によるパラメータを含む再帰式を解いて,また多段確率決定樹表で解かれる.
		+
		+	[[Category:動的・確率・多目的計画\|きたいちさいてきか]]

「期待値最適化 (多段決定過程における)」の版間の差分

2008年11月7日 (金) 15:58時点における最新版

案内メニュー

検索