「繰り返し法 (動的計画法における)」の版間の差分

2008年11月8日 (土) 20:07時点における最新版

【くりかえしほう (iterative method)】

基本的には多変数同時問題を1変数問題の繰り返しで解く方法. 例えば, 原始政策 $\mu =\{\mu _{1},\mu _{2}\}\in \Pi _{p}\,$ の2変数同時最適化問題

$\mathbf {max} _{\mu }\sum \sum _{(x_{2},x_{3})}g(x_{1},u_{1},x_{2},u_{2},x_{3})\cdot p(x_{2}\vert x_{1},u_{1})p(x_{3}\vert x_{2},u_{2})\,$

を解く代わりに, $\mu _{2}\,$ による最適化の後に $\mu _{1}\,$ による最適化を行なう問題

${\mathbf {max} }_{\mu _{1}}\mathbf {max} _{\mu _{2}}\sum \sum _{(x_{2},x_{3})}g(x_{1},u_{1},x_{2},u_{2},x_{3})\cdot p(x_{2}\vert x_{1},u_{1})p(x_{3}\vert x_{2},u_{2})\,$

を解く方法. ただし, $u_{1}=\mu _{1}(x_{1}),u_{2}=\mu _{2}(x_{1},u_{1},x_{2})\,$ .

2007年7月20日 (金) 09:35時点における版 (ソースを閲覧) Orsjwiki (トーク \| 投稿記録) 細 ("繰り返し法 (動的計画法における)" を保護しました。 [edit=sysop:move=sysop]) ← 古い編集		2008年11月8日 (土) 20:07時点における最新版 (ソースを閲覧) Albeit-Kun (トーク \| 投稿記録)
26行目:		26行目:

	を解く方法. ただし, <math>u_{1} = \mu_{1}(x_{1}), u_{2} = \mu_{2}(x_{1},u_{1},x_{2})\,</math>.		を解く方法. ただし, <math>u_{1} = \mu_{1}(x_{1}), u_{2} = \mu_{2}(x_{1},u_{1},x_{2})\,</math>.
		+
		+	[[Category:動的・確率・多目的計画\|くりかえしほう]]

「繰り返し法 (動的計画法における)」の版間の差分

2008年11月8日 (土) 20:07時点における最新版

案内メニュー

検索