「繰り返し法 (動的計画法における)」の版間の差分

2008年11月8日 (土) 20:07時点における最新版

【くりかえしほう (iterative method)】

基本的には多変数同時問題を1変数問題の繰り返しで解く方法. 例えば, 原始政策 $\mu =\{\mu _{1},\mu _{2}\}\in \Pi _{p}\,$ の2変数同時最適化問題

構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mathbf{max}_{\mu} \sum \sum_{(x_2,x_3)} g(x_1,u_1,x_2,u_2,x_3) \cdot p(x_2\vert x_1,u_1)p(x_3\vert x_2, u_2) \,}

を解く代わりに, $\mu _{2}\,$ による最適化の後に構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mu_{1} \,} による最適化を行なう問題

構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle {\mathbf{max}}_{\mu_1}\mathbf{max}_{\mu_2} \sum \sum_{(x_2,x_3)} g(x_1,u_1,x_2,u_2,x_3) \cdot p(x_2\vert x_1,u_1)p(x_3\vert x_2, u_2) \,}

を解く方法. ただし, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle u_{1} = \mu_{1}(x_{1}), u_{2} = \mu_{2}(x_{1},u_{1},x_{2})\,} .

@@ 1行目: / 1行目: @@
 '''【くりかえしほう (iterative method)】'''
-基本的には多変数同時問題を1変数問題の繰り返しで解く方法. 例えば, 原始政策 $ \mu = \{\mu_{1}, \mu_{2} \} \in \Pi_{p} $ の2変数同時最適化問題
+基本的には多変数同時問題を1変数問題の繰り返しで解く方法. 例えば, 原始政策 <math> \mu = \{\mu_{1}, \mu_{2} \} \in \Pi_{p} \,</math> の2変数同時最適化問題
-\[
-\begin{array}{l}
-  \hspace*{-5mm} \displaystyle{\mathop{{\rm max}}_{\mu}
-   \sum \sum_{\hspace{-7mm}(x_{2},x_{3})}
-   g(x_{1},u_{1},x_{2},u_{2},x_{3}) \cdot }
- p(x_{2}\vert x_{1},u_{1})p(x_3\vert x_2, u_2)
-\end{array}
-\]
-を解く代わりに, $ \mu_{2} $ による最適化の後に $ \mu_{1} $ による最適化を行なう問題
+<center>
+<math>
+\mathbf{max}_{\mu}
+   \sum \sum_{(x_2,x_3)}
+   g(x_1,u_1,x_2,u_2,x_3) \cdot
+ p(x_2\vert x_1,u_1)p(x_3\vert x_2, u_2)
+\,</math>
+</center>
-\[
-\begin{array}{l}
- \hspace*{-5mm} \displaystyle{\mathop{{\rm max}}_{\mu_{1}}\mathop{{\rm max}}_{\mu_{2}}
-  \sum \sum_{\hspace{-7mm}(x_{2},x_{3})} g(x_{1},u_{1},x_{2},u_{2},x_{3}) \cdot }p(x_{2}\vert x_{1},u_{1})p(x_3\vert x_2, u_2)
-\end{array}
-\]
-を解く方法. ただし, $u_{1} = \mu_{1}(x_{1}), u_{2} = \mu_{2}(x_{1},u_{1},x_{2})$.
+を解く代わりに, <math> \mu_{2} \,</math> による最適化の後に <math> \mu_{1} \,</math> による最適化を行なう問題
+<center>
+<math>
+{\mathbf{max}}_{\mu_1}\mathbf{max}_{\mu_2}
+  \sum \sum_{(x_2,x_3)} g(x_1,u_1,x_2,u_2,x_3) \cdot p(x_2\vert x_1,u_1)p(x_3\vert x_2, u_2)
+\,</math>
+</center>
+を解く方法. ただし, <math>u_{1} = \mu_{1}(x_{1}), u_{2} = \mu_{2}(x_{1},u_{1},x_{2})\,</math>.
+[[Category:動的・確率・多目的計画|くりかえしほう]]

「繰り返し法 (動的計画法における)」の版間の差分

2008年11月8日 (土) 20:07時点における最新版

案内メニュー

検索