「繰り返し法 (動的計画法における)」の版間の差分
ナビゲーションに移動
検索に移動
(新しいページ: ''''【くりかえしほう (iterative method)】''' 基本的には多変数同時問題を1変数問題の繰り返しで解く方法. 例えば, 原始政策 $ \mu = \{\mu_...') |
Albeit-Kun (トーク | 投稿記録) |
||
(3人の利用者による、間の3版が非表示) | |||
1行目: | 1行目: | ||
'''【くりかえしほう (iterative method)】''' | '''【くりかえしほう (iterative method)】''' | ||
− | 基本的には多変数同時問題を1変数問題の繰り返しで解く方法. 例えば, 原始政策 | + | 基本的には多変数同時問題を1変数問題の繰り返しで解く方法. 例えば, 原始政策 <math> \mu = \{\mu_{1}, \mu_{2} \} \in \Pi_{p} \,</math> の2変数同時最適化問題 |
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | + | <center> | |
+ | <math> | ||
+ | \mathbf{max}_{\mu} | ||
+ | \sum \sum_{(x_2,x_3)} | ||
+ | g(x_1,u_1,x_2,u_2,x_3) \cdot | ||
+ | p(x_2\vert x_1,u_1)p(x_3\vert x_2, u_2) | ||
+ | \,</math> | ||
+ | </center> | ||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | を解く方法. ただし, | + | を解く代わりに, <math> \mu_{2} \,</math> による最適化の後に <math> \mu_{1} \,</math> による最適化を行なう問題 |
+ | |||
+ | |||
+ | <center> | ||
+ | <math> | ||
+ | {\mathbf{max}}_{\mu_1}\mathbf{max}_{\mu_2} | ||
+ | \sum \sum_{(x_2,x_3)} g(x_1,u_1,x_2,u_2,x_3) \cdot p(x_2\vert x_1,u_1)p(x_3\vert x_2, u_2) | ||
+ | \,</math> | ||
+ | </center> | ||
+ | |||
+ | |||
+ | を解く方法. ただし, <math>u_{1} = \mu_{1}(x_{1}), u_{2} = \mu_{2}(x_{1},u_{1},x_{2})\,</math>. | ||
+ | |||
+ | [[Category:動的・確率・多目的計画|くりかえしほう]] |
2008年11月8日 (土) 20:07時点における最新版
【くりかえしほう (iterative method)】
基本的には多変数同時問題を1変数問題の繰り返しで解く方法. 例えば, 原始政策 の2変数同時最適化問題
を解く代わりに, による最適化の後に による最適化を行なう問題
を解く方法. ただし, .