繰り返し法 (動的計画法における)のソースを表示
←
繰り返し法 (動的計画法における)
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、以下のグループに属する利用者のみが実行できます:
登録利用者
。
このページは編集や他の操作ができないように保護されています。
このページのソースの閲覧やコピーができます。
'''【くりかえしほう (iterative method)】''' 基本的には多変数同時問題を1変数問題の繰り返しで解く方法. 例えば, 原始政策 $ \mu = \{\mu_{1}, \mu_{2} \} \in \Pi_{p} $ の2変数同時最適化問題 \[ \begin{array}{l} \hspace*{-5mm} \displaystyle{\mathop{{\rm max}}_{\mu} \sum \sum_{\hspace{-7mm}(x_{2},x_{3})} g(x_{1},u_{1},x_{2},u_{2},x_{3}) \cdot } p(x_{2}\vert x_{1},u_{1})p(x_3\vert x_2, u_2) \end{array} \] を解く代わりに, $ \mu_{2} $ による最適化の後に $ \mu_{1} $ による最適化を行なう問題 \[ \begin{array}{l} \hspace*{-5mm} \displaystyle{\mathop{{\rm max}}_{\mu_{1}}\mathop{{\rm max}}_{\mu_{2}} \sum \sum_{\hspace{-7mm}(x_{2},x_{3})} g(x_{1},u_{1},x_{2},u_{2},x_{3}) \cdot }p(x_{2}\vert x_{1},u_{1})p(x_3\vert x_2, u_2) \end{array} \] を解く方法. ただし, $u_{1} = \mu_{1}(x_{1}), u_{2} = \mu_{2}(x_{1},u_{1},x_{2})$.
繰り返し法 (動的計画法における)
に戻る。
案内メニュー
個人用ツール
ログイン
名前空間
ページ
議論
変種
表示
閲覧
ソースを表示
履歴表示
その他
検索
案内
メインページ
コミュニティ・ポータル
最近の出来事
最近の更新
おまかせ表示
ヘルプ
ORWikiへのお問い合わせ
OR学会HP
OR学会アーカイブ集
ツール
リンク元
関連ページの更新状況
特別ページ
ページ情報