直接法 (動的計画法における)のソースを表示
←
直接法 (動的計画法における)
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、以下のグループに属する利用者のみが実行できます:
登録利用者
。
このページは編集や他の操作ができないように保護されています。
このページのソースの閲覧やコピーができます。
'''【ちょくせつほう (direct method)】''' 多段確率システム上での逐次最適化の1つ. 加法型などの可分な評価関数に限定せず, 任意の評価関数の期待値最適化問題を再帰式で解く方法. 最適値の評価を, 始発の状態から(決定を含んだ終端状態まで)の全履歴の関数として考え, 可分・非可分を意識することなく, 「直接」再帰式を導く. 所与の評価関数から始まって, 逐次後ろ向きに期待値を取った関数を最適化して最後に初期状態の関数として最適な期待値と最適な原始政策が求められる.
直接法 (動的計画法における)
に戻る。
案内メニュー
個人用ツール
ログイン
名前空間
ページ
議論
変種
表示
閲覧
ソースを表示
履歴表示
その他
検索
案内
メインページ
コミュニティ・ポータル
最近の出来事
最近の更新
おまかせ表示
ヘルプ
ORWikiへのお問い合わせ
OR学会HP
OR学会アーカイブ集
ツール
リンク元
関連ページの更新状況
特別ページ
ページ情報