一般政策 (逐次決定過程における)のソースを表示
←
一般政策 (逐次決定過程における)
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、以下のグループに属する利用者のみが実行できます:
登録利用者
。
このページは編集や他の操作ができないように保護されています。
このページのソースの閲覧やコピーができます。
'''【いっぱんせいさく (general policy)】''' 有限 $ N $ 段逐次決定過程において, 過去の状態の履歴に依存して定まる政策. すなわち, 時刻 $ n $ での決定を, 状態空間 $ X $ からなる$ n$ 個の直積 $ X^{n} := X \times X \times \cdots \times X $ から決定空間 $ U $ への関数 $ \sigma_{n} : X^{n} \to U $ で定めるとき, これらの決定関数の列 $ \sigma = \{\sigma_{1}, \sigma_{2}, \ldots , \sigma_{N} \} $ を一般政策という. 非加法型最適化問題では一般政策クラスで最適化が行われ, 不変埋没原理によって, このクラスの最適政策が得られる.
一般政策 (逐次決定過程における)
に戻る。
案内メニュー
個人用ツール
ログイン
名前空間
ページ
議論
変種
表示
閲覧
ソースを表示
履歴表示
その他
検索
案内
メインページ
コミュニティ・ポータル
最近の出来事
最近の更新
おまかせ表示
ヘルプ
ORWikiへのお問い合わせ
OR学会HP
OR学会アーカイブ集
ツール
リンク元
関連ページの更新状況
特別ページ
ページ情報