原始政策のソースを表示
←
原始政策
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、以下のグループに属する利用者のみが実行できます:
登録利用者
。
このページは編集や他の操作ができないように保護されています。
このページのソースの閲覧やコピーができます。
【げんしせいさく (primitive policy)】 有限 $ N $ 段逐次決定過程において, 過去の状態と決定の履歴に依存して定まる政策. すなわち, 時刻 $ n $ の決定を, 状態空間 $ X $ と決定空間 $ U $ からなる$ (2n - 1)$ 個の直積 $ H_{n} := X \times U \times X \times U \times \cdots X \times U \times X $ から決定空間 $ U $ への関数 $ \mu_{n} : H_{n} \to U $ で定めるとき, これらの決定関数の列 $ \mu = \{\mu_{1}, \mu_{2}, \ldots , \mu_{N} \} $ を原始政策という. 情報量は一般政策より要するが, 非加法型期待値最適化問題では原始政策は一般政策と同じ期待値を与える.
原始政策
に戻る。
案内メニュー
個人用ツール
ログイン
名前空間
ページ
議論
変種
表示
閲覧
ソースを表示
履歴表示
その他
検索
案内
メインページ
コミュニティ・ポータル
最近の出来事
最近の更新
おまかせ表示
ヘルプ
ORWikiへのお問い合わせ
OR学会HP
OR学会アーカイブ集
ツール
リンク元
関連ページの更新状況
特別ページ
ページ情報