事前条件付き決定過程

提供: ORWiki
2008年11月9日 (日) 18:25時点におけるAlbeit-Kun (トーク | 投稿記録)による版
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

【じぜんじょうけんつきけっていかてい (a priori conditional decision process)】

事後条件付き決定過程とは対称的に, 各段において決定の「前に」条件付き期待値をとる過程をいう. すなわち, (今日からの期待効用)を, (今日の効用)と(明日からの不確実な効用)との非加法的再帰集積値の期待値と考えている. これに対し 事後過程では(今日の効用)と(明日からの期待効用)との非加法的再帰集積値と考えている. 両条件付き過程はマルコフ政策クラスの中で動的計画法によって最適化される.