事前条件付き決定過程

提供: ORWiki
ナビゲーションに移動 検索に移動

【じぜんじょうけんつきけっていかてい (a priori conditional decision process)】

事後条件付き決定過程とは対称的に, 各段において決定の「前に」条件付き期待値をとる過程をいう. すなわち, (今日からの期待効用)を, (今日の効用)と(明日からの不確実な効用)との非加法的再帰集積値の期待値と考えている. これに対し 事後過程では(今日の効用)と(明日からの期待効用)との非加法的再帰集積値と考えている. 両条件付き過程はマルコフ政策クラスの中で動的計画法によって最適化される.