「事前条件付き決定過程」の版間の差分
ナビゲーションに移動
検索に移動
細 ("事前条件付き決定過程" を保護しました。 [edit=sysop:move=sysop]) |
Albeit-Kun (トーク | 投稿記録) |
||
2行目: | 2行目: | ||
事後条件付き決定過程とは対称的に, 各段において決定の「前に」条件付き期待値をとる過程をいう. すなわち, (今日からの期待効用)を, (今日の効用)と(明日からの不確実な効用)との非加法的再帰集積値の期待値と考えている. これに対し 事後過程では(今日の効用)と(明日からの期待効用)との非加法的再帰集積値と考えている. 両条件付き過程はマルコフ政策クラスの中で動的計画法によって最適化される. | 事後条件付き決定過程とは対称的に, 各段において決定の「前に」条件付き期待値をとる過程をいう. すなわち, (今日からの期待効用)を, (今日の効用)と(明日からの不確実な効用)との非加法的再帰集積値の期待値と考えている. これに対し 事後過程では(今日の効用)と(明日からの期待効用)との非加法的再帰集積値と考えている. 両条件付き過程はマルコフ政策クラスの中で動的計画法によって最適化される. | ||
+ | |||
+ | [[Category:動的・確率・多目的計画|じぜんじょうけんつきけっていかてい ]] |
2008年11月9日 (日) 18:25時点における最新版
【じぜんじょうけんつきけっていかてい (a priori conditional decision process)】
事後条件付き決定過程とは対称的に, 各段において決定の「前に」条件付き期待値をとる過程をいう. すなわち, (今日からの期待効用)を, (今日の効用)と(明日からの不確実な効用)との非加法的再帰集積値の期待値と考えている. これに対し 事後過程では(今日の効用)と(明日からの期待効用)との非加法的再帰集積値と考えている. 両条件付き過程はマルコフ政策クラスの中で動的計画法によって最適化される.