「一般政策 (逐次決定過程における)」の版間の差分

2008年11月7日 (金) 14:23時点における最新版

【いっぱんせいさく (general policy)】

有限 $N\,$ 段逐次決定過程において, 過去の状態の履歴に依存して定まる政策. すなわち, 時刻 $n\,$ での決定を, 状態空間 $X\,$ からなる $n\,$ 個の直積 $X^{n}:=X\times X\times \cdots \times X\,$ から決定空間 $U\,$ への関数 $\sigma _{n}:X^{n}\to U\,$ で定めるとき, これらの決定関数の列 $\sigma =\{\sigma _{1},\sigma _{2},\ldots ,\sigma _{N}\}\,$ を一般政策という. 非加法型最適化問題では一般政策クラスで最適化が行われ, 不変埋没原理によって, このクラスの最適政策が得られる.

@@ 1行目: / 1行目: @@
 '''【いっぱんせいさく (general policy)】'''
-有限 $ N $ 段逐次決定過程において, 過去の状態の履歴に依存して定まる政策. すなわち, 時刻 $ n $ での決定を, 状態空間 $ X $ からなる$ n$ 個の直積 $ X^{n} := X \times X \times \cdots \times X $ から決定空間 $ U $ への関数 $ \sigma_{n} : X^{n} \to U $ で定めるとき, これらの決定関数の列 $ \sigma = \{\sigma_{1}, \sigma_{2}, \ldots , \sigma_{N} \} $ を一般政策という. 非加法型最適化問題では一般政策クラスで最適化が行われ, 不変埋没原理によって, このクラスの最適政策が得られる.
+有限 <math> N \,</math> 段逐次決定過程において, 過去の状態の履歴に依存して定まる政策. すなわち, 時刻 <math> n \,</math> での決定を, 状態空間 <math> X \,</math> からなる<math> n \,</math> 個の直積 <math> X^{n} := X \times X \times \cdots \times X \,</math> から決定空間 <math> U \,</math> への関数 <math> \sigma_{n} : X^{n} \to U \,</math> で定めるとき, これらの決定関数の列 <math> \sigma = \{\sigma_{1}, \sigma_{2}, \ldots , \sigma_{N} \} \,</math> を一般政策という. 非加法型最適化問題では一般政策クラスで最適化が行われ, 不変埋没原理によって, このクラスの最適政策が得られる.
+[[Category:動的・確率・多目的計画|いっぱんせいさく]]

「一般政策 (逐次決定過程における)」の版間の差分

2008年11月7日 (金) 14:23時点における最新版

案内メニュー

検索