「一般政策 (逐次決定過程における)」の版間の差分
(新しいページ: ''''【いっぱんせいさく (general policy)】''' 有限 $ N $ 段逐次決定過程において, 過去の状態の履歴に依存して定まる政策. すなわち, 時...') |
|||
| 1行目: | 1行目: | ||
'''【いっぱんせいさく (general policy)】''' | '''【いっぱんせいさく (general policy)】''' | ||
| − | 有限 | + | 有限 <math> N \,</math> 段逐次決定過程において, 過去の状態の履歴に依存して定まる政策. すなわち, 時刻 <math> n \,</math> での決定を, 状態空間 <math> X \,</math> からなる<math> n \,</math> 個の直積 <math> X^{n} := X \times X \times \cdots \times X \,</math> から決定空間 <math> U \,</math> への関数 <math> \sigma_{n} : X^{n} \to U \,</math> で定めるとき, これらの決定関数の列 <math> \sigma = \{\sigma_{1}, \sigma_{2}, \ldots , \sigma_{N} \} \,</math> を一般政策という. 非加法型最適化問題では一般政策クラスで最適化が行われ, 不変埋没原理によって, このクラスの最適政策が得られる. |
2007年7月11日 (水) 12:24時点における版
【いっぱんせいさく (general policy)】
有限 段逐次決定過程において, 過去の状態の履歴に依存して定まる政策. すなわち, 時刻 での決定を, 状態空間 からなる構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle n \,} 個の直積 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle X^{n} := X \times X \times \cdots \times X \,} から決定空間 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle U \,} への関数 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \sigma_{n} : X^{n} \to U \,} で定めるとき, これらの決定関数の列 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \sigma = \{\sigma_{1}, \sigma_{2}, \ldots , \sigma_{N} \} \,} を一般政策という. 非加法型最適化問題では一般政策クラスで最適化が行われ, 不変埋没原理によって, このクラスの最適政策が得られる.