逐次決定過程

提供: ORWiki
2008年11月13日 (木) 12:14時点におけるAlbeit-Kun (トーク | 投稿記録)による版
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
ナビゲーションに移動 検索に移動

【ちくじけっていかてい (sequential decision process)】

システムが時間とともに推移しているとき, 各時点で最適化を行なって全体の評価関数を最適化する過程. 状態は, 確定的, 確率的, またはファジィ的に推移する. 評価関数には陰に陽に再帰性(可分性)が見られる. さらに, 単調性があれば, 動的計画法で最適化される. 特に, 直列的に多段構造になると, 状態推移が明確になり最適化し易くなる. 組み合せ最適化問題の表現, 最適解へのアルゴリズムなど種々応用される.