負値乗法型評価系
2008年11月13日 (木) 15:39時点におけるAlbeit-Kun (トーク | 投稿記録)による版
【ふちじょうほうがたひょうかけい (negative-valued multiplicative criterion)】
多段逐次決定過程において, 各段の評価を総合してシステム全体として積で評価することを, 乗法型評価系という. このとき, 各段の評価が負値を取り得るとき, 負値乗法型評価系という. この最適化は, 確定系では両的計画法で, 確率系ではマルコフ両決定過程で解かれる.