「マルコフ両決定過程」の版間の差分

2008年11月13日 (木) 22:16時点における最新版

【まるこふりょうけっていかてい (Markov bidecision process)】

いわゆるマルコフ決定過程では割引き総利得の期待値を最大化している. 割引き率構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \beta \,} が状態と決定に依存して「割引き関数」構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替（最新ブラウザーや補助ツールに推奨）: サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \beta(s,a) \,} になって, 負値をもとる過程を, マルコフ両決定過程という. この過程では最大化部分問題群ばかりでなく最小化部分問題群までを考えて埋め込む必要がある. このとき両最適値関数間に連立した再帰式(両帰式)が成り立つ.

2007年7月20日 (金) 11:00時点における版 (ソースを閲覧) Orsjwiki (トーク \| 投稿記録) 細 ("マルコフ両決定過程" を保護しました。 [edit=sysop:move=sysop]) ← 古い編集		2008年11月13日 (木) 22:16時点における最新版 (ソースを閲覧) Albeit-Kun (トーク \| 投稿記録)
2行目:		2行目:

	いわゆるマルコフ決定過程では割引き総利得の期待値を最大化している. 割引き率 <math> \beta \,</math> が状態と決定に依存して「割引き関数」<math> \beta(s,a) \,</math> になって, 負値をもとる過程を, マルコフ両決定過程という. この過程では最大化部分問題群ばかりでなく最小化部分問題群までを考えて埋め込む必要がある. このとき両最適値関数間に連立した再帰式(両帰式)が成り立つ.		いわゆるマルコフ決定過程では割引き総利得の期待値を最大化している. 割引き率 <math> \beta \,</math> が状態と決定に依存して「割引き関数」<math> \beta(s,a) \,</math> になって, 負値をもとる過程を, マルコフ両決定過程という. この過程では最大化部分問題群ばかりでなく最小化部分問題群までを考えて埋め込む必要がある. このとき両最適値関数間に連立した再帰式(両帰式)が成り立つ.
		+
		+	[[Category:動的・確率・多目的計画\|まるこふりょうけっていかてい]]

「マルコフ両決定過程」の版間の差分

2008年11月13日 (木) 22:16時点における最新版

案内メニュー

検索