確率動的計画のソースを表示
←
確率動的計画
ナビゲーションに移動
検索に移動
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
この操作は、以下のグループに属する利用者のみが実行できます:
登録利用者
。
このページは編集や他の操作ができないように保護されています。
このページのソースの閲覧やコピーができます。
'''【かくりつどうてきけいかく (stochastic dynamic programming)】''' システムの状態推移が確率的なとき, 多段階にわたる評価の期待値を最適化する方法で, マルコフ決定過程と同じ意味で使われる. いわゆる総利得の期待値をマルコフクラスで最大にする問題は動的計画法の再帰式を後ろ向きに解くことによって解ける.総利得は加法型評価系の一例であるが, 一般の結合型評価系に対しては(非負値乗法型を除けば)後向きの再帰式を解いてマルコフ政策クラスの中で最適政策を求めることはできない.
確率動的計画
に戻る。
案内メニュー
個人用ツール
ログイン
名前空間
ページ
議論
変種
表示
閲覧
ソースを表示
履歴表示
その他
検索
案内
メインページ
コミュニティ・ポータル
最近の出来事
最近の更新
おまかせ表示
ヘルプ
ORWikiへのお問い合わせ
OR学会HP
OR学会アーカイブ集
ツール
リンク元
関連ページの更新状況
特別ページ
ページ情報