<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="ja">
	<id>https://orsj-ml.org/orwiki/wiki/index.php?action=history&amp;feed=atom&amp;title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96</id>
	<title>原始政策 - 版の履歴</title>
	<link rel="self" type="application/atom+xml" href="https://orsj-ml.org/orwiki/wiki/index.php?action=history&amp;feed=atom&amp;title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96"/>
	<link rel="alternate" type="text/html" href="https://orsj-ml.org/orwiki/wiki/index.php?title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96&amp;action=history"/>
	<updated>2026-06-16T23:33:13Z</updated>
	<subtitle>このウィキのこのページに関する変更履歴</subtitle>
	<generator>MediaWiki 1.35.3</generator>
	<entry>
		<id>https://orsj-ml.org/orwiki/wiki/index.php?title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96&amp;diff=10378&amp;oldid=prev</id>
		<title>2008年11月8日 (土) 11:53にAlbeit-Kunによる</title>
		<link rel="alternate" type="text/html" href="https://orsj-ml.org/orwiki/wiki/index.php?title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96&amp;diff=10378&amp;oldid=prev"/>
		<updated>2008-11-08T11:53:03Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left diff-editfont-monospace&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ja&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← 古い版&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;2008年11月8日 (土) 11:53時点における版&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l2&quot; &gt;2行目:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;2行目:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;有限 &amp;lt;math&amp;gt; N  \,&amp;lt;/math&amp;gt; 段逐次決定過程において, 過去の状態と決定の履歴に依存して定まる政策. すなわち, 時刻 &amp;lt;math&amp;gt; n  \,&amp;lt;/math&amp;gt; の決定を, 状態空間 &amp;lt;math&amp;gt; X  \,&amp;lt;/math&amp;gt; と決定空間 &amp;lt;math&amp;gt; U  \,&amp;lt;/math&amp;gt; からなる&amp;lt;math&amp;gt; (2n - 1) \,&amp;lt;/math&amp;gt; 個の直積 &amp;lt;math&amp;gt; H_{n} := X \times U \times X \times U \times \cdots X \times U \times X  \,&amp;lt;/math&amp;gt; から決定空間 &amp;lt;math&amp;gt; U  \,&amp;lt;/math&amp;gt; への関数 &amp;lt;math&amp;gt; \mu_{n} : H_{n} \to U  \,&amp;lt;/math&amp;gt; で定めるとき, これらの決定関数の列 &amp;lt;math&amp;gt; \mu = \{\mu_{1}, \mu_{2}, \ldots , \mu_{N} \}  \,&amp;lt;/math&amp;gt; を原始政策という. 情報量は一般政策より要するが, 非加法型期待値最適化問題では原始政策は一般政策と同じ期待値を与える.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;有限 &amp;lt;math&amp;gt; N  \,&amp;lt;/math&amp;gt; 段逐次決定過程において, 過去の状態と決定の履歴に依存して定まる政策. すなわち, 時刻 &amp;lt;math&amp;gt; n  \,&amp;lt;/math&amp;gt; の決定を, 状態空間 &amp;lt;math&amp;gt; X  \,&amp;lt;/math&amp;gt; と決定空間 &amp;lt;math&amp;gt; U  \,&amp;lt;/math&amp;gt; からなる&amp;lt;math&amp;gt; (2n - 1) \,&amp;lt;/math&amp;gt; 個の直積 &amp;lt;math&amp;gt; H_{n} := X \times U \times X \times U \times \cdots X \times U \times X  \,&amp;lt;/math&amp;gt; から決定空間 &amp;lt;math&amp;gt; U  \,&amp;lt;/math&amp;gt; への関数 &amp;lt;math&amp;gt; \mu_{n} : H_{n} \to U  \,&amp;lt;/math&amp;gt; で定めるとき, これらの決定関数の列 &amp;lt;math&amp;gt; \mu = \{\mu_{1}, \mu_{2}, \ldots , \mu_{N} \}  \,&amp;lt;/math&amp;gt; を原始政策という. 情報量は一般政策より要するが, 非加法型期待値最適化問題では原始政策は一般政策と同じ期待値を与える.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt; &lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td colspan=&quot;2&quot;&gt; &lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;[[Category:動的・確率・多目的計画|げんしせいさく]]&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Albeit-Kun</name></author>
	</entry>
	<entry>
		<id>https://orsj-ml.org/orwiki/wiki/index.php?title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96&amp;diff=6482&amp;oldid=prev</id>
		<title>Orsjwiki: &quot;原始政策&quot; を保護しました。 [edit=sysop:move=sysop]</title>
		<link rel="alternate" type="text/html" href="https://orsj-ml.org/orwiki/wiki/index.php?title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96&amp;diff=6482&amp;oldid=prev"/>
		<updated>2007-07-20T00:52:11Z</updated>

		<summary type="html">&lt;p&gt;&amp;quot;原始政策&amp;quot; を保護しました。 [edit=sysop:move=sysop]&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left diff-editfont-monospace&quot; data-mw=&quot;interface&quot;&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ja&quot;&gt;
				&lt;td colspan=&quot;1&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← 古い版&lt;/td&gt;
				&lt;td colspan=&quot;1&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;2007年7月20日 (金) 00:52時点における版&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-notice&quot; lang=&quot;ja&quot;&gt;&lt;div class=&quot;mw-diff-empty&quot;&gt;(相違点なし)&lt;/div&gt;
&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;</summary>
		<author><name>Orsjwiki</name></author>
	</entry>
	<entry>
		<id>https://orsj-ml.org/orwiki/wiki/index.php?title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96&amp;diff=4849&amp;oldid=prev</id>
		<title>2007年7月16日 (月) 06:47に122.17.2.240による</title>
		<link rel="alternate" type="text/html" href="https://orsj-ml.org/orwiki/wiki/index.php?title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96&amp;diff=4849&amp;oldid=prev"/>
		<updated>2007-07-16T06:47:35Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left diff-editfont-monospace&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ja&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← 古い版&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;2007年7月16日 (月) 06:47時点における版&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l1&quot; &gt;1行目:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;1行目:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;【げんしせいさく (primitive policy)】&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;'''&lt;/ins&gt;【げんしせいさく (primitive policy)】&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;'''&lt;/ins&gt;&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;有限 &amp;lt;math&amp;gt; N  \,&amp;lt;/math&amp;gt; 段逐次決定過程において, 過去の状態と決定の履歴に依存して定まる政策. すなわち, 時刻 &amp;lt;math&amp;gt; n  \,&amp;lt;/math&amp;gt; の決定を, 状態空間 &amp;lt;math&amp;gt; X  \,&amp;lt;/math&amp;gt; と決定空間 &amp;lt;math&amp;gt; U  \,&amp;lt;/math&amp;gt; からなる&amp;lt;math&amp;gt; (2n - 1) \,&amp;lt;/math&amp;gt; 個の直積 &amp;lt;math&amp;gt; H_{n} := X \times U \times X \times U \times \cdots X \times U \times X  \,&amp;lt;/math&amp;gt; から決定空間 &amp;lt;math&amp;gt; U  \,&amp;lt;/math&amp;gt; への関数 &amp;lt;math&amp;gt; \mu_{n} : H_{n} \to U  \,&amp;lt;/math&amp;gt; で定めるとき, これらの決定関数の列 &amp;lt;math&amp;gt; \mu = \{\mu_{1}, \mu_{2}, \ldots , \mu_{N} \}  \,&amp;lt;/math&amp;gt; を原始政策という. 情報量は一般政策より要するが, 非加法型期待値最適化問題では原始政策は一般政策と同じ期待値を与える.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;有限 &amp;lt;math&amp;gt; N  \,&amp;lt;/math&amp;gt; 段逐次決定過程において, 過去の状態と決定の履歴に依存して定まる政策. すなわち, 時刻 &amp;lt;math&amp;gt; n  \,&amp;lt;/math&amp;gt; の決定を, 状態空間 &amp;lt;math&amp;gt; X  \,&amp;lt;/math&amp;gt; と決定空間 &amp;lt;math&amp;gt; U  \,&amp;lt;/math&amp;gt; からなる&amp;lt;math&amp;gt; (2n - 1) \,&amp;lt;/math&amp;gt; 個の直積 &amp;lt;math&amp;gt; H_{n} := X \times U \times X \times U \times \cdots X \times U \times X  \,&amp;lt;/math&amp;gt; から決定空間 &amp;lt;math&amp;gt; U  \,&amp;lt;/math&amp;gt; への関数 &amp;lt;math&amp;gt; \mu_{n} : H_{n} \to U  \,&amp;lt;/math&amp;gt; で定めるとき, これらの決定関数の列 &amp;lt;math&amp;gt; \mu = \{\mu_{1}, \mu_{2}, \ldots , \mu_{N} \}  \,&amp;lt;/math&amp;gt; を原始政策という. 情報量は一般政策より要するが, 非加法型期待値最適化問題では原始政策は一般政策と同じ期待値を与える.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>122.17.2.240</name></author>
	</entry>
	<entry>
		<id>https://orsj-ml.org/orwiki/wiki/index.php?title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96&amp;diff=3381&amp;oldid=prev</id>
		<title>2007年7月12日 (木) 12:57に124.144.188.143による</title>
		<link rel="alternate" type="text/html" href="https://orsj-ml.org/orwiki/wiki/index.php?title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96&amp;diff=3381&amp;oldid=prev"/>
		<updated>2007-07-12T12:57:57Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table class=&quot;diff diff-contentalign-left diff-editfont-monospace&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;ja&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← 古い版&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;2007年7月12日 (木) 12:57時点における版&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l1&quot; &gt;1行目:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;1行目:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;【げんしせいさく (primitive policy)】&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;【げんしせいさく (primitive policy)】&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt; &lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class='diff-marker'&gt;−&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;有限 &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;N &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;段逐次決定過程において, 過去の状態と決定の履歴に依存して定まる政策. すなわち, 時刻 &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;n &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;の決定を, 状態空間 &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;X &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;と決定空間 &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;U &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;からなる&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;(2n - 1)&lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;個の直積 &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;H_{n} := X \times U \times X \times U \times \cdots X \times U \times X &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;から決定空間 &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;U &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;への関数 &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;\mu_{n} : H_{n} \to U &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;で定めるとき, これらの決定関数の列 &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;\mu = \{\mu_{1}, \mu_{2}, \ldots , \mu_{N} \} &lt;del class=&quot;diffchange diffchange-inline&quot;&gt;$ &lt;/del&gt;を原始政策という. 情報量は一般政策より要するが, 非加法型期待値最適化問題では原始政策は一般政策と同じ期待値を与える.&lt;/div&gt;&lt;/td&gt;&lt;td class='diff-marker'&gt;+&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #a3d3ff; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;有限 &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;math&amp;gt; &lt;/ins&gt;N &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt; \,&amp;lt;/math&amp;gt; &lt;/ins&gt;段逐次決定過程において, 過去の状態と決定の履歴に依存して定まる政策. すなわち, 時刻 &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;math&amp;gt; &lt;/ins&gt;n &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt; \,&amp;lt;/math&amp;gt; &lt;/ins&gt;の決定を, 状態空間 &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;math&amp;gt; &lt;/ins&gt;X &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt; \,&amp;lt;/math&amp;gt; &lt;/ins&gt;と決定空間 &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;math&amp;gt; &lt;/ins&gt;U &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt; \,&amp;lt;/math&amp;gt; &lt;/ins&gt;からなる&lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;math&amp;gt; &lt;/ins&gt;(2n - 1) &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;\,&amp;lt;/math&amp;gt; &lt;/ins&gt;個の直積 &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;math&amp;gt; &lt;/ins&gt;H_{n} := X \times U \times X \times U \times \cdots X \times U \times X &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt; \,&amp;lt;/math&amp;gt; &lt;/ins&gt;から決定空間 &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;math&amp;gt; &lt;/ins&gt;U &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt; \,&amp;lt;/math&amp;gt; &lt;/ins&gt;への関数 &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;math&amp;gt; &lt;/ins&gt;\mu_{n} : H_{n} \to U &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt; \,&amp;lt;/math&amp;gt; &lt;/ins&gt;で定めるとき, これらの決定関数の列 &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt;&amp;lt;math&amp;gt; &lt;/ins&gt;\mu = \{\mu_{1}, \mu_{2}, \ldots , \mu_{N} \} &lt;ins class=&quot;diffchange diffchange-inline&quot;&gt; \,&amp;lt;/math&amp;gt; &lt;/ins&gt;を原始政策という. 情報量は一般政策より要するが, 非加法型期待値最適化問題では原始政策は一般政策と同じ期待値を与える.&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>124.144.188.143</name></author>
	</entry>
	<entry>
		<id>https://orsj-ml.org/orwiki/wiki/index.php?title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96&amp;diff=2902&amp;oldid=prev</id>
		<title>122.17.2.240: 新しいページ: '【げんしせいさく (primitive policy)】  有限 $ N $ 段逐次決定過程において, 過去の状態と決定の履歴に依存して定まる政策. すなわち, ...'</title>
		<link rel="alternate" type="text/html" href="https://orsj-ml.org/orwiki/wiki/index.php?title=%E5%8E%9F%E5%A7%8B%E6%94%BF%E7%AD%96&amp;diff=2902&amp;oldid=prev"/>
		<updated>2007-07-12T02:11:07Z</updated>

		<summary type="html">&lt;p&gt;新しいページ: &amp;#039;【げんしせいさく (primitive policy)】  有限 $ N $ 段逐次決定過程において, 過去の状態と決定の履歴に依存して定まる政策. すなわち, ...&amp;#039;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;新規ページ&lt;/b&gt;&lt;/p&gt;&lt;div&gt;【げんしせいさく (primitive policy)】&lt;br /&gt;
&lt;br /&gt;
有限 $ N $ 段逐次決定過程において, 過去の状態と決定の履歴に依存して定まる政策. すなわち, 時刻 $ n $ の決定を, 状態空間 $ X $ と決定空間 $ U $ からなる$ (2n - 1)$ 個の直積 $ H_{n} := X \times U \times X \times U \times \cdots X \times U \times X $ から決定空間 $ U $ への関数 $ \mu_{n} : H_{n} \to U $ で定めるとき, これらの決定関数の列 $ \mu = \{\mu_{1}, \mu_{2}, \ldots , \mu_{N} \} $ を原始政策という. 情報量は一般政策より要するが, 非加法型期待値最適化問題では原始政策は一般政策と同じ期待値を与える.&lt;/div&gt;</summary>
		<author><name>122.17.2.240</name></author>
	</entry>
</feed>