「判別関数」の版間の差分

提供: ORWiki
ナビゲーションに移動 検索に移動
 
1行目: 1行目:
 
'''【はんべつかんすう (discriminant function)】'''
 
'''【はんべつかんすう (discriminant function)】'''
 +
 +
=== 概要 ===
  
 
いくつかの変数 (特性) についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という. その対象の測定値 (ベクトル) と各グループの中心 (平均) の距離を計算して, それが最小であるグループに属していると判別することが多い.
 
いくつかの変数 (特性) についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という. その対象の測定値 (ベクトル) と各グループの中心 (平均) の距離を計算して, それが最小であるグループに属していると判別することが多い.
  
詳しくは[[《判別関数》|基礎編:判別関数]]を参照.
+
=== 詳説 ===
 +
 
 +
 いくつかの変数(特性)についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という.
 +
 
 +
 いくつかの特性の値からグループを判別するから,特性が説明変数であり, グループが(質的)目的変数である.説明変数を<math>x_i(i=1,\ 2,\ \cdots,\ p)\, </math>, 目的変数を<math>y\, </math>で表す.また, <math>y\, </math>のとりうる値(グループ名)を<math>G_h(h=1,\ 2,\ \cdots,\ r)\, </math>とする.すなわち, <math>r\, </math> 個のグループが考えられているとする. グループの判別には, <math>\boldsymbol{ x}(x_i(i=1,\ 2,\ \cdots,\ p)\, </math>を並べたベクトル)と<math>G_h(h=1,\ 2,\ \cdots,\ r)\, </math>の中心(平均)の間の距離<math>D_h(\boldsymbol{ x})\, </math>を用いる. <math>G_h\, </math>における平均ベクトル <math>(x_i(i=1,\ 2,\ \cdots,\ p)\, </math> の平均を並べたベクトル) を<math>\boldsymbol{m}_h\, </math>, 分散共分散行列の逆行列を <math>C_h\, </math> とする. このとき, <math>D_h(\boldsymbol{ x})\, </math> は, 次式で計算される.
 +
 
 +
 
 +
<center>
 +
<math>
 +
D_h(\boldsymbol{x})=
 +
(\boldsymbol{x}\boldsymbol{m}_h)^{\top}
 +
C_h(\boldsymbol{x}-\boldsymbol{m}_h)
 +
</math>
 +
</center>
 +
 
 +
 
 +
グループが正規母集団とみなされ, 分散共分散行列がすべて等しいとき, 上の式で <math>\boldsymbol{x}\,=\,\boldsymbol{m}_k\, </math>とおいて得られる距離を, <math>G_k\, </math>と<math>G_h\, </math>の間のマハラノビス汎距離という. 平均や分散共分散行列は, 各グループに属していることがわかっている対象についての測定値より計算される. <math>D_h(\boldsymbol{x}) (h=1,\ 2,\ \cdots,\ r)\, </math> の中で,<math>D_k(\boldsymbol{x})\, </math> が最小であれば, この対象は,<math>G_k\, </math>に属していると判別すればよい. また, どれにも属さないという判別が許される場合は, あらかじめ上限を設定しておいて, <math>D_k(\boldsymbol{x})\, </math> がそれを越えたときは, どれにも属さないと判別すればよい.
 +
 
 +
 <math>r=2\, </math> のときは, <math>\mathit{\Delta}D_{12}(\boldsymbol{x})=D_1(\boldsymbol{x})-D_2(\boldsymbol{x})\, </math> を計算して, <math>\mathit{\Delta}D_{12}(\boldsymbol{x})>0\, </math>であれば <math>G_2\, </math>に属し, <math>\mathit{\Delta}D_{12}(\boldsymbol{x})<0\, </math>であれば <math>G_1\, </math>に属すると判別すればよい. 分散共分散行列が等しいとき, すなわち, <math>C_1=C_2=C\, </math>であるとき,
 +
 
 +
 
 +
<center>
 +
<math>
 +
\mathit{\Delta}D_{12}(\boldsymbol{x})
 +
=2(\boldsymbol{m}_2-\boldsymbol{m}_1)^{\top}
 +
C\boldsymbol{x}-(\boldsymbol{m}_2-\boldsymbol{m}_1)^{\top}
 +
C(\boldsymbol{m}_1+\boldsymbol{m}_2)
 +
</math>
 +
</center>
 +
 
 +
 
 +
と変形できるので, <math>\mathit{\Delta}D_{12}(\boldsymbol{x})\, </math>は, <math>x_i(i=1,\ 2,\ \cdots,\ p)\, </math>の線形式になる. したがって, これを(<math>G_1\, </math>と<math>G_2\, </math>を判別する)線形判別関数という. <math>r\, </math>が3以上のときは, 線形判別関数は, <math>{}_r{\rm C}_2\, </math> 個できる. なお, 分散共分散行列が等しくないときは, <math>\mathit{\Delta}D_{12}(\boldsymbol{x})\, </math> は, <math>x_i(i=1,\ 2,\ \cdots,\ p)\, </math> の2次式になる.
 +
 
 +
 
 +
 
 +
----
 +
'''参考文献'''
 +
 
 +
[1] 奥野忠一, 久米均, 芳賀敏郎, 吉澤正, 『多変量解析法(改訂版)』, 日科技連出版, 1981.
 +
 
 +
[[category:統計|はんべつかんすう]]

2008年4月4日 (金) 10:49時点における最新版

【はんべつかんすう (discriminant function)】

概要

いくつかの変数 (特性) についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という. その対象の測定値 (ベクトル) と各グループの中心 (平均) の距離を計算して, それが最小であるグループに属していると判別することが多い.

詳説

 いくつかの変数(特性)についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という.

 いくつかの特性の値からグループを判別するから,特性が説明変数であり, グループが(質的)目的変数である.説明変数を構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle x_i(i=1,\ 2,\ \cdots,\ p)\, } , 目的変数を構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle y\, } で表す.また, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle y\, } のとりうる値(グループ名)を構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_h(h=1,\ 2,\ \cdots,\ r)\, } とする.すなわち, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle r\, } 個のグループが考えられているとする. グループの判別には, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \boldsymbol{ x}(x_i(i=1,\ 2,\ \cdots,\ p)\, } を並べたベクトル)と構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_h(h=1,\ 2,\ \cdots,\ r)\, } の中心(平均)の間の距離構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle D_h(\boldsymbol{ x})\, } を用いる. 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_h\, } における平均ベクトル 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle (x_i(i=1,\ 2,\ \cdots,\ p)\, } の平均を並べたベクトル) を, 分散共分散行列の逆行列を 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle C_h\, } とする. このとき, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle D_h(\boldsymbol{ x})\, } は, 次式で計算される.


構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle D_h(\boldsymbol{x})= (\boldsymbol{x}\boldsymbol{m}_h)^{\top} C_h(\boldsymbol{x}-\boldsymbol{m}_h) }


グループが正規母集団とみなされ, 分散共分散行列がすべて等しいとき, 上の式で 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \boldsymbol{x}\,=\,\boldsymbol{m}_k\, } とおいて得られる距離を, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_k\, }構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_h\, } の間のマハラノビス汎距離という. 平均や分散共分散行列は, 各グループに属していることがわかっている対象についての測定値より計算される. 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle D_h(\boldsymbol{x}) (h=1,\ 2,\ \cdots,\ r)\, } の中で, が最小であれば, この対象は,構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_k\, } に属していると判別すればよい. また, どれにも属さないという判別が許される場合は, あらかじめ上限を設定しておいて, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle D_k(\boldsymbol{x})\, } がそれを越えたときは, どれにも属さないと判別すればよい.

 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle r=2\, } のときは, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mathit{\Delta}D_{12}(\boldsymbol{x})=D_1(\boldsymbol{x})-D_2(\boldsymbol{x})\, } を計算して, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mathit{\Delta}D_{12}(\boldsymbol{x})>0\, } であれば 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_2\, } に属し, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mathit{\Delta}D_{12}(\boldsymbol{x})<0\, } であれば 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_1\, } に属すると判別すればよい. 分散共分散行列が等しいとき, すなわち, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle C_1=C_2=C\, } であるとき,


構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mathit{\Delta}D_{12}(\boldsymbol{x}) =2(\boldsymbol{m}_2-\boldsymbol{m}_1)^{\top} C\boldsymbol{x}-(\boldsymbol{m}_2-\boldsymbol{m}_1)^{\top} C(\boldsymbol{m}_1+\boldsymbol{m}_2) }


と変形できるので, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mathit{\Delta}D_{12}(\boldsymbol{x})\, } は, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle x_i(i=1,\ 2,\ \cdots,\ p)\, } の線形式になる. したがって, これを(構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_1\, }構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_2\, } を判別する)線形判別関数という. 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle r\, } が3以上のときは, 線形判別関数は, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle {}_r{\rm C}_2\, } 個できる. なお, 分散共分散行列が等しくないときは, は, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle x_i(i=1,\ 2,\ \cdots,\ p)\, } の2次式になる.



参考文献

[1] 奥野忠一, 久米均, 芳賀敏郎, 吉澤正, 『多変量解析法(改訂版)』, 日科技連出版, 1981.