「《判別関数》」の版間の差分
(3人の利用者による、間の3版が非表示) | |||
3行目: | 3行目: | ||
いくつかの変数(特性)についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という. | いくつかの変数(特性)についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という. | ||
− | いくつかの特性の値からグループを判別するから,特性が説明変数であり, グループが(質的)目的変数である.説明変数を | + | いくつかの特性の値からグループを判別するから,特性が説明変数であり, グループが(質的)目的変数である.説明変数を<math>x_i(i=1,\ 2,\ \cdots,\ p)\, </math>, 目的変数を<math>y\, </math>で表す.また, <math>y\, </math>のとりうる値(グループ名)を<math>G_h(h=1,\ 2,\ \cdots,\ r)\, </math>とする.すなわち, <math>r\, </math> 個のグループが考えられているとする. グループの判別には, <math>\boldsymbol{ x}(x_i(i=1,\ 2,\ \cdots,\ p)\, </math>を並べたベクトル)と<math>G_h(h=1,\ 2,\ \cdots,\ r)\, </math>の中心(平均)の間の距離<math>D_h(\boldsymbol{ x})\, </math>を用いる. <math>G_h\, </math>における平均ベクトル <math>(x_i(i=1,\ 2,\ \cdots,\ p)\, </math> の平均を並べたベクトル) を<math>\boldsymbol{m}_h\, </math>, 分散共分散行列の逆行列を <math>C_h\, </math> とする. このとき, <math>D_h(\boldsymbol{ x})\, </math> は, 次式で計算される. |
− | + | <center> | |
− | + | <math> | |
− | + | D_h(\boldsymbol{x})= | |
+ | (\boldsymbol{x}\boldsymbol{m}_h)^{\top} | ||
+ | C_h(\boldsymbol{x}-\boldsymbol{m}_h) | ||
+ | </math> | ||
+ | </center> | ||
− | グループが正規母集団とみなされ, 分散共分散行列がすべて等しいとき, 上の式で <math>{ | + | グループが正規母集団とみなされ, 分散共分散行列がすべて等しいとき, 上の式で <math>\boldsymbol{x}\,=\,\boldsymbol{m}_k\, </math>とおいて得られる距離を, <math>G_k\, </math>と<math>G_h\, </math>の間のマハラノビス汎距離という. 平均や分散共分散行列は, 各グループに属していることがわかっている対象についての測定値より計算される. <math>D_h(\boldsymbol{x}) (h=1,\ 2,\ \cdots,\ r)\, </math> の中で,<math>D_k(\boldsymbol{x})\, </math> が最小であれば, この対象は,<math>G_k\, </math>に属していると判別すればよい. また, どれにも属さないという判別が許される場合は, あらかじめ上限を設定しておいて, <math>D_k(\boldsymbol{x})\, </math> がそれを越えたときは, どれにも属さないと判別すればよい. |
− | + | <math>r=2\, </math> のときは, <math>\mathit{\Delta}D_{12}(\boldsymbol{x})=D_1(\boldsymbol{x})-D_2(\boldsymbol{x})\, </math> を計算して, <math>\mathit{\Delta}D_{12}(\boldsymbol{x})>0\, </math>であれば <math>G_2\, </math>に属し, <math>\mathit{\Delta}D_{12}(\boldsymbol{x})<0\, </math>であれば <math>G_1\, </math>に属すると判別すればよい. 分散共分散行列が等しいとき, すなわち, <math>C_1=C_2=C\, </math>であるとき, | |
− | + | <center> | |
− | =2(\ | + | <math> |
− | C\ | + | \mathit{\Delta}D_{12}(\boldsymbol{x}) |
− | C(\ | + | =2(\boldsymbol{m}_2-\boldsymbol{m}_1)^{\top} |
+ | C\boldsymbol{x}-(\boldsymbol{m}_2-\boldsymbol{m}_1)^{\top} | ||
+ | C(\boldsymbol{m}_1+\boldsymbol{m}_2) | ||
+ | </math> | ||
+ | </center> | ||
− | と変形できるので, | + | と変形できるので, <math>\mathit{\Delta}D_{12}(\boldsymbol{x})\, </math>は, <math>x_i(i=1,\ 2,\ \cdots,\ p)\, </math>の線形式になる. したがって, これを(<math>G_1\, </math>と<math>G_2\, </math>を判別する)線形判別関数という. <math>r\, </math>が3以上のときは, 線形判別関数は, <math>{}_r{\rm C}_2\, </math> 個できる. なお, 分散共分散行列が等しくないときは, <math>\mathit{\Delta}D_{12}(\boldsymbol{x})\, </math> は, <math>x_i(i=1,\ 2,\ \cdots,\ p)\, </math> の2次式になる. |
30行目: | 38行目: | ||
[1] 奥野忠一, 久米均, 芳賀敏郎, 吉澤正, 『多変量解析法(改訂版)』, 日科技連出版, 1981. | [1] 奥野忠一, 久米均, 芳賀敏郎, 吉澤正, 『多変量解析法(改訂版)』, 日科技連出版, 1981. | ||
+ | |||
+ | [[category:統計|はんべつかんすう]] |
2007年8月7日 (火) 02:58時点における最新版
【はんべつかんすう (discriminant function) 】
いくつかの変数(特性)についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という.
いくつかの特性の値からグループを判別するから,特性が説明変数であり, グループが(質的)目的変数である.説明変数を構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle x_i(i=1,\ 2,\ \cdots,\ p)\, } , 目的変数をで表す.また, のとりうる値(グループ名)をとする.すなわち, 個のグループが考えられているとする. グループの判別には, を並べたベクトル)との中心(平均)の間の距離を用いる. における平均ベクトル の平均を並べたベクトル) を, 分散共分散行列の逆行列を とする. このとき, は, 次式で計算される.
グループが正規母集団とみなされ, 分散共分散行列がすべて等しいとき, 上の式で とおいて得られる距離を, との間のマハラノビス汎距離という. 平均や分散共分散行列は, 各グループに属していることがわかっている対象についての測定値より計算される. の中で, が最小であれば, この対象は,に属していると判別すればよい. また, どれにも属さないという判別が許される場合は, あらかじめ上限を設定しておいて, がそれを越えたときは, どれにも属さないと判別すればよい.
構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle r=2\, } のときは, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mathit{\Delta}D_{12}(\boldsymbol{x})=D_1(\boldsymbol{x})-D_2(\boldsymbol{x})\, } を計算して, であれば 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_2\, } に属し, であれば 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_1\, } に属すると判別すればよい. 分散共分散行列が等しいとき, すなわち, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle C_1=C_2=C\, } であるとき,
構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mathit{\Delta}D_{12}(\boldsymbol{x}) =2(\boldsymbol{m}_2-\boldsymbol{m}_1)^{\top} C\boldsymbol{x}-(\boldsymbol{m}_2-\boldsymbol{m}_1)^{\top} C(\boldsymbol{m}_1+\boldsymbol{m}_2) }
と変形できるので, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mathit{\Delta}D_{12}(\boldsymbol{x})\, }
は, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle x_i(i=1,\ 2,\ \cdots,\ p)\, }
の線形式になる. したがって, これを(構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_1\, }
と構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle G_2\, }
を判別する)線形判別関数という. 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle r\, }
が3以上のときは, 線形判別関数は, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle {}_r{\rm C}_2\, }
個できる. なお, 分散共分散行列が等しくないときは, 構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle \mathit{\Delta}D_{12}(\boldsymbol{x})\, }
は, の2次式になる.
参考文献
[1] 奥野忠一, 久米均, 芳賀敏郎, 吉澤正, 『多変量解析法(改訂版)』, 日科技連出版, 1981.