「《判別関数》」の版間の差分
(新しいページ: ''''【はんべつかんすう (discriminant function) 】''' いくつかの変数(特性)についての測定値が得られている対象に対して, それが属し...') |
|||
3行目: | 3行目: | ||
いくつかの変数(特性)についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という. | いくつかの変数(特性)についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という. | ||
− | いくつかの特性の値からグループを判別するから,特性が説明変数であり, グループが(質的)目的変数である.説明変数を$x_i(i=1,\ 2,\ \cdots,\ p)$, 目的変数を$y$で表す.また, $y$のとりうる値(グループ名)を$G_h(h=1,\ 2,\ \cdots,\ r)$とする.すなわち, $r$ 個のグループが考えられているとする. グループの判別には, {\boldmath $x$}($x_i(i=1,\ 2,\ \cdots,\ p)$を並べたベクトル)と$G_h(h=1,\ 2,\ \cdots,\ r)$の中心(平均)の間の距離$D_h$({\boldmath $x$})を用いる.$G_h$における平均ベクトル($x_i(i=1,\ 2,\ \cdots,\ p)$の平均を並べたベクトル)を$\mbox{\boldmath $m$}_h$, 分散共分散行列の逆行列を $C_h$ とする. このとき, $D_h$({\boldmath $x$}) は, 次式で計算される. | + | いくつかの特性の値からグループを判別するから,特性が説明変数であり, グループが(質的)目的変数である.説明変数を$<math>x_i(i=1,\ 2,\ \cdots,\ p)\, </math>$, 目的変数を$<math>y\, </math>$で表す.また, $<math>y\, </math>$のとりうる値(グループ名)を$<math>G_h(h=1,\ 2,\ \cdots,\ r)\, </math>$とする.すなわち, $<math>r\, </math>$ 個のグループが考えられているとする. グループの判別には, <math>{\boldmath $x$}($x_i(i=1,\ 2,\ \cdots,\ p)\, </math>$を並べたベクトル)と$<math>G_h(h=1,\ 2,\ \cdots,\ r)\, </math>$の中心(平均)の間の距離$<math>D_h$({\boldmath $x$})\, </math>を用いる. $<math>G_h\, </math>$における平均ベクトル <math>($x_i(i=1,\ 2,\ \cdots,\ p)\, </math>$ の平均を並べたベクトル) を$<math>\mbox{\boldmath $m$}_h\, </math>$, 分散共分散行列の逆行列を <math>$C_h\, </math>$ とする. このとき, $<math>D_h$({\boldmath $x$})\, </math> は, 次式で計算される. |
11行目: | 11行目: | ||
− | グループが正規母集団とみなされ, 分散共分散行列がすべて等しいとき, 上の式で {\boldmath $x$}\,=\,$\mbox{\boldmath $m$}_k$とおいて得られる距離を, $G_k$と$G_h$の間のマハラノビス汎距離という. 平均や分散共分散行列は, 各グループに属していることがわかっている対象についての測定値より計算される. $D_h(\mbox{\boldmath $x$}) (h=1,\ 2,\ \cdots,\ r)$ の中で,$D_k(\mbox{\boldmath $x$})$ が最小であれば, この対象は,$G_k$に属していると判別すればよい. また, どれにも属さないという判別が許される場合は, あらかじめ上限を設定しておいて,$D_k(\mbox{\boldmath $x$})$ がそれを越えたときは, どれにも属さないと判別すればよい. | + | グループが正規母集団とみなされ, 分散共分散行列がすべて等しいとき, 上の式で <math>{\boldmath $x$}\,=\,$\mbox{\boldmath $m$}_k\, </math>$とおいて得られる距離を, $<math>G_k\, </math>$と$<math>G_h\, </math>$の間のマハラノビス汎距離という. 平均や分散共分散行列は, 各グループに属していることがわかっている対象についての測定値より計算される. $<math>D_h(\mbox{\boldmath $x$}) (h=1,\ 2,\ \cdots,\ r)\, </math>$ の中で,$<math>D_k(\mbox{\boldmath $x$})\, </math>$ が最小であれば, この対象は,$<math>G_k\, </math>$に属していると判別すればよい. また, どれにも属さないという判別が許される場合は, あらかじめ上限を設定しておいて, $<math>D_k(\mbox{\boldmath $x$})\, </math>$ がそれを越えたときは, どれにも属さないと判別すればよい. |
− | $r=2$ のときは, ${\mit\Delta}D_{12}(\mbox{\boldmath $x$})=D_1(\mbox{\boldmath $x$})-D_2(\mbox{\boldmath $x$})$ を計算して, ${\mit\Delta}D_{12}(\mbox{\boldmath $x$})>0$であれば $G_2$に属し, ${\mit\Delta}D_{12}(\mbox{\boldmath $x$})<0$であれば $G_1$に属すると判別すればよい. 分散共分散行列が等しいとき, すなわち, $C_1=C_2=C$であるとき, | + | $<math>r=2\, </math>$ のときは, $<math>{\mit\Delta}D_{12}(\mbox{\boldmath $x$})=D_1(\mbox{\boldmath $x$})-D_2(\mbox{\boldmath $x$})\, </math>$ を計算して, $<math>{\mit\Delta}D_{12}(\mbox{\boldmath $x$})>0\, </math>$であれば $<math>G_2\, </math>$に属し, $<math>{\mit\Delta}D_{12}(\mbox{\boldmath $x$})<0\, </math>$であれば $<math>G_1\, </math>$に属すると判別すればよい. 分散共分散行列が等しいとき, すなわち, $<math>C_1=C_2=C\, </math>$であるとき, |
22行目: | 22行目: | ||
− | と変形できるので, ${\mit\Delta}D_{12}(\mbox{\boldmath $x$})$は, $x_i(i=1,\ 2,\ \cdots,\ p)$の線形式になる. したがって, これを($G_1$と$G_2$を判別する)線形判別関数という. $r$が3以上のときは, 線形判別関数は, ${}_r{\rm C}_2$ 個できる. なお, 分散共分散行列が等しくないときは, ${\mit\Delta}D_{12}(\mbox{\boldmath $x$})$ は, $x_i(i=1,\ 2,\ \cdots,\ p)$ の2次式になる. | + | と変形できるので, $<math>{\mit\Delta}D_{12}(\mbox{\boldmath $x$})\, </math>$は, $<math>x_i(i=1,\ 2,\ \cdots,\ p)\, </math>$の線形式になる. したがって, これを($<math>G_1\, </math>$と$<math>G_2\, </math>$を判別する)線形判別関数という. $<math>r\, </math>$が3以上のときは, 線形判別関数は, $<math>{}_r{\rm C}_2\, </math>$ 個できる. なお, 分散共分散行列が等しくないときは, $<math>{\mit\Delta}D_{12}(\mbox{\boldmath $x$})\, </math>$ は, $<math>x_i(i=1,\ 2,\ \cdots,\ p)\, </math>$ の2次式になる. |
---- | ---- | ||
− | |||
'''参考文献''' | '''参考文献''' | ||
[1] 奥野忠一, 久米均, 芳賀敏郎, 吉澤正, 『多変量解析法(改訂版)』, 日科技連出版, 1981. | [1] 奥野忠一, 久米均, 芳賀敏郎, 吉澤正, 『多変量解析法(改訂版)』, 日科技連出版, 1981. |
2007年7月9日 (月) 02:30時点における版
【はんべつかんすう (discriminant function) 】
いくつかの変数(特性)についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という.
いくつかの特性の値からグループを判別するから,特性が説明変数であり, グループが(質的)目的変数である.説明変数を$$, 目的変数を$$で表す.また, $$のとりうる値(グループ名)を$$とする.すなわち, $$ 個のグループが考えられているとする. グループの判別には, 構文解析に失敗 (不明な関数「\boldmath」): {\displaystyle {\boldmath $x$}($x_i(i=1,\ 2,\ \cdots,\ p)\, } $を並べたベクトル)と$$の中心(平均)の間の距離$構文解析に失敗 (不明な関数「\boldmath」): {\displaystyle D_h$({\boldmath $x$})\, } を用いる. $$における平均ベクトル $ の平均を並べたベクトル) を$構文解析に失敗 (構文エラー): {\displaystyle \mbox{\boldmath $m$}_h\, } $, 分散共分散行列の逆行列を $ とする. このとき, $構文解析に失敗 (不明な関数「\boldmath」): {\displaystyle D_h$({\boldmath $x$})\, } は, 次式で計算される.
D_h(\mbox{\boldmath $x$})=
(\mbox{\boldmath $x$}-\mbox{\boldmath $m$}_h)^{\top} C_h(\mbox{\boldmath $x$}-\mbox{\boldmath $m$}_h)
グループが正規母集団とみなされ, 分散共分散行列がすべて等しいとき, 上の式で 構文解析に失敗 (不明な関数「\boldmath」): {\displaystyle {\boldmath $x$}\,=\,$\mbox{\boldmath $m$}_k\, }
$とおいて得られる距離を, $$と$$の間のマハラノビス汎距離という. 平均や分散共分散行列は, 各グループに属していることがわかっている対象についての測定値より計算される. $構文解析に失敗 (構文エラー): {\displaystyle D_h(\mbox{\boldmath $x$}) (h=1,\ 2,\ \cdots,\ r)\, }
$ の中で,$構文解析に失敗 (MathML、ただし動作しない場合はSVGかPNGで代替(最新ブラウザーや補助ツールに推奨): サーバー「https://en.wikipedia.org/api/rest_v1/」から無効な応答 ("Math extension cannot connect to Restbase."):): {\displaystyle D_k(\mbox{\boldmath $x$})\, }
$ が最小であれば, この対象は,$$に属していると判別すればよい. また, どれにも属さないという判別が許される場合は, あらかじめ上限を設定しておいて, $構文解析に失敗 (構文エラー): {\displaystyle D_k(\mbox{\boldmath $x$})\, }
$ がそれを越えたときは, どれにも属さないと判別すればよい.
$$ のときは, $構文解析に失敗 (不明な関数「\mit」): {\displaystyle {\mit\Delta}D_{12}(\mbox{\boldmath $x$})=D_1(\mbox{\boldmath $x$})-D_2(\mbox{\boldmath $x$})\, } $ を計算して, $構文解析に失敗 (不明な関数「\mit」): {\displaystyle {\mit\Delta}D_{12}(\mbox{\boldmath $x$})>0\, } $であれば $$に属し, $構文解析に失敗 (不明な関数「\mit」): {\displaystyle {\mit\Delta}D_{12}(\mbox{\boldmath $x$})<0\, } $であれば $$に属すると判別すればよい. 分散共分散行列が等しいとき, すなわち, $$であるとき,
$${\mit\Delta}D_{12}(\mbox{\boldmath $x$})
=2(\mbox{\boldmath $m$}_2-\mbox{\boldmath $m$}_1)^{\top}
C\mbox{\boldmath $x$}-(\mbox{\boldmath $m$}_2-\mbox{\boldmath $m$}_1)^{\top}
C(\mbox{\boldmath $m$}_1+\mbox{\boldmath $m$}_2)$$
と変形できるので, $構文解析に失敗 (不明な関数「\mit」): {\displaystyle {\mit\Delta}D_{12}(\mbox{\boldmath $x$})\, }
$は, $$の線形式になる. したがって, これを($$と$$を判別する)線形判別関数という. $$が3以上のときは, 線形判別関数は, $$ 個できる. なお, 分散共分散行列が等しくないときは, $構文解析に失敗 (不明な関数「\mit」): {\displaystyle {\mit\Delta}D_{12}(\mbox{\boldmath $x$})\, }
$ は, $$ の2次式になる.
参考文献
[1] 奥野忠一, 久米均, 芳賀敏郎, 吉澤正, 『多変量解析法(改訂版)』, 日科技連出版, 1981.