《判別関数》
【はんべつかんすう (discriminant function) 】
いくつかの変数(特性)についての測定値が得られている対象に対して, それが属している可能性があるグループが複数考えられるときに, それらの変数の関数を用いて対象の属するグループを判別することにする. このときに用いる関数を判別関数という.
いくつかの特性の値からグループを判別するから,特性が説明変数であり, グループが(質的)目的変数である.説明変数を$x_i(i=1,\ 2,\ \cdots,\ p)$, 目的変数を$y$で表す.また, $y$のとりうる値(グループ名)を$G_h(h=1,\ 2,\ \cdots,\ r)$とする.すなわち, $r$ 個のグループが考えられているとする. グループの判別には, {\boldmath $x$}($x_i(i=1,\ 2,\ \cdots,\ p)$を並べたベクトル)と$G_h(h=1,\ 2,\ \cdots,\ r)$の中心(平均)の間の距離$D_h$({\boldmath $x$})を用いる.$G_h$における平均ベクトル($x_i(i=1,\ 2,\ \cdots,\ p)$の平均を並べたベクトル)を$\mbox{\boldmath $m$}_h$, 分散共分散行列の逆行列を $C_h$ とする. このとき, $D_h$({\boldmath $x$}) は, 次式で計算される.
D_h(\mbox{\boldmath $x$})=
(\mbox{\boldmath $x$}-\mbox{\boldmath $m$}_h)^{\top} C_h(\mbox{\boldmath $x$}-\mbox{\boldmath $m$}_h)
グループが正規母集団とみなされ, 分散共分散行列がすべて等しいとき, 上の式で {\boldmath $x$}\,=\,$\mbox{\boldmath $m$}_k$とおいて得られる距離を, $G_k$と$G_h$の間のマハラノビス汎距離という. 平均や分散共分散行列は, 各グループに属していることがわかっている対象についての測定値より計算される. $D_h(\mbox{\boldmath $x$}) (h=1,\ 2,\ \cdots,\ r)$ の中で,$D_k(\mbox{\boldmath $x$})$ が最小であれば, この対象は,$G_k$に属していると判別すればよい. また, どれにも属さないという判別が許される場合は, あらかじめ上限を設定しておいて,$D_k(\mbox{\boldmath $x$})$ がそれを越えたときは, どれにも属さないと判別すればよい.
$r=2$ のときは, ${\mit\Delta}D_{12}(\mbox{\boldmath $x$})=D_1(\mbox{\boldmath $x$})-D_2(\mbox{\boldmath $x$})$ を計算して, ${\mit\Delta}D_{12}(\mbox{\boldmath $x$})>0$であれば $G_2$に属し, ${\mit\Delta}D_{12}(\mbox{\boldmath $x$})<0$であれば $G_1$に属すると判別すればよい. 分散共分散行列が等しいとき, すなわち, $C_1=C_2=C$であるとき,
$${\mit\Delta}D_{12}(\mbox{\boldmath $x$})
=2(\mbox{\boldmath $m$}_2-\mbox{\boldmath $m$}_1)^{\top}
C\mbox{\boldmath $x$}-(\mbox{\boldmath $m$}_2-\mbox{\boldmath $m$}_1)^{\top}
C(\mbox{\boldmath $m$}_1+\mbox{\boldmath $m$}_2)$$
と変形できるので, ${\mit\Delta}D_{12}(\mbox{\boldmath $x$})$は, $x_i(i=1,\ 2,\ \cdots,\ p)$の線形式になる. したがって, これを($G_1$と$G_2$を判別する)線形判別関数という. $r$が3以上のときは, 線形判別関数は, ${}_r{\rm C}_2$ 個できる. なお, 分散共分散行列が等しくないときは, ${\mit\Delta}D_{12}(\mbox{\boldmath $x$})$ は, $x_i(i=1,\ 2,\ \cdots,\ p)$ の2次式になる.
参考文献
[1] 奥野忠一, 久米均, 芳賀敏郎, 吉澤正, 『多変量解析法(改訂版)』, 日科技連出版, 1981.