「多変量解析」の版間の差分
細 ("多変量解析" を保護しました。 [edit=sysop:move=sysop]) |
Tetsuyatominaga (トーク | 投稿記録) |
||
(他の1人の利用者による、間の1版が非表示) | |||
1行目: | 1行目: | ||
'''【たへんりょうかいせき (multivariate analysis)】''' | '''【たへんりょうかいせき (multivariate analysis)】''' | ||
+ | |||
+ | === 概要 === | ||
解析の対象に対して, 複数の変数(特性)についての値が得られているときに, それらを用いて, 総合的に解析するのを多変量解析という. 変数の型および変数の扱い方により, 種々の解析方法がある. 主成分分析や因子分析のように, すべての変数を同じに扱う場合と, 回帰分析のように, 変数を2つのグループに分けて, 一方で他方を説明する場合がある. | 解析の対象に対して, 複数の変数(特性)についての値が得られているときに, それらを用いて, 総合的に解析するのを多変量解析という. 変数の型および変数の扱い方により, 種々の解析方法がある. 主成分分析や因子分析のように, すべての変数を同じに扱う場合と, 回帰分析のように, 変数を2つのグループに分けて, 一方で他方を説明する場合がある. | ||
+ | |||
+ | === 詳説 === | ||
+ | |||
+ | 解析の対象 (会社, 地域, 人など) に対して, 複数の変数 (特性) についての値が得られているときに, それらを用いて, 総合的に解析するのを多変量解析という. 変数の型および変数の扱い方により, 種々の解析方法がある. | ||
+ | |||
+ | 変数の型は, 同異だけがわかる名義尺度変数 (質的変数) と差に意味がある間隔尺度変数 (量的変数) に分かれる. 会社名, 地名, 人名などは, 名義尺度変数である. 名義尺度変数は, 分類にしか使えないが, 複数の間隔尺度変数は, 重み(係数)を乗じて, 加えた関数を考えることができる. | ||
+ | |||
+ | 変数の扱い方には, すべての変数を同じに扱う場合と二つに分ける場合がある. 後者では, 第1のグループの変数の関数と第2のグループの変数の対応を求める. 第1のグループの変数を説明変数, 第2のグループの変数を目的変数という. 目的変数は, 1個であることが多い. | ||
+ | |||
+ | [解析方法の種類] | ||
+ | |||
+ | 1. すべての変数を同じに扱う場合 | ||
+ | |||
+ | すべての変数が名義尺度変数である場合は, 対象を多重に分類した分割表を解析する方法があるが, 通常は, 多変量解析の対象にしていないので, ここでは, すべての変数が間隔尺度変数であるとする. | ||
+ | |||
+ | (1) 総合特性値を求める方法 | ||
+ | |||
+ | 元の変数との関係をできるだけ失わないようにして, より少数の総合特性値をいくつか求める方法として, [[主成分分析]]や[[因子分析]]がある. 主成分分析では, 主成分といわれる元の変数の線形式を順次一つずつ求めていく. したがって, 第<math>k\, </math>(≧2)主成分には, すでに定まっている第1から第<math>(k-1)\, </math>主成分までに追加するのに最適なものが選ばれる. しかし, とりあげる総合特性値の数<math>k\, </math>が予め定まっている場合は, 第1主成分から第<math>k\, </math>主成分の1次変換であれば, どれでもよいので, 意味を考えて, よりよい<math>k\, </math>個の因子と呼ばれる総合特性値を求めるのが因子分析である. | ||
+ | |||
+ | (2) 対象を分類する方法 | ||
+ | |||
+ | 対象をいくつかのグループに分類する方法として, クラスター分析がある. | ||
+ | |||
+ | 2. 説明変数と目的変数に分かれている場合 | ||
+ | |||
+ | 説明変数は, すべて間隔尺度変数であるとする. 目的変数との関係がある説明変数の関数を求める方法がいくつか考えられている. | ||
+ | |||
+ | (1) 目的変数が名義尺度変数である場合 | ||
+ | |||
+ | 目的変数によって対象をグループ分けしたとき, 同じグループ内では近い値をとり, 異なるグループでは離れた値をとる説明変数の関数が求められれば, 説明変数で目的変数を判別することができる. 目的変数を判別するために用いる説明変数の関数を判別関数という. | ||
+ | |||
+ | (2) 目的変数が間隔尺度変数である場合 | ||
+ | |||
+ | その値が目的変数の値とできるだけ近くなるような説明変数の関数を求める方法として, 回帰分析がある. | ||
+ | |||
+ | [変数の型の変換] | ||
+ | |||
+ | ある特徴の有無, 質問の肯定・否定による回答などのように, 二つに分けられる名義尺度変数は, 0か1の値をとる0-1変数におきかえることで, 間隔尺度変数のように扱うことができる. 一般に, <math>k\, </math>個に分ける名義尺度変数は, <math>k\, </math>個の0-1変数に置き換えることができる. | ||
+ | |||
+ | 0-1変数だけの多変量解析として, 各種の数量化法が提案されている. | ||
+ | |||
+ | 順序だけ意味がある順序尺度変数は, 点数化によって, 間隔尺度変数にできる. たとえば, 品物に松, 竹, 梅のランクが付けられている場合, それぞれに, 3, 2, 1や5, 2, 1の数値を対応させれば, 間隔尺度変数として扱うことができる. なお, 順序尺度変数は, [[順位相関係数]]を用いて, 解析することもできる. | ||
+ | |||
+ | 比が意味を持つ比尺度変数は, その対数をとることによって, 間隔尺度変数になる. | ||
+ | |||
+ | [単位に関する注意] | ||
+ | |||
+ | 複数の変数を扱うとき, 単位に注意する必要がある. 単位がすべて同じであれば, ほとんど問題がないが, <math>x_1\, </math> の単位はm, <math>x_2\, </math> はcm, <math>x_3\, </math> はgのように, 異なるときは, 重み (係数) <math>a_1, a_2, a_3\, </math> の単位を変えることによって, 重み付きの和 | ||
+ | |||
+ | :<math>a_{1}x_1+a_{2}x_2+a_{3}x_3\, </math> | ||
+ | |||
+ | が意味を持つ. このときに, 重みの2乗和 | ||
+ | |||
+ | :<math>a_1^2+a_2^2+a_3^2\, </math> | ||
+ | |||
+ | を1にするといった誤りをしないように, 注意されたい. | ||
+ | |||
+ | 多変量解析では, 単位を揃えることとばらつきを揃えることを兼ねて, 初めにその変数の標準偏差で割る変数変換がよく行われる. | ||
+ | |||
+ | |||
+ | |||
+ | ---- | ||
+ | '''参考文献''' | ||
+ | |||
+ | [1] 奥野忠一, 久米均, 芳賀敏郎, 吉澤正, 『多変量解析法(改訂版)』, 日科技連出版, 1981. | ||
+ | |||
+ | [2] M. G. Kendall 著, 奥野忠一, 大橋靖雄 訳, 『多変量解析』, 培風館, 1981. | ||
+ | |||
+ | [[category:統計|たへんりょうかいせき]] |
2008年4月4日 (金) 10:51時点における最新版
【たへんりょうかいせき (multivariate analysis)】
概要
解析の対象に対して, 複数の変数(特性)についての値が得られているときに, それらを用いて, 総合的に解析するのを多変量解析という. 変数の型および変数の扱い方により, 種々の解析方法がある. 主成分分析や因子分析のように, すべての変数を同じに扱う場合と, 回帰分析のように, 変数を2つのグループに分けて, 一方で他方を説明する場合がある.
詳説
解析の対象 (会社, 地域, 人など) に対して, 複数の変数 (特性) についての値が得られているときに, それらを用いて, 総合的に解析するのを多変量解析という. 変数の型および変数の扱い方により, 種々の解析方法がある.
変数の型は, 同異だけがわかる名義尺度変数 (質的変数) と差に意味がある間隔尺度変数 (量的変数) に分かれる. 会社名, 地名, 人名などは, 名義尺度変数である. 名義尺度変数は, 分類にしか使えないが, 複数の間隔尺度変数は, 重み(係数)を乗じて, 加えた関数を考えることができる.
変数の扱い方には, すべての変数を同じに扱う場合と二つに分ける場合がある. 後者では, 第1のグループの変数の関数と第2のグループの変数の対応を求める. 第1のグループの変数を説明変数, 第2のグループの変数を目的変数という. 目的変数は, 1個であることが多い.
[解析方法の種類]
1. すべての変数を同じに扱う場合
すべての変数が名義尺度変数である場合は, 対象を多重に分類した分割表を解析する方法があるが, 通常は, 多変量解析の対象にしていないので, ここでは, すべての変数が間隔尺度変数であるとする.
(1) 総合特性値を求める方法
元の変数との関係をできるだけ失わないようにして, より少数の総合特性値をいくつか求める方法として, 主成分分析や因子分析がある. 主成分分析では, 主成分といわれる元の変数の線形式を順次一つずつ求めていく. したがって, 第(≧2)主成分には, すでに定まっている第1から第主成分までに追加するのに最適なものが選ばれる. しかし, とりあげる総合特性値の数が予め定まっている場合は, 第1主成分から第主成分の1次変換であれば, どれでもよいので, 意味を考えて, よりよい個の因子と呼ばれる総合特性値を求めるのが因子分析である.
(2) 対象を分類する方法
対象をいくつかのグループに分類する方法として, クラスター分析がある.
2. 説明変数と目的変数に分かれている場合
説明変数は, すべて間隔尺度変数であるとする. 目的変数との関係がある説明変数の関数を求める方法がいくつか考えられている.
(1) 目的変数が名義尺度変数である場合
目的変数によって対象をグループ分けしたとき, 同じグループ内では近い値をとり, 異なるグループでは離れた値をとる説明変数の関数が求められれば, 説明変数で目的変数を判別することができる. 目的変数を判別するために用いる説明変数の関数を判別関数という.
(2) 目的変数が間隔尺度変数である場合
その値が目的変数の値とできるだけ近くなるような説明変数の関数を求める方法として, 回帰分析がある.
[変数の型の変換]
ある特徴の有無, 質問の肯定・否定による回答などのように, 二つに分けられる名義尺度変数は, 0か1の値をとる0-1変数におきかえることで, 間隔尺度変数のように扱うことができる. 一般に, 個に分ける名義尺度変数は, 個の0-1変数に置き換えることができる.
0-1変数だけの多変量解析として, 各種の数量化法が提案されている.
順序だけ意味がある順序尺度変数は, 点数化によって, 間隔尺度変数にできる. たとえば, 品物に松, 竹, 梅のランクが付けられている場合, それぞれに, 3, 2, 1や5, 2, 1の数値を対応させれば, 間隔尺度変数として扱うことができる. なお, 順序尺度変数は, 順位相関係数を用いて, 解析することもできる.
比が意味を持つ比尺度変数は, その対数をとることによって, 間隔尺度変数になる.
[単位に関する注意]
複数の変数を扱うとき, 単位に注意する必要がある. 単位がすべて同じであれば, ほとんど問題がないが, の単位はm, はcm, はgのように, 異なるときは, 重み (係数) の単位を変えることによって, 重み付きの和
が意味を持つ. このときに, 重みの2乗和
を1にするといった誤りをしないように, 注意されたい.
多変量解析では, 単位を揃えることとばらつきを揃えることを兼ねて, 初めにその変数の標準偏差で割る変数変換がよく行われる.
参考文献
[1] 奥野忠一, 久米均, 芳賀敏郎, 吉澤正, 『多変量解析法(改訂版)』, 日科技連出版, 1981.
[2] M. G. Kendall 著, 奥野忠一, 大橋靖雄 訳, 『多変量解析』, 培風館, 1981.