独立とは相関がないという意味ではない
説明
独立である場合、相関関係はないが、相関関係がないからといって独立とは限らない。
相関関係がない時に独立であり、必要十分条件になるケースは、確率変数が正規分布に従う時だ。
左のケースでは正の相関関係があり、右のケースでは負の相関関係があると言われる。図のcor
は相関係数を意味しており、2変数がどれだけ線形の関係を持っているかを示す指標である。独立の場合、相関係数は非常に低く計算され、2変数が相関関係を持たないことがわかる。ここで重要なのは、相関係数が「線形相関関係」に関する指標である点だ。
上のようなケースでは、相関係数が非常に低く出るが、確かに何らかの関係があると推測できる1。
つまり、独立ではないということだが、相関係数はあくまで線形相関関係についての指標なので、これを捉えきれないのだ。従って、変数間の関係があるかどうかを確認する時、相関係数だけを見て安易に信じるのではなく、実際にデータを見て判断するべきだ。
Hadi. (2006). Regression Analysis by Example(4th Edition): p25. ↩︎