ピアソン相関係数
📂数理統計学ピアソン相関係数
定義
二つの確率変数 X,Y に対して次のように定義される ρ=ρ(X,Y) を ピアソン相関係数pearson Correlation と呼ぶ。
ρ=σXσYCov(X,Y)
- σX, σY はそれぞれ X, Y の標準偏差である。
説明
(ピアソン)相関係数(Pearson) Correlation coefficient は、二つの変数が互いに (線形)相関関係 を持っているかどうかを確認する尺度となる。1 または –1 に近ければ相関関係があると見なし、0 であればないと見なす。
注意すべきことは、相関関係と独立が同じ概念ではないということだ。相関関係はあくまで二つの変数が直線型のグラフを描くかどうかだけを確認する。相関関係がないからといって必ずしも独立であるとは限らない。しかし、独立であれば相関関係がないと言える。この逆が成り立つのは、二つの変数が正規分布に従うときだけである。
性質
ピアソン相関係数は [−1,1] を外れない。すなわち、
–1≤ρ≤1
証明
証明は二つの方法を紹介したい。
コーシー・シュワルツ不等式を用いた証明
ρ=σXσYCov(X,Y)=n1k=1∑n(σXxk−μX)(σYyk−μY)
両辺を2乗すると
ρ2=n21{k=1∑n(σXxk−μX)(σYyk−μY)}2
コーシー・シュワルツ不等式:
(a2+b2)(x2+y2)≥(ax+by)2
コーシー・シュワルツ不等式により
n21{k=1∑n(σXxk−μX)(σYyk−μY)}2≤n21k=1∑n(σXxk−μX)2k=1∑n(σYyk−μY)2
右辺を整理すると
===n21k=1∑n(σXxk−μX)2k=1∑n(σYyk−μY)2σX2σY21k=1∑n(nxk−μX)2k=1∑n(nyk−μY)2σX2σY21σX2σY21
ρ2≤1 であるから
−1≤ρ≤1
■
共分散の定義を利用した証明
Var(Y)=σY2,Var(X)=σX2, Z=σYY−ρσXX とおくと、共分散の定義に従って
Var(Z)==σY21Var(Y)+σX2ρ2Var(X)−2σXσYρCov(X,Y)σY21σY2+σX2ρ2σX2−2ρ⋅ρ=1+ρ2−2ρ2=1−ρ2
Var(Z)≥0 であるので
1−ρ2≥0⟹⟹⟹ρ2−1≤0(ρ+1)(ρ–1)≤0−1≤ρ≤1
■
関連項目