ピアソン相関係数
📂数理統計学ピアソン相関係数
定義
二つの確率変数 X,Yに対して、次のように定義されたρ=ρ(X,Y)をピアソン相関係数pearson Correlationと呼ぶ。
ρ=σXσYCov(X,Y)
- σX、σYはそれぞれ X、Yの標準偏差だ。
説明
ピアソン相関係数(Pearson) Correlation Coefficientは、二つの変数がお互いに**(線形)相関関係**を持っているかを確認する尺度になる。1や–1に近ければ相関関係があると見なし、0ならばないとされる。
相関関係と独立は同じ概念ではないことに注意が必要だ。相関関係は、二つの変数が直線形のグラフを描くかだけを確認する。相関関係がないとしても必ずしも独立とは限らない。しかし、独立であれば相関関係がないと言える。この逆が成立するのは二つの変数が正規分布に従う場合に限られる。
性質
ピアソン相関係数は[−1,1]を超えない。つまり、
–1≤ρ≤1
証明
証明は二つの方法を紹介したい。
コーシー・シュワルツの不等式を用いた証明
ρ=σXσYCov(X,Y)=n1k=1∑n(σXxk−μX)(σYyk−μY)
両辺を二乗すると
ρ2=n21{k=1∑n(σXxk−μX)(σYyk−μY)}2
コーシー・シュワルツの不等式:
(a2+b2)(x2+y2)≥(ax+by)2
コーシー・シュワルツの不等式により、
n21{k=1∑n(σXxk−μX)(σYyk−μY)}2≤n21k=1∑n(σXxk−μX)2k=1∑n(σYyk−μY)2
右辺を整理すると、
===n21k=1∑n(σXxk−μX)2k=1∑n(σYyk−μY)2σX2σY21k=1∑n(nxk−μX)2k=1∑n(nyk−μY)2σX2σY21σX2σY21
ρ2≤1であるため、
−1≤ρ≤1
■
共分散の定義を用いた証明
Var(Y)=σY2,Var(X)=σX2、Z=σYY−ρσXXを共分散の定義とすると、
Var(Z)==σY21Var(Y)+σX2ρ2Var(X)−2σXσYρCov(X,Y)σY21σY2+σX2ρ2σX2−2ρ⋅ρ=1+ρ2−2ρ2=1−ρ2
Var(Z)≥0であるから、
1−ρ2≥0⟹⟹⟹ρ2−1≤0(ρ+1)(ρ–1)≤0−1≤ρ≤1
■