ロケーション-スケール族の補助統計量
📂数理統計学ロケーション-スケール族の補助統計量
定理
X1,⋯,Xnがロケーションファミリーであり、かつスケールファミリーから来るランダムサンプルであるとしよう。二つの統計量 T1(X1,⋯,Xn) と T2(X1,⋯,Xn) が全てのx1,⋯,xnおよび全ての定数 b∈R、a>0に対して
Ti(ax1+b,⋯,axn+b)=aTi(x1,⋯,xn)
を満たすならば、その比 T1/T2 は補助統計量である。
証明
Xk はロケーション-スケールファミリーから来ているので、あるロケーションパラメーターθ∈Rとスケールパラメーターσ>0について次のように表せる。
Xk=θ+σZk
ここで、Zkはf(z;θ=0,σ=1)から抽出されるサンプルを意味する。仮定によればT1とT2の比は
T2(X1,⋯,Xn)T1(X1,⋯,Xn)=σT2(Z1,⋯,Zn)σT1(Z1,⋯,Zn)=T2(Z1,⋯,Zn)T1(Z1,⋯,Zn)
であるので、θとσに依存しない補助統計量である。
■
説明
例
例として、サンプルの範囲Rと標本標準偏差Sの比は補助統計量である。まず範囲rangeは
=====R(σZ1+θ,⋯,σZn+θ)R(X1,⋯,Xn)X(n)−X(1)σZ(n)+θ−σZ(1)−θσ(Z(n)−σZ(1))σR(Z1,⋯,Zn)
であり、標本標準偏差Sは
======S(σZ1+θ,⋯,σZn+θ)S(X1,⋯,Xn)n−11i=1∑n(Xi−Xˉ)2n−11i=1∑n(σZi+θ−σZˉ−θ)2n−11i=1∑nσ2(Zi−Zˉ)2σn−11i=1∑n(Zi−Zˉ)2σS(Z1,⋯,Zn)
である。これらの比R/Sは本来θを排除してθに関する補助統計量であり、比の分子分母でσが約分されるため、σに関しても補助統計量となる。これは、データの散布度を両方が示す点で直感的に納得がいく話である。