Rでの様々な分布関数
説明
Rで、特定の分布に関連した関数は、以下の接頭辞と接尾辞の組み合わせで作られます。
接頭辞
確率分布$X$の確率分布関数を$f(x)$としましょう。
- r-: ランダム抽出のため、確率分布$X$から出た$x_{1}, \cdots , x_{n}$を考えるといい。
- d-: 分布関数のため、$f(x)$。
- p-: 累積分布関数のため、$F(x) = \displaystyle \int_{\infty}^{x} f(t) dt$。
- q-: 分位数関数のため、$F^{-1}(\alpha)$。
接尾辞
名が知られた分布はほぼすべてありますが、特によく使われる分布は以下の通りです。
- -norm: 正規分布
- -t: t-分布
- -f: F-分布
- -chisq: カイ二乗分布
さまざまな分布について知りたい場合は、コンソールに
?distribution
と入力します。
ランダム抽出関数の最初の引数は、常にどれだけ抽出するかについてのことで、具体的なパラメータの調整は分布により異なります。分布関数は、与えられた$x$に対してただの関数値を返すので、下のようにplot()
を使うと確率密度関数のグラフが描かれます。累積分布関数は、与えられた$x$まで積分した値を返すので、よく知っている通り、$x=1.96$に対して$0.975$を返しました。分位数関数は、与えられた$\alpha$に対して分位数を返すので、よく知っている通り、$\alpha = 95%$に対して$1.65$を返しました。
コード
以下は例示コードです。
set.seed(150421)
rnorm(4)
pnorm(1.96)
qnorm(0.95)
dnorm(0)
win.graph()
plot(dnorm,xlim=c(-3,3))