logo

モンテカルロ法とブートストラップの違い 📂数理統計学

モンテカルロ法とブートストラップの違い

概要

モンテカルロ法は、任意のデータを使ってシミュレーションを繰り返し、新しい技術を検証する方法であり、ブートストラップは実際のデータから再サンプリングすることでコストを抑えつつ問題を解決しようとする方法だ。

定義

モンテカルロ法monte Carlo methodは、ランダムサンプリングを通じて興味のある対象に対する点推定値を見つけ出す方法だ。

ブートストラップbootstrapは、サンプルから再サンプリングを行い、興味のある対象の分布を理解する方法だ。

説明

基本的に、両方とも多く抽出して多くの試行を行う点では紛らわしいが、プロセスだけが似ており、用途は全く異なる。

まず、モンテカルロ法は、何らかの真の値を知っている場合に、ある統計量がそれをどの程度正確に推定しているかを見る際に使う。ここで「どうして真の値を知っているのか」という疑問が生じるが、答えは意外とシンプルで、実験者がパラメーターと分布を指定してデータを生成した場合、理論的な真の値を知っているのは普通のことだ。このように、作為的なデータでシミュレーションを繰り返してみると、最終的に新しいメソッドや統計量が実際にどれくらい近いかを確認することもできるだろう。

一方、ブートストラップは、与えられたサンプルから再度サンプルを抽出してサンプル自体を増やすことから始まる。統計学では、サンプルが多ければ多いほど良いため、サンプルサイズの増加自体は喜ばしいことだ。実験を行うのが非常に高価で困難であるか、これ以上データを確保することが不可能な場合、この方法はプロジェクトに大きな助けとなるだろう。問題は、それをどうやって信じるかだ。正常に統計学を学んだ人なら、聞いただけでなんとなく不安を感じるのが普通だ。

ブートストラップを使用するには、与えられたサンプルが少なくとも全体集団の特徴をよく反映しているという前提が必要だ。うまく反映していても、たまたま偏ったデータが出る可能性も考慮する必要がある。さらに、ブートストラップを通じて得られた結果はその分布についてしか語ることができず、求めたい値が何であるかを正確には言うことができない。

例えば、回帰係数にブートストラップを使用した場合、その標準誤差はかなり近似的な値で求めることができるかもしれないが、計算された係数が良好なサンプルから正しく得られたものであるかどうかはわからない。計算された係数が正確でない場合、t検定も意味がなく、したがって、回帰係数が有意であるかどうかも分からず、無用の長物になってしまう。

結論として、モンテカルロ法とブートストラップは、プロセスを除いて、すべての面で完全に異なる。

関連項目