ピタゴラス勝率の導出
📂セイバーメトリクスピタゴラス勝率の導出
公式
特定競技リーグのチームが一つあるとする。チーム得点scores S と チーム失点allows A はそれぞれ ワイブル分布に従う 確率変数
SA∼Weibull(αS,β,γ)∼Weibull(αA,β,γ)
とし、お互い 独立であるとする。このチームのシーズン期待勝率 p は γ>0 に対して次のようになる。
pγ=μSγ+μAγμSγ
ここで μS:=E(S) と μA:=E(A) はそれぞれ期待得点、期待失点を示している。
導出
戦略:これは ピタゴラス勝率に対する数理統計的な導出である。ただ正直に ジョイント確率密度関数を通じて導かれる。関数 Γ:R→R は ガンマ関数を表している。
ワイブル分布の平均と分散:スケールパラメータ α>0 とロケーションパラメータ β>0、形状パラメータ γ>0 に対して以下のような確率密度関数を持つ 確率分布を 三パラメーターワイブル分布three-parameter Weibull distributionと呼ぶ。
f(x)=αγ(αx−β)γ−1e−((x−β)/α)γ,x≥β
もし X∼Weibull(α,β,γ) であれば、その平均と分散は以下の通りである。
E(X)=Var(X)=αΓ(1+γ1)+βα2[Γ(1+γ2)−(Γ(1+γ1)2)]
μS=μA=E(S)=αSΓ(1+γ−1)+βE(A)=αAΓ(1+γ−1)+β
S と A の 母集団平均をそれぞれ μS と μA として示すと、ワイブル分布の第一パラメーター αS、αA は
αS=αA=Γ(1+γ−1)μS−βΓ(1+γ−1)μA−β
のように表され、導出の便宜上、次を満たす α を定義しよう。
αγ1=αSγ1+αAγ1=αSγαAγαSγ+αAγ
これで、期待勝率の計算が本格的に必要になる時だ。ほとんどのスポーツでは、勝利は得点 S が失点 A より大きい 事象として定義されるため、期待勝率は本質的に P(S>A) である。もし S と A のそれぞれの確率密度関数が fS と fA であり、S と A が 独立であるという仮定に従えば、そのジョイント確率密度関数は fSfA である。
==============P(S>A)∫β∞∫βxfS(x)fA(y)dydx∫β∞∫βxαSγ(αSx−β)γ−1e−((x−β)/αS)γαAγ(αAy−β)γ−1e−((y−β)/αA)γdydx∫0∞∫0xαSγ(αSx)γ−1e−(x/αS)γαAγ(αAy)γ−1e−(y/αA)γdydx∫0∞αSγ(αSx)γ−1e−(x/αS)γ[∫0xαAγ(αAy)γ−1e−(y/αA)γdy]dx∫0∞αSγ(αSx)γ−1e−(x/αS)γ[1−e−(x/αA)γ]dx1+∫0∞αSγ(αSx)γ−1e−(x/αS)γ[−e−(x/αA)γ]dx1−∫0∞αSγ(αSx)γ−1exp(−xγ(αSγ1+αAγ1))dx1−∫0∞αSγ(αSx)γ−1exp(−(αx)γ)dx1−αSγαγ∫0∞αγ(αx)γ−1e−(x/α)γdx1−αSγαγ⋅11−αSγ1αSγ+αAγαSγαAγ1−αSγ+αAγαAγαSγ+αAγαSγ(μS−β)γ+(μA−β)γ(μS−β)γ
ここで、β は失点と得点の最小値を意味するので、β=0 と置いても問題なく、結果的に次を得る。
P(S>A)=μSγ+μAγμSγ
■