チェビシェフ展開
📂数値解析チェビシェフ展開
ビルドアップ
チェビシェフ展開を理解するためには、チェビシェフ展開がどのように導出されるのかをまず知る必要がある。最小化問題を解く代わりに最小二乗問題を解くと考えてみよう。
Mn(f):=deg(r)≤ninf∥f−r∥2
f:[a,b]→Rについて上述のような最小二乗問題が与えられているとしよう。目標はMn(f)を最小化するn次以下の多項式rn∗を見つけることである。幸いにも多項式の空間R[x]は、内積⟨f,g⟩:=∫abf(x)g(x)w(x)dxに対して与えられたウェイトw(x)がある場合、有限次元内積空間となり、グラム・シュミットの過程によって正規直交基底{φk}k=0nの存在が保証されているため
r(x)=b0φ0(x)+b1φ1(x)+⋯+bnφn(x)
のようにr(x)の線形結合を見つける問題に変えることができる。言い換えれば、最小二乗問題とは
∣f−r∣22=∫ab[f(x)−j=0∑nbjφj(x)]2w(x)dx
が最小値となるようなr=rn∗を見つけることである。
0≤====∣f−r∣22⟨f−j=0∑nbjφj,f−j=0∑nbjφj⟩⟨f,f⟩−2j=0∑nbj⟨f,φj⟩+i∑j∑bibj⟨φi,φj⟩∣f∣22−2j=0∑nbj⟨f,φj⟩+j=0∑nbj2∣f∣22−j=0∑n⟨f,φj⟩2+j=0∑n[⟨f,φj⟩−bj]2
ここで∣f∣22 とj=0∑n⟨f,φj⟩2 はf と{φk}k=0n によって既に決まっているため、変わらない。したがって、最後の項j=0∑n[⟨f,φj⟩−bj]2 を最小化する場合を見つける必要があるが、これは単純にbj=⟨f,φj⟩によって行え、以下のような最小二乗解を得ることができる。
rn∗(x)=j=0∑n⟨f,φj⟩φj(x)
さて、本格的にチェビシェフ多項式について話そう。
定義
チェビシェフ多項式: Tn(x)=cos(ncos−1x) は第一種チェビシェフ多項式と呼ばれる。
- [3] 関数の内積: ⟨f,g⟩:=∫abf(x)g(x)w(x)dx の内積にウェイトw をw(x):=1−x21 のように与えると、{T0,T1,T2,⋯} は直交集合になる。
直交基底{Tk}k=0nが正規化されるように正規直交基底{φk}k=0nを以下のように定義しよう。
φn(x):=⎩⎨⎧π1π2Tn(x),n=0,n∈N
この基底についての次のシリーズは チェビシェフ最小二乗近似、または単に チェビシェフ展開 とも呼ばれる。
Cn(x):=j=0∑n⟨f,φj⟩φj(x)
または、時々、Tk を直接使用する方が便利な場合もあるので、以下のように書くこともある。
cj:=π2∫−111−x2f(x)Tj(x)dx
Cn(x)=c0+j=1∑ncjTj(x)
説明
以下のような関数近似において良い条件を比較的よく満たしているため、チェビシェフ展開が有益である理由は:
- (i): fが[−1,1]からf(r)まで存在し、連続である場合、チェビシェフ最小二乗近似Cnとf,rにおけるある定数Bに対して∣f−Cn∣∞≤nrBlnnが成り立つ。
- (ii): Cn+1(x)=Cn(x)+cn+1Tn+1(X)
- (iii): cn+1∼2n1
関数近似における良い基底の条件:
- (i): pn(x)が{φn(x)∈Q[x]:n≥0}の線形結合として表され、x∈[a,b]max∣f(x)−pn(x)∣が望むほど小さくなるようにするn∈Nが存在する必要がある。
- (ii): pn(x)はpn(x)=k=0∑nakφn(X)のように計算されるのが良い。つまり、エラーを減らすために毎回全てを再計算するのではなく、新しい項を加えることで計算するのが良い。
- (iii): ∣an∣が迅速に0に収束するのが良い。つまり、可能な限り少ない項を加えても迅速に収束するのが良い。
- (i): チェビシェフ展開を理解する最も重要な理由の一つ。もともと最小二乗法は、グローバルにエラーが最小になる解を見つける方法ではなく、分散が最小になるような近似解を見つけることである。エラーの和や積分で計算するため、ある部分ではうまく合っているが、他の部分では大きく間違えることもある。このような不安定さを無視するなら、そもそも関数近似をする理由がなかった。関数近似の真の目的は、一様なエラーを最小化すること、つまりρn(f)=deg(q)≤ninf∥f−q∥∞が小さくなる近似をすることである。nrに比べて、lnnの発散速度はかなり遅いため、∣f−Cn∣∞≤nrBlnnという不等式は、驚くべきことに、チェビシェフの最小二乗近似が最小化問題でもかなり役立つことを意味する。
- (ii): Tnは既に再帰的に全て定まっている。これを計算することは特に難しくなく、cjも単純無闇に計算するだけである。望む精度まで一度に計算する必要はなく、実用的な観点からいつでも歓迎される。精度が低くても計算を節約でき、より高い精度が必要な場合でも、これまでに行った計算を破棄する必要がないためである。
- (iii): fを近似するための多項式pn+1を以下の二つの方法で表現してみよう。
pn+1(x):=pn+1(x):=a0+a1x+⋯+anxn+an+1xn+1c0+c1T1(x)+⋯+cnTn(x)+cn+1Tn+1(x)
pn+1(X)の最高次項の係数an+1は、cn+1Tn+1(x)の最高次項の係数と同じである。しかし、
T0(x)=T1(x)=Tn+1(x)=1x2xTn(x)−Tn−1(x)
となるため、Tn+1(x)の最高次項の係数は2nである。これを数式で要約すると
an+1=cn+12n⟹cn+1=2nan+1
である。一方で∣Tm(x)∣=cos(mcos−1x)≤1であるため、∣cm+1Tm+1(x)∣=2m1∣am+1Tm+1(x)∣という項はかなり、いや、非常に速く減少することがわかる。これは質的に言えば、チェビシェフ展開は最初から良い基底を選んだと言える。テイラー展開が1,x,x2,x3,⋯のように純粋に平凡な項を加えている間、チェビシェフ展開は関数を近似するのに大きく役立つ関数から優先的に選び、ここに加えて、あそこを引くなどして速度を上げたのである。