Taylorの定理の直感的理解

注意:\(0^0=1\)と定めておく。
【定理】(Taylorの定理)
\(n\)を正の整数とし、関数\(f:{\bf R}\rightarrow{\bf R}\)は\([a,b]\)で連続、\((a,b)\)で\(n\)回微分可能であるとき、\[f(b)=\left(\sum_{k=0}^{n-1}\frac{f^{(k)}(a)}{k!}(b-a)^k\right)+\frac{f^{(n)}(c)}{n!}(b-a)^n\]となる\(c\in(a,b)\)が存在する。
(証明)\(\displaystyle g(x)=f(b)-\sum_{k=0}^{n-1}\frac{f^{(k)}(x)}{k!}(b-x)^k\)とおき、さらに\(\displaystyle h(x)=g(x)-\frac{g(a)}{(b-a)^n}(b-x)^n\)とする。
\(h(a)=h(b)=0\)から、Rolleの定理により\(h'(c)=0\)なる\(c\in(a,b)\)が存在する。
\(\displaystyle g'(x)=-\frac{f^{(n)}(x)(b-x)^{n-1}}{(n-1)!}\)から\(\displaystyle h'(c)=-\frac{f^{(n)}(x)(b-c)^{n-1}}{(n-1)!}+\frac{ng(a)(b-c)^{n-1}}{(b-a)^n}\)であり、これが\(0\)に等しいことと\(b-c\neq 0\)から\(\displaystyle g(a)=\frac{f^{(n)}(c)}{n!}(b-a)^n\)を得る。\(g\)の定義を書き戻せば定理が得られる。■

この証明はエレガントであるが、天下りに\(h(x)\)という関数が与えられていて理解しにくいかもしれない。そこで\(n=1,2\)の場合について、\(h(x)\)を直感的に捉えてみよう。以下では特定の図でしか成り立たない記述もあるが、概略をつかむのに支障はないであろう。
f:id:y_bonten:20140817182409j:plain
\(n=1\)のとき:\(\displaystyle h(x)=f(b)-f(x)-\frac{f(b)-f(a)}{b-a}(b-x)\)である。
\(y=f(x)\)のグラフを描き、\(A(a,f(a) ),B(b,f(b) )\)とする。\(y\)軸に平行な直線\(L\)が、\(x=a\)から\(x=b\)まで動く。\(L\)と曲線\(y=f(x)\)、および\(L\)と直線\(AB\)との交点を各々\(P,Q\)とし、\(P,Q\)から直線\(x=b\)に下ろした垂線の足を\(P',Q'\)とする。
\(P,Q\)の\(x\)座標を\(x\)と書くと\(\displaystyle P'B=f(b)-f(x),Q'B=\frac{f(b)-f(a)}{b-a}(b-x)\)であるから、\(h(x)=P'B-Q'B=P'Q'=PQ\)である。したがって\(h'(x)=0\)となるのは\(PQ\)が増加から減少に転じる瞬間、すなわち最大値をとるときである。曲線と割線が作る「弓」を鉛直に切ったとき、その断面が最も大きくなる、すなわち弓が(鉛直方向に)最も膨らんだ瞬間の\(x\)座標が\(c\)なのである。
実際、\(h'(c)=0\)を書き直すと\(\displaystyle f'(c)=\frac{f(b)-f(a)}{b-a}\)となり、よく知られているように「\(n=1\)の場合のTaylorの定理」とは平均値の定理に他ならない。上述のような瞬間に\(y=f(x)\)の接線が割線\(AB\)と平行になるというのは容易に頷けるところであろう。

\(n=2\)のとき:\(\displaystyle h(x)=f(b)-f(x)-f'(x)(b-x)-\frac{f(b)-f(a)-f'(a)(b-a)}{(b-a)^2}(b-x)^2\)である。

これを理解しやすくするために、\(n=1\)の場合を再考してみる。曲線\(y=f(x)\)にとっての直線\(AB\)とは、「点\(A\)を共有し、傾きが一定のまま点\(B\)に達する」、すなわち\(y=F(x)\)で表される曲線のうち「\(F(a)=f(a)\)、\(F'(x)\):一定、\(F(b)=f(b)\)」という条件を満たすものであった。また、\(L\)のゴールである直線\(x=b\)を「スクリーン」と呼ぶことにすれば、\(h(x)\)は「\(P,Q\)からスクリーンに落とした影の距離」とみなすこともできる。\(L\)が一定速度で左から右に移動するとき、\(P',Q'\)はスクリーン上を\( (b,f(a) )\)から\( (b,f(b) )\)まで(一般には)抜きつ抜かれつしながら移動する。\(P',Q'\)の速度は、\(P,Q\)における\(y=f(x)\)と\(y=F(x)\)の傾きを表し、その差(相対速度)がゼロとなる瞬間が\(h'(c)=0\)に対応する。すなわち\(f'(c)=F'(c)\)である。

これを踏まえて、\(n=2\)の場合には、直線\(AB\)の代わりに「点\(A\)とそこでの接線を共有し、傾きの変化率が一定のまま点\(B\)に達する」、すなわち「\(F(a)=f(a)\)かつ\(F'(a)=f'(a)\)、\(F''(x)\):一定、\(F(b)=f(b)\)」という条件を満たす曲線\(y=F(x)\)を考えよう。\(n=1\)のときは1次関数を考えたために\(F'(x)\)が一定となったが、\(F''(x)\)を一定にしたければ2次関数にすればよいだろう。すなわち\(y=F(x)\)のグラフは放物線となる。
f:id:y_bonten:20140816143718j:plain
\(P,Q\)は\(n=1\)のときと同様にとるが、今回はスクリーンに単純な垂線を下ろすのではなく、両点における\(y=f(x)\)と\(y=F(x)\)の接線を引き、各々がスクリーンと交わる点を\(P',Q'\)とする。実はこのとき、\(P'B=f(b)-f(x)-f'(x)(b-x)\)、\(\displaystyle Q'B=\frac{f(b)-f(a)-f'(a)(b-a)}{(b-a)^2}(b-x)^2\)であるために、\(h(x)=P'Q'\)となるのである。\(Q'B\)については詳細を省くが、\(L\)からスクリーンまでの残りの距離の2乗に比例することが示されるので、このような式になる。

いま\(P',Q'\)の速度が何を表すか考えてみると、これは「\(P,Q\)における両曲線の接線の傾きの増加率\(f''(x),F''(x)\)」と「\(L\)からスクリーンまでの距離」の積に比例する。したがって後者が共通の両者にあっては、\(P',Q'\)の速度の大小は\(f''(x)\)と\(F''(x)\)の大小に一致する。すると、その差(相対速度)\(h'(x)\)がゼロとなるのは、\(f''(x)=F''(x)\)となる瞬間であることが分かる。\(n=2\)の場合における\(c\)は、このような意味を持っている。

以上の考察から、一般の\(n\)についても同様に、Taylorの定理における\(c\)とは、「\(k=0,1,\ldots,n-1\)について\(F^{(k)}(a)=f^{(k)}(a)\)、\(F^{(n)}(x)\):一定、\(F(b)=f(b)\)」という条件を満たす関数\(F(x)\)を考えたとき、\(f^{(n)}(c)=F^{(n)}(c)\)となる点であると推測できる。