手を動かしてまなぶケーリー・ハミルトンの定理

ケーリー・ハミルトンの定理:$n$次正方行列$A$の固有多項式\[\phi_A(x)={\rm det}(xI_n-A)=c_nx^n+c_{n-1}x^{n-1}+\cdots+c_1x+c_0\]に対し、
\[\phi_A(X)=c_nX^n+c_{n-1}X^{n-1}+\cdots+c_1X+c_0I_n\]と定義すれば\[\phi_A(A)=O\]が成り立つ。

$A=\begin{pmatrix}a&b\\c&d\end{pmatrix}$のとき、$\phi_A(x)={\rm det}(xI_2-A)=x^2-(a+d)x+(ad-bc)$である。まずは素朴に$\phi_A(A)$を成分計算すると

\[\begin{pmatrix}a&b\\c&d\end{pmatrix}\begin{pmatrix}a&b\\c&d\end{pmatrix}-(a+d)\begin{pmatrix}a&b\\c&d\end{pmatrix}+(ad-bc)\begin{pmatrix}1&0\\0&1\end{pmatrix}\]\[=\begin{pmatrix}a^2+bc&ab+bd\\ac+cd&bc+d^2\end{pmatrix}-\begin{pmatrix}a^2+ad&ab+bd\\ac+cd&ad+d^2\end{pmatrix}+\begin{pmatrix}ad-bc&0\\0&ad-bc\end{pmatrix}\]\[=\begin{pmatrix}0&0\\0&0\end{pmatrix}\]となって、確かに$n=2$に対しては定理の成立することが分かる。もう少し見通し良く計算するために$C=\begin{pmatrix}d&-b\\-c&a\end{pmatrix}$とおくと、$C+A=(a+d)I_2,CA=(ad-bc)I_2$となるので\[\phi_A(X)=X^2-(C+A)X+CA\]と書ける。したがって$\phi_A(A)=A^2-(C+A)A+CA=O$となる。これは素朴に展開して計算すれば確かめられるが、$n$次行列への拡張を見据えるなら、なぜうまく$O$になるのか、理由が分かるような計算が望ましい。少し工夫すると、この式は$(A-C)(A-A)$と変形できるので、$O$になる理由が見えやすくなる。あるいは、あらかじめ$\phi_A(X)=(X-C)(X-A)$と因数分解しておけば、$X=A$において$O$となるのは明らかである……と言われて騙されてはいけない。一般には$\phi_A'(X)=(X-C)(X-A)$に等しいのは$X^2-(CX+XA)+CA$であって、$XA=AX$とは限らないから、これは不正な因数分解である。しかし今回は他ならぬ$A$を代入するので$\phi_A(A)=\phi_A'(A)=O$となるのである。さらにまた、「非可換性に縛られた精一杯の変形」として$\phi_A(X)=(X-A)X-C(X-A)$までは許されるので、これに$A$を代入したと考えても$O$になることは頷ける。

次に、先ほど天下(あまくだ)ってきた$C$がどこから来たのかを追究しよう。逆行列の議論を思い出すと、一般に$n$次行列$P$の逆行列は存在するとは限らないが、$PQ=QP={\rm det}(P)I_n$を満たす$Q$までは必ず存在する。そこで、$xI_n-A$に対しても\[B(x)(xI_n-A)=\phi_A(x)I_n\]なる$B(x)$をとることができる。$B(x)$の各成分は$xI_n-A$の「余因子」からなり、ここでは省略するが具体的に構成することができる。これに従うと、$xI_2-A=\begin{pmatrix}x-a&-b\\-c&x-d\end{pmatrix}$に対しては$B(x)=\begin{pmatrix}x-d&b\\c&x-a\end{pmatrix}$となる。実際に$B(x)(xI_2-A)$を計算すると\[\begin{pmatrix}x-d&b\\c&x-a\end{pmatrix}\begin{pmatrix}x-a&-b\\-c&x-d\end{pmatrix}=\begin{pmatrix}(x-d)(x-a)-bc&0\\0&-bc+(x-a)(x-d)\end{pmatrix}\]となり、確かに単位行列の${\rm det}(xI_2-A)$倍になっている。

いま議論しているのは$x$についての多項式であるので、$B(x)$も$x$について整理してみよう:
\[B(x)=\underbrace{\begin{pmatrix}1&0\\0&1\end{pmatrix}}_{B_1}x+\underbrace{\begin{pmatrix}-d&b\\c&-a\end{pmatrix}}_{B_0}\]$x$の$1$次の係数(行列)を$B_1$、定数項(行列)を$B_0$とおくと\[B(x)(xI_2-A)=(B_1x+B_0)(I_2x-A)=B_1x^2+(-B_1A+B_0)x+(-B_0A)\]となる。いっぽう$\phi_A(x)=c_2x^2+c_1x+c_0$とおいて$\phi_A(x)I_2$と成分ごとに係数比較することにより\[\phi_A(X)=B_1X^2+(-B_1A+B_0)X+(-B_0A)\]となることが分かる。これに$A$を代入してみると項がスパスパと消えて確かに$O$になる。先ほど見た通り、$\phi_A(X)$自体を$(B_1X+B_0)(X-A)$と因数分解するわけにはいかないが、$X=A$における両者の値は等しいのである。あるいは$\phi_A(X)=B_1(X-A)X+B_0(X-A)$としてから代入してもよい。実際には$B_1=I_2, B_0=-C$だったわけだが、$B(x)=B_1x+B_0$と書くことにより、具体的な成分を求めなくても$\phi_A(A)=O$となることが見通せる。

$3$次行列の場合はどうであろうか?成分計算することはかなり大変になるが、一般に$B(x)$の各成分は$x$の$n-1$次以下の多項式になることが余因子の構成法から分かるので、とにかく\[B(x)=B_2x^2+B_1x+B_0\]という形をしているはずである。すると$2$次の場合と同様に\[B(x)(xI_3-A)=(B_2x^2+B_1x+B_0)(I_3x-A)=B_2x^3+(-B_2A+B_1)x^2+(-B_1A+B_0)x+(-B_0A)\]係数比較を経て
\[\phi_A(X)=B_2X^3+(-B_2A+B_1)X^2+(-B_1A+B_0)X+(-B_0A)\]

これに$A$を代入するとやはりスパスパと項が消えて$O$になる。「因数分解はできないが$X=A$における値は等しい」という事情も同じであり、$\phi_A(X)=B_2(X-A)X^2+B_1(X-A)X+B_0(X-A)$まで変形して代入してもよい。

以上の議論は、$n$次行列でも全く同様に成り立つ。