題目

Find the trace of \(I+A+A^2+\cdots+A^{28}\) for \(A=\begin{bmatrix}4&3\\2&3\end{bmatrix}\).

想法與解法

朱立民 says

想法

我們首先需要知道一個 \(n \times n\) 矩陣 \(M\) 會有 \(\tr(M) = \sum_{i=1}^{n}\lambda_i\) 這個特性,再來我們只需要知道所有 \(A\) 的特徵值跟所有 \(I+A+A^2+\cdots+A^{28}\) 的特徵值有甚麼關係就可以求出 \(\tr(I+A+A^2+\cdots+A^{28})\)。

解法

在解這題時,我們需要知道兩件事情。
一個是對於所有\(n \times n\) 矩陣 \(M\) 會有 \(\tr(M) = \sum_{i=1}^{n}\lambda_i\)。
首先,我們知道 \(n \times n\) 矩陣 \(M\) 在算特徵方程式 \(P_M(x)\) 時,\((-x)^{n-1}\) 的係數為 \(\tr(M)\),又因為

\[P_M(x)=(\lambda_1-x)(\lambda_2-x)\cdots(\lambda_n-x), \]

其中 \(\lambda_i\) 為矩陣 \(M\) 的特徵值,乘開發現 \((-x)^{n-1}\) 的係數為 \(\sum_{i=1}^n\lambda_i\),所以 \(\tr(M) = \sum_{i=1}^n\lambda_i\)。
另一個是對任何多項式 \(f\),若 \(\lambda\) 是 \(M\) 的特徵值,則 \(f(\lambda)\) 是 \(f(M)\) 的特徵值,且 \(\lambda\) 在 \(M\) 中的代數重數和 \(f(\lambda)\) 在 \(f(M)\) 中的代數重數一樣
我們這裡只須用到比較簡單的版本,也就是當 \(M\) 是可對角化的時候這個敘述是對的。

假設一個可對角化的矩陣 \(M\) 有一個特徵值 \(\lambda\) 和特徵向量 \(\bv\) 使得 \(M\bv=\lambda\bv\),那麼

\[M^2\bv=M(M\bv)=M(\lambda\bv)=\lambda M(\bv)=\lambda^2\bv, \]

再用數學歸納法我們可以證明

\[M^k\bv=\lambda^k\bv. \]

再來假設 \(k\) 是一個係數,那麼

\[kM\bv=k\lambda\bv. \]

最後假設多項式 \(f(M)=c_0I+c_1M+c_2M^2+\cdots+c_nM^n\),其中 \(c_0,\cdots, c_n\) 是係數,那麼

\[\begin{aligned} f(M)\bv&=(c_0I+c_1M+c_2M^2+\cdots+c_nM^n)\bv\\ &=c_0\bv+c_1\lambda\bv+c_2\lambda^2\bv+\cdots+c_n\lambda^n\bv\\ &=(c_0\lambda^0+c_1\lambda^1+c_2\lambda^2+\cdots+c_n\lambda^n)\bv\\ &=f(\lambda)\bv.\end{aligned} \]

所以 \(f(M)\) 的特徵值是 \(f(\lambda)\)。
有了這兩件事情,我們只需要將 \(f(A)=I+A+A^2+\cdots+A^{28}\) 的特徵值算出來再全部加起來就是 \(\tr(f(A))\)。
首先,因為 \(A\) 是一個 \(2\times 2\) 的矩陣,所以會有兩個特徵值 \(\lambda_1,\lambda_2\),之後我們有兩個式子

\[\begin{aligned} \lambda_1+\lambda_2&=\tr(A) =7,\\ \lambda_1\lambda_2&=\det(A) =6.\end{aligned} \]

不失一般性,我們可以得到 \(\lambda_1=1\) 及 \(\lambda_2=6\),則

\[\begin{aligned} \tr(f(A))&=f(\lambda_1)+f(\lambda_2)\\ &=f(1)+f(6)\\ &=29+(1+6+6^2+\cdots+6^{28})\\ &=29+\frac{1-6^{29}}{1-6}. \end{aligned} \]