如果一个数学问题要用到特征方程,那么这个问题一定可以用矩阵进行描述和求解,并且答案往往会和矩阵的任意正整数次幂有关。

而为了计算矩阵幂,我们需要对角化或约旦标准化矩阵。特征方程就是此时出现的。所有数学问题中出现的特征方程本质上都是矩阵的特征方程。

后文将以常系数线性微分方程和常系数线性差分方程这两个问题为例阐明上述的话究竟是什么意思。为了不偏离主题,我们只讨论齐次的情况。

常系数线性齐次微分方程

用矩阵描述常系数线性齐次微分方程

任意高阶的线性齐次微分方程,都可通过下述方法转化为等价的一阶线性齐次微分方程组。

以三阶线性齐次微分方程为例

已知 $x(0)$、$x'(0)$、$x''(0)$,求 $x(t)$ 满足

$$x'''(t) = ax(t) + bx'(t) + cx''(t)$$

可令

$$\begin{align*} x_0(t) &= x(t) \\ x_1(t) &= x'(t) \\ x_2(t) &= x''(t) \end{align*}$$

从而将问题改写为如下形式

已知 $x_0(0)$、$x_1(0)$、$x_2(0)$,求 $x_0(t)$、$x_1(t)$、$x_2(t)$ 满足

$$\begin{align*} x_0'(t) &= x_1(t) \\x_1'(t) &= x_2(t) \\ x_2'(t) &= ax_0(t) + bx_1(t) + cx_2(t) \end{align*}$$

因此一阶线性齐次微分方程组是比高阶线性齐次微分方程更一般的情况,我们先重点讨论前者,最后再专门讲下后者。

现在用矩阵来描述我们要讨论的问题

已知 $\mathbf{x}(0)$,求 $\mathbf{x}(t)$ 满足如下方程

$$\mathbf{x}'(t) = \mathbf{A} \mathbf{x}(t)$$

其中 $\mathbf{x}(t) = \begin{bmatrix} x_0(t)\\ x_1(t) \\ \dots \\ x_{n-1}(t) \\ \end{bmatrix}$ 称为向量值函数,对每一个确定的 $t$,$\mathbf{x}(t)$ 为一个 $n\times1$ 的列向量;$\mathbf{x}'(t) = \begin{bmatrix} x_0'(t) \\ x_1'(t) \\ \dots \\ x_{n-1}'(t) \\ \end{bmatrix}$ 表示对 $\mathbf{x}(t)$ 的每一个分量分别求导;$\mathbf{A} = \begin{bmatrix} a_{11} & a_{12} & \dots & a_{1n} \\ a_{21} & a_{22} & \dots & a_{2n} \\ \dots & \dots & \dots & \dots\\ a_{n1} & a_{n2} & \dots & a_{nn} \end{bmatrix}$ 称为系数矩阵,大小为 $n\times n$

至此我们成功地用矩阵描述了问题。

用矩阵求解常系数线性齐次微分方程

在求解该方程组之前,我们先回顾一下单个方程该如何求解

已知 ${x}(0)$,求 $x(t)$ 满足

$$x'(t) = a x(t)$$

假设我们还不知道该解的一般形式,不知道什么是特征方程,也不知道什么是 $e^x$,甚至不知道该怎么用分离变量法得到 $\int \frac{1}{x} \mathrm{d}x$ 这种形式。

在微分方程中有一种很重要的解法——幂级数求解法,该方法简述如下

  1. 假设解可以用幂级数表示,即 $x(t) = \sum_{i=0}^{\infty}a_it^i$
  2. 将该幂级数代入原微分方程,并结合已知条件,求出 $a_i$ 的通项公式
  3. 将 $a_i$ 代回到幂级数中,判断该级数的收敛性质

我们试着用此方法来求解上述的微分方程

首先,假设解可用幂级数表示

$$x(t) = \sum_{i=0}^{\infty}a_it^i$$

然后,将其代入微分方程中

$$\begin{align*} (\sum_{i=0}^{\infty}a_it^i)' &= a\sum_{i=0}^{\infty}a_it^i \\ \sum_{i=0}^{\infty}(i+1)a_{i+1}t^i &= a\sum_{i=0}^{\infty}a_it^i\\ \sum_{i=0}^{\infty}[(i+1)a_{i+1}-aa_i]t^i &= 0 \end{align*}$$

由于 $t$ 是一个变量,而该方程对任意 $t$ 都成立,因此有

$$(i+1)a_{i+1}-aa_i = 0$$

接着,以此递推关系求 $a_i$ 的通项公式

$$a_i = \frac{a}{i}a_{i-1}= \frac{a}{i}\frac{a}{i-1}a_{i-2} = \dots =\frac{a^i}{i!}a_0$$

而 $a_0=x(0)$ 正好是已知条件,因此

$$a_i = \frac{a^i}{i!}x(0)$$

最后,将 $a_i$ 代回到幂级数中

$$x(t) = \sum_{i=0}^{\infty}a_it^i = \sum_{i=0}^{\infty} \frac{a^i}{i!}x(0)t^i =(\sum_{i=0}^{\infty} \frac{(at)^i}{i!})x(0)$$

对于 $\sum_{i=0}^{\infty} \frac{(at)^i}{i!}$ 这个级数,我们令 $u=at$,并用 $f(u)=\sum_{i=0}^{\infty} \frac{u^i}{i!}$ 表示它,以便研究它的性质。可以证明

  • $f(u)$ 在整个实数域上收敛
  • $f(0) = 1$
  • $f(u_1 + u_2) = f(u_1)f(u_2)$

这个函数其实就是指数函数。如果定义 $e=f(1)=\sum_{i=0}^{\infty} \frac{1}{i!}$,那么我们就得到了这个指数函数的底数,从而可以方便地把 $f(u)$ 表示为 $e^u$ 这一更简洁的形式。

回到刚才的问题,使用新的定义,我们的答案为

已知 ${x}(0)$,求 $x(t)$ 满足

$$x'(t) = a x(t)$$

该微分方程的解为

$$x(t) = e^{at}x(0)$$

再回到方程组的情况,我们的求解方法是一样的

首先,假设解可用幂级数表示

$$\mathbf{x}(t) = \begin{bmatrix} x_0(t) \\ x_1(t) \\ \dots \\ x_{n-1}(t) \\ \end{bmatrix} = \begin{bmatrix} \sum_{i=0}^{\infty}a_{0,i}t^i \\ \sum_{i=0}^{\infty}a_{1,i}t^i \\ \dots \\ \sum_{i=0}^{\infty}a_{n-1,i}t^i \\ \end{bmatrix} = \sum_{i=0}^{\infty} \begin{bmatrix} a_{0,i} \\ a_{1,i} \\ \dots \\ a_{n-1,i} \\ \end{bmatrix}t^i$$

$$\mathbf{a}_i = \begin{bmatrix} a_{0,i} \\ a_{1,i} \\ \dots \\ a_{n-1,i} \\ \end{bmatrix}$$

则 $\mathbf{x}(t)$ 可简写为

$$\mathbf{x}(t) = \sum_{i=0}^{\infty}\mathbf{a}_it^i$$

然后,将其代入微分方程组中

$$\begin{align*} (\sum_{i=0}^{\infty}\mathbf{a}_it^i)' &= \mathbf{A}\sum_{i=0}^{\infty}\mathbf{a}_it^i \\ \sum_{i=0}^{\infty}(i+1)\mathbf{a}_{i+1}t^i &= \mathbf{A}\sum_{i=0}^{\infty}\mathbf{a}_it^i\\ \sum_{i=0}^{\infty}[(i+1)\mathbf{a}_{i+1}-\mathbf{A}\mathbf{a}_i]t^i &= \mathbf0 \end{align*}$$

由于 $t$ 是一个变量,而该方程对任意 $t$ 都成立,因此有

$$(i+1)\mathbf{a}_{i+1}-\mathbf{A}\mathbf{a}_i = \mathbf0$$

接着,以此递推关系求 $\mathbf{a}_i$ 的通项公式

$$\mathbf{a}_i = \frac{\mathbf{A}}{i}\mathbf{a}_{i-1}= \frac{\mathbf{A}}{i}\frac{\mathbf{A}}{i-1}\mathbf{a}_{i-2} = \dots =\frac{\mathbf{A}^i}{i!}\mathbf{a}_0$$

而 $\mathbf{a}_0=\mathbf{x}(0)$,正好是已知条件,因此

$$\mathbf{a}_i = \frac{\mathbf{A}^i}{i!}\mathbf{x}(0)$$

最后,将 $\mathbf{a}_i$ 代回到幂级数中

$$\mathbf{x}(t) = \sum_{i=0}^{\infty}\mathbf{a}_it^i = \sum_{i=0}^{\infty} \frac{\mathbf{A}^i}{i!}\mathbf{x}(0)t^i =(\sum_{i=0}^{\infty} \frac{\mathbf{A}^i}{i!}t^i)\mathbf{x}(0)$$

级数 $\sum_{i=0}^{\infty} \frac{\mathbf{A}^i}{i!}t^i$ 和 $e^{at}$ 的幂级数展开形式非常相似!因此我们可以试着定义矩阵指数

$$e^{\mathbf{A}}=\sum_{i=0}^{\infty} \frac{\mathbf{A}^i}{i!}$$

于是

$$e^{\mathbf{A}t}=\sum_{i=0}^{\infty} \frac{\mathbf{(At)}^i}{i!}=\sum_{i=0}^{\infty} \frac{\mathbf{A}^i}{i!}t^i$$

有了这个定义后,解就变得更简洁了

已知 $\mathbf{x}(0)$,求 $\mathbf{x}(t)$ 满足

$$\mathbf{x}'(t) = \mathbf{A} \mathbf{x}(t)$$

该微分方程组的解为

$$\mathbf{x}(t) = e^{\mathbf{A}t}\mathbf{x}(0)$$

至此我们成功地将解表示为了一个与矩阵有关的形式。

计算矩阵幂

先别高兴得太早,这样的结果我们肯定是不满意的。

目前最严重的问题是:根据定义,$e^{\mathbf{A}t}$ 实在太难算了!$e^{\mathbf{A}t}$ 中包含了矩阵的任意正整数次幂,而对于一般的 $n\times n$ 矩阵,直接计算 $\mathbf{A}^m$ 需要 $O(mn^3)$ 的时间复杂度。如果不借助计算机,我们很难判断该级数大概会收敛到哪里。

因此,我们需要用一些方法来简化计算。不过,为了便于教学,同时也是因为用 $\LaTeX$ 打矩阵实在太麻烦了,后面都以 $2\times2$ 矩阵举例。

我们知道有一种矩阵非常容易计算任意正整数次幂

如果

$$\mathbf{D} = \begin{bmatrix} \lambda_1&0\\ 0&\lambda_2 \end{bmatrix}$$

那么

$$\mathbf{D}^n = \begin{bmatrix} \lambda_1^n&0\\ 0&\lambda_2^n \end{bmatrix}$$

从而

$$\begin{align*} e^{\mathbf{D}t} &= \sum_{n=0}^{\infty} \frac{\mathbf{D}^n}{n!}t^n \\ &= \sum_{n=0}^{\infty} \frac{\begin{bmatrix} \lambda_1^n&0\\ 0&\lambda_2^n \end{bmatrix}}{n!}t^n \\ &= \begin{bmatrix}\sum_{n=0}^{\infty}\frac{ \lambda_1^n}{n!}t^n&0\\ 0&\sum_{n=0}^{\infty}\frac{ \lambda_2^n}{n!}t^n \end{bmatrix} \\ &=\begin{bmatrix} e^{\lambda_1t}&0\\ 0&e^{\lambda_2t} \end{bmatrix} \end{align*}$$

当然,大多数时候我们遇到的矩阵并没有这么简单。不过,线性代数为我们提供了一种对角化矩阵的方法

对 $\mathbf{A}$ 进行对角化,意思是将其表示为

$$\mathbf{A} = \mathbf{P}\mathbf{D}\mathbf{P^{-1}}$$

其中 $\mathbf{D} = \begin{bmatrix} \lambda_1&0\\ 0&\lambda_2 \end{bmatrix}$ 为对角矩阵,$\mathbf{P}=\begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 \end{bmatrix}$ 为可逆矩阵,$\lambda_1$、$\lambda_2$ 为 $\mathbf{A}$ 的特征值,$\mathbf{v}_1$、$\mathbf{v}_2$ 为 $\mathbf{A}$ 的特征向量

对角化后的矩阵也可以方便地求解任意正整数次幂,从而计算出 $e^{\mathbf{A}t}$,最后得到 $\mathbf{x}(t)$

若 $\mathbf{A}$ 已对角化,则

$$\mathbf{A}^n = \mathbf{P}\mathbf{D}\mathbf{P^{-1}} \mathbf{P}\mathbf{D}\mathbf{P^{-1}} \dots \mathbf{P}\mathbf{D}\mathbf{P^{-1}} =\mathbf{P}\mathbf{D}^n\mathbf{P^{-1}}$$

从而

$$\begin{align*} e^{\mathbf{A}t} &= \sum_{n=0}^{\infty} \frac{\mathbf{A}^n}{n!}t^n \\ &=\sum_{n=0}^{\infty} \frac{\mathbf{P}\mathbf{D}^n\mathbf{P^{-1}}}{n!}t^n \\ &= \mathbf{P}\sum_{n=0}^{\infty} \frac{\mathbf{D}^n}{n!}t^n \mathbf{P^{-1}}\\ &= \mathbf{P} \begin{bmatrix} e^{\lambda_1t} & 0\\ 0 & e^{\lambda_2t} \end{bmatrix}\mathbf{P^{-1}} \\ &= \begin{bmatrix} \mathbf{v}_1e^{\lambda_1t} & \mathbf{v}_2 e^{\lambda_2t}\end{bmatrix}\mathbf{P^{-1}} \end{align*}$$

$$\mathbf{P^{-1}}\mathbf{x}(0)=\begin{bmatrix} c_1 \\ c_2 \end{bmatrix}$$

则解为

$$\begin{align*} \mathbf{x}(t) &= e^{\mathbf{A}t}\mathbf{x}(0)\\ &= \begin{bmatrix} \mathbf{v}_1e^{\lambda_1t} & \mathbf{v}_2 e^{\lambda_2t}\end{bmatrix}\mathbf{P^{-1}}\mathbf{x}(0) \\ &=\begin{bmatrix} \mathbf{v}_1e^{\lambda_1t} & \mathbf{v}_2 e^{\lambda_2t}\end{bmatrix}\begin{bmatrix} c_1 \\ c_2 \end{bmatrix} \\ &= c_1\mathbf{v}_1e^{\lambda_1t} +c_2 \mathbf{v}_2 e^{\lambda_2t} \end{align*}$$

可以看到,$\mathbf{x}(t)$ 是 $\mathbf{v}_1e^{\lambda_1t}$ 和 $\mathbf{v}_2e^{\lambda_2t}$ 这两个向量值函数的线性组合。这个结论很有用,后续会再提到,届时将借此简化计算过程

而要对矩阵进行对角化,就要求出特征值;而要求特征值,就要列出特征方程。特征方程就是此时出现的。鉴于大多数的线性代数课程都会介绍对角化的方法,故此处不再赘述,只举一个简单的例子

对于系数矩阵

$$\mathbf{A} = \begin{bmatrix} 2 & 1 \\ 1 & 2 \end{bmatrix}$$

特征方程为

$$\det \begin{bmatrix} 2-\lambda & 1 \\ 1 & 2-\lambda \end{bmatrix}=0$$

展开行列式得到

$$\lambda^2-4\lambda+3=0$$

解得

$$\lambda_1=1, \lambda_2=3$$

对应的特征向量为

$$\mathbf{v}_1 = \begin{bmatrix} -1 \\ 1 \end{bmatrix},\mathbf{v}_2 = \begin{bmatrix} 1 \\ 1 \end{bmatrix}$$

对角化得到

$$\mathbf{A} = \begin{bmatrix} -1 & 1 \\ 1 & 1 \end{bmatrix} \begin{bmatrix} 1 & 0 \\ 0 & 3 \end{bmatrix} \begin{bmatrix} -\frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \end{bmatrix}$$

从而

$$e^{\mathbf{A}t}=\begin{bmatrix} \mathbf{v}_1e^{\lambda_1t} & \mathbf{v}_2 e^{\lambda_2t}\end{bmatrix}\mathbf{P^{-1}}= \begin{bmatrix} \begin{bmatrix} -1\\ 1 \end{bmatrix}e^t &\begin{bmatrix} 1\\ 1 \end{bmatrix}e^{3t}\end{bmatrix} \begin{bmatrix} -\frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \end{bmatrix}$$

该微分方程组的解为

$$\mathbf{x}(t) = \begin{bmatrix} \begin{bmatrix} -1\\ 1 \end{bmatrix}e^t &\begin{bmatrix} 1\\ 1 \end{bmatrix}e^{3t}\end{bmatrix} \begin{bmatrix} -\frac{1}{2} & \frac{1}{2} \\ \frac{1}{2} & \frac{1}{2} \end{bmatrix}\mathbf{x}(0)$$

将已知条件 $\mathbf{x}(0)= \begin{bmatrix} x_0\\ x_1 \end{bmatrix}$ 代入有

$$\begin{align*} \mathbf{x}(t) &=\begin{bmatrix} \begin{bmatrix} -1\\ 1 \end{bmatrix}e^t &\begin{bmatrix} 1\\ 1 \end{bmatrix}e^{3t}\end{bmatrix} \begin{bmatrix} -\frac{1}{2}x_0 + \frac{1}{2}x_1 \\ \frac{1}{2}x_0 + \frac{1}{2}x_1 \end{bmatrix}\\ &=(-\frac{1}{2}x_0 + \frac{1}{2}x_1)\begin{bmatrix} -1\\ 1 \end{bmatrix}e^t+ (\frac{1}{2}x_0 + \frac{1}{2}x_1 )\begin{bmatrix} 1\\ 1 \end{bmatrix}e^{3t} \end{align*}$$

可以看到,不管怎样改变 $\mathbf{x}(0)$,解始终是 $\begin{bmatrix} -1\\ 1 \end{bmatrix}e^t$ 和 $\begin{bmatrix} 1\\ 1 \end{bmatrix}e^{3t}$ 这两个向量值函数的线性组合。这符合我们之前发现的结论

然而,当特征方程存在复根或重根的时候,处理过程会有些不同。

出现复根时,需要使用欧拉公式进行化简

对于实系数矩阵 $\mathbf{A}$,若其特征方程出现复根,则复根必定是成对出现的,且两者互为共轭复数。对于 $2\times 2$ 的实系数矩阵,不妨设为

$$\lambda_1=a+ib , \lambda_2 = a - ib$$

此时复特征值对应的复特征向量也互为共轭复向量,设为

$$\mathbf{v}_1=\mathbf{a}+i\mathbf{b},\mathbf{v}_2=\mathbf{a}-i\mathbf{b}$$

复特征值和复特征向量并不会影响对角化,即同样有

$$\mathbf{A} = \mathbf{P}\mathbf{D}\mathbf{P^{-1}}$$

直接把之前的结论可以照搬过来

$$e^{\mathbf{A}t}=\begin{bmatrix} \mathbf{v}_1e^{\lambda_1t} & \mathbf{v}_2 e^{\lambda_2t}\end{bmatrix}\mathbf{P^{-1}}$$

运用欧拉公式,有

$$\begin{align*} \mathbf{v}_1e^{\lambda_1t} &=(\mathbf{a}+i\mathbf{b})e^{(a+ib)t}\\ &=(\mathbf{a}+i\mathbf{b})e^{at}(\cos bt +i \sin bt) \\ &=(\mathbf{a}\cos bt-\mathbf{b}\sin bt)e^{at}+i(\mathbf{a} \sin bt + \mathbf{b}\cos bt)e^{at} \\ \mathbf{v}_2e^{\lambda_2t} &=(\mathbf{a}-i\mathbf{b})e^{(a-ib)t}\\ &=(\mathbf{a}-i\mathbf{b})e^{at}(\cos bt -i \sin bt)\\ &=(\mathbf{a}\cos bt-\mathbf{b}\sin bt)e^{at}-i(\mathbf{a} \sin bt + \mathbf{b}\cos bt)e^{at} \end{align*}$$

不出意料,$\mathbf{v}_1e^{\lambda_1t}$ 和 $\mathbf{v}_2e^{\lambda_2t}$ 也互为共轭的复向量值函数。不妨令 $\mathbf{v}_1e^{\lambda_1t}$ 的实部为 $\mathbf{f}_{Re}(t)$,虚部为 $\mathbf{f}_{Im}(t)$,即

$$\begin{align*} \mathbf{f}_{Re}(t)&=(\mathbf{a}\cos bt-\mathbf{b}\sin bt)e^{at}\\ \mathbf{f}_{Im}(t)&=(\mathbf{a} \sin bt + \mathbf{b}\cos bt)e^{at} \end{align*}$$

从而

$$\begin{align*} e^{\mathbf{A}t} &=\begin{bmatrix} \mathbf{f}_{Re}(t)+i\mathbf{f}_{Im}(t) & \mathbf{f}_{Re}(t) -i\mathbf{f}_{Im}(t)\end{bmatrix}\mathbf{P^{-1}}\\ &=(\begin{bmatrix} \mathbf{f}_{Re}(t) & \mathbf{f}_{Re}(t)\end{bmatrix} +\begin{bmatrix} i\mathbf{f}_{Im}(t) & -i\mathbf{f}_{Im}(t)\end{bmatrix}) \mathbf{P^{-1}}\\ &=(\mathbf{f}_{Re}(t)\begin{bmatrix} 1 & 1\end{bmatrix} +\mathbf{f}_{Im}(t)\begin{bmatrix} i & -i\end{bmatrix}) \mathbf{P^{-1}}\\ &=\mathbf{f}_{Re}(t)\begin{bmatrix} 1 & 1\end{bmatrix}\mathbf{P^{-1}} +\mathbf{f}_{Im}(t) \begin{bmatrix} i & -i\end{bmatrix} \mathbf{P^{-1}} \end{align*}$$

由于 $\mathbf{A}$ 是实系数矩阵,因此 $e^{\mathbf{A}t}$ 也是个实矩阵,继而 $\begin{bmatrix} 1 & 1\end{bmatrix}\mathbf{P^{-1}}$ 和 $\begin{bmatrix} i & -i\end{bmatrix} \mathbf{P^{-1}}$ 是实的行向量。于是设

$$\begin{align*} \begin{bmatrix} 1 & 1\end{bmatrix}\mathbf{P^{-1}} \mathbf{x}(0)&=c_1\\ \begin{bmatrix} i & -i\end{bmatrix}\mathbf{P^{-1}} \mathbf{x}(0)&=c_2 \end{align*}$$

则解为

$$\begin{align*} \mathbf{x}(t) &= e^{\mathbf{A}t}\mathbf{x}(0)\\ &=(\mathbf{f}_{Re}(t)\begin{bmatrix} 1 & 1\end{bmatrix}\mathbf{P^{-1}} +\mathbf{f}_{Im}(t) \begin{bmatrix} i & -i\end{bmatrix} \mathbf{P^{-1}})\mathbf{x}(0)\\ &=\mathbf{f}_{Re}(t)\begin{bmatrix} 1 & 1\end{bmatrix}\mathbf{P^{-1}} \mathbf{x}(0)+\mathbf{f}_{Im}(t) \begin{bmatrix} i & -i\end{bmatrix} \mathbf{P^{-1}}\mathbf{x}(0)\\ &=c_1\mathbf{f}_{Re}(t) +c_2 \mathbf{f}_{Im}(t) \end{align*}$$

可以看到,$\mathbf{x}(t)$ 是 $\mathbf{f}_{Re}(t)$ 和 $\mathbf{f}_{Im}(t)$ 这两个向量值函数的线性组合。这个结论同样重要,后续会再次提到

下面举个具体的例子

对于实系数矩阵

$$\mathbf{A} = \begin{bmatrix} 1 & -1 \\ 1 & 1 \end{bmatrix}$$

其特征方程为

$$\lambda^2-2\lambda+2=0$$

解得

$$\lambda_1=1-i,\lambda_2=1+i$$

注意到实部和虚部分别为

$$a=1,b=-1$$

对应的特征向量为

$$\mathbf{v}_1=\begin{bmatrix} -i\\ 1 \end{bmatrix}, \mathbf{v}_2=\begin{bmatrix} i\\ 1 \end{bmatrix}$$

注意到实部和虚部分别为

$$\mathbf{a}=\begin{bmatrix} 0\\ 1 \end{bmatrix}, \mathbf{b}=\begin{bmatrix} -1\\ 0 \end{bmatrix}$$

于是得到

$$\begin{align*} \mathbf{f}_{Re}(t) &=(\mathbf{a}\cos bt-\mathbf{b}\sin bt)e^{at}\\ &=(\begin{bmatrix} 0\\ 1 \end{bmatrix}\cos (-t)-\begin{bmatrix} -1\\ 0 \end{bmatrix}\sin (-t))e^{t}\\ &=\begin{bmatrix} -\sin t\\ \cos t \end{bmatrix}e^{t}\\ \mathbf{f}_{Im}(t) &=(\mathbf{a} \sin bt + \mathbf{b}\cos bt)e^{at}\\ &=(\begin{bmatrix} 0\\ 1 \end{bmatrix} \sin (-t) + \begin{bmatrix} -1\\ 0 \end{bmatrix}\cos (-t))e^{t}\\ &=\begin{bmatrix} -\cos t\\ -\sin t \end{bmatrix}e^{t} \end{align*}$$

对角化结果为

$$\mathbf{A} = \begin{bmatrix} -i & i \\ 1 & 1 \end{bmatrix} \begin{bmatrix} 1-i & 0 \\ 0 & 1+i \end{bmatrix} \begin{bmatrix} \frac{i}2 & \frac{1}2 \\ -\frac{i}2 & \frac{1}2 \end{bmatrix}$$

于是

$$\begin{align*} e^{\mathbf{A}t} &=\mathbf{f}_{Re}(t)\begin{bmatrix} 1 & 1\end{bmatrix}\mathbf{P^{-1}} +\mathbf{f}_{Im}(t) \begin{bmatrix} i & -i\end{bmatrix} \mathbf{P^{-1}}\\ &=\begin{bmatrix} -\sin t\\ \cos t \end{bmatrix}e^{t} \begin{bmatrix} 1& 1 \end{bmatrix} \begin{bmatrix} \frac{i}2 & \frac{1}2 \\ -\frac{i}2 & \frac{1}2 \end{bmatrix} + \begin{bmatrix} -\cos t\\ -\sin t \end{bmatrix}e^{t} \begin{bmatrix} i& -i \end{bmatrix} \begin{bmatrix} \frac{i}2 & \frac{1}2 \\ -\frac{i}2 & \frac{1}2 \end{bmatrix}\\ &=\begin{bmatrix} -\sin t\\ \cos t \end{bmatrix}e^{t} \begin{bmatrix} 0& 1 \end{bmatrix} + \begin{bmatrix} -\cos t\\ -\sin t \end{bmatrix}e^{t} \begin{bmatrix} -1& 0 \end{bmatrix} \end{align*}$$

该微分方程组的解为

$$\mathbf{x}(t)= (\begin{bmatrix} -\sin t\\ cos t \end{bmatrix}e^{t} \begin{bmatrix} 0& 1 \end{bmatrix} + \begin{bmatrix} -\cos t\\ -\sin t \end{bmatrix}e^{t} \begin{bmatrix} -1& 0 \end{bmatrix})\mathbf{x}(0)$$

将已知条件 $\mathbf{x}(0)= \begin{bmatrix} x_0\\ x_1 \end{bmatrix}$ 代入有

$$\mathbf{x}(t)=x_1\begin{bmatrix} -\sin t\\ \cos t \end{bmatrix}e^{t} -x_0\begin{bmatrix} -\cos t\\ -\sin t \end{bmatrix}e^{t}$$

同样地,我们看到,不管怎样改变 $\mathbf{x}(0)$,方程的解始终是 $\begin{bmatrix} -\sin t\\ \cos t \end{bmatrix}e^t$ 和 $\begin{bmatrix} -\cos t\\ -\sin t \end{bmatrix}e^{t}$ 这两个向量值函数的线性组合。这符合我们之前发现的结论

最麻烦的是出现重根的时候,矩阵在这一情形下无法对角化。不过,不管什么矩阵都可以进行约旦标准化

对 $\mathbf{A}$ 进行约旦标准化,意思是将其表示为

$$\mathbf{A} = \mathbf{P}\mathbf{J}\mathbf{P^{-1}}$$

其中 $\mathbf{J}=\mathbf{D} + \mathbf{N}$ 为约旦标准型矩阵,$\mathbf{D} = \begin{bmatrix} \lambda_1&0\\ 0&\lambda_2 \end{bmatrix}$ 为对角矩阵,$\mathbf{N}$ 为幂零矩阵,$\mathbf{P}=\begin{bmatrix} \mathbf{v}_1 & \mathbf{v}_2 \end{bmatrix}$ 为可逆矩阵,$\lambda_1$、$\lambda_2$ 为 $\mathbf{A}$ 的特征值,$\mathbf{v}_1$、$\mathbf{v}_2$ 分别为 $\mathbf{A}$ 的特征向量和广义特征向量。

显然这里最特殊的就是 $\mathbf{N}$。对于 $2\times 2$ 的系数矩阵,其有两种可能的值

$$\mathbf{N} = \begin{bmatrix} 0&0\\0&0 \end{bmatrix}, \mathbf{N} = \begin{bmatrix} 0&1\\0&0 \end{bmatrix}$$

对于前一种情形,约旦标准型矩阵同时也是对角矩阵,可以沿用之前的结论,故下文只讨论后一种情形

约旦标准化同样可以简化矩阵幂的计算,并最终得到方程的解

当约旦标准化处于后一种情形时,意味着特征方程出现了重根,即

$$\lambda_1=\lambda_2=\lambda$$

从而将对角矩阵改写为

$$\mathbf{D}=\lambda\mathbf{I}$$

假设 $\mathbf{A}$ 已约旦标准化,则

$$\mathbf{A}^n=\mathbf{P}\mathbf{J}\mathbf{P^{-1}}\mathbf{P}\mathbf{J}\mathbf{P^{-1}}\dots \mathbf{P}\mathbf{J}\mathbf{P^{-1}} =\mathbf{P}\mathbf{J^n}\mathbf{P^{-1}}$$

而 $\mathbf{J^n}$ 可用二项式展开进行计算

$$\mathbf{J^n}=(\lambda \mathbf{I}+\mathbf{N})^n =\sum_{k=0}^n\binom{n}{k} (\lambda \mathbf{I})^{n-k}\mathbf{N}^k$$

当 $k>1$ 时,$\mathbf{N}^k = \mathbf{0}$,于是

$$\mathbf{J^n}=\lambda^n\mathbf{I}+n\lambda^{n-1}\mathbf{N} =\begin{bmatrix} \lambda^n&n\lambda^{n-1}\\0&\lambda^n \end{bmatrix}$$

进一步计算得

$$\sum_{n=0}^{\infty}\frac{\mathbf{J^n}}{n!}t^n =\sum_{n=0}^{\infty} \frac{ \begin{bmatrix} \lambda^n&n\lambda^{n-1}\\ 0&\lambda^n \end{bmatrix} }{n!}t^n =\begin{bmatrix}\sum_{n=0}^{\infty}\frac{ \lambda^nt^n}{n!}&\sum_{n=0}^{\infty}\frac{ n\lambda^{n-1}t^{n}}{n!}\\ 0&\sum_{n=0}^{\infty}\frac{ \lambda^nt^n}{n!} \end{bmatrix}$$

其中

$$\sum_{n=0}^{\infty}\frac{ n\lambda^{n-1}t^{n}}{n!}=t\sum_{n=1}^{\infty}\frac{ \lambda^{n-1}t^{n-1}}{(n-1)!}=t\sum_{m=0}^{\infty}\frac{ \lambda^{m}t^{m}}{m!}=te^{\lambda t}$$

于是

$$\sum_{n=0}^{\infty}\frac{\mathbf{J^n}}{n!}t^n=\begin{bmatrix} e^{\lambda t} & te^{\lambda t}\\ 0 & e^{\lambda t} \end{bmatrix}$$

从而

$$\begin{align*} e^{\mathbf{A}t} &=\sum_{n=0}^{\infty} \frac{\mathbf{A}^n}{n!}t^n \\ &=\sum_{n=0}^{\infty} \frac{\mathbf{P}\mathbf{J}^n\mathbf{P^{-1}}}{n!}t^n \\ &=\mathbf{P}\sum_{n=0}^{\infty}\frac{\mathbf{J^n}}{n!}t^n \mathbf{P^{-1}}\\ &= \mathbf{P} \begin{bmatrix} e^{\lambda t} & te^{\lambda t}\\ 0 & e^{\lambda t} \end{bmatrix} \mathbf{P^{-1}}\\ &=\begin{bmatrix} \mathbf{v}_1e^{\lambda t} & \mathbf{v}_1te^{\lambda t}+ \mathbf{v}_2 e^{\lambda t}\end{bmatrix}\mathbf{P^{-1}} \end{align*}$$

$$\mathbf{P^{-1}}\mathbf{x}(0)=\begin{bmatrix} c_1 \\ c_2 \end{bmatrix}$$

则解为

$$\begin{align*} \mathbf{x}(t) &= e^{\mathbf{A}t}\mathbf{x}(0)\\ &= \begin{bmatrix} \mathbf{v}_1e^{\lambda t} & \mathbf{v}_1te^{\lambda t}+ \mathbf{v}_2 e^{\lambda t}\end{bmatrix}\mathbf{P^{-1}}\mathbf{x}(0)\\ &= \begin{bmatrix} \mathbf{v}_1e^{\lambda t} & \mathbf{v}_1te^{\lambda t}+ \mathbf{v}_2 e^{\lambda t}\end{bmatrix}\begin{bmatrix} c_1 \\ c_2 \end{bmatrix}\\ &=c_1\mathbf{v}_1e^{\lambda t} +c_2 (\mathbf{v}_1te^{\lambda t}+\mathbf{v}_2 e^{\lambda t}) \end{align*}$$

可以看到,$\mathbf{x}(t)$ 是 $\mathbf{v}_1e^{\lambda_1t}$ 和 $\mathbf{v}_1te^{\lambda t}+\mathbf{v}_2 e^{\lambda t}$ 这两个向量值函数的线性组合。这个结论也是非常有用的,后续会再次提到

这里不介绍约旦标准化的具体步骤,感兴趣者可自行了解。下面列举一个简单的例子

对于系数矩阵

$$\mathbf{A} = \begin{bmatrix} 1 & 1 \\ -1 & 3 \end{bmatrix}$$

特征方程为

$$\lambda^2-4\lambda+4=0$$

解得

$$\lambda_1=\lambda_2=2$$

特征方程出现了重根,尝试进行约旦标准化,得到

$$\mathbf{A} = \begin{bmatrix} -1 & 1 \\ -1 & 0 \end{bmatrix} \begin{bmatrix} 2 & 1 \\ 0 & 2 \end{bmatrix} \begin{bmatrix} 0 & -1 \\ 1 & -1 \end{bmatrix}$$

于是

$$\begin{align*} e^{\mathbf{A}t} &= \begin{bmatrix} \mathbf{v}_1e^{\lambda t} & \mathbf{v}_1te^{\lambda t}+ \mathbf{v}_2 e^{\lambda t}\end{bmatrix}\mathbf{P^{-1}}\\ &=\begin{bmatrix} \begin{bmatrix} -1 \\ -1 \end{bmatrix} e^{2t} &\begin{bmatrix} -1 \\ -1 \end{bmatrix} te^{2t}+\begin{bmatrix} 1 \\ 0 \end{bmatrix}e^{2t} \end{bmatrix} \begin{bmatrix} 0 & -1 \\ 1 & -1 \end{bmatrix} \end{align*}$$

该微分方程组的解为

$$\mathbf{x}(t)= \begin{bmatrix} \begin{bmatrix} -1 \\ -1 \end{bmatrix} e^{2t} &\begin{bmatrix} -1 \\ -1 \end{bmatrix} te^{2t}+\begin{bmatrix} 1 \\ 0 \end{bmatrix}e^{2t} \end{bmatrix} \begin{bmatrix} 0 & -1 \\ 1 & -1 \end{bmatrix}\mathbf{x}(0)$$

将已知条件 $\mathbf{x}(0)= \begin{bmatrix} x_0\\ x_1 \end{bmatrix}$ 代入有

$$\begin{align*} \mathbf{x}(t) &=\begin{bmatrix} \begin{bmatrix} -1 \\ -1 \end{bmatrix} e^{2t} &\begin{bmatrix} -1 \\ -1 \end{bmatrix} te^{2t}+\begin{bmatrix} 1 \\ 0 \end{bmatrix}e^{2t} \end{bmatrix} \begin{bmatrix} -x_1 \\ x_0 -x_1 \end{bmatrix}\\ &=-x_1\begin{bmatrix} -1 \\ -1 \end{bmatrix} e^{2t} + (x_0-x_1)(\begin{bmatrix} -1 \\ -1 \end{bmatrix} te^{2t}+\begin{bmatrix} 1 \\ 0 \end{bmatrix}e^{2t}) \end{align*}$$

还是一样,不管怎样改变 $\mathbf{x}(0)$,方程的解始终为 $\begin{bmatrix} -1 \\ -1 \end{bmatrix} e^{2t}$ 和 $\begin{bmatrix} -1 \\ -1 \end{bmatrix} te^{2t}+\begin{bmatrix} 1 \\ 0 \end{bmatrix}e^{2t}$ 这两个向量值函数的线性组合。这同样符合我们之前的发现

常系数线性齐次微分方程求解方法总结

实际求解微分方程的时候不必像上面几个例子那样麻烦。至少有一步是可以省略的——我们不需要去求逆矩阵 $\mathbf{P^{-1}}$。下面讲述具体的原因。

基于前面的分析,我们知道了一个非常重要的事实:一阶线性齐次微分方程组的解是某些向量某些函数之积的线性组合。这些向量我们称为特征向量,这些函数我们称为特征函数,而线性组合的具体系数可以通过已知条件求得。

对于特征方程无复根和重根的情况

已知 $\mathbf{x}(0)$,求 $\mathbf{x}(t)$ 满足

$$\mathbf{x}'(t) = \mathbf{A} \mathbf{x}(t)$$

该微分方程组的解为

$$\mathbf{x}(t)=\sum_{i=1}^n c_i\mathbf{v}_ie^{\lambda_it}$$

其中 $\lambda_i$ 为系数矩阵 $\mathbf{A}$ 的特征值,$\mathbf{v}_i$ 为 $\lambda_i$ 对应的特征向量,$c_i$ 可通过初值条件计算

因此,我们在求出特征值以及对应的特征向量后,可以直接设 $\mathbf{x}(t)=\sum_{i=1}^n c_i\mathbf{v}_ie^{\lambda_it}$,然后代入初值条件解出 $c_1$、$c_2$……$c_n$。有 $n$ 个未知系数,而初值条件 $\mathbf{x}(0)$ 代入微分方程 $\mathbf{x}'(0) = \mathbf{A}\mathbf{x}(0)$ 后得到了 $n$ 个代数方程,所以总是能够算出系数的。虽然说求逆矩阵本质也是解方程组,但显然这里直接解方程组会比例题里先求 $\mathbf{P^{-1}}$ 然后再用 $\mathbf{P^{-1}}$ 乘 $\mathbf{x}(0)$ 计算系数更简单。

当特征方程出现复根或重根后,情况会更复杂一点。对于 $2\times2$ 的系数矩阵,前面的例子已经给出了出现复根或重根时的答案,这里再总结一下。

对于出现了复根的情况

微分方程组的解为

$$\mathbf{x}(t)=c_1(\mathbf{a}\cos bt-\mathbf{b}\sin bt)e^{at} +c_2 (\mathbf{a}\sin bt+\mathbf{b}\cos bt)e^{at}$$

其中 $a$、$b$ 分别是复特征值 $\lambda_1$ 的实部和虚部,$\mathbf{a}$、$\mathbf{b}$ 分别是复特征向量 $\mathbf{v}_1$ 的实部和虚部,$c_1$、$c_2$ 可通过初值条件计算

对于出现了重根的情况

微分方程组的解为

$$\mathbf{x}(t)=c_1\mathbf{v}_1e^{\lambda t} +c_2 (\mathbf{v}_1te^{\lambda t}+\mathbf{v}_2 e^{\lambda t})$$

其中 $\lambda=\lambda_1=\lambda_2$ 是相同的特征值,$\mathbf{v}_1$、$\mathbf{v}_2$ 是 $\lambda$ 对应的广义特征向量,$c_1$、$c_2$ 可通过初值条件计算

读者可自行研究该答案要怎么推广到更高阶的矩阵。

最后简要提一下单个的高阶线性微分方程。由于高阶方程化为等价的一阶方程组后,系数矩阵具有特殊的形式,我们可以利用这一点来得到更方便求解的结论。

还是以开头提到的三阶微分方程为例

已知 $x(0)$、$x'(0)$、$x''(0)$,求 $x(t)$ 满足

$$x'''(t) = ax(t) + bx'(t) + cx''(t)$$

我们已经将其转为了等价的一阶微分方程组

已知 $x_0(0)$、$x_1(0)$、$x_2(0)$,求 $x_0(t)$、$x_1(t)$、$x_2(t)$ 满足

$$\begin{align*} x_0'(t) &= x_1(t) \\ x_1'(t) &= x_2(t) \\ x_2'(t) &= ax_0(t) + bx_1(t) + cx_2(t) \end{align*}$$

可以看到,系数矩阵为

$$\mathbf{A}=\begin{bmatrix} 0 & 1 &0\\ 0 & 0 &1\\ a & b &c \end{bmatrix}$$

首先求其特征值

矩阵的特征值满足如下性质

$$\det(\mathbf{A}-\lambda\mathbf{I})=0$$

$$\det\begin{bmatrix} -\lambda & 1 &0\\ 0 & -\lambda &1\\ a & b &c -\lambda \end{bmatrix}=0$$

展开行列式得到特征方程

$$\lambda^3=a+b\lambda+c\lambda^2$$

而原微分方程为

$$x'''(t) = ax(t) + bx'(t) + cx''(t)$$

我们发现,特征方程中 $\lambda^n$ 的系数正好就是微分方程中 $x^{(n)}(t)$ 的系数。正是这个特殊的系数矩阵导致了这一结果。

然后我们求出对应的特征向量

设特征值 $\lambda$ 对应的特征向量为

$$\mathbf{v}=\begin{bmatrix} v_1\\ v_2\\ v_3 \end{bmatrix}$$

由 $\mathbf{A}\mathbf{v}=\lambda\mathbf{v}$ 得 $(\mathbf{A}-\lambda\mathbf{I})\mathbf{v}=\mathbf0$,即

$$\begin{bmatrix} -\lambda & 1 &0\\ 0 & -\lambda &1\\ a & b &c -\lambda \end{bmatrix}\begin{bmatrix} v_1\\ v_2\\ v_3 \end{bmatrix}=\mathbf0$$

相乘后得到三个等式

$$\begin{align*} v_2 &=\lambda v_1\\ v_3 &=\lambda v_2\\ \lambda v_3 &=av_1+bv_2+cv_3 \end{align*}$$

对最后一个等式消去 $v_3$、$v_2$ 得到

$$\lambda^3v_1=(a+b\lambda+c\lambda^2)v_1$$

由于 $\lambda$ 是特征值,满足特征方程

$$\lambda^3=a+b\lambda+c\lambda^2$$

因此任意 $v_1$ 都能使等式成立。不妨取 $v_1=1$,从而特征值 $\lambda$ 对应的特征向量为

$$\mathbf{v}=\begin{bmatrix} 1\\ \lambda \\ \lambda^2 \end{bmatrix}$$

我们发现,该矩阵的特征向量也非常容易计算。这仍然要归功于那个特殊的系数矩阵。

最后我们试着解出微分方程

因为对该高阶方程,我们只需要求出 $x(t)$,即等价一阶方程组中的 $x_0(t)$,所以我们只关注特征向量的第一个分量。而对该矩阵的所有特征向量,第一个分量都是任意的,故可全取为 $1$,于是有

$$x(t)=c_1f_1(t)+c_2f_2(t)+c_3f_3(t)$$

其中 $f_i(t)$ 为 $\lambda_i$ 对应的特征函数,若 $\lambda_i$ 不为复根或重根则 $f_i(t)=e^{\lambda_it}$,其余情况 $f_i(t)$ 具有更复杂的形式;$c_1$、$c_2$、$c_3$ 可通过初值条件求出

我们发现,该微分方程的计算其实并不需要经过求特征向量、对角化或约旦标准化、矩阵相乘等繁琐的步骤。我们可以首先根据微分方程的系数直接列写特征方程,然后算出特征值并求对应的特征函数,最后代入初值条件求出线性组合的系数。能够这样做,同样是因为那个特殊的系数矩阵。

对于更高阶的方程也可以用这个方法求解。这里直接给出推广到 $n$ 阶线性齐次微分方程的解法

  1. 根据微分方程的系数列写特征方程并求解,从而得到特征值 $\lambda_1$、$\lambda_2$……$\lambda_n$(由代数基本定理,算上复根和重根,一元 $n$ 次方程一定会有 $n$ 个解)
  2. 按特征值的不同情况分类讨论,从而得到特征函数
    1. 特征值 $\lambda_i$ 是与其他特征值相异的实根,则特征函数为 $e^{\lambda_it}$
    2. 特征值 $\lambda_i$ 和 $\lambda_j$ 是共轭的复根,分别为 $a\pm ib$,则特征函数为 $e^{at}\cos bt$ 和 $e^{at}\sin bt$
    3. 特征值 $\lambda_{i1}=\lambda_{i2}=\dots=\lambda_{ik}$ 是 $k$ 个相同的实根,都等于 $\lambda$,则特征函数为 $e^{\lambda t}$、$te^{\lambda t}$……$t^{k-1}e^{\lambda t}$
    4. 特征值 $\lambda_{i1}=\lambda_{i2}=\dots=\lambda_{ik}$ 是 $k$ 个相同的复根,都等于 $a + ib$,而 $\lambda_{j1}=\lambda_{j2}=\dots=\lambda_{jk}$ 是 $k$ 个相同的与前者共轭的复根,都等于 $a - ib$,则特征函数为 $e^{at}\cos bt$、$e^{at}\sin bt$、$te^{at}\cos bt$、$te^{at}\sin bt$……$t^{k-1}e^{at}\cos bt$、$t^{k-1}e^{at}\sin bt$
  3. 设 $x(t)=\sum_{i=0}^nc_if_i(t)$,其中 $f_i(t)$ 为刚才求得的特征函数。代入初值条件求出 $c_i$

常系数线性齐次差分方程

用矩阵描述常系数线性齐次差分方程

差分方程对于部分人而言可能较为陌生。不过差分方程其实很常见,比如之前在用幂级数求解微分方程的时候就遇到了一个差分方程

已知 $a_0$,求 $a_n$ 满足 $(n+1)a_{n+1}-aa_n=0$ 的通项公式

没错,求解数列递推问题其实就是在解差分方程。为了使其看起来更像微分方程,我们这里用一套更专业的符号来定义差分方程和差分方程的解

差分方程的解是一个数列。我们用 $x[n]$ 来表示数列,其中 $n$ 为非负整数。$x[0]$ 表示该数列的第 $1$ 个数,$x[1]$ 表示该数列的第 $2$ 个数,以此类推,$x[n]$ 表示该数列的第 $n+1$ 个数

一阶齐次线性差分方程的一般形式为

$$x[n+1]=ax[n]$$

其中 $a$ 是常数

$k$ 阶齐次线性差分方程的一般形式为

$$x[n+k]=a_1x[n]+a_2x[n+1]+\dots+a_kx[n+k-1]$$

其中 $a_1$、$a_2$……$a_k$ 是常数

解差分方程,就是求 $x[n]$ 在 $n$ 为任意非负整数时的表达式

注意,根据定义,因为 $(n+1)a_{n+1}-aa_n=0$ 中存在非常数系数 $n+1$,所以这个数列递推问题不属于常系数线性差分方程,无法使用特征方程法求解。

由于高阶线性齐次差分方程可用与微分方程同样的方法转化为一阶线性齐次差分方程组,因此线性齐次差分方程组是更一般的情况,我们只讨论此情况。

现在用矩阵描述我们的问题

已知 $\mathbf{x}[0]$,求 $\mathbf{x}[n]$ 满足

$$\mathbf{x}[n+1]=\mathbf{A}\mathbf{x}[n]$$

其中 $\mathbf{x}[n] = \begin{bmatrix} x_0[n] \\ x_1[n] \\ \dots \\ x_{m-1}[n] \\ \end{bmatrix}$ 称为向量值数列,对每一个非负整数 $n$,$\mathbf{x}[n]$ 为一个 $m\times1$ 的列向量;$\mathbf{A} = \begin{bmatrix} a_{11} & a_{12} & \dots & a_{1m} \\ a_{21} & a_{22} & \dots & a_{2m} \\ \dots & \dots & \dots & \dots\\ a_{m1} & a_{m2} & \dots & a_{mm} \end{bmatrix}$ 称为系数矩阵,大小为 $m\times m$

至此我们成功地用矩阵描述了问题。

用矩阵求解常系数线性齐次差分方程

求解差分方程相比微分方程简单多了

对于

$$\mathbf{x}[n+1]=\mathbf{A}\mathbf{x}[n]$$

令 $n$ 取不同的值,得

$$\begin{align*} \mathbf{x}[n]&=\mathbf{A}\mathbf{x}[n-1]\\ \mathbf{x}[n-1]&=\mathbf{A}\mathbf{x}[n-2]\\ &\dots \\ \mathbf{x}[1]&=\mathbf{A}\mathbf{x}[0] \end{align*}$$

不断地用下面的等式替换上面的等式,从而

$$\mathbf{x}[n]=\mathbf{A}\mathbf{x}[n-1]=\mathbf{A}\times\mathbf{A}\mathbf{x}[n-2]=\dots=\mathbf{A}^n\mathbf{x}[0]$$

至此我们成功地将解表示为了一个与矩阵有关的形式。

最后又回到了计算矩阵幂的问题。$\mathbf{A}^n$ 通常不好计算,但我们可以对角化或约旦标准化 $\mathbf{A}$ 从而快速计算矩阵幂。特征方程就是此时出现的。这些都已在解微分方程时讨论过了,此处不再赘述。

总结

除了在解微分方程和差分方程时要用到特征方程外,其实特征方程还出现在一些别的地方。如果你学过信号与系统或控制理论,那么可能听说过线性时不变系统的特征方程。对于状态空间模型,即用微分方程或微分方程组描述的系统,此时特征方程显然就是微分方程或微分方程组的特征方程;对于传递函数模型,即用传递函数描述的系统,由于传递函数是通过对微分方程或微分方程组两边同时拉普拉斯变换得到的,因此其本质上还是微分方程或微分方程组的特征方程。

最后把开头的那段话复述如下,相信你应该有了更深的理解

如果一个数学问题要用到特征方程,那么这个问题一定可以用矩阵进行描述和求解,并且答案往往会和矩阵的任意正整数次幂有关。

而为了计算矩阵幂,我们需要对角化或约旦标准化矩阵。特征方程就是此时出现的。所有数学问题中出现的特征方程本质上都是矩阵的特征方程。