关于不变子空间和同时对角化问题[WIP]

不变子空间是一个重要概念.下面给出定义.

定义 (不变子空间) 设\(\mathcal{A}\)是数域\(P\)上线性空间\(V\)的线性变换,\(W\)\(V\)的一个子空间.如果\(W\)中的向量在\(\mathcal{A}\) 的像仍在\(W\)中,则称\(W\)\(\mathcal{A}\)的不变子空间, 也称\(\mathcal A-\)子空间. 形象的话来描述就是

\[ \forall{\xi\in W},\mathcal{A}\xi\in W. \]

最平凡的不变子空间自然是\(V\)本身以及 \({0}\)子空间.我们下面来讨论一些不那么频繁的不变子空间. 首先则是\(\mathcal{A}(V)\)\(\mathcal{A}^{-1}(0)\).


proof.

\[ \forall{\xi}\in\mathcal{A}(V),\mathcal{A}\xi\in\mathcal{A}(V) \]

\[ \forall{\xi}\in\mathcal{A}^{-1}(0),\mathcal{A}\xi=0\in\mathcal A^{-1}(0) \]


另外也有\(\mathcal A\)\(\mathcal B\)可交换\(\Leftrightarrow\)\(\mathcal B(V)\)\(\mathcal B^{-1}(0)\)\(\mathcal A-\)子空间.


proof.

\[ \forall{\mathcal B\xi}\in\mathcal B(V),\mathcal A(\mathcal B\xi)=\mathcal B(\mathcal A\xi)\in\mathcal B(V) \]

\[ \forall{\xi} \in\mathcal B^{-1}(0),\mathcal B(\mathcal A\xi)=\mathcal A0=0 \]


通过这些例子,我们理解到事实上\(\mathcal A-\)不变子空间就是对\(\mathcal A\)运算封闭的空间,\(\xi\)落在里面,则\(\mathcal A\xi\)还落在里面.落在里面更形象地来说就是仍保有该空间的性质.

类似地我们来看一道题.


例题\(\mathcal{A,B}\)是复线性空间\(V\)上的线性变换,且\(\mathcal{AB}-\mathcal{BA}=\mathcal A\),试证明:\(\mathcal{A,B}\)有公共特征向量.

proof. 设\(V_0\)\(\mathcal B\)的特征根\(\lambda\)的线性空间.

\[ \begin{aligned} \forall\xi\in V_0,\mathcal{AB}\xi-\mathcal{BA}\xi=\mathcal A\xi\\ \lambda \mathcal A\xi-\mathcal{BA}\xi=\mathcal A\xi\\ \mathcal B(\mathcal A\xi)=(\lambda-1)\mathcal A\xi \end{aligned} \]

\(\mathcal B\)存在\(\lambda-1\)的特征根,考虑\((\mathcal A-\lambda'\mathcal E)\xi=0\)的解.由于\(\mathcal A\)必然存在特征向量,则该向量同时属于\(\mathcal B\)的特征根\((\lambda-1)\)的特征空间和\(\mathcal A\)的特征根\(\lambda'\)的特征空间.得证.


我们来继续深入对不变子空间的认识.

\(\mathcal A-\)子空间的交与和也是\(\mathcal A-\)子空间.


proof. 设\(V_1,V_2\)\(\mathcal A-\)子空间,则有 \[ \forall\xi\in V_1\cap V_2,\mathcal A\xi\in V_1 \wedge \mathcal A\xi\in V_2\Rightarrow \mathcal A\xi\in V_1\cap V_2 \]

考虑\(V_1=L(\omega_1,\omega_2,\cdots,\omega_p),V_2=L(\eta_1,\eta_2,\cdots,\eta_q)\),则有

\[ \begin{aligned}\forall\xi\in V_1+V_2 &\Rightarrow\xi=k_1\omega_1+\cdots+k_p\omega_p+l_1\eta_1+\cdots+l_q\eta_q\\ &\Rightarrow\mathcal A\xi=\mathcal A(k_1\omega_1+\cdots)+\mathcal A(l_1\eta_1+\cdots)\\ &=(k'_1\omega_1+\cdots+k'_p\omega_p)+(l'_1\eta_1+\cdots+l'_q\eta_q)\in V_1+V_2 \end{aligned} \]


既然\(\mathcal A\)\(\mathcal A-\)子空间内封闭,则我们就可以把在\(\mathcal A-\)子空间内部的\(\mathcal A\)拿出来单独考虑,也即把\(\mathcal A\)看作是某\(\mathcal A-\)子空间的一个线性变换.取一\(\mathcal A-\)子空间\(W\),将该变换记作\(\mathcal A|_W\).

该变换具有如下性质: \[ \begin{aligned} \forall{\xi\in W},\mathcal A|_W\xi=\mathcal A\xi\\ \forall{\xi\not\in W},\mathcal A|_W\xi\mbox{无意义.} \end{aligned} \]

在对应的不变子空间上某些线性变换的性质会更加简化.比如说线性变换在他的核(kernel)内的变换为零变换,在其特征子空间内的变换就是数乘变换.

这样地我们引入一个性质.


性质 线性变换若可对角化,则对于任意不变子空间可对角化.

proof. 若线性变换可对角化,则有最小多项式(零化多项式的首一最大公因式)幂次最高为一.考虑线性变换在一不变子空间上的变换则有最小多项式整除于线性变换本身的最小多项式(若否,考虑不变子空间的直和的最小多项式不整除线性变换的最小多项式本身,显然不成立),由是幂次最高为一,得证.

如果我们考虑对角化本身的话,也可以这样分析.若线性变换\(\mathcal A\)可对角化,则有\(\mathcal A\)的所有特征向量可以作为\(V\)的一组基,也即\(V^n=L(\xi_1,\xi_2,\cdots,\xi_n)\).那么考虑\(\mathcal A-\)子空间\(W\).

\(W\)内不存在特征根,那么\(W\)为零子空间\(\{0\}\).否则\(W^k\)存在\(k\)个特征向量(通过基扩充).由是\(W\)可对角化.


既然讨论了对角化问题,我们就可以来讨论同时对角化问题了.


例题 \(V\)上可对角化的线性变换\(\mathcal A,\mathcal B\)可交换,则存在一组基使其同时对角化.

proof. 由于\(\mathcal A,\mathcal B\)可交换,则有\(\mathcal A-\)子空间亦为\(\mathcal B-\)子空间. 则在\(\mathcal A\)的特征空间下\(\mathcal B\)能对角化.收集在\(\mathcal A\)特征空间下\(\mathcal B\)对角化的向量为一组基,则可令\(\mathcal A,\mathcal B\)同时对角化.


这个结论还可以推广到\(n\)个乃至任意个可对角化且可彼此交换的线性变换上.


例题\('\) \(V\)上可对角化的线性变换\(\mathcal A_1,\mathcal A_2,\cdots,\mathcal A_m\)可交换,则存在一组基使其同时对角化.

proof. 考虑数学归纳法.

  1. \(n=2\)时,由上面知可同时对角化.
  2. \(n=k-1\)时若可同时对角化,加入一可对角化可交换线性变换\(\mathcal A_k\),通过上述方法也可同时对角化.
  3. 得证.


例题\(''\) 对于任意多的….

proof. 对于\(n\)维线性空间,其上的线性变换中最多有\(n^2\)个线性变换的极大无关组.由例题\('\)知可同时对角化.设其为\(\{\mathcal A_1,\mathcal A_2,\cdots,\mathcal A_{n^2}\}\). \[\forall{\mathcal B}=k_1\mathcal A_1+\cdots+k_{n^2}\mathcal A_{n^2}\mbox{且$\mathcal B$可对角化.}\] 且对于\(\mathcal A_k\)的每个特征基向量都有\(\mathcal A_k\varepsilon=\lambda_{k*}\varepsilon\),同样地对\(\mathcal B\)作用于该向量则有 \[\mathcal B\varepsilon=(\lambda_{1*}+\lambda_{2*}+\cdots+\lambda_{n^2*})\varepsilon\] 即有\(\mathcal B\)在这些特征向量中也能对角化.


从线性空间和矩阵的关系,我们来考虑不变子空间在矩阵上的意义(上面的题目里面我们似乎有所涉及).

由于不变子空间的元素不会被线性变换给投到外面去,所以我们纠结一众\(\mathcal A-\)子空间,他们的直和为\(V\),在子空间里选定基,合起来(每个子空间的基放一块儿)就是一组\(V\)的基,就能产生一个漂亮的矩阵 \[ \begin{pmatrix} A_1& & & \\ &A_2& & \\ & &\ddots& \\ & & & A_k \end{pmatrix} \] 这就达到了化简的目的(?).