Sinofine Lotusie

关于不变子空间和同时对角化问题

线性空间的不变子空间是一个重要概念. 他实际上类似于环的理想. 下面给出定义.

𝒜\mathcal{A}是数域PP上线性空间VV的线性变换,WWVV的一个子空间.如果WW中的向量在𝒜\mathcal{A} 的像仍在WW中,则称WW𝒜\mathcal{A}的不变子空间, 也称𝒜\mathcal A-子空间. 形象的话来描述就是

ξW,𝒜ξW. \forall{\xi\in W},\mathcal{A}\xi\in W.

最平凡的不变子空间自然是VV本身以及 0{0}子空间.我们下面来讨论一些不那么平凡的不变子空间. 首先则是𝒜(V)\mathcal{A}(V)𝒜1(0)\mathcal{A}^{-1}(0).

ξ𝒜(V),𝒜ξ𝒜(V) \forall{\xi}\in\mathcal{A}(V),\mathcal{A}\xi\in\mathcal{A}(V)

ξ𝒜1(0),𝒜ξ=0𝒜1(0) \forall{\xi}\in\mathcal{A}^{-1}(0),\mathcal{A}\xi=0\in\mathcal A^{-1}(0)

另外也有𝒜\mathcal A\mathcal B可交换\Leftrightarrow(V)\mathcal B(V)1(0)\mathcal B^{-1}(0)𝒜\mathcal A-子空间.

ξ(V),𝒜(ξ)=(𝒜ξ)(V) \forall{\mathcal B\xi}\in\mathcal B(V),\mathcal A(\mathcal B\xi)=\mathcal B(\mathcal A\xi)\in\mathcal B(V)

ξ1(0),(𝒜ξ)=𝒜0=0 \forall{\xi} \in\mathcal B^{-1}(0),\mathcal B(\mathcal A\xi)=\mathcal A0=0

通过这些例子,我们理解到事实上𝒜\mathcal A-不变子空间就是对𝒜\mathcal A运算封闭的空间,ξ\xi落在里面,则𝒜ξ\mathcal A\xi还落在里面.落在里面更形象地来说就是仍保有该空间的性质.

类似地我们来看一道题.

𝒜,\mathcal{A,B}是复线性空间VV上的线性变换,且𝒜𝒜=𝒜\mathcal{AB}-\mathcal{BA}=\mathcal A,试证明:𝒜,\mathcal{A,B}有公共特征向量.

V0V_0\mathcal B的特征根λ\lambda的线性空间.

ξV0,𝒜ξ𝒜ξ=𝒜ξλ𝒜ξ𝒜ξ=𝒜ξ(𝒜ξ)=(λ1)𝒜ξ \begin{aligned} \forall\xi\in V_0,\mathcal{AB}\xi-\mathcal{BA}\xi=\mathcal A\xi\\ \lambda \mathcal A\xi-\mathcal{BA}\xi=\mathcal A\xi\\ \mathcal B(\mathcal A\xi)=(\lambda-1)\mathcal A\xi \end{aligned}

\mathcal B存在λ1\lambda-1的特征根,考虑(𝒜λ)ξ=0(\mathcal A-\lambda'\mathcal E)\xi=0的解.由于𝒜\mathcal A必然存在特征向量,则该向量同时属于\mathcal B的特征根(λ1)(\lambda-1)的特征空间和𝒜\mathcal A的特征根λ\lambda'的特征空间.得证.

我们来继续深入对不变子空间的认识.

𝒜\mathcal A-子空间的交与和也是𝒜\mathcal A-子空间.

V1,V2V_1,V_2𝒜\mathcal A-子空间,则有

ξV1V2,𝒜ξV1𝒜ξV2𝒜ξV1V2 \forall\xi\in V_1\cap V_2,\mathcal A\xi\in V_1 \wedge \mathcal A\xi\in V_2\Rightarrow \mathcal A\xi\in V_1\cap V_2

考虑V1=L(ω1,ω2,,ωp),V2=L(η1,η2,,ηq)V_1=L(\omega_1,\omega_2,\cdots,\omega_p),V_2=L(\eta_1,\eta_2,\cdots,\eta_q),则有

ξV1+V2ξ=k1ω1++kpωp+l1η1++lqηq𝒜ξ=𝒜(k1ω1+)+𝒜(l1η1+)=(k1ω1++kpωp)+(l1η1++lqηq)V1+V2 \begin{aligned}\forall\xi\in V_1+V_2 &\Rightarrow\xi=k_1\omega_1+\cdots+k_p\omega_p+l_1\eta_1+\cdots+l_q\eta_q\\ &\Rightarrow\mathcal A\xi=\mathcal A(k_1\omega_1+\cdots)+\mathcal A(l_1\eta_1+\cdots)\\ &=(k'_1\omega_1+\cdots+k'_p\omega_p)+(l'_1\eta_1+\cdots+l'_q\eta_q)\in V_1+V_2 \end{aligned}

既然𝒜\mathcal A𝒜\mathcal A-子空间内封闭,则我们就可以把在𝒜\mathcal A-子空间内部的𝒜\mathcal A拿出来单独考虑,也即把𝒜\mathcal A看作是某𝒜\mathcal A-子空间的一个线性变换.取一𝒜\mathcal A-子空间WW,将该变换记作𝒜|W\mathcal A|_W.

该变换具有如下性质:

ξW,𝒜|Wξ=𝒜ξξW,𝒜|Wξ无意义. \begin{aligned} \forall{\xi\in W},\mathcal A|_W\xi=\mathcal A\xi\\ \forall{\xi\not\in W},\mathcal A|_W\xi\text{无意义.} \end{aligned}

在对应的不变子空间上某些线性变换的性质会更加简化.比如说线性变换在他的核(kernel)内的变换为零变换,在其特征子空间内的变换就是数乘变换.

这样地我们引入一个性质.

线性变换若可对角化,则对于任意不变子空间可对角化.

若线性变换可对角化,则有最小多项式(零化多项式的首一最大公因式)幂次最高为一.考虑线性变换在一不变子空间上的变换则有最小多项式整除于线性变换本身的最小多项式(若否,考虑不变子空间的直和的最小多项式不整除线性变换的最小多项式本身,显然不成立),由是幂次最高为一,得证.

如果我们考虑对角化本身的话,也可以这样分析.若线性变换𝒜\mathcal A可对角化,则有𝒜\mathcal A的所有特征向量可以作为VV的一组基,也即Vn=L(ξ1,ξ2,,ξn)V^n=L(\xi_1,\xi_2,\cdots,\xi_n).那么考虑𝒜\mathcal A-子空间WW.

WW内不存在特征根,那么WW为零子空间{0}\{0\}.否则WkW^k存在kk个特征向量(通过基扩充).由是WW可对角化.

既然讨论了对角化问题,我们就可以来讨论同时对角化问题了.

VV上可对角化的线性变换𝒜,\mathcal A,\mathcal B可交换,则存在一组基使其同时对角化.

由于𝒜,\mathcal A,\mathcal B可交换,则有𝒜\mathcal A-子空间亦为\mathcal B-子空间. 则在𝒜\mathcal A的特征空间下\mathcal B能对角化.收集在𝒜\mathcal A特征空间下\mathcal B对角化的向量为一组基,则可令𝒜,\mathcal A,\mathcal B同时对角化.

这个结论还可以推广到nn个乃至任意个可对角化且可彼此交换的线性变换上.

VV上可对角化的线性变换𝒜1,𝒜2,,𝒜m\mathcal A_1,\mathcal A_2,\cdots,\mathcal A_m可交换,则存在一组基使其同时对角化.

考虑数学归纳法.

  1. n=2n=2时,由上面知可同时对角化.
  2. n=k1n=k-1时若可同时对角化,加入一可对角化可交换线性变换𝒜k\mathcal A_k,通过上述方法也可同时对角化.
  3. 得证.

对于任意多的….

对于nn维线性空间,其上的线性变换中最多有n2n^2个线性变换的极大无关组.由上个推论知可同时对角化.设其为{𝒜1,𝒜2,,𝒜n2}\{\mathcal A_1,\mathcal A_2,\cdots,\mathcal A_{n^2}\}.

=k1𝒜1++kn2𝒜n2可对角化.\forall{\mathcal B}=k_1\mathcal A_1+\cdots+k_{n^2}\mathcal A_{n^2}\mbox{且$\mathcal B$可对角化.}
且对于𝒜k\mathcal A_k的每个特征基向量都有𝒜kε=λk*ε\mathcal A_k\varepsilon=\lambda_{k*}\varepsilon,同样地对\mathcal B作用于该向量则有
ε=(λ1*+λ2*++λn2*)ε\mathcal B\varepsilon=(\lambda_{1*}+\lambda_{2*}+\cdots+\lambda_{n^2*})\varepsilon
即有\mathcal B在这些特征向量中也能对角化.

从线性空间和矩阵的关系,我们来考虑不变子空间在矩阵上的意义(上面的题目里面我们似乎有所涉及).

由于不变子空间的元素不会被线性变换给投到外面去,所以我们纠结一众𝒜\mathcal A-子空间,他们的直和为VV,在子空间里选定基,合起来(每个子空间的基放一块儿)就是一组VV的基,就能产生一个漂亮的矩阵

(A1A2Ak) \begin{pmatrix} A_1& & & \\ &A_2& & \\ & &\ddots& \\ & & & A_k \end{pmatrix}
这就达到了化简的目的.