老饼讲解:一步一步上手学习
刚开始学习高等代数时,总是对矩阵的对角化糊里糊涂,不知道在讲什么,只知道跟着公式就可以把矩阵变成对角矩阵,直到后来才发现,原来矩阵的对角化背后其实代表着变换的表示,顺着这路子,终于把矩阵对角化弄明白了,下面就来说说矩阵对角化的理解。
矩阵的对角化是指:对于方阵A,求一个可逆P,使得是一个对角矩阵。
其中,是一个对角矩阵,
好了,矩阵的对角化到底是个什么东西,它的意义又是什么呢?在理解对角化的意义之前,我们先来理解矩阵与线性变换之间的关系。
不太严谨地说,线性变换就是把空间的一个向量,线性映射到该空间的另一个向量之中。而线性变换一般可以使用矩阵来描述,对应地,每个矩阵,背后都指代着一个线性变换:

如图所示,矩阵A所代表的变换,将向量(1,0)变换到了(1.5,0)中。因此每个矩阵A,都可以当作某个变换的数学描述。但矩阵A并不完全等价于变换,因为是绝对的,而A只是它的其中一种表述。
我们都知道,矩阵的对角化,就是在找一个P,使它满足,那找这个P,到底是在找什么呢?
由可得:
即对于P的每一列都有:
即P的每一列在矩阵A指代的线性变换下,都保持方向不变,只是长度进行了的伸缩:

所以矩阵的对角化所要找的P,其实就是在找n个向量,这n个向量在A的变换下只进行伸缩。
在这里,我们加深了对和的理解:
P中的每一列,都代表一个特征向量,它在变换A下方向不变,只进行伸缩,而特征值则就是它们的伸缩倍数了。也就是说,矩阵的对角化,其实就是找出这些不变的向量(特征向量)以及它们对应的伸缩倍数。
好了,上面我们说到,矩阵的对角化过程,就是在找变换A中不变的向量、以及它们的伸缩倍数,那找这些东西来干什么呢?找到之后将矩阵进行对角化又是为了什么呢?其实这一切,都是为了简化变换A,且让我们细细道来。
我们都知道,矩阵A对角后化就会得到对角矩阵,事实上,这个与都指向了同一个变换,区别在于,A是原来坐标系下变换的表示,而则是以P为基所构成的坐标系下变换的表示。
证明如下:
对于任意向量q,记它在基P下的坐标为,则:
由于每个在A所指代的线性变换下只进行简单的伸缩,因此有:
也就是,的坐标为:
可得,在基P所构成的坐标系下,如果q的坐标为,则的坐标就是,因此,就是变换在基P下的表示。
很明显,使用来作为的表示会更加的简单,更有意义的是,它是一个对角矩阵,所以它也就揭示了其实只是一种伸缩变换。所以,矩阵对角化的意义,就是找出一个基P,使得在基P下,A所指代的变换成为一个伸缩变换。
在这里,我们又进一步加深了对和的理解:
与所代表的变换是同一个,而P是代表时所使用的基。
好了,下面我们来个具体的例子,展示矩阵对角化,是如何清晰的抓住矩阵对应的线性变换的特性的。
不妨设:
将A进行对角化,可得:
以向量为例
如果直接看A,就只知道它所指代的变换,会将q变换到:

光是这样看,是很难了解A所指代的变换的特性的,就仅仅是知道它把(1,0)变换到了(1.5,0.5)而已。
通过对角化后,可得到,以P为基,则有:

以P为基,变换对于任意点q,都只是将它在P1、P2方向伸缩2、1倍。
因此,变换在原来坐标系的表示为A,很难理解是个什么样的变换,而用P作为基,则就只是在各个坐标轴中进行伸缩的变换,一下子就简单得多了~
总的来说,矩阵对角化其实就是找一组基P,使得变换A在该基下的表示为对角矩阵。所以,一个矩阵如果可以对角化,则说明它背后所指的变换实质是某组基下的伸缩变换,而变换总是各种各样的,并不永远都是伸缩变换,所以不会所有的矩阵都能对角化。
评论