> 知识仓库

> 杂文

杂文
- 1.1.杂文

老饼讲解：一步一步上手学习

【理解】如何理解-矩阵的对角化

作者 : 老饼发表日期 : 2025-12-31 06:22:10 更新日期 : 2026-05-12 00:35:48

老饼讲解-简单易懂，干货满满，爽过嗦螺！

刚开始学习高等代数时，总是对矩阵的对角化糊里糊涂，不知道在讲什么，只知道跟着公式就可以把矩阵变成对角矩阵，直到后来才发现，原来矩阵的对角化背后其实代表着变换的表示，顺着这路子，终于把矩阵对角化弄明白了，下面就来说说矩阵对角化的理解。

一、如何理解矩阵对角化

矩阵的对角化是指：对于方阵A，求一个可逆P，使得是一个对角矩阵。

其中，是一个对角矩阵，

好了，矩阵的对角化到底是个什么东西，它的意义又是什么呢？在理解对角化的意义之前，我们先来理解矩阵与线性变换之间的关系。

1.1. 矩阵与线性变换

不太严谨地说，线性变换就是把空间的一个向量，线性映射到该空间的另一个向量之中。而线性变换一般可以使用矩阵来描述，对应地，每个矩阵，背后都指代着一个线性变换：

矩阵与线性变换

如图所示，矩阵A所代表的变换，将向量(1,0)变换到了(1.5,0)中。因此每个矩阵A，都可以当作某个变换的数学描述。但矩阵A并不完全等价于变换，因为是绝对的，而A只是它的其中一种表述。

1.2. 矩阵的对角化-在干什么

我们都知道，矩阵的对角化，就是在找一个P，使它满足，那找这个P，到底是在找什么呢？

由可得：

即对于P的每一列都有：

即P的每一列在矩阵A指代的线性变换下，都保持方向不变，只是长度进行了的伸缩：

特征向量与特征值

所以矩阵的对角化所要找的P，其实就是在找n个向量，这n个向量在A的变换下只进行伸缩。

在这里，我们加深了对和的理解：

P中的每一列，都代表一个特征向量，它在变换A下方向不变，只进行伸缩，而特征值则就是它们的伸缩倍数了。也就是说，矩阵的对角化，其实就是找出这些不变的向量(特征向量)以及它们对应的伸缩倍数。

1.3. 矩阵对角化-是为了什么

好了，上面我们说到，矩阵的对角化过程，就是在找变换A中不变的向量、以及它们的伸缩倍数，那找这些东西来干什么呢？找到之后将矩阵进行对角化又是为了什么呢？其实这一切，都是为了简化变换A，且让我们细细道来。

我们都知道，矩阵A对角后化就会得到对角矩阵，事实上，这个与都指向了同一个变换，区别在于，A是原来坐标系下变换的表示，而则是以P为基所构成的坐标系下变换的表示。

证明如下：

对于任意向量q，记它在基P下的坐标为，则：

由于每个在A所指代的线性变换下只进行简单的伸缩，因此有：

也就是，的坐标为：

可得，在基P所构成的坐标系下，如果q的坐标为，则的坐标就是，因此，就是变换在基P下的表示。

很明显，使用来作为的表示会更加的简单，更有意义的是，它是一个对角矩阵，所以它也就揭示了其实只是一种伸缩变换。所以，矩阵对角化的意义，就是找出一个基P，使得在基P下，A所指代的变换成为一个伸缩变换。

在这里，我们又进一步加深了对和的理解：

与所代表的变换是同一个，而P是代表时所使用的基。

二、矩阵对角化的意义-例子解说

好了，下面我们来个具体的例子，展示矩阵对角化，是如何清晰的抓住矩阵对应的线性变换的特性的。

不妨设：

将A进行对角化，可得：

2.1. 未对角化前对线性变换A的认识

以向量为例

如果直接看A，就只知道它所指代的变换，会将q变换到：

对变换的认识(对角化前)

光是这样看，是很难了解A所指代的变换的特性的，就仅仅是知道它把(1,0)变换到了(1.5,0.5)而已。

2.2. 对角化后对线性变换A的认识

通过对角化后，可得到，以P为基，则有：

对变换的认识(对角化后)

以P为基，变换对于任意点q，都只是将它在P1、P2方向伸缩2、1倍。

因此，变换在原来坐标系的表示为A，很难理解是个什么样的变换，而用P作为基，则就只是在各个坐标轴中进行伸缩的变换，一下子就简单得多了~

总结

总的来说，矩阵对角化其实就是找一组基P，使得变换A在该基下的表示为对角矩阵。所以，一个矩阵如果可以对角化，则说明它背后所指的变换实质是某组基下的伸缩变换，而变换总是各种各样的，并不永远都是伸缩变换，所以不会所有的矩阵都能对角化。

上一篇: 【证明】KL散度大于0的证明

添加评论

教程
杂文
- 杂文