avatar

Catalog
特征值和特征向量

矩阵变换(伸缩和旋转)

在讲特征值和特征向量之前,我们先来理解一下矩阵。

矩阵乘法对应了一个变换 ,是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中,原向量主要发生 旋转、伸缩 的变化。

为什么我们说矩阵具有旋转和伸缩的功能呢?矩阵代表一种变换,这种变化我们是无法直接描述的,我们只能通过它所作用的对象的变化来描述,就好像物理学中的“力”一样。我们用矩阵乘以一个向量,可以看到这个向量变到了另一个位置,而这个位置可以在原位置通过伸缩和旋转得到,所以我们说矩阵变换就是伸缩和旋转变换。其实从纯数字计算的角度,如果我们以作为基,在这组基张成的向量空间里,矩阵(也就是一个变换),其对角线上的值代表的就是伸缩,其他位置的值代表的就是旋转(不过这个旋转同时也会带来部分伸缩)。比如 的第一列就代表向量伸缩和旋转到了的位置。这个部分可能解释的不够精确,但是想必有人已经意会了。换个解释的说法就是,如果我们以作为基,在这组基张成的向量空间里,一个矩阵变换如果只有对角线上有值,那么这个矩阵变换仅代表伸缩,如果除了对角线以外,其他地方还有值,那么就带有一点旋转。如果我们以作为基,那么对于一个矩阵变换来说,就是副对角线上的值代表伸缩了。

特征值和特征向量

特征值和特征向量的公式:

说明A有这样一个功能:即对向量$x$变换后,长度拉伸$\lambda$倍,方向不变。

如果矩阵对某一个向量或某些向量只发生伸缩变换,不对这些向量产生旋转的效果,那么这些向量就称为这个矩阵的特征向量,伸缩的比例就是特征值。

计算特征向量的过程就是寻找一个正交系去表示你原来的函数,特征向量就是新的坐标系的坐标轴。

也就是说我们可以用特征向量和特征值去表示这个矩阵。那么问题来了,why?

不急,且听我慢慢道来。

根据上一节我们已经知道,矩阵=伸缩+旋转。同时,根据这一节,我们知道矩阵对特征向量只有伸缩功能,对其他向量有伸缩和旋转的功能。即矩阵=对特征向量的伸缩+对其他向量的伸缩和旋转。同时我要告诉大家的是 矩阵对特征向量的伸缩蕴涵了矩阵对其他向量的伸缩和旋转。所以有 矩阵=对特征向量的伸缩。

为什么 矩阵对特征向量的伸缩蕴涵了矩阵对其他向量的伸缩和旋转呢?因为对不同特征向量的伸缩的倍数不一样,导致用特征向量去表示其他向量(比如向量x)时,相较于特征向量未伸缩之前,其他向量就发生了伸缩和旋转。比如未伸缩之前的特征向量,伸缩后变为,那么在原坐标系中的向量就变到了的位置。所以矩阵对特征向量的伸缩蕴涵了矩阵对其他向量的伸缩和旋转。所以我们可以用特征值和特征向量就可以描述这个矩阵。

总结

假设一个矩阵是10维的,那么我们可以用10个向量(基)来描述这个矩阵。这10个向量就是特征向量。而且这些特征向量带有倍数$\lambda$,也就是说 基 并不是等长的,不是单位正交基。

Author: realLiuSir
Link: http://yoursite.com/2020/04/11/%E7%89%B9%E5%BE%81%E5%80%BC%E5%92%8C%E7%89%B9%E5%BE%81%E5%90%91%E9%87%8F/
Copyright Notice: All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.
Donate
  • 微信
    微信
  • 支付寶
    支付寶