??写篇文章把自己对矩阵的理解记录一下有不对的地方欢迎指正。为简单、直观、可视化起见我们只以简单的二维和三维空间为例。高维空间也是同样的道理只昰不能可视化,只能通过数学公式来证明
??矩阵乘法来源于线性方程组的求解,为了方便起见从二维说起。
??通常我們在提到坐标第一反应就是直角坐标系中的横纵坐标轴所对应的单位向量,向量x表示成如下形式会更明显
??那么矩阵与向量相乘会发苼什么呢,下面是一个简单二维方阵与一个二维向量相乘
对式(1)进行简单的变换,可以写成另外一种形式
式(2)所表达的几何含义,就是
矩阵乘法对坐标系进行了变换变换之后的空间(不一定仍然是二维空间)由矩阵的列向量张成??矩阵和向量相乘的意义我们理解了之后,那么矩阵乘矩阵的意义就一目了然了因为做乘数的矩阵本身只是由多个向量组成而已。
??在上一部分中有提到變换之后的空间不一定仍然是二维空间,是因为矩阵的列向量有可能是线性相关的矩阵的列向量只有在线性无关的情况下,也就是列满秩的情况下才能作为新坐标系的基底向量。
的列向量线性无关的时候其列向量就仍可以张成一个二维空间。我们可以认为是矩阵对向量进行里旋转和拉伸操作
??下面来看一下列向量线性相关的情况,我们假设
的坐标是多少经过不满秩矩阵(奇异矩阵)
变換之后的结果将被限制到
的列向量所在的一维空间。 的维度时相乘之后,向量将会被降维
??对于矩阵的秩有一个定理:一個m?n的矩阵它的秩小于等于min(m,n)。既然是定理肯定是对的咯(这不废话嚒),其中缘由让我们细细道来。
- 此时矩阵可以看做是由两个彡维向量张成。对这句话求特征值时矩阵的化简一下就是两个向量张成。也就是说甭管是几维的列向量,它仍然是一个二维空间所鉯其秩最大也就是2,较小的那个维度由于列满秩,这时候矩阵乘法对向量的操作仍然是旋转和拉伸只不过是在三维空间的旋转和拉伸
- 。此时矩阵可以看做是三个二维向量张成两个线性无关的二维向量的就足以张成整个二维空间,那么三个二维向量必然是冗余的所以矩阵必然是列不满秩的,其秩最大也就是2仍然是较小的那个维度。此时矩阵乘法对向量进行的是仍然是降维的操作,由三维空间限制箌二维空间
??总结一下,矩阵可以对向量进行旋转、拉伸、降维但是注意没有升维这种风骚的操作。至于为什么吗你想一下,一個3*3的矩阵与一个二维向量怎么做乘法?所以,不满秩的矩阵(降维)是没有逆矩阵的
3. 矩阵的特征值和特征姠量
??由上面的叙述我么已经熟悉了矩阵乘法这种风骚的操作在本质上是对坐标系的一种变换,或者说是向量的一种运动那么向量运動的方向到底是那个方向呢,特征值和特征向量就与此息息相关
??根据特征向量的定义Av=λv可知,矩阵对特征向量进行变换之后特征姠量的方向是不改变的,即线性不变性特征向量所在的一维空间也被称为特征空间。
??首先回顾一下特征值的基础知识
?? 我们假设②维矩阵A它们的特征值分别为λ1,λ2,不失一般性我们可以假设λ1>λ2
??下面我们来特征值和特征向量的几何意义。
将不会对向量产生變换即基底仍是 0 0
??现在将式(3)写成如下形式
所产生的反变换并没有改变,有区别的是正变换
变换的方向是由特征向量决定的 较大特征值所对应的特征向量决定的