线性代数这点事

Posted by allon li on 2017-11-21

线性代数

线性代数最重要的概念就是矩阵,理解矩阵,一定要先从变换起手。

矩阵

矩阵的本质就是在描述坐标系变换,比如一个二维直角坐标系向左旋转了90度,那么怎么才能描述这种运动呢,其实就可以盯住(1,0)和(0,1)这两个基本点的坐标在新的坐标系跑哪去了。

如果我告诉你那两个坐标现在分别跑到了(0,1)和(-1,0)就明白新坐标系长什么样了。

如果把这两个坐标竖起来写到一起,就是矩阵了!如下式:

A=[0110]A = \left[ \begin{array}{} 0&-1\\ 1& 0 \end{array} \right]

  • 矩阵A是变换的结果,也用来表示变换的过程。也就是说,矩阵A可以把标准坐标系旋转90度。

  • 由于坐标轴旋转了,整个坐标系也就随之旋转了,所有的坐标系内的向量也就一起旋转。

  • 当原坐标系里的任意向量被矩阵A施加变换以后,就得到了新坐标系内对应的向量,在这个该例中,就是得到了旋转90度后的向量。

-w250

标准直角坐标系中,向量[1,0]和[0,1]构成了最基本的二维单位矩阵。
所有的矩阵都可以看成是对单位矩阵的变换。
所有的矩阵都是一套坐标系。

变换

变换和函数的作用是一样的。被称为变换也是体现了图形上的含义。

线性变换就是原来是根线,变完还是根线。同时,原点不能动。简单讲线性变换就是拉伸、旋转。

向量vvx,yx,y的线性组合,那么不管x,yx,y经历怎么样的线性变换,你大爷永远是你大爷。vv永远是x,yx,y的变换后相同系数的线性组合。

v=3x+4yv=3x + 4y

v^=3x^+4y^\hat{v}=3\hat{x} + 4\hat{y}

  • 二维空间中,只要知道两个变换后的向量,就可以求出任意向量经过变换后结果。
  • 下图中x,yx,y为变换前的坐标,j^\hat j,i^\hat i都是已知w变换后的向量,可以求出经过变换后的向量。

-w400

下图解读为矩阵对向量[x,y][x,y]进行作用后得到的结果,其实也可以理解为向量对矩阵里的各列进行线性组合:
-w400

  • 上图矩阵可以看成是将[1,0]变换成[a,c],将[0,1]变换成[b,d],OK,那么就可以由变换后的矩阵求得向量[x,y]被变换后的向量是什么。这也说明了为什么单位矩阵的乘法具有不变性,因为经过单位矩阵的作用之后还是原来的向量。

-w150

  • 上图中的x,y就是在新座系中的两个坐标。

    矩阵乘法的本质就是线性变换,所有的矩阵都是逐行对单位向量做变换

矩阵乘法

A×B=CA \times B = C

两个矩阵相乘,就是两个线性变换的叠加,结果矩阵也就是“增强”后的效果。

下图中,可以看作是M2M_2M1M_1的两个向量([e,g][e,g][f,h][f,h])分别进行线性变换。
-w500

行列式

det([abcd])=e det( \left[ \begin{array}{} a&b\\ c&d \end{array} \right] )= e

如上图行列式的结果ee就是经过变换后,固定区域的缩放比例。
-w500

行列式可以为负值,当为负值时,空间定向变了。简单讲就是翻个儿了。
-w300

矩阵的逆,就是矩阵变换后,再变回来。

下图中向量x\vec{x}经过矩阵AA的变换后得到向量v\vec{v},由此可得将v\vec{v}沿着A1{A}^{-1}的还原回去,就会得到向量x\vec{x}

x=A1v\vec{x}={A}^{-1} \cdot \vec{v}

-w500

  • det(A)det(A)不等于0,意味着空间没有被压缩到丢维的程度。那么不管AA有多大能耐,制造出多邪乎的变换,都可以还原,也就是说AA可逆。

      比如你把二维空间给变换成了一条直线,那还怎么可能恢复成平面。
    

秩就是变换后的空间维数。nn维矩阵变换后还是nn维空间叫满秩。

经过线性变换后的空间,如果是一条一维的直接,秩就是1。二维平面秩就是2。

列空间

列(基)向量的线性组合组成的空间。

零空间

线性变换后,被压缩到原点的那部分,叫零空间。

一个直线被线性压缩变换后只有原点保持不变;
一个平面被线性变换压缩成直线,原平面中有一条直线的空间就被压缩到了原点。
那么这条被压缩到原点的直线就是零空间。

如下式可以看出,所有可以被AA变换压缩到原点的向量x\vec{x}集合组成了零空间。也就是方程组可能是解的集合。下式中如果向量x\vec{x}不在零空间内,也一定无解。

Ax=[00...]A \cdot \vec{x} = \left[ \begin{array}{} 0\\ 0\\ .\\ .\\ . \end{array} \right]

点积

两个向量v,j\vec{v},\vec{j}点积,几何意义就是v\vec{v}j\vec{j}的投影长度,乘以j\vec{j}的长度。反之也成立,这是一个对称的。

叉积

  • 两个向量围成的平行四边形的面积,有正有负。
  • 计算方式相对简单,将两个向量看成是由单位矩阵变换而来的两个基,行列式的值就是该面积。
  • 在求出该面积后,也就得出来叉积向量。它和上述的平行四边形平面垂直,长度就是面积值。如下图红色向量(需要用到右手定则)。

-w240

-w240

基变换

A1MA{A}^{-1} \cdot M \cdot A

特征

在经历矩阵线性变换后,该向量还保持方向不变,该向量就是特征向量,且长度是放大比例就是特征值。零空间和特征有紧密联系。

Av=λvA \vec{v} = \lambda \vec{v}

粉色轴是长度为1的特征向量,那么整个正方体可以在该方向旋转而不变形。
-w300

如果λ\lambda大于1了,也就意味着在所有维度都放大λ\lambda倍,否则就被拉歪了。各维度都牵扯相同的比例也不会“倾倒”。就像下面的矩阵一样,它们正是一组由单位矩阵缩放λ\lambda倍得到的基。

[1001]\left[ \begin{array}{} 1&0\\ 0& 1 \end{array} \right]

[λ00λ]\left[ \begin{array}{} \lambda&0\\ 0&\lambda \end{array} \right]

抽象向量空间

世间万物,符合线性特征者,皆可矩阵化运算。

L(v+w)=L(v)+L(w)L(\vec{v} + \vec{w}) = L(\vec{v}) + L(\vec{w})

L(cv)=cL(v)L(c\vec{v}) = cL(\vec{v})

  • 上一式表示一起整和分开整,一个效果
  • 上二式表示变一个大向量和变一个小向量再倍乘一个效果

符合以上两点就是线性的。导数就是这样的

ddx(x3+x2)=ddx(x3)+ddx(x2)\frac{d}{dx}(x^3+x^2) = \frac{d}{dx}(x^3)+\frac{d}{dx}(x^2)

ddx(4x3)=4ddx(x3)\frac{d}{dx}(4x^3) = 4\frac{d}{dx}(x^3)

不管多么复杂的多项式,它们的区别只是系数不同(有的位置是零)。导数函数也不过是个多项式而已。求导的过程就可以理解为:源函数系数向量经过基导数矩阵的变换作用,得出导数多项式的系数向量。

下面这张图表示了用矩阵来求导数的过程,箭头为标准基,它由x0x^0,x1x^1,x2x^2xnx^n一组基函数分别求导得出的一组导数基。
-w500