新理解矩阵(1-6全)

上传人:小** 文档编号:93488647 上传时间:2019-07-22 格式:PDF 页数:13 大小:331.96KB
返回 下载 相关 举报
新理解矩阵(1-6全)_第1页
第1页 / 共13页
新理解矩阵(1-6全)_第2页
第2页 / 共13页
新理解矩阵(1-6全)_第3页
第3页 / 共13页
新理解矩阵(1-6全)_第4页
第4页 / 共13页
新理解矩阵(1-6全)_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《新理解矩阵(1-6全)》由会员分享,可在线阅读,更多相关《新理解矩阵(1-6全)(13页珍藏版)》请在金锄头文库上搜索。

1、新理解矩阵 1 前边我承诺过会写一些关于自己对矩阵的理解。其实孟岩在理解矩阵这三篇文章中,已 经用一种很直观的方法告诉了我们有关矩阵以及线性代数的一些性质和思想。 而我对矩阵的 理解,大多数也是来源于他的文章。当然,为了更好地理解线性代数,我还阅读了很多相关 书籍,以求得到一种符合直觉的理解方式。孟岩的 blog 已经很久没有更新了,在此谨引用 他的标题,来叙述我对矩阵的理解。 当然,我不打算追求那些空间、算子那些高抽象性的问题,我只是想发表一下自己对线性代 数中一些常用工具的看法,比如说矩阵、行列式等。同时,文章命名为“理解矩阵”,也就是 说这不是矩阵入门教程, 而是与已经有一定的线性代数基

2、础的读者一起探讨关于矩阵的其他 理解方式,仅此而已。我估计基本上学过线性代数的读者都能够读懂这篇文章。 首先,我们不禁要追溯一个本源问题:矩阵是什么? 我们不妨回忆一下,矩阵是怎么产生的。矩阵可以看成是一个个向量的有序组合,这说明矩 阵可以类比向量; 但是向量又是怎么产生的?向量则是一个个数字的有序组合, 这又把我们 的研究方向指向了“数字是什么”这个问题上。比如,数字 1 是什么?它可以代表 1 米,可以 代表 1 千克,也可以代表 1 分钟、1 摄氏度甚至 1 个苹果。它为什么有这么多的表示意义? 答案很简单,因为在本质上,它什么都不是,它就是数字 1,一个记号,一个抽象的概念。 正因为它

3、抽象,它才可以被赋予各种各样直观的意义!回到矩阵本身,我们才会明白,矩阵 的作用如此之大,就是因为书本上那个很枯燥的定义矩阵就是 m 行 n 列的一个数表! 它把矩阵抽象出来,让它得到了“进化”。它是一个更一般化的概念:一个向量可以看作一个 矩阵,甚至一个数都可以看成一个矩阵,等等。 代数方面的理解代数方面的理解 当然, 上述说法是含糊的, 我们还是需要确切知道它究竟有什么用?这可以从代数和几何的 角度来分析,因为做到数形结合才是最完美的。首先我们知道数学最基本的元素就是数字, 严格来说是自然数,如 0,1,2,.;有了数字,我们就可以做到很多东西。但是数字是单 一的,而我们很多时候都要批量处

4、理一些类似的运算,比如同时要计算 1+2,1+3,2+3,4+5 这四个算式。不论是从记录还是从研究的角度来说,分开研究它们都是比较繁琐的。于是一 种“批量”的记号产生了,我们记为(1,1,2,4)+(2,3,3,5),用两个不同记号记录它们,比如 A? =(1,1,2,4),B? =(2,3,3,5),我们就可以将它记为A? +B?。这样不论在研究还是记 录方面都能够给我们方便。于是一个我们称之为“向量”的东西产生了,也就是说,从代数的 角度来讲, 向量是为了研究批量运算而产生的。 但是向量并没有解决所有的批量运算的问题。 比如 3 元一次方程组 a11x1+a12x2+a13x3=b1 a

5、21x1+a22x2+a23x3=b2 a31x1+a32x2+a33x3=b3 单单用向量我们还是没有办法很好地研究这一类问题。 于是我们就要想法子创造出一些新的 记号,由于左边的系数的具有一定的排列顺序和统一的形式,我们不妨把它们单独写出来 a11,a12,a13 a21,a22,a23 a31,a32,a33 并用一个简单的符号A来表示它,然后把未知数和右边的常数都分别写成向量形式 x=x1,x2,x3T和b=b1,b2,b3T(多加了上标 T 表示列向量)。我们期待上面的方程组可以 写成一个简单的形式 Ax=b 由此我们可以定义一个 3 阶方阵乘以一个 3 维列向量的乘法了, 这是一种

6、纯粹的定义, 是为 了方便我们记录和研究的定义。在此基础上,我们就可以研究更多的东西,比如矩阵乘矩阵 会得到什么? 同样, 这里要研究的矩阵都是指 n 阶方阵这个最核心的东西, 我们要先把核心问题研究透彻, 不然一开始就考虑所有的繁杂的情况,容易让我们陷入迷惘中而不知所措。 在研究一般乘法之前,我们先来了解一下关于运算定律问题。我们知道在实数中,加法满足 结合律和交换律, 乘法满足结合律、 交换律和分配律。 哪些定律可以迁移到矩阵乘法中的呢? 交换律是无法先验的交换律是无法先验的,它是个定义问题,我可以定义它成立也可以定义不成立,但是为了运 算的方便,我们还是希望它满足更多地运算定律,所以我们

7、先来考虑结合律,希望它能够满 足这一定律。也就是说 (AB)x=A(Bx) 其中Bx已经是我们所熟知的运算(由定义而来),它将得到一个列向量,所以我们也可以 轻易算出A(Bx),从直观上来讲,AB应该也是一个 n 阶方阵,我们可以先把它设出来,然 后与列向量 x 进行运算,最后把两边的结果一一对应起来,就得到了AB这个 n 阶方阵中各 个元素的表达式。我们最终可以发现,它就是我们书本上定义的表达式。 以 2 阶方阵为例,令 A 为 a,b c,d B 为 e,f g,h AB 为 p,q r,s 并令x=x,yT,那么(AB)x就等于 px+qy,rx+syT 而Bx=ex+fy,gx+hyT

8、,那么A(Bx)=aex+afy+bgx+bhy,cex+cfy+dgx+dhyT 那么根据各个元素的对应,就得到 p=ae+bg,q=af+bh,r=ce+dg,s=cf+dh。这就完成了 2 阶方阵 乘法的定义。 现在我们就可以从代数的角度来讲,矩阵是为了简化批量线性运算的一个矩阵是为了简化批量线性运算的一个“终极武器终极武器”!这 就是矩阵的一个比较直观和有用的代数意义。 如果根据我们这个定义去考虑交换律, 我们会发现矩阵一般不符合交换律。 这不能不说是一 个遗憾。但是没关系,它服从结合律这一个事实,已经赋予了这个工具极大的力量。比如线 性方程组Ax=y,我们有By=B(Ax)=(AB)

9、x,如果我们想办法找到一个矩阵B,使得AB=I, 那么就很棒了,因为我只要用矩阵 B 作用于向量 y 就可以得到方程组的解了,事实上这样 的矩阵 B 是存在的,这就是逆矩阵。要是没有结合律,这一切都免谈! 由于这是实数基本运算(线性运算)的“批量版”,那么我们就可以很自然地把实数的一些公 式延伸为矩阵版(只要不是涉及到交换律就行)。比如,在实数中,我们有公式 11x=1+x+x2+x3+.1+x 那么我们求矩阵的逆阵时,也有类似的公式 (IA)1=I+A+A2+A3+.I+A 其中 I 是单位矩阵,A 是一个“比较小”的矩阵。至于“比较小”怎么定义,现在还说不清楚, 可以认为是矩阵的行列式值比

10、较小。类似的,根据 1+x1+12x 也能够相应地给出(I+12A)2I+A,这是求矩阵“平方根”的一个近似公式。 得益于我们定义的矩阵乘法, 批量的运算可以直接用单个量的运算公式进行, 不用我们煞费 苦心、绞尽脑汁地构思新的公式。这就是矩阵的强大所在!它在解决很多线性问题时有着奇 迹般的美妙,最简单的例子莫过于线性方程组Ax=y的解为y=A1x,解答方程组的时候就 好像求解一元方程那样有简单的形式! 还有一些关于指数的定义等等, 以后在应用时会把它 介绍的。它们都好像非常精美的非常精美的“艺术品艺术品”! 下一回,我们将从几何角度来理解矩阵。当然,这里边的绝大多数内容在孟岩的文章里头都 已经

11、提到了,我只是重提旧论而已,希望读者不会厌烦。 新理解矩阵 2 上一篇文章中我从纯代数运算的角度来讲述了我对矩阵的一个理解, 可以看到, 我们赋予了 矩阵相应的运算法则,它就在代数、分析等领域显示出了巨大作用。但是纯粹的代数是不足 够的,要想更加完美,最好是找到相应的几何对象能够与之对应,只有这样,我们才能够直 观地理解它,以达到得心应手的效果。 几何理解几何理解 我假设读者已经看过孟岩的理解矩阵三篇文章,所以更多的细节我就不重复了。我们知 道,矩阵 A a11,a12 a21,a22 事实上由两个向量a11,a21T和a12,a22T(这里的向量都是列向量)组成,它描述了一个平 面(仿射)坐

12、标系。换句话说,这两个向量其实是这个坐标系的两个基,而运算y=Ax则是 告诉我们,在A这个坐标系下的 x 向量,在I坐标系下是怎样的。这里的I坐标系就是我 们最常用的直角坐标系,也就是说,任何向量(包括矩阵里边的向量),只要它前面没有矩 阵作用于它,那么它都是在直角坐标系下度量出来的。 (事实上,单位矩阵 I 是默认的直角坐标系,这一说法并非总是成立的,但是我们现在寻求 直观的理解方式,我们就用最简单的东西来实行。)太多的文字未必能够把问题说清楚,我 们需要一张图来解释一下: 图上所用的矩阵 A 是 3,2 1,3 这构成了一个仿射坐标系,在这个坐标系下,有一个向量x=2,2T,它在直角坐标系

13、下测 得的坐标为10,8T,现在我们不难发现,直接用矩阵乘法来计算,有 Ax=3 2+2 2,1 2+3 2T=10,8T 正是我们所期待的! 为什么会有这样的特点?其实这源于我们对矩阵乘法的定义, 反过来, 如果我们用这样的几 何方式来定义矩阵乘法, 那么我们也将得到在书本上了解到的矩阵乘法计算公式。 更高阶的 矩阵也可以作同样的类比。推导过程只是一道很简单的练习题,读者不妨自己动笔尝试一 下? 现在我们又回到孟岩文章上的说法了,对于矩阵作用于一个向量(对应的一个点),我们既 可以看作点没有变,只不过是坐标系从直角坐标系变换为仿射坐标系而已;另一方面,我们 也可以看做矩阵把直角坐标系的一个

14、A点“运动”(变换)到了 A 点。这两种说法都行,正 如孟岩所说的“运动是相对的”。 更正确地讲, 两种说法都要同时被提及, 才算是最好的理解。 矩阵是一个点到另外一个点的变换,变换的方式就是坐标系的变换。矩阵是一个点到另外一个点的变换,变换的方式就是坐标系的变换。 当然,上面只讨论了矩阵乘以向量的乘法,那么矩阵乘以矩阵矩阵乘以矩阵呢?比如AB,我们就可以看 作是矩阵B给出了一个坐标系,但是这个坐标系的各个分量是在A坐标系下测量得到的, 而A是在直角坐标系下测量得到的, 所以要把B的各个分量 (列向量) 与矩阵 A 作乘法后, 才得到了这个仿射坐标系在直角坐标系下的“像”。 这很直接地导致了矩

15、阵乘以矩阵的计算公 式,也很显然地回答了“为什么 n 阶方阵只有与 n 阶方阵相乘才有意义”,因为两者要在同一 空间中测量,才能够完整而唯一地把测量值确定下来。正如,在 n+1 维的空间中讨论 n 个 n 维向量是没有意义的,因为在 n+1 维空间中的观测者看来,它们只不过是一个“面”,多出的 一个维度可以随意变化;在 n 维空间中讨论 n+1 维向量就更没有意义了,因为维度根本就 不够用。 有了这个直观的几何意义,很多问题看起来几乎都是显然的了,比如那些行列式问题,还有 相似矩阵等等,这将在下回谈到。 张量介绍张量介绍 我们已经大概了解到,数字的有序组合产生了向量,向量的有序组合产生了矩阵。

16、这样两个 新构造出来的对象,作用一个比一个大。那么有人会联想到:矩阵的有序组合,就可以产生 一个“立方阵”, 它的功能会不会更加强大?更一般的, n 维立方阵呢?这种联想是有道理的, 数学上也有这样的研究对象,它就是张量张量。 最通俗的说法,n 阶张量就是一个 n 维立方阵,所以 0 阶张量就对应一个数,向量、矩阵分 别对应 1 阶和 2 阶张量,我们所说的三维立方阵,就是 3 阶张量啦。当然,张量属于很高深 的数学理论,它的性质和作用不可能这么简单就说清楚了。回想当年,爱因斯坦就是用张量 分析作为工具, 建立起他那伟大的广义相对论的。 如果有机会的话, 我们一定会重新造访它。 接下来,我们还是回到矩阵问题,谈谈矩阵的行列式。 新理解矩阵 3 亲爱的读者朋友们, 科学空间版的理解矩阵已经来到了 BoJone 认为是最激动人 心的部分了,那就是关于行列式的叙述。这部分内容没有在孟岩的文章中被谈 及到,是我自己结合了一些书籍和网络资源而得出的一

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号