线性代数的本质

上传人:壹****1 文档编号:543987249 上传时间:2022-09-09 格式:DOCX 页数:10 大小:28.01KB
返回 下载 相关 举报
线性代数的本质_第1页
第1页 / 共10页
线性代数的本质_第2页
第2页 / 共10页
线性代数的本质_第3页
第3页 / 共10页
线性代数的本质_第4页
第4页 / 共10页
线性代数的本质_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《线性代数的本质》由会员分享,可在线阅读,更多相关《线性代数的本质(10页珍藏版)》请在金锄头文库上搜索。

1、线性代数的本质【转载】来源:张涛的日志偶尔在网上看到此篇文章,很受启发,转载过来共勉。线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版), 一上来就介绍逆序数这个古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接 着是一些简直犯傻的行列式性质和习题一一把这行乘一个系数加到另一行上,再把那一列 减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就 开始钻火圈表演了,这未免太无厘头了吧!于是开始有人逃课

2、,更多的人开始抄作业。这 下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的, 是一个同样无厘头但是伟大的无以复加的家伙的出场一一矩阵来了!多年之后,我才明白, 当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说: 这个东西叫做 矩阵的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所 有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定 线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来, 我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。事实上,我并不是特例。

3、一般工科学生初学线性代数,通常都会感到困难。这种情形在国 内外皆然。瑞典数学家Lars Garding在其名著Encounter with Mathematics中说: 如果不 熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。然而按照现行的国 际标准,线性代数是通过公理化来表述的,它是第二代数学模型,这就带来了教学上的困 难。事实上,当我们开始学习线性代数的时候,不知不觉就进入了第二代数学模型的范 畴当中,这意味着数学的表述方式和抽象性有了一次全面的进化,对于从小一直在第一代 数学模型,即以实用为导向的、具体的数学模型中学习的我们来说,在没有并明确告知的 情况下进行如此剧烈的pa

4、radigm shift,不感到困难才是奇怪的。大部分工科学生,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后, 才逐渐能够理解和熟练运用线性代数。即便如此,不少人即使能够很熟练地以线性代数为 工具进行科研和应用工作,但对于很多这门课程的初学者提出的、看上去是很基础的问题 却并不清楚。比如说:1、矩阵究竟是什么东西?2、向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?3、我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种 展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用? 4、如果矩阵中每一个元素又是一个向量,

5、那么我们再展开一次,变成三维的立方阵,是不 是更有用?5、矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中 发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘 法,这难道不是很奇妙的事情?难道在矩阵乘法那看上去莫名其妙的规则下面,包含着世 界的某些本质规律?如果是的话,这些本质规律是什么?6、行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本 质上是什么关系?为什么只有方阵才有对应的行列式,而一般矩阵就没有(不要觉得这个 问题很蠢,如果必要,针对mxn矩阵定义行列式不是做不到的,之所以不做,是因为没有 这个必要,

6、但是为什么没有这个必要)?而且,行列式的计算规则,看上去跟矩阵的任何 计算规则都没有直观的联系,为什么又在很多方面决定了矩阵的性质?难道这一切仅是巧 合?7、矩阵为什么可以分块计算?分块计算这件事情看上去是那么随意,为什么竟是可行的?8、对于矩阵转置运算AT,有(AB)T=BTAT,对于矩阵求逆运算A-1,有(AB)-1=B-1A-1。两个看上去完全没有什么关系的运算,为什么有着类似的性质?这仅仅是巧合吗?9、为什么说P-1AP得到的矩阵与A矩阵相似?这里的相似是什么意思?10、特征值和特征向量的本质是什么?它们定义就让人很惊讶,因为Ax=Ax,一个诺大的 矩阵的效应,竟然不过相当于一个小小的

7、数入,确实有点奇妙。但何至于用特征甚至本 征”来界定?它们刻划的究竟是什么?这样的一类问题,经常让使用线性代数已经很多年的人都感到为难。就好像大人面对小孩 子的刨根问底,最后总会迫不得已地说就这样吧,到此为止一样,面对这样的问题,很 多老手们最后也只能用: 就是这么规定的,你接受并且记住就好来搪塞。然而,这样的问题如果不能获得回答,线性代数对于我们来说就是一个粗暴的、不讲道理 的、莫名其妙的规则集合,我们会感到,自己并不是在学习一门学问,而是被不由分说地 抛到一个强制的世界中,只是在考试的皮鞭挥舞之下被迫赶路,全然无法领略其中的美 妙、和谐与统一。直到多年以后,我们已经发觉这门学问如此的有用,

8、却仍然会非常迷惑: 怎么这么凑巧?我认为这是我们的线性代数教学中直觉性丧失的后果。上述这些涉及到“如 何能、怎么会的问题,仅仅通过纯粹的数学证明来回答,是不能令提问者满意的。比如, 如果你通过一般的证明方法论证了矩阵分块运算确实可行,那么这并不能够让提问者的疑 惑得到解决。他们真正的困惑是:矩阵分块运算为什么竟然是可行的?究竟只是凑巧,还 是说这是由矩阵这种对象的某种本质所必然决定的?如果是后者,那么矩阵的这些本质是 什么?只要对上述那些问题稍加考虑,我们就会发现,所有这些问题都不是单纯依靠数学 证明所能够解决的。像我们的教科书那样,凡事用数学证明,最后培养出来的学生,只能 熟练地使用工具,却

9、欠缺真正意义上的理解。自从1930年代法国布尔巴基学派兴起以来,数学的公理化、系统性描述已经获得巨大的 成功,这使得我们接受的数学教育在严谨性上大大提高。然而数学公理化的一个备受争议 的副作用,就是一般数学教育中直觉性的丧失。数学家们似乎认为直觉性与抽象性是矛盾 的,因此毫不犹豫地牺牲掉前者。然而包括我本人在内的很多人都对此表示怀疑,我们不 认为直觉性与抽象性一定相互矛盾,特别是在数学教育中和数学教材中,帮助学生建立直 觉,有助于它们理解那些抽象的概念,进而理解数学的本质。反之,如果一味注重形式上 的严格性,学生就好像被迫进行钻火圈表演的小白鼠一样,变成枯燥的规则的奴隶。对于线性代数的类似上述

10、所提到的一些直觉性的问题,两年多来我断断续续地反复思考了 四、五次,为此阅读了好几本国内外线性代数、数值分析、代数和数学通论性书籍,其中 像前苏联的名著数学:它的内容、方法和意义、龚昇教授的线性代数五讲、前面 提到的Encounter with Mathematics (数学概观)以及Thomas A. Garrity的数学拾 遗都给我很大的启发。不过即使如此,我对这个主题的认识也经历了好几次自我否定。 比如以前思考的一些结论曾经写在自己的blog里,但是现在看来,这些结论基本上都是错 误的。因此打算把自己现在的有关理解比较完整地记录下来,一方面是因为我觉得现在的 理解比较成熟了,可以拿出来与

11、别人探讨,向别人请教。另一方面,如果以后再有进一步 的认识,把现在的理解给推翻了,那现在写的这个sn apshot也是很有意义的。今天先谈谈对线形空间和矩阵的几个核心概念的理解。这些东西大部分是凭着自己的理解 写出来的,基本上不抄书,可能有错误的地方,希望能够被指出。但我希望做到直觉,也 就是说能把数学背后说的实质问题说出来。首先说说空间(space),这个概念是现代数学的命根子之一,从拓扑空间开始,一步步往上 加定义,可以形成很多空间。线形空间其实还是比较初级的,如果在里面定义了范数,就 成了赋范线性空间。赋范线性空间满足完备性,就成了巴那赫空间;赋范线性空间中定义 角度,就有了内积空间,内

12、积空间再满足完备性,就得到希尔伯特空间。总之,空间有很 多种。你要是去看某种空间的数学定义,大致都是:存在一个集合,在这个集合上定义某 某概念,然后满足某些性质,就可以被称为空间。这未免有点奇怪,为什么要用空间来 称呼一些这样的集合呢?大家将会看到,其实这是很有道理的。我们一般人最熟悉的空间, 毫无疑问就是我们生活在其中的(按照牛顿的绝对时空观)的三维空间,从数学上说,这 是一个三维的欧几里德空间,我们先不管那么多,先看看我们熟悉的这样一个空间有些什 么最基本的特点。仔细想想我们就会知道,这个三维的空间:1由很多(实际上是无穷多个)位置点组成;2. 这些点之间存在相对的关系;3. 可以在空间中

13、定义长度、角度;4. 这个空间可以容纳运动,这里我们所说的运动是从一个点到另一个点的移动(变换), 而不是微积分意义上的连续”性的运动。上面的这些性质中,最最关键的是第4条。第1、2条只能说是空间的基础,不算是空间 特有的性质,凡是讨论数学问题,都得有一个集合,大多数还得在这个集合上定义一些结 构(关系),并不是说有了这些就算是空间。而第3条太特殊,其他的空间不需要具备, 更不是关键的性质。只有第4条是空间的本质,也就是说,容纳运动是空间的本质特征。 认识到了这些,我们就可以把我们关于三维空间的认识扩展到其他的空间。事实上,不管 是什么空间,都必须容纳和支持在其中发生的符合规则的运动(变换)。

14、你会发现,在某 种空间中往往会存在一种相对应的变换,比如拓扑空间中有拓扑变换,线性空间中有线性 变换,仿射空间中有仿射变换,其实这些变换都只不过是对应空间中允许的运动形式而已。因此只要知道,空间是容纳运动的一个对象集合,而变换则规定了对应空间的运动。下 面我们来看看线性空间。线性空间的定义任何一本书上都有,但是既然我们承认线性空间 是个空间,那么有两个最基本的问题必须首先得到解决,那就是:1. 空间是一个对象集合,线性空间也是空间,所以也是一个对象集合。那么线性空间是什 么样的对象的集合?或者说,线性空间中的对象有什么共同点吗?2. 线性空间中的运动如何表述的?也就是,线性变换是如何表示的?我

15、们先来回答第一个问题,回答这个问题的时候其实是不用拐弯抹角的,可以直截了当的 给出答案:线性空间中的任何一个对象,通过选取基和坐标的办法,都可以表达为向量的 形式。通常的向量空间我就不说了,举两个不那么平凡的例子:1、L1是最高次项不大于n次的多项式的全体构成一个线性空间,也就是说,这个线性空 间中的每一个对象是一个多项式。如果我们以xO,x1,.,xn为基,那么任何一个这样的多项 式都可以表达为一组n+1维向量,其中的每一个分量ai其实就是多项式中x(i-1)项的系数。 值得说明的是,基的选取有多种办法,只要所选取的那一组基线性无关就可以。这要用到 后面提到的概念了,所以这里先不说,提一下而

16、已。L2是闭区间a, b上的n阶连续可微函数的全体,构成一个线性空间。也就是说,这个线 性空间的每一个对象是一个连续函数。对于其中任何一个连续函数,根据魏尔斯特拉斯定 理,一定可以找到最高次项不大于n的多项式函数,使之与该连续函数的差为0,也就是 说,完全相等。这样就把问题归结为L1 了。后面就不用再重复了。所以说,向量是很厉害的,只要你找到合适的基,用向量可以表示线性空间里任何一个对 象。这里头大有文章,因为向量表面上只是一列数,但是其实由于它的有序性,所以除了 这些数本身携带的信息之外,还可以在每个数的对应位置上携带信息。为什么在程序设计 中数组最简单,却又威力无穷呢?根本原因就在于此。这是另一个问题了,这里就不说了。下面来回答第二个问题,这个问题的回答会涉及到线性代数的一个最根本的问题。线性空 间中的运动,被称为

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号