文档详情

数学之美:超乎你的想象

慢***
实名认证
店铺
DOC
88.50KB
约9页
文档ID:231140873
数学之美:超乎你的想象_第1页
1/9

数学之美:超乎你的想象数学是美丽的数学是有用的数学是其它科学的基础和工具概率统计,向量与余弦定理,图论与动态规划,黎曼几何数学大师丘成桐说过:“数学是一门很有意义、很美丽、同时也很重要的科学从实用角度讲,数学遍及到物理、工程、生物、化学和经济,甚至与社会科学也有很密切的关系文学最高境界,是美的境界,而数学也具有诗歌和散文的内在气质,达到一定的境界后,也能体会和享受到数学之美数学既有文学性的方面,也有应用性的方面,我对这些都感兴趣,探讨它们之间妙趣横生的关系,让我真正享受到了研究数学的乐趣数学是美丽的,数学作为自然科学的基础,其本身就具有许多美的特征,它们是形象、生动而具体的把数学中美的现象展示出来,再从美学角度重新认识,这不仅是对人们观念的一种启迪,同时可帮助人们去思维、探索、研究、发掘古代哲学家普洛克拉斯就说:“哪里有数学,哪里就有美著名哲学家罗素也这样说:“数学,如果正确看它,不但拥有真理,而且也具至高的美第一是数学的外在形式美,表现为简洁、对称、和谐、统一,它给人的美感是“悦目”; 爱因期坦说过:“美,本质上终究是简单性他还认为,只有借助数学,才能达到简单性的美学准则物理学家爱因期坦的这种美学理论,在数学界,也被多数人所认同。

朴素,简单,是其外在形式只有既朴实清秀,又底蕴深厚,才称得上至美欧拉给出的公式:V-E+F=2,堪称“简单美”的典范数学的这种简洁美,不是用几个定理可以说清的,数学历史中每一次进步都使已有的定理更简洁正如伟大的希而伯特曾说过:“数学中每一步真正的进展都与更有力的工具和更简单的方法的发现密切联系着”第二是数学的内在理性美,表现为内容的真实、逻辑的严密、结构的严谨、方法的巧妙、思想的深邃这种内在意蕴的美要凭借人的智慧才能把握,它给人的美感是“赏心”; 以学生的学习的心理过程来看,认知过程与审美情感本身就是深刻地渗透在一起的学生对知识的掌握理解以及由知识到智力的转化都需要借助逻辑的严密、结构的严谨、方法的巧妙,正是知识向智力转化的最有效的动力第三是数学的创造美,是最高层次的美,只有在发现数学和应用数学的活动中才能产生,它给人的美感是“怡神”; 学生思维有较大的活动空间,呈跳跃状,对新奇的事物的困惑或矛盾都扶植和加强了学生成为探索者的愿望,学习潜能得到充分发展难怪有人说数学是思维体操数学之美更体现在它的精神,著名数学家M.克莱因说过,数学一直是形成现代文化的主要力量,同时又是这种文化极其重要的因素。

由于数学已经广泛地影响着现代生活和思想,今天的西方文明与以往任何历史上的文明都有着明显的区别数学不仅是一种方法、一门艺术或一种语言,数学更主要的是一门有着丰富内容的知识体系,其内容对自然科学家、社会科学家、哲学家、逻辑学家和艺术家十分有用,同时影响着政治家和神学家的学说;满足了人类探索宇宙的好奇心和对美妙音乐的冥想;甚至可能有时以难以察觉到的方式但无可置疑地影响着现代历史的进程在最广泛的意义上说,数学是一种精神,一种理性的精神正是这种精神,使得人类的思维得以运用到最完善的程度,也正是这种精神,试图决定性地影响人类的物质、道德和社会生活;试图回答有关人类自身存在提出的问题;努力去理解和控制自然;尽力去探求和确立已经获得知识的最深刻的和最完美的内涵数学之美还体现在能以最简捷的方式解决难以用其他方法解决的难题数学是有用的下面以现代信息技术为例,略举数例信息检索和自然语言处理也许大家不相信,数学是解决信息检索和自然语言处理的最好工具它能非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法每当人们应用数学工具解决一个语言问题时,总会感叹数学之美长期以来,人类一直梦想着能让机器代替人来翻译语言、识别语音、认识文字(不论是印刷体或手写体)和进行海量文献的自动检索,这就需要让机器理解语言。

但是人类的语言可以说是信息里最复杂最动态的一部分为了解决这个问题,人们容易想到的办法就是让机器模拟人类进行学习 - 学习人类的语法、分析语句等等尤其是在乔姆斯基(Noam Chomsky 有史以来最伟大的语言学家)提出 “形式语言” 以后,人们更坚定了利用语法规则的办法进行文字处理的信念遗憾的是,几十年过去了,在计算机处理语言领域,基于这个语法规则的方法几乎毫无突破其实早在几十年前,数学家兼信息论的祖师爷 香农 (Claude Shannon)就提出了用数学的办法处理自然语言的想法遗憾的是当时的计算机条件根本无法满足大量信息处理的需要,所以他这个想法当时并没有被人们重视七十年代初,有了大规模集成电路的快速计算机后,香农的梦想才得以实现首先成功利用数学方法解决自然语言处理问题的是语音和语言处理大师贾里尼克一、自然语言句子的理解在很多涉及到自然语言处理的领域,如机器翻译、语音识别、印刷体或手写体识别、拼写纠错、汉字输入和文献查询中,我们都需要知道一个文字序列是否能构成一个大家能理解的句子,显示给使用者对这个问题,我们可以用一个简单的统计模型来解决这个问题如果 S 表示一连串特定顺序排列的词 w1, w2,…, wn ,换句话说,S 可以表示某一个由一连串特定顺序排列的词而组成的一个有意义的句子。

现在,机器对语言的识别从某种角度来说,就是想知道S在文本中出现的可能性,也就是数学上所说的S 的概率,用 P(S) 来表示利用条件概率的公式,S 这个序列出现的概率等于每一个词出现的概率相乘,于是P(S) 可展开为:P(S) = P(w1)P(w2|w1)P(w3| w1 w2)…P(wn|w1 w2…wn-1)也许很多人不相信用这么简单的数学模型能解决复杂的语音识别、机器翻译等问题其实不光是常人,就连很多语言学家都曾质疑过这种方法的有效性,但事实证明,统计语言模型比任何已知的借助某种规则的解决方法都有效20世纪90年代统计方法成为自然语言处理的主流技术现在,你也许已经能感受到数学的美妙之处了,它把一些复杂的问题变得如此的简单当然,真正实现一个好的统计语言模型还有许多细节问题需要解决贾里尼克和他的同事的贡献在于提出了统计语言模型,而且很漂亮地解决了所有的细节问题十几年后,李开复用统计语言模型把 997 词语音识别的问题简化成了一个 20 词的识别问题,实现了有史以来第一次大词汇量非特定人连续语音的识别二、余弦定理和新闻的分类余弦定理和新闻的分类似乎是两件八杆子打不着的事,但是它们确有紧密的联系。

具体说,新闻的分类很大程度上依靠余弦定理所谓新闻的分类无非是要把相似的新闻放到一类中计算机其实读不懂新闻,它只能快速计算这就要求我们设计一个算法来算出任意两篇新闻的相似性为了做到这一点,我们需要想办法用一组数字来描述一篇新闻我们来看看怎样找一组数字,或者说一个向量来描述一篇新闻回忆一下我们在“如何度量网页相关性”一文中介绍的TF/IDF 的概念对于一篇新闻中的所有实词,我们可以计算出它们的单文本词汇频率/逆文本频率值(TF/IDF)不难想象,和新闻主题有关的那些实词频率高,TF/IDF 值很大我们按照这些实词在词汇表的位置对它们的 TF/IDF 值排序比如,词汇表有六万四千个词,分别为编号 汉字词1 阿2 啊3 阿斗4 阿姨...789 服装....64000 做作在一篇新闻中,这 64,000 个词的 TF/IDF 值分别为单词编号 TF/IDF 值==============1 02 0.00343 04 0.000525 0...789 0.034...64000 0.075如果单词表中的某个词在新闻中没有出现,对应的值为零,那么这 64,000 个数,组成一个64,000维的向量。

我们就用这个向量来代表这篇新闻,并成为新闻的特征向量如果两篇新闻的特征向量相近,则对应的新闻内容相似,它们应当归在一类,反之亦然学过向量代数的人都知道,向量实际上是多维空间中有方向的线段如果两个向量的方向一致,即夹角接近零,那么这两个向量就相近而要确定两个向量方向是否一致,这就要用到余弦定理计算向量的夹角了余弦定理对我们每个人都不陌生,它描述了三角形中任何一个夹角和三个边的关系,换句话说,给定三角形的三条边,我们可以用余弦定理求出三角形各个角的角度假定三角形的三条边为 a, b 和 c,对应的三个角为 A, B 和 C,那么角 A 的余弦––如果我们将三角形的两边 b 和 c 看成是两个向量,那么上述公式等价于其中分母表示两个向量 b 和 c 的长度,分子表示两个向量的内积举一个具体的例子,假如新闻 X 和新闻 Y 对应向量分别是x1,x2,...,x64000 和y1,y2,...,y64000,那么它们夹角的余弦等于, 当两条新闻向量夹角的余弦等于一时,这两条新闻完全重复(用这个办法可以删除重复的网页);当夹角的余弦接近于一时,两条新闻相似,从而可以归成一类;夹角的余弦越小,两条新闻越不相关。

我们在中学学习余弦定理时,恐怕很难想象它可以用来对新闻进行分类在这里,我们再一次看到数学工具的用途自动导航技术最近开始进入市场运营的3G ,其中一个重要的功能是利用全球卫星定位系统实现全球导航其中的关键技术只有两个:第一是利用卫星定位;第二根据用户输入的起终点,在地图上规划最短路线或者最快路线后者的关键算法是计算机科学图论中的动态规划(Dynamic Programming)的算法在图论中,一个抽象的图包括一些节点和连接他们的弧比如说中国公路网就是一个很好的“图”的例子:每个城市是一个节点,每一条公路是一个弧图的弧可以有权重,权重对应于地图上的距离或者是行车时间、过路费金额等等图论中很常见的一个问题是要找一个图中给定两个点之间的最短路径(shortest path)比如,我们想找到从北京到广州的最短行车路线或者最快行车路线当然,最直接的笨办法是把所有可能的路线看一遍,然后找到最优的这种办法只有在节点数是个位数的图中还行得通,当图的节点数(城市数目)有几十个的时候,计算的复杂度就已经让人甚至计算机难以接受了,因为所有可能路径的个数随着节点数的增长而成呈指数增长(或者说几何级数),也就是说每增加一个城市,复杂度要大一倍。

显然我们的导航系统中不会用这种笨办法所有的导航系统采用的都是动态规划的办法(Dynamic Programming),这里面的规划(programming)一词在数学上的含义是“优化”的意思,不是计算机里面编程的意思它的原理其实很简单以上面的问题为例,当我们要找从北京到广州的最短路线时,我们先不妨倒过来想这个问题:假如我们找到了所要的最短路线(称为路线一),如果它经过郑州,那么从北京到郑州的这条子路线(比如是北京-> 保定->石家庄->郑州,称为子路线一),必然也是所有从北京到郑州的路线中最短的否则的话,我们可以假定还存在从北京到郑州更短的路线(比如北京->济南->徐州->郑州,称为子路线二),那么只要用这第二条子路线代替第一条,我们就可以找到一条从北京到广州的全程更短的路线(称为路线二),这就和我们讲的路线一是北京到广州最短的路线相矛盾其矛盾的根源在于,我们假设的子路线二或者不存在,或者比子路线一还来得长在实际实现算法时,我们又正过来解决这个问题,也就是说,要想找到从北京到广州的最短路线,先要找到从北京到郑州的最短路线当然,聪明的读者可能已经发现其中的一个“漏洞”,就是我们在还没有找到全程最短路线前,不能肯定它一定经过郑州。

不过没有关系,只要我们在图上横切一刀,这一刀要保证将任何从北京到广州的路一截为二,如下图那么从广州到北京的最短路径必须经过这一条线上的某个城市(图中蓝色的菱。

下载提示
相似文档
正为您匹配相似的精品文档