x矩阵分析及其应用课件

上传人:cl****1 文档编号:571100353 上传时间:2024-08-08 格式:PPT 页数:348 大小:4.13MB
返回 下载 相关 举报
x矩阵分析及其应用课件_第1页
第1页 / 共348页
x矩阵分析及其应用课件_第2页
第2页 / 共348页
x矩阵分析及其应用课件_第3页
第3页 / 共348页
x矩阵分析及其应用课件_第4页
第4页 / 共348页
x矩阵分析及其应用课件_第5页
第5页 / 共348页
点击查看更多>>
资源描述

《x矩阵分析及其应用课件》由会员分享,可在线阅读,更多相关《x矩阵分析及其应用课件(348页珍藏版)》请在金锄头文库上搜索。

1、第五章第五章 矩阵分析及其应用矩阵分析及其应用虽然在微积分开端时期贝克莱将无穷小称虽然在微积分开端时期贝克莱将无穷小称为为“上帝的幽灵上帝的幽灵”,进而导致,进而导致“第二次数第二次数学危机学危机”,直到柯西的,直到柯西的“极限论极限论”和戴德和戴德金等的金等的“实数理论实数理论”的出现危机才算彻底的出现危机才算彻底解决。但微积分在近代社会的巨大作用我解决。但微积分在近代社会的巨大作用我们早已深有体会,们早已深有体会,将微积分中的极限、导将微积分中的极限、导数、积分、级数等分析思想和方法应用于数、积分、级数等分析思想和方法应用于矩阵的研究矩阵的研究,自然就在情理之中。,自然就在情理之中。 对于

2、实数和复数,由于定义了它们的对于实数和复数,由于定义了它们的绝对绝对值或模,值或模,这样我们就可以用这个这样我们就可以用这个度量度量来表示它来表示它们的们的大小大小(几何上就是(几何上就是长度长度),进而可以考察),进而可以考察两个实数或复数的两个实数或复数的距离距离。 对于对于 维线性空间,定义了维线性空间,定义了内积内积以后,以后,向量就有了向量就有了长度长度(大小)、(大小)、角度角度、距离距离等度量等度量概念,这显然是概念,这显然是3维现实空间中相应概念的推维现实空间中相应概念的推广。利用广。利用公理化的方法公理化的方法,可以进一步把向量长,可以进一步把向量长度的概念推广到度的概念推广

3、到范数范数。1、从向量范数到矩阵范数、从向量范数到矩阵范数一、一、 从向量的长度或模谈起从向量的长度或模谈起 ,当且仅当,当且仅当 时,等号成立。时,等号成立。例例例例 1 1 1 1复数复数 的长度或的长度或模模模模指的是指的是量量显然复数显然复数 的模的模 具有下列三条性质:具有下列三条性质: ,当且仅当,当且仅当 时,等号成立。时,等号成立。显然向量显然向量 的模的模 也具有下列三条性质:也具有下列三条性质:例例例例 2 2 2 2 维欧氏空间中向量维欧氏空间中向量 的长度或范数定义的长度或范数定义为为定义定义定义定义3 3 3 3如果如果 是是数域数域 上的上的线性空间线性空间,对,对

4、 中的任中的任意向量意向量 ,都有一个,都有一个非负实数非负实数 与之对应,并与之对应,并且具有下列三个条件(且具有下列三个条件(正定性、正齐性和三角不等式正定性、正齐性和三角不等式):):则称则称 是向量是向量 的的向量范数向量范数向量范数向量范数,称定义了范数的线,称定义了范数的线性空间性空间 为为赋范线性空间赋范线性空间赋范线性空间赋范线性空间。例例例例 4 4 4 4 设设 是内积空间,则由是内积空间,则由定义的定义的 是是 上的向量范数,称为由内积上的向量范数,称为由内积 导导导导出的范数出的范数出的范数出的范数。这说明范数未必都可由内积导出这说明范数未必都可由内积导出。例如后。例如

5、后面介绍的面介绍的 和和 。 例例例例 5 5 5 5 在赋范线性空间在赋范线性空间 中,定义任意两向量之间的中,定义任意两向量之间的距离距离为为则称此距离则称此距离 为为为为 由范数由范数由范数由范数 导出的距离导出的距离导出的距离导出的距离。此。此时按此式定义了距离的时按此式定义了距离的 满足度量空间的满足度量空间的距离三公距离三公理理(对称性、三角不等式和非负性对称性、三角不等式和非负性),所以赋范线性,所以赋范线性空间按由范数导出的距离构成一个特殊的空间按由范数导出的距离构成一个特殊的度量空间度量空间度量空间度量空间。 拓扑空间拓扑空间线性空间线性空间Hausdorff空间空间赋范空间

6、赋范空间 距离空间距离空间(度量空间度量空间)拓扑线性空间拓扑线性空间完备距离完备距离线性空间线性空间距离线性空间距离线性空间内积空间内积空间Hilbert空间空间Banach空间空间欧氏空间欧氏空间 和和各类空间的层次关系各类空间的层次关系二、二、 常用的向量范数常用的向量范数例例例例 6 6 6 6 对任意对任意 ,由,由定义的定义的 是是 上的向量范数,称为上的向量范数,称为2-2-范数范数范数范数或或 范数,也称为范数,也称为 Euclid Euclid 范数范数范数范数。 例例例例 7 7 7 7 对任意对任意 ,由,由定义的定义的 是是 上的向量范数,称为上的向量范数,称为p -p

7、 -范数范数范数范数或或 范数或范数或Holder范数。范数。 定义的定义的 是是 上的向量范数,称为上的向量范数,称为1-1-范数范数范数范数或或 范数或范数或和范数和范数和范数和范数,也被风趣地称为,也被风趣地称为ManhattanManhattan范数范数范数范数。 特别地,特别地,p = 1 时,有时,有例例例例 8 8 8 8 对任意对任意 ,由,由遗憾的是,当遗憾的是,当 时,由时,由定义的定义的 不是不是 上的向量范数。上的向量范数。因为因为 时,取时,取 ,则,则定义的定义的 是是 上的向量范数,称为上的向量范数,称为 - -范数范数范数范数或或 范数或范数或极大范数极大范数极

8、大范数极大范数。 在在广义实数(即将广义实数(即将“无穷无穷”看成数)看成数)范围内,范围内,P P能否能否取到正无穷大呢?具体而言,如何计算这种范数呢?取到正无穷大呢?具体而言,如何计算这种范数呢?也就是也就是例例例例 9 9 9 9 对任意对任意 ,由,由证明:证明: 验证验证 是向量范数显然很是向量范数显然很容易。下证容易。下证 。令令 ,则有,则有由极限的两边夹法则,并注意到由极限的两边夹法则,并注意到 ,即得,即得欲证结论。欲证结论。例例例例 10101010 计算向量计算向量的的p范数,这里范数,这里解解解解 : %exm501.m i=sqrt(-1);a=3*i,0,-4*i,

9、-12; norm(a),norm(a,1),norm(a,inf) ans = 13ans = 19ans = 12这些范数在几何上如何理解呢?这些范数在几何上如何理解呢?例例例例11 11 11 11 对任意对任意 ,对应于,对应于 四四种范数的种范数的闭单位圆闭单位圆 的图形分别为的图形分别为例例例例 12121212 对任意对任意 ,由,由定义的定义的 是是 上的向量范数,称为上的向量范数,称为 范数。范数。 特别地,特别地, 范数、范数、 范数和范数和 范数分别为范数分别为定义的定义的 是是 上的向量范数,称为上的向量范数,称为加权范数加权范数加权范数加权范数或或椭椭椭椭圆范数圆范数

10、圆范数圆范数。 例例例例 13 13 13 13 若矩阵若矩阵 为为Hermite正定矩阵,则由正定矩阵,则由对于任意对于任意 ,有,有当当 时,时, ;当;当 时由时由 Hermite正定知正定知 ,即,即 。由于由于 为为Hermite正定矩阵,故存在酉矩阵正定矩阵,故存在酉矩阵 ,使得,使得从而有从而有这里这里 的特征值的特征值 都为正数。都为正数。此时此时因此对任意因此对任意 ,这从几何上可以理解成求可逆变换这从几何上可以理解成求可逆变换 的像的的像的“长度长度” 。这说明只要运算这说明只要运算 成立即可,因此对矩阵成立即可,因此对矩阵 的的要求可放宽为列满秩矩阵要求可放宽为列满秩矩阵

11、。 如果如果 ,此时,此时 ,这就是这就是加权范数加权范数加权范数加权范数或或椭圆范数椭圆范数椭圆范数椭圆范数名称的由来。名称的由来。 一般地,由于一般地,由于 是是Hermite正定矩阵,从而存在正定矩阵,从而存在Cholesky分解,即存在可逆矩阵分解,即存在可逆矩阵 (未必是酉矩阵)(未必是酉矩阵),使得,使得 ,因此,因此为为李雅普诺夫(李雅普诺夫(李雅普诺夫(李雅普诺夫(LyapunovLyapunov)函数)函数)函数)函数,这里,这里 是正定是正定Hermite矩阵。大家已经知道,此函数是讨论线性和矩阵。大家已经知道,此函数是讨论线性和非线性系统稳定性的重要工具。非线性系统稳定性

12、的重要工具。在现代控制理论中,称二次型函数在现代控制理论中,称二次型函数例例例例 14 14 14 14 (模式识别中的模式分类问题模式识别中的模式分类问题)模式分类模式分类模式分类模式分类的问题指的是根据已知类型属性的观测样本的问题指的是根据已知类型属性的观测样本的模式向量的模式向量 ,判断未知类型属性的模式,判断未知类型属性的模式向量向量 归属于哪一类模式。其基本思想是归属于哪一类模式。其基本思想是根据根据 与与模式样本向量模式样本向量 的相似度大小作出判断。的相似度大小作出判断。最简单的方法是用最简单的方法是用两向量之间的距离两向量之间的距离来表示相似度,来表示相似度,距离越小,相似度越

13、大距离越小,相似度越大。最典型的是。最典型的是Euclidean距离距离其他其他距离测度距离测度还包括还包括以及与椭圆范数类似的以及与椭圆范数类似的Mahalanobis距离距离:这里这里 是从正态总体是从正态总体 中抽取的两个样本。中抽取的两个样本。三、三、 向量范数的几个性质向量范数的几个性质定理定理定理定理15 15 15 15 Euclid范数是范数是酉不变酉不变酉不变酉不变的,即对任意酉矩阵的,即对任意酉矩阵 以及任意以及任意 ,均有,均有这个定理的结论是显然的,因为酉变换保持向量的这个定理的结论是显然的,因为酉变换保持向量的内积不变内积不变,自然也保持了,自然也保持了Euclid意

14、义下的意义下的几何结构几何结构(长度、(长度、角度角度或或范数范数等)等)不变不变。注意这个结论对注意这个结论对无限维无限维未必成立。另外,根据等价未必成立。另外,根据等价性,处理向量问题(例如向量序列的敛散性)时,性,处理向量问题(例如向量序列的敛散性)时,我们可以基于一种范数来建立理论,而使用另一种我们可以基于一种范数来建立理论,而使用另一种范数来进行计算。范数来进行计算。定理定理定理定理16 16 16 16 有限维线性空间有限维线性空间 上的上的不同范数是等价的不同范数是等价的不同范数是等价的不同范数是等价的,即对即对 上定义的任意两种范数上定义的任意两种范数 ,必存在,必存在两个任意

15、正常数两个任意正常数 ,使得,使得 向量是特殊的矩阵,向量是特殊的矩阵, 矩阵可以看矩阵可以看成一个成一个 维向量,因此自然想到将向维向量,因此自然想到将向量范数推广到矩阵范数。量范数推广到矩阵范数。四、四、 矩阵范数的概念矩阵范数的概念定义定义定义定义17 17 17 17 对对 中的任意矩阵中的任意矩阵 ,都有一个非负实,都有一个非负实数数 与之对应,并且具有下列三个条件(与之对应,并且具有下列三个条件(正定性、正正定性、正齐性和三角不等式齐性和三角不等式):):则称则称 是矩阵是矩阵 的(的(广义广义广义广义)矩阵范数矩阵范数矩阵范数矩阵范数。例例例例 18 18 18 18 对任意对任

16、意 ,由,由定义的定义的 是是 上的矩阵范数,称为上的矩阵范数,称为 范数。范数。 例例例例 19191919 对任意对任意 ,由,由定义的定义的 是是 上的(广义)矩阵范数,称为上的(广义)矩阵范数,称为 范数。范数。 例例例例 20 20 20 20 对任意对任意 ,由,由定义的定义的 是是 上的矩阵范数,称为上的矩阵范数,称为 范范数或数或Euclid Euclid 范数或范数或范数或范数或SchurSchur范数范数范数范数或或FrobeniusFrobenius范数范数范数范数(F(F范数范数范数范数) )或或或或Hibert-SchmidtHibert-Schmidt范数范数范数范

17、数。五、五、 算子范数和范数的相容性算子范数和范数的相容性矩阵不仅仅是向量,它还可以看成变换或算子。矩阵不仅仅是向量,它还可以看成变换或算子。 实际实际中,从算子或变换的角度来定义范数更加有用。中,从算子或变换的角度来定义范数更加有用。定义定义定义定义21 21 21 21 对对 中的任意矩阵中的任意矩阵 ,用一个非负实,用一个非负实数数 表示对于任意向量表示对于任意向量 , 可以可以“拉伸拉伸”向量向量 的最大倍数的最大倍数,即使得不等式,即使得不等式成立的最小的数成立的最小的数 。称。称 为范数为范数 和和 诱导出的矩阵范数诱导出的矩阵范数诱导出的矩阵范数诱导出的矩阵范数或或算子范数算子范

18、数算子范数算子范数。 由矩阵范数的正齐性可知由矩阵范数的正齐性可知 的作用是由它对单位向的作用是由它对单位向量的作用所决定,因此可以等价地用量的作用所决定,因此可以等价地用单位向量在单位向量在 下下的像的像来定义矩阵范数,即来定义矩阵范数,即从几何上看,矩阵范数反映了线性映射把一个向量映从几何上看,矩阵范数反映了线性映射把一个向量映射为另一个向量,射为另一个向量,向量的向量的“长度长度”缩放的比例缩放的比例 的上界。的上界。 而且考虑到而且考虑到矩阵乘法的重要地位矩阵乘法的重要地位,因此讨论矩阵范数,因此讨论矩阵范数时一般附加时一般附加“范数相容性范数相容性”条件(这里的范数一般条件(这里的范

19、数一般要求是要求是同类的同类的):): 注意到注意到即即可以证明,前面给出的矩阵范数可以证明,前面给出的矩阵范数 都都满足满足“相容性条件相容性条件”,即成立,即成立但是矩阵范数但是矩阵范数 不满足不满足“相容性条件相容性条件”。例如。例如对于矩阵对于矩阵就有就有要使矩阵范数要使矩阵范数 满足满足“相容性条件相容性条件”,则可以,则可以修正其定义为:修正其定义为: 在在“相容性条件相容性条件”中,如果中,如果 而且而且范数范数 与范数与范数 相同时,即如果有相同时,即如果有则称则称矩阵范数矩阵范数矩阵范数矩阵范数 与向量范数与向量范数与向量范数与向量范数 是相容的是相容的是相容的是相容的。证明

20、证明:定理定理定理定理22222222 上的矩阵上的矩阵F-范数与范数与 上的向量上的向量2-2-范数相容。范数相容。 根据算子范数的定义,当向量范数根据算子范数的定义,当向量范数 分别为分别为 时,我们可时,我们可诱导出诱导出相应的相容相应的相容矩阵范数矩阵范数 。设任意矩阵设任意矩阵 ,则,则1-1-范数范数单位球单位球 在在 下的下的像像中的任意向量中的任意向量 满足满足从而从而如果如果 ,则选取,则选取 ,此时由,此时由 ,得,得因此因此类似地可得,类似地可得, 实际上,实际上,这些诱导矩阵范数具有如下的这些诱导矩阵范数具有如下的表示定理表示定理。定理定理定理定理23232323 对对

21、 中的任意矩阵中的任意矩阵 ,有,有 最大最大列和列和 最大最大行和行和 最大最大谱谱证明:证明: 所以所以 是半正定是半正定Hermite矩阵矩阵,因此特征因此特征值全部为非负实数。设为值全部为非负实数。设为 并设对应的两两互相正交且并设对应的两两互相正交且2-范数都为范数都为1的特的特征向量为征向量为 ,那么,对于,那么,对于任意的单位任意的单位2-范数向量范数向量 ,必成立,必成立 由于由于因此有因此有 所以所以因此成立因此成立 另外,由于另外,由于 ,而且,而且同样给出这些范数在几何上的理解。同样给出这些范数在几何上的理解。例例例例 24 24 24 24 求矩阵求矩阵的的 范数(范数

22、( ),并考察对应于),并考察对应于 的三种向量范数的的三种向量范数的闭单位球闭单位球在矩阵在矩阵 作用下的效果。作用下的效果。%exm502.m A=1 2;0 2; norm(A),norm(A,1),norm(A,inf) ans = 2.9208ans = 4ans = 3定理定理定理定理25252525 上的上的谱范数谱范数具有下列性质:具有下列性质:六、矩阵范数的一些性质六、矩阵范数的一些性质(1)(1)设有设有 使使 ,令令 ,则有,则有 证明证明:(2)(2)(3)(3)设有设有 使使 ,则,则 定理定理定理定理2 2 2 26 6 6 6 上的矩阵上的矩阵F-F-范数和谱范数

23、都是范数和谱范数都是酉不酉不酉不酉不变的变的变的变的,即对任意酉矩阵,即对任意酉矩阵 ,恒有,恒有令令则则即即对于对于谱范数谱范数的情形,利用定义即可。的情形,利用定义即可。对于对于谱范数谱范数, 这个定理的结论可以推广到这个定理的结论可以推广到列正列正交酉矩阵交酉矩阵,即,即的情形,此时仍然成立的情形,此时仍然成立利用定理利用定理2626可以证明这个推广结论。可以证明这个推广结论。定理定理2727对矩阵对矩阵 , 表示矩阵表示矩阵 的的 个个非零非零奇异值,则奇异值,则 %exm503.m H=hilb(20); /Hilbert矩阵 norm(H,2); /计算H的2范数max(svd(H

24、); /计算H的2范数ans = 1.9071 长度和距离在长度和距离在实分析实分析和和复分析复分析中的应中的应用,我们已经有充分认识,而范数是长度用,我们已经有充分认识,而范数是长度和距离的推广,因此和距离的推广,因此范数范数作为一种推广的作为一种推广的度量,由于其抽象性和概括性,其应用范度量,由于其抽象性和概括性,其应用范围自然也随之扩展。至少在围自然也随之扩展。至少在矩阵分析矩阵分析和和数数值线性代数值线性代数领域,范数有着深刻的应用。领域,范数有着深刻的应用。2、范数的几个应用、范数的几个应用一、谱半径与矩阵范数一、谱半径与矩阵范数根据矩阵的诱导范数的含义,结合特征值,根据矩阵的诱导范

25、数的含义,结合特征值,设设 为为 的任意的任意特征对特征对,则,则从而从而这说明矩阵特征值的模都不超过它的范数这说明矩阵特征值的模都不超过它的范数。定义定义2 27 7 设设 的特征值为的特征值为 ,称,称为矩阵为矩阵 的的谱半径谱半径。定理定理2 28 8对对 的任意矩阵范数的任意矩阵范数 ,恒有恒有当当 是是正规矩阵正规矩阵时,等号对时,等号对2-范数范数成立。成立。当当 是正规阵时,有是正规阵时,有特征值分解特征值分解从而从而故结论成立。故结论成立。证明证明:例例例例 29 29 29 29 求矩阵求矩阵的谱半径的谱半径 %exm504.mA=-1 1 0;-4 3 0; 1 0 2;D

26、=jordan(A)a=norm(D,inf) /最大特征值最大特征值a = 2定理定理3 30 0 对对 ,存在存在 上矩阵范上矩阵范数数 ,对任意,对任意 ,恒有,恒有定理定理2929给出了矩阵谱半径的的一个上界,那给出了矩阵谱半径的的一个上界,那么矩阵谱半径的下界呢?么矩阵谱半径的下界呢?注意这里的矩阵范数与矩阵注意这里的矩阵范数与矩阵 有关。有关。 对任意矩阵对任意矩阵 ,存在,存在Jordan标准型标准型其中其中 ,证明证明:令令 ,则,则从而从而易证函数易证函数 是是 上上的矩阵范数,这里的矩阵范数,这里例例3 31 1 设设 为为 的的单单位列向量位列向量 ,令令 , 则则(1)

27、 ;(2) ;(3)(1) 因为因为 ,所以,所以(2) 因为秩因为秩 ,并且,并且 是对称矩阵,是对称矩阵,所以所以1是矩阵是矩阵 唯一的非零特征值,因此矩唯一的非零特征值,因此矩阵阵 的特征值为的特征值为 ,从而,从而(3) 二、矩阵逆和线性方程组解的扰动分析二、矩阵逆和线性方程组解的扰动分析例例 3 32 2 线性方程组线性方程组的精确解为的精确解为如果系数矩阵和常数项分别有一个如果系数矩阵和常数项分别有一个扰动扰动则则扰动后的线性方程组扰动后的线性方程组为为它的精确解为它的精确解为显然,由于原方程组本身的固有性质导致显然,由于原方程组本身的固有性质导致原始原始数据的小扰动引起解的很大变

28、化数据的小扰动引起解的很大变化,我们称这样,我们称这样的问题是的问题是病态的病态的(敏感的敏感的)或)或不稳定的。不稳定的。下面下面定量分析定量分析系数矩阵和常数项的扰动对线性系数矩阵和常数项的扰动对线性方程组解的影响。方程组解的影响。设设非奇异非奇异线性方程组线性方程组 ,经扰动后仍有,经扰动后仍有唯一解唯一解 ,即成立,即成立因此因此两边取范数,并缩放,得两边取范数,并缩放,得如果有如果有 ,则,则绝对误差估计式绝对误差估计式再由再由 ,可得,可得即即因此因此这里这里相对误差相对误差估计式估计式显然在相对误差估计式中,系数显然在相对误差估计式中,系数 反映了方反映了方程组解程组解 的相对误

29、差对于系数矩阵的相对误差对于系数矩阵 和常数和常数项项 的相对误差的依赖程度。的相对误差的依赖程度。 越大,方程组越大,方程组解的相对误差也越大。解的相对误差也越大。定义定义3 33 3 对非奇异线性方程组对非奇异线性方程组 ,称数,称数为为求解此线性方程组的条件数。求解此线性方程组的条件数。问题是非奇异线性方程组问题是非奇异线性方程组 经过扰动后经过扰动后未必有唯一解,也即未必有唯一解,也即非奇异矩阵非奇异矩阵 经过什么经过什么样的扰动后得到的矩阵样的扰动后得到的矩阵 仍然是可仍然是可逆的呢?扰动对逆矩阵又有何影响?逆的呢?扰动对逆矩阵又有何影响?由于由于两边取范数,并缩放,得两边取范数,并

30、缩放,得因此因此下一步需要缩放下一步需要缩放 ,由于,由于假定假定 可逆可逆,两边取范数,并缩放,两边取范数,并缩放,得得因此因此令令 ,由于,由于即即两边取范数,并缩放,得两边取范数,并缩放,得如果有如果有 ,则,则下一步需要缩放下一步需要缩放 。并且并且 的任意特征值的任意特征值 ,从,从而而 的特征值的特征值 均不为零,因此矩阵均不为零,因此矩阵 可逆。可逆。定理定理3 34 4 对对 ,若,若 ,则矩,则矩阵阵 非奇异,且非奇异,且从而由定理从而由定理34,得,得由于由于 ,将条件,将条件 修修改为改为 ,此时仍有,此时仍有绝对误差估计式绝对误差估计式即即相对误差估相对误差估计式计式定

31、义定义3 35 5称数称数为为可逆矩阵可逆矩阵 关于求逆的条件数。关于求逆的条件数。定理定理3 36 6 设设 非奇异,且非奇异,且 。如果如果扰动矩阵扰动矩阵 满足条件满足条件则则扰动后的矩阵扰动后的矩阵 为非奇异矩阵,为非奇异矩阵,并且并且定理定理3 37 7 设设 非奇异,且非奇异,且 。如果如果扰动矩阵扰动矩阵 满足条件满足条件则非齐次线性方程组则非齐次线性方程组 经过经过扰动后的扰动后的方程组方程组 有唯一有唯一解解有唯一解有唯一解 ,并且,并且%exm504.m A1=1 0.99;0.99 0.98;b1=1;1; dA=0 0 ;0 0.01;db=0 ; 0.001; %扰动

32、 k=cond(A1) %矩阵A的条件数 Ab1=A1 b1; UC1,ip1=rref(Ab1) %内置函数rref化矩阵为最简形 UC(:,ip1)=; %删掉主元列 x1=UC1 %余下的就是原方程组的解 A2=A1+dA;b2=b1+db; Ab2=A2 b2;UC2,ip2=rref(Ab2);UC2(:,ip2)=; x2=UC2 %扰动后的方程组的解dx=x2-x1;rx=100*norm(dx)/norm(x1) %解的绝对误差和相对误差 k = 3.9206e+004 x1 = 100 -100x2 = -0.1000 1.1111rx = 100.6068则有则有这就是矩阵

33、这就是矩阵 的的秩秩1 矩阵分解式矩阵分解式 。这里这里如果将矩阵如果将矩阵 的的SVD中的对角阵中的对角阵 分解为分解为三、矩阵的低秩逼近及其应用三、矩阵的低秩逼近及其应用根据矩阵根据矩阵 的秩的秩1 矩阵分解式,可以说明,在矩阵分解式,可以说明,在所有秩为所有秩为 的矩阵中,以矩阵的矩阵中,以矩阵离矩阵离矩阵 的的“距离距离”最近,也即矩阵最近,也即矩阵 是矩阵是矩阵 的的最佳秩最佳秩 逼近逼近,也就是包含了,也就是包含了 中的中的“能能量量”最多。最多。 定理定理3838对任意矩阵对任意矩阵 , 为矩阵为矩阵 的的SVD, ,且,且这里这里 为为 的非零奇异值,的非零奇异值,则则 证明:

34、证明:由由 知知所以所以对任意满足对任意满足 的矩阵的矩阵 ,存,存在单位正交向量在单位正交向量 ,使得其零空间为,使得其零空间为由维数可知,存在由维数可知,存在2 2范数单位向量范数单位向量 ,使得,使得设设 ,则,则注意到注意到 ,因此,因此 从几何上看从几何上看,用,用 为长、短轴作成的椭圆为长、短轴作成的椭圆是所有椭圆中离矩阵是所有椭圆中离矩阵 对应的超椭圆对应的超椭圆“距离距离”最近的;如果使用最近的;如果使用 为轴作成椭球体,为轴作成椭球体,则得到所有椭球体中离矩阵则得到所有椭球体中离矩阵 对应的超椭圆对应的超椭圆“距离距离”最近的椭球体。按这种方式,最近的椭球体。按这种方式, 步

35、之后,步之后,就得到了就得到了 的全部信息。但即使到了第的全部信息。但即使到了第 步,步,我们也只利用了我们也只利用了 个数据,即个数据,即矩阵的矩阵的奇异值和对应的左右奇异向量奇异值和对应的左右奇异向量。例例 3939 (图像压缩)(图像压缩)对于一幅用对于一幅用 像素矩阵像素矩阵 表示的图像,如表示的图像,如果传送所有果传送所有 个数据,显然数据量太大。因个数据,显然数据量太大。因此我们希望传送少一些的数据,并且在接收端此我们希望传送少一些的数据,并且在接收端还能重构原图像。如果我们从矩阵还能重构原图像。如果我们从矩阵 的的SVD中中选择选择 个奇异三元组个奇异三元组 来逼近原图像,来逼近

36、原图像,即用即用 个数值代替像素矩阵个数值代替像素矩阵 。那。那么在接收端,我们可得到么在接收端,我们可得到从而在接收端近似地重构出原图像。此时,图从而在接收端近似地重构出原图像。此时,图像的像的压缩比压缩比为为% ex710.mload clown.mat; % clown是内置的是内置的200X320像素的图像像素的图像U,S,V=svd(X);colormap(gray);k=3; %修改修改k值即可值即可image(U(:,1:k)*S(1:k,1:k)*V(:,1:k)%exm504.m(续续) A1=1 0.99;0.99 0.98;b1=1;1; dA=0 0 ;0 0.01;d

37、b=0 ; 0.001;%扰动 k=cond(A1) %矩阵A的条件数 IA1=inv(A1) %原矩阵的逆 IA2=inv(A2) %扰动后的逆 dIA=IA2-IA1; rIA=100*norm(dIA)/norm(IA1) %逆的绝对误差和相对误差 k = 3.9206e+004 IA1 = 1.0e+004 * -0.9800 0.9900 0.9900 -1.0000IA2 = 100.0000 -100.0000 -100.0000 101.0101rIA = 101.01263、矩阵序列与矩阵级数、矩阵序列与矩阵级数 微积分的基础是数列极限的收敛理论及微积分的基础是数列极限的收敛

38、理论及其衍生出来的级数理论。矩阵可看成一个其衍生出来的级数理论。矩阵可看成一个“超数超数”,因此,因此类比类比可得可得矩阵序列矩阵序列与与矩阵矩阵级数级数,只要找到,只要找到度量两个度量两个“超数超数”距离距离的的适当工具。在矩阵里,这就是适当工具。在矩阵里,这就是范数范数。尽管。尽管使用给定基下的分量和元素等也可以,但使用给定基下的分量和元素等也可以,但明显用范数记号简洁明晰,且有助于证明。明显用范数记号简洁明晰,且有助于证明。一、矩阵序列的收敛性一、矩阵序列的收敛性定义定义1 1 设有设有 中的中的矩阵序列矩阵序列这里这里 。如果如果 ,则称此,则称此矩阵序列收矩阵序列收敛敛,其,其极限极

39、限为为 ,记为,记为根据矩阵序列收敛性的定义,可证明下列性质根据矩阵序列收敛性的定义,可证明下列性质。定理定理2 2 中的中的矩阵序列矩阵序列 分别分别收敛于收敛于 ,则,则定理定理3 3 中的中的矩阵系列矩阵系列 分别分别收敛于收敛于 ,则,则定理定理4 4 中的中的矩阵序列矩阵序列 收敛于收敛于 ,且,且所有所有 和和 都可逆都可逆,则,则注意注意定理中条件定理中条件“所有所有 和和 都可逆都可逆”必不可少,例如下面的必不可少,例如下面的 不可逆,虽然不可逆,虽然 可逆,且可逆,且用矩阵的范数理论来研究矩阵序列的收敛性是用矩阵的范数理论来研究矩阵序列的收敛性是最常用、最简洁的方法最常用、最

40、简洁的方法。特别地,若特别地,若 ,则,则 的的充充要条件要条件是是定理定理5 5 中的中的矩阵序列矩阵序列 收敛于收敛于 的的充要条件充要条件是对任意一种矩阵范数是对任意一种矩阵范数 ,都有,都有证明证明:所以所以由范数的等价性,对于由范数的等价性,对于 上任意一个范数上任意一个范数 ,必存在正常数,必存在正常数 ,使,使由于向量是特殊的矩阵,因此我们有由于向量是特殊的矩阵,因此我们有推论推论1 1 中的中的向量序列向量序列 收敛于收敛于 的的充要条件充要条件是对任意一种向量范数是对任意一种向量范数 ,都有,都有联想到联想到等比数列等比数列 收敛当且仅当收敛当且仅当 ,类似地,我们有类似地,

41、我们有最常见的矩阵序列是最常见的矩阵序列是方阵的幂方阵的幂构成的矩阵序列构成的矩阵序列。定理定理6 6 中的矩阵中的矩阵 是是收敛矩阵收敛矩阵,即,即的的充要条件充要条件是矩阵是矩阵 的的谱半径小于谱半径小于1 1,即,即证明证明:设矩阵设矩阵 的的Jordan分解分解为为则则从而由定理从而由定理3 3可知,可知,这里规定这里规定 时,时,由于谱半径不易计算,联系到由于谱半径不易计算,联系到谱半径不超过任谱半径不超过任何一种矩阵范数何一种矩阵范数,实际常用范数来判断矩阵是,实际常用范数来判断矩阵是否是收敛矩阵。否是收敛矩阵。只有很难找到这样的范数,才只有很难找到这样的范数,才计算出矩阵的所有特

42、征值,进而得到谱半径。计算出矩阵的所有特征值,进而得到谱半径。定理定理7 7 中的矩阵中的矩阵 是是收敛矩阵收敛矩阵的的充分充分条件条件是是存在存在一种矩阵范数一种矩阵范数 ,使得,使得二、矩阵级数二、矩阵级数定义定义8 8 设有设有 中的矩阵序列中的矩阵序列 ,矩阵矩阵级数级数指的是指的是无穷和无穷和称称矩阵级数收敛矩阵级数收敛,且其,且其和和为为 ,如果其,如果其部分部分和序列和序列收敛于收敛于 ,即,即这是因为这是因为显然,显然,矩阵级数矩阵级数 收敛时其通项收敛时其通项 是收敛矩阵,即是收敛矩阵,即这个结果与数项级数一致。这个结果与数项级数一致。定义定义9 9 中的矩阵级数中的矩阵级数

43、 称为称为绝绝对收敛对收敛的,如果数项级数的,如果数项级数都绝对收敛。这里都绝对收敛。这里定理定理1010 中的矩阵级数中的矩阵级数 绝对绝对收敛的收敛的充要条件充要条件是是正项级数正项级数 收敛,收敛,这里的矩阵范数是任意的。这里的矩阵范数是任意的。同数项级数相吻合的是,判定矩阵级数是否绝同数项级数相吻合的是,判定矩阵级数是否绝对收敛可借助范数理论转化为判定对收敛可借助范数理论转化为判定正项级数正项级数的的敛散性。敛散性。证明证明:必要性。必要性。从而从而若级数若级数 绝对收敛,则绝对收敛,则 都都收敛,故收敛,故所以正项级数所以正项级数 收敛。收敛。根据范数的等价性,对任意矩阵范数,正项根

44、据范数的等价性,对任意矩阵范数,正项级数级数 收敛。收敛。证明证明:充分性。充分性。若级数若级数 收敛,则正项级数收敛,则正项级数 也收敛,故也收敛,故所以所以 都收敛,即都收敛,即 绝对绝对收敛,因此矩阵级数收敛,因此矩阵级数 绝对收敛。绝对收敛。定义定义1111 中的矩阵级数中的矩阵级数称为矩阵称为矩阵 的的幂级数幂级数。这里。这里 . . 由前可知矩阵的幂级数是由前可知矩阵的幂级数是实变量的幂级实变量的幂级数数 以及以及复变量的幂级数复变量的幂级数 的的推广推广,因此讨论矩阵幂级数的收敛性问题自然,因此讨论矩阵幂级数的收敛性问题自然就与就与复变量的幂级数的收敛半径复变量的幂级数的收敛半径

45、联系起来。联系起来。定理定理1212 设幂级数的收敛半径为设幂级数的收敛半径为 ,则,则当当 时幂级数时幂级数 收敛;收敛;当当 时幂级数时幂级数 发散。发散。证明证明:设矩阵设矩阵 的的Jordan分解分解为为则则从而从而其中其中这里规定这里规定 时,时,绝对收敛,故矩阵幂级数绝对收敛,故矩阵幂级数 绝对收敛。绝对收敛。则当则当 时幂级数时幂级数当当 时矩阵时矩阵 必有某个特征值必有某个特征值 ,从而幂级数,从而幂级数 发散,因发散,因此矩阵幂级数此矩阵幂级数 发散。发散。绝对收敛,故矩阵幂级数绝对收敛,故矩阵幂级数 绝对收敛。绝对收敛。最后讨论最特殊的最后讨论最特殊的诺伊曼诺伊曼( (Ne

46、umann) )级数级数, ,即即幂级数幂级数 的收敛半径是的收敛半径是 ,并且收敛于,并且收敛于所以我们通过所以我们通过类比类比可以得到可以得到定理定理1313 上的上的诺伊曼诺伊曼( (Neumann) )级数级数收收敛的敛的充要条件充要条件是是 。并且。并且诺伊曼诺伊曼( (Neumann) )级数级数收敛于收敛于定理定理1414 对对 上满足上满足 的相容矩阵的相容矩阵范数范数 ,如果,如果 ,则有,则有误差估计式误差估计式定理定理1414的证明需要用到上一节的定理的证明需要用到上一节的定理3434,即:,即:定理定理34 34 对对 ,若,若 ,则矩,则矩阵阵 非奇异,且非奇异,且证

47、明证明:所以所以Neumann级数收敛。则级数收敛。则由于由于 ,由题知,由题知两边取范数,并利用引理两边取范数,并利用引理6 6,得,得例例 15 15 判断方阵幂级数判断方阵幂级数收敛,并求其和。收敛,并求其和。解:解:方阵方阵 的的谱半径谱半径满足满足所以方阵幂级数收敛,并且所以方阵幂级数收敛,并且4、 函数矩阵及函数矩阵及 矩阵矩阵从函数的眼光看,特征多项式和矩阵序列从函数的眼光看,特征多项式和矩阵序列涉及的都是特殊的涉及的都是特殊的函数矩阵函数矩阵,即元素是函,即元素是函数的矩阵,这就自然引出对数的矩阵,这就自然引出对 矩阵的研矩阵的研究,并进而发现它能够简化究,并进而发现它能够简化

48、Jordan标准型标准型的繁杂计算。的繁杂计算。一、一、 函数矩阵函数矩阵定义定义定义定义1 1 1 1称矩阵称矩阵 为为函数矩阵函数矩阵函数矩阵函数矩阵,也称为,也称为矩阵值函数矩阵值函数矩阵值函数矩阵值函数,其中元素,其中元素 为数域为数域 上关于实数上关于实数 的实函数。的实函数。特别地,当特别地,当 时时 是一个是一个函数行向量函数行向量函数行向量函数行向量;当;当 时时 是一个是一个函数列向量函数列向量函数列向量函数列向量。两者统称。两者统称向量值向量值向量值向量值函数函数函数函数。 (3)矩阵函数:矩阵函数:初等变换,相似变换,矩阵多项初等变换,相似变换,矩阵多项式,矩阵指数函数,

49、求特征值,求主元列,等等式,矩阵指数函数,求特征值,求主元列,等等 定义域是矩阵或向量,值域也是矩阵或向量定义域是矩阵或向量,值域也是矩阵或向量函数与矩阵函数与矩阵 (2)标量函数:标量函数:行列式,秩,二次型,迹,范数等行列式,秩,二次型,迹,范数等 定义域是矩阵或向量,值域是数集;定义域是矩阵或向量,值域是数集; (1)函数矩阵:函数矩阵:梯度,梯度, 矩阵等矩阵等 定义域是数集,值域是矩阵或向量:定义域是数集,值域是矩阵或向量: 定义定义定义定义2 2 2 2 称称 阶函数矩阵阶函数矩阵 是是可逆的可逆的可逆的可逆的,如果有,如果有 并称并称 为为 的的逆矩阵逆矩阵逆矩阵逆矩阵。反之亦然

50、。反之亦然。 视函数为视函数为“数数”,则函数,则函数矩阵的矩阵的加法、数乘、乘法、转加法、数乘、乘法、转置置与与常数矩阵常数矩阵的相应运算相同;方函数矩阵的的相应运算相同;方函数矩阵的行列式行列式计计算与常数矩阵也相同。算与常数矩阵也相同。定义定义定义定义3 3 3 3 称称 阶函数矩阵阶函数矩阵 在在 上是上是可逆可逆可逆可逆的的的的,当且仅当,当且仅当 在在 上不处处为零,且上不处处为零,且这里这里 为为 的伴随矩阵。的伴随矩阵。 在在 上是可逆的,但在上是可逆的,但在 上却上却不是可逆的。不是可逆的。定义定义4 4 设有设有函数矩阵函数矩阵 。如果函数。如果函数在在 都有极限,则称都有

51、极限,则称函数矩阵函数矩阵 在在 有极限有极限,记为,记为如果如果 ,则称,则称函数矩阵函数矩阵 在在 连续。连续。 显然函数显然函数矩阵求极限的加减法、数乘、乘法等运算法则与函数极限的相应运算法则相同。定义定义5 5 设有设有函数矩阵函数矩阵 。称。称矩阵矩阵 可导可导,如果其每个元素,如果其每个元素 都是可微都是可微函数,且函数,且导数导数为为定义定义6 6 设有函数矩阵设有函数矩阵 。称。称矩阵矩阵 的导数的导数为满足下式的矩阵为满足下式的矩阵 :联想到普通函数联想到普通函数 的导数的导数 也满足下式:也满足下式:定理定理 7 7 设设 和和 都是可微矩阵,则都是可微矩阵,则这里这里 为

52、可微矩阵。为可微矩阵。遗憾的是,链氏法则对矩阵值函数并不成立。遗憾的是,链氏法则对矩阵值函数并不成立。例如对矩阵多项式函数例如对矩阵多项式函数 显然显然上式中,要使法则成立,显然需要上式中,要使法则成立,显然需要补充条件补充条件如此,对如此,对多项式函数多项式函数 ,才能成立链式法,才能成立链式法则则定义定义8 8 设有函数矩阵设有函数矩阵 。称。称矩阵矩阵 二阶可微二阶可微,如果其每个元素,如果其每个元素 都是二阶可都是二阶可微函数,且微函数,且二阶导数二阶导数为为一般地,不难给出函数矩阵的高阶导数。一般地,不难给出函数矩阵的高阶导数。定义定义9 9 设有函数矩阵设有函数矩阵 。称。称 在在

53、 上可积上可积,如果其每个元素,如果其每个元素 都都在在 上可积,且上可积,且积分积分为为容易验证函数矩阵的积分具有下列性质:容易验证函数矩阵的积分具有下列性质:这里这里 为常量矩阵。为常量矩阵。定理定理 1010 设设 和和 都在都在 上可积,则上可积,则定理定理 1111 设设 在在 上连续,则成立上连续,则成立微积分微积分基本定理基本定理:定理定理 1212 设设 在在 上连续,则成立牛顿上连续,则成立牛顿- -莱布尼兹公式:莱布尼兹公式:例例13 13 设矩阵设矩阵 ,证明,证明因为因为矩阵的迹是线性函数矩阵的迹是线性函数,即,即例例13说明对函数矩阵说明对函数矩阵A(t)而言,而言,

54、求导和求导和A(t)的线的线性函数性函数l(A(t)可以交换运算次序可以交换运算次序,即,即二、二、 矩阵及其标准型矩阵及其标准型定义定义定义定义14141414称函数矩阵称函数矩阵 为为 矩阵矩阵矩阵矩阵,如果元,如果元素素 为数域为数域 上关于上关于 的多项式函数。的多项式函数。定理定理定理定理15 15 15 15 矩阵矩阵 可逆的可逆的充要条件充要条件是其行列式是其行列式 为为非零的常数非零的常数,即,即定义定义定义定义16161616如果矩阵如果矩阵 经过有限次的经过有限次的初等变换初等变换化成化成矩阵矩阵 ,则称矩阵,则称矩阵 与与 等价等价,记为,记为定理定理定理定理171717

55、17矩阵矩阵 与与 等价的等价的充要条件充要条件是存在是存在可逆矩阵可逆矩阵 ,使得,使得定理定理定理定理18181818任意任意 阶的阶的 矩阵矩阵 都必定有都必定有一个与之一个与之等价等价的的Smith标准型标准型这里数这里数 称为称为 的的秩秩,记为,记为 ,非零对角元非零对角元是首一(首项系数为是首一(首项系数为1 1)多项式,并且)多项式,并且例例 1919 求矩阵求矩阵 的的 Smith标准型标准型 ,其中,其中解:解: 对矩阵对矩阵 进行初等变换,可得进行初等变换,可得不满足整除不满足整除条件!条件!即为所求的即为所求的Smith标准型。标准型。定义定义定义定义20202020矩

56、阵矩阵 的的Smith标准型中的标准型中的非零对角元非零对角元 称为称为 的的不变因子不变因子不变因子不变因子。这说明我们可以通过先求这说明我们可以通过先求SmithSmith标准型,再来确定不标准型,再来确定不变因子。例变因子。例1919就是这么做的。就是这么做的。定义定义定义定义21212121矩阵矩阵 的的所有非零所有非零 阶子式的阶子式的首一首一(最高(最高次项系数为次项系数为 1 )最大公因式最大公因式 称为称为 的的 阶行列式因子阶行列式因子阶行列式因子阶行列式因子。定理定理定理定理22222222等价矩阵具有相同的等价矩阵具有相同的秩秩和相同的各级和相同的各级行列式行列式因子因子

57、。定理定理定理定理23232323 矩阵矩阵 的的Smith标准型是标准型是唯一的唯一的,并且,并且定理定理2323说明我们可以用行列式因子来确定不变因子,说明我们可以用行列式因子来确定不变因子,从而得到唯一的从而得到唯一的SmithSmith标准型。但行列式因子的计算标准型。但行列式因子的计算复杂,所以通过初等变换求复杂,所以通过初等变换求SmithSmith标准型显然标准型显然“胜出胜出”。在线性代数中处理数字矩阵时也是如此。在线性代数中处理数字矩阵时也是如此。定理定理定理定理24 24 24 24 矩阵矩阵 与与 等价的等价的充要条件充要条件是它们是它们有相同的有相同的行列式因子行列式因

58、子(或相同的(或相同的不变因子不变因子)。)。定义定义定义定义25252525 将矩阵将矩阵 的的所有所有非常数不变因子非常数不变因子分解为分解为互不相同互不相同的一次因式方幂的乘积,所有这些的一次因式方幂的乘积,所有这些一次因式一次因式的方幂的方幂(相同的按出现的次数计算(相同的按出现的次数计算 )称为称为 的的初初初初等因子等因子等因子等因子。例如例例如例19中中 的的不变因子不变因子为为因此因此 的的初等因子初等因子为为例例2626 矩阵矩阵 的的 不变因子不变因子为为则矩阵则矩阵 的的 所有所有初等因子初等因子为为如果知道矩阵如果知道矩阵 的所有的所有初等因子初等因子,能否确定相应,能

59、否确定相应的的不变因子不变因子呢?等价矩阵的呢?等价矩阵的初等因子初等因子是否相同呢?是否相同呢?下面的两个矩阵的初等因子相同,但不变因子不相同,下面的两个矩阵的初等因子相同,但不变因子不相同,也不是等价矩阵,因为它们的秩不相等:也不是等价矩阵,因为它们的秩不相等:定理定理定理定理27 27 27 27 矩阵矩阵 与与 等价的等价的充要条件充要条件是它是它们有相同的们有相同的初等因子初等因子,并且,并且秩相等秩相等。例例 2828 求矩阵求矩阵 的的 Smith标准型标准型 ,其中,其中解:解: 对矩阵对矩阵 进行初等变换,可得进行初等变换,可得即为所求的即为所求的Smith标准型。标准型。例

60、例28 28 中中 的的不变因子不变因子为为因此因此 的的初等因子初等因子为为反之,反之,如果还知道如果还知道 的秩为的秩为3,则可知,则可知 的的三个三个不变因子不变因子,进而可确定,进而可确定 的的Smith标准型,标准型,因此也可唯一确定相应的因此也可唯一确定相应的Jordan块,即:块,即:总结总结等等 价价不变因子或行不变因子或行列式因子相同列式因子相同初等因子相同初等因子相同秩相同秩相同三、三、Smith标准型的应用标准型的应用定理定理定理定理29292929 两个数字方阵两个数字方阵相似相似的的充要条件充要条件是它们的特是它们的特征矩阵征矩阵等价等价。定义定义定义定义30 30

61、30 30 称称 阶数字矩阵阶数字矩阵 的特征矩阵的特征矩阵 的的行列式因子、不变因子和初等因子为行列式因子、不变因子和初等因子为矩阵矩阵矩阵矩阵 的行列的行列的行列的行列式因子、不变因子和初等因子式因子、不变因子和初等因子式因子、不变因子和初等因子式因子、不变因子和初等因子。定理定理定理定理31313131 两个数字方阵相似的两个数字方阵相似的充要条件充要条件是它们有相是它们有相同的行列式因子(或不变因子)。同的行列式因子(或不变因子)。不变因子或行列不变因子或行列式因子相同式因子相同初等因子相同初等因子相同 与与 等价等价 与与 相似相似 与与 的秩都为的秩都为定理定理定理定理323232

62、32 复数域上两个数字方阵相似的充要条件是复数域上两个数字方阵相似的充要条件是它们有相同的它们有相同的初等因子初等因子初等因子初等因子。由定理由定理3232和例和例2828可知,可知, 初等因子初等因子 与与 阶阶Jordan块块存在一一对应关系。存在一一对应关系。因此可利用特征矩阵的初等因子因此可利用特征矩阵的初等因子求矩阵的求矩阵的JordanJordan标准型。标准型。例例3333 求矩阵求矩阵 的的 Jordan标准型标准型 ,其中,其中解:解: 对矩阵对矩阵 进行初等变换,可得进行初等变换,可得因此因此 的初等因子为的初等因子为从而所求从而所求Jordan标准型为标准型为初等因子法初

63、等因子法的优缺点都是不能求出的优缺点都是不能求出Jordan变换矩阵。变换矩阵。 那么那么 的最小多项式为的最小多项式为定理定理定理定理34 34 34 34 矩阵矩阵 的最小多项式的最小多项式 是是矩阵矩阵 的第的第 个不变因子个不变因子 ,也就是说,如果有,也就是说,如果有 这里这里 为为 的的Jordan标准型标准型 中包含中包含 的的 最大最大Jordan块的阶数,即指标块的阶数,即指标。例例 3535 求矩阵求矩阵 的的 最小多项式最小多项式 ,其中,其中并求矩阵并求矩阵 的的矩阵多项式矩阵多项式矩阵多项式矩阵多项式解:解: 对矩阵对矩阵 进行初等变换,可得进行初等变换,可得因此因此

64、 的最小多项式为的最小多项式为由于由于因此因此定理定理定理定理36 36 36 36 矩阵矩阵 可对角化的可对角化的充要条件充要条件是是 的的最小多最小多项式没有重根项式没有重根。例例 3737 证明幂等矩阵一定相似于对角矩阵证明幂等矩阵一定相似于对角矩阵。证明:证明:证明:证明:由于由于 ,因此,因此 是是 的零化多项式。由于的零化多项式。由于 没有重根,没有重根,因此因此 也也没有重根没有重根。根据定理。根据定理 3636,结论成,结论成立。立。5、矩阵函数及其计算、矩阵函数及其计算矩阵函数在力学、控制理论及信号处理等矩阵函数在力学、控制理论及信号处理等学科中具有重要应用。学科中具有重要应

65、用。类比类比普通函数,矩普通函数,矩阵函数的特殊之处在于其自变量与因变量阵函数的特殊之处在于其自变量与因变量都是方阵。对应于矩阵函数的多种表示方都是方阵。对应于矩阵函数的多种表示方式式(幂级数幂级数、Jordan表示表示、多项式表示多项式表示、积积分表示分表示等等),定义矩阵函数的方式也很多。,定义矩阵函数的方式也很多。一、矩阵函数的定义及性质一、矩阵函数的定义及性质定义定义1 1 设一元函数设一元函数 可展开为收敛半径可展开为收敛半径为为 的幂级数,即的幂级数,即而矩阵而矩阵 的谱半径的谱半径 ,则,则矩阵函数矩阵函数 即为相应的矩阵幂级数即为相应的矩阵幂级数(收敛时收敛时)的和,即的和,即

66、在在高等数学高等数学和和复变函数复变函数中,有幂级数展开式:中,有幂级数展开式:相应地,我们有矩阵函数:相应地,我们有矩阵函数:以及以及含参矩阵函数含参矩阵函数:根据欧拉公式根据欧拉公式 ,可以推出:可以推出:遗憾的是,指数运算规则一般不成立遗憾的是,指数运算规则一般不成立:例如,令例如,令有有则则可以验证可以验证 确实两两不等。确实两两不等。那么那么什么条件下指数运算规则成立呢?什么条件下指数运算规则成立呢?定理定理2 2 如果如果 ,那么,那么证明证明:而而推论推论 设设 ,则,则二、矩阵函数的计算二、矩阵函数的计算由矩阵函数的定义,矩阵函数的计算转化为矩由矩阵函数的定义,矩阵函数的计算转

67、化为矩阵幂级数和的计算,主要就是阵幂级数和的计算,主要就是矩阵幂的计算矩阵幂的计算。首先联想到首先联想到矩阵的对角化问题矩阵的对角化问题,即希望利用,即希望利用特特征值分解征值分解来计算矩阵函数。由于对角矩阵的对来计算矩阵函数。由于对角矩阵的对角元就是矩阵的特征值,而相似矩阵就是相应角元就是矩阵的特征值,而相似矩阵就是相应的特征向量构成的矩阵。这样对任意矩阵,则的特征向量构成的矩阵。这样对任意矩阵,则可以使用可以使用Jordan分解分解。这两种方法的计算都比。这两种方法的计算都比较复杂,因此最后我们给出较复杂,因此最后我们给出待定系数法待定系数法。Jordan分解法分解法计算原理计算原理 设任

68、意矩阵设任意矩阵 的的Jordan分解分解为为则对于任意则对于任意复系数多项式复系数多项式 ,有,有其中其中特别地,当矩阵特别地,当矩阵 可对角化时可对角化时,我们有下,我们有下面的面的特征值分解法。特征值分解法。特征值分解法特征值分解法计算原理计算原理 设设可对角化矩阵可对角化矩阵 的的特征值分解特征值分解为为则有则有例例 3 3 求矩阵函数求矩阵函数 、 和和 ,其中,其中解:解: 求得求得 的的Jordan分解分解为为其中其中当当 时时 ,则,则当当 时时%exm505.m A=-1 1 0 ;-4 3 0; 1 0 2; expm(A) %调用expm函数 %expm uses the

69、 Pad approximation with scaling % and squaring.ans = -2.7183 2.7183 0 -10.8731 8.1548 0 0.7658 1.9525 7.3891%exm505.m(续)(续) A=-1 1 0 ;-4 3 0; 1 0 2; syms t % 声明符号变量t S=expm(A*t); S=simple(S) % 简化矩阵函数的结果S = -exp(t)*(2*t - 1), t*exp(t), 0 -4*t*exp(t), exp(t)*(2*t + 1), 0 exp(t)*(2*t - exp(t) + 1), -ex

70、p(t)*(t - exp(t) + 1), exp(2*t)当当 时时%exm505.m(续)(续) A=-1 1 0 ;-4 3 0; 1 0 2; syms t % 声明符号变量t A1=sin(A*t) % 内置函数sin(A)给出错误结果A1 = -sin(t), sin(t), 0 -sin(4*t), sin(3*t), 0 sin(t), 0, sin(2*t)%exm505.m(续)(续) A=-1 1 0 ;-4 3 0; 1 0 2; j=sqrt(-1); %虚数单位i A2=(expm(j*A*t) - expm(-1)*j*A*t)/(2*j) %利用Euler公式

71、公式,调用函数expm A2=simple(A2) % 简化矩阵函数的结果A2 = sin(t) - 2*t*cos(t), t*cos(t), 0 -4*t*cos(t), sin(t) + 2*t*cos(t), 0 sin(t) - 2*cos(t)*sin(t) + 2*t*cos(t), 2*cos(t)*sin(t) - sin(t) - t*cos(t), sin(2*t)例例 4 4 求矩阵函数求矩阵函数 和和 ,其中,其中解:解: 矩阵矩阵 的特征值为的特征值为 对应的特征向量为对应的特征向量为 对应的特征向量为对应的特征向量为 因此相似矩阵为因此相似矩阵为 从而从而%exm

72、506.m A=4 6 0;-3 -5 0;-3 -6 1; syms t % 声明符号变量t S=expm(A*t); S=simple(S) % 简化矩阵函数的结果S = 2*exp(t) - 1/exp(2*t), 2*exp(t) - 2/exp(2*t), 0 1/exp(2*t) - exp(t), 2/exp(2*t) - exp(t), 0 1/exp(2*t) - exp(t), 2/exp(2*t) - 2*exp(t), exp(t)%exm506.m (续)(续) A=4 6 0;-3 -5 0;-3 -6 1; j=sqrt(-1); %虚数单位i B=(expm(j

73、*A)+expm(-1)*j*A)/2 %利用Euler公式,调用函数expmB = 1.4968 1.9129 0 -0.9564 -1.3726 0 -0.9564 -1.9129 0.5403%ex506.m(续)(续) A=4 6 0;-3 -5 0;-3 -6 1; P,D=eig(A); j=sqrt(-1); C= P*(expm1(j*D)+expm1(-1)*j*D)/2)*inv(P) +eye(size(A) %函数expm1返回e(x)-1ans = 1.4968 1.9129 0 -0.9564 -1.3726 0 -0.9564 -1.9129 0.5403利用幂级

74、数求矩阵函数,要求相应的函数利用幂级数求矩阵函数,要求相应的函数必须必须能够展开成收敛的幂级数能够展开成收敛的幂级数,这个条件一般不容这个条件一般不容易满足易满足。而根据。而根据特征值分解法特征值分解法,我们可以根据,我们可以根据矩阵的谱矩阵的谱即矩阵的特征值的集合来定义矩阵函即矩阵的特征值的集合来定义矩阵函数,这样就拓宽了矩阵函数的定义范围,尤其数,这样就拓宽了矩阵函数的定义范围,尤其是对那些是对那些不能展开成收敛的幂级数的函数不能展开成收敛的幂级数的函数也可也可以定义出相应的矩阵函数。以定义出相应的矩阵函数。 一般地,如果矩阵一般地,如果矩阵 的最小多项式为的最小多项式为则对于任意复值函数

75、则对于任意复值函数 ,只要,只要有意义,我们就说函数有意义,我们就说函数 在在矩阵矩阵 的谱的谱 上有定义。上有定义。则定义任意复值函数则定义任意复值函数 的的矩阵函数矩阵函数为为定义定义5 5 设设复值函数复值函数 在矩阵在矩阵 的的谱上有谱上有定义定义,矩阵,矩阵 有有Jordan分解分解其中其中例例 6 6 求矩阵函数求矩阵函数 和和 ,其中,其中解:解: 求得求得 的的Jordan分解分解为为其中其中显然显然 和和 在在 都有意义,都有意义,因此因此 和和 都有意义。都有意义。%exm506.m(续)(续) A=-1 1 0;-4 3 0; 1 0 2;F=logm(A) % 函数lo

76、gm(A)返回lnAF = -2.0000 1.0000 -0.0000 -4.0000 2.0000 0 1.3069 -0.3069 0.6931%exm506.m(续)(续) A=-1 1 0;-4 3 0; 1 0 2;G=sqrtm(A)G = -0.0000 0.5000 -0.0000 -2.0000 2.0000 0.0000 0.5858 -0.0858 1.4142需要指出的是,需要指出的是,计算相应的矩阵函数时,涉及计算相应的矩阵函数时,涉及到的算法主要分为到的算法主要分为特征值方法特征值方法(特征值分解、特征值分解、Jordan分解、分解、Schur分解等分解等)和)和

77、逼近方法逼近方法(泰泰勒逼近、勒逼近、pade逼近逼近等)。考虑到计算复杂性及等)。考虑到计算复杂性及稳定性,具体实现时前一类方法实际采用的是稳定性,具体实现时前一类方法实际采用的是Schur分解法分解法(例如例如matlab中的中的logm函数函数),后一类方法实际则采是后一类方法实际则采是Pade逼近法逼近法(例如例如matlab中的中的expm函数函数)。详见)。详见Golub &Van Loan矩阵计算矩阵计算和和Matlab帮助文档。帮助文档。在在定义定义5 5中,矩阵函数中,矩阵函数 只与函数只与函数 在在 上的值有关,这启发我们,如果能够求上的值有关,这启发我们,如果能够求出一个

78、尽可能简单的函数出一个尽可能简单的函数 (比如复系数多(比如复系数多项式),使得两者在项式),使得两者在 上等值,那么便有上等值,那么便有 。这就是著名的。这就是著名的Hermite多项式插值问题多项式插值问题。则存在唯一的复值多项式函数则存在唯一的复值多项式函数 ,使得,使得定理定理7 7 设复值函数设复值函数 在矩阵在矩阵 的谱上有的谱上有定义,矩阵定义,矩阵 有有最小多项式最小多项式以及以及待定系数法待定系数法计算原理计算原理 设矩阵设矩阵 的的特征多项式特征多项式为为由带余除法,设有由带余除法,设有确定出余式确定出余式再根据再根据Cayley-Hamilton定理,有定理,有从而从而则

79、可由则可由例例 8 8 求矩阵函数求矩阵函数 ,其中,其中 矩阵矩阵 的的特征多项式特征多项式为为 因此设因此设则则 解得解得因此因此 注意到此例中注意到此例中因此因此 即矩阵的高次幂都可以转化为低次幂,因此即矩阵的高次幂都可以转化为低次幂,因此 从而矩阵幂级数求和问题转化为数项级数求和从而矩阵幂级数求和问题转化为数项级数求和。递推公式法递推公式法计算原理计算原理 由矩阵由矩阵 的的特征多项式或最小多特征多项式或最小多项式项式得到矩阵的递推关系式,代入矩阵函数得到矩阵的递推关系式,代入矩阵函数的矩阵幂级数定义形式中,从而将矩阵函数的矩阵幂级数定义形式中,从而将矩阵函数的计算转化为数项级数求和问

80、题。的计算转化为数项级数求和问题。显然这种方法适用于递推关系式不太复杂的显然这种方法适用于递推关系式不太复杂的情形。情形。例例 9 9 设设4阶矩阵阶矩阵 的特征值为的特征值为 , 求求解:解: 由题由题 的特征多项式为的特征多项式为因此因此从而从而从而从而三、矩阵函数的最完美定义三、矩阵函数的最完美定义(不要求掌握不要求掌握)定义定义1010 设复值函数设复值函数 在闭曲线在闭曲线 的内部的内部解析,且解析,且 包围了包围了 ,则矩阵函数为,则矩阵函数为显然这是复变函数中显然这是复变函数中Cauchy积分定理积分定理的矩阵形的矩阵形式。式。6、矩阵的微分与积分、矩阵的微分与积分实际使用时,矩

81、阵函数与函数矩阵的微分、实际使用时,矩阵函数与函数矩阵的微分、积分常常同时出现。研究矩阵函数和函数积分常常同时出现。研究矩阵函数和函数矩阵的微分、积分,这对研究微分方程组矩阵的微分、积分,这对研究微分方程组以及优化问题等都非常重要。其中尤为重以及优化问题等都非常重要。其中尤为重要的是要的是梯度分析的方法梯度分析的方法,张贤达在,张贤达在矩阵矩阵分析及应用分析及应用中将之列为矩阵分析的五大中将之列为矩阵分析的五大分析方法之首,并有详细介绍。分析方法之首,并有详细介绍。定义定义1 1 设有矩阵函数设有矩阵函数 ,其中,其中 为常数矩阵。为常数矩阵。则则 是关于参数是关于参数 的函数矩阵,其导数(如

82、的函数矩阵,其导数(如果存在的话)为果存在的话)为其积分可参照函数矩阵的积分。其积分可参照函数矩阵的积分。一、含参矩阵函数的微分和积分一、含参矩阵函数的微分和积分例例1 1 矩阵矩阵 为任意常量方阵,则为任意常量方阵,则例例 2 2 已知已知 (1)求矩阵求矩阵 ; (2)求求 。注意到注意到 时,时, ,因此,因此 解:解:(1 1)两边对两边对 求导,得求导,得解:解:(2 2)各元素分别)各元素分别对对 求定积分,得求定积分,得%exm507.m syms t% 函数矩阵SS=sin(2*t)+3*sin(t) 5*sin(2*t)-sin(t); 3*sin(2*t)-sin(t) 5

83、*sin(2*t)+sin(t);DS=diff(S,t) % 调用内置函数diff求S对t的导数ans = 2*cos(2*t) + 3*cos(t), 10*cos(2*t) - cos(t) 6*cos(2*t) - cos(t), 10*cos(2*t) + cos(t)%exm507.m(续)(续) syms t% 函数矩阵SS=sin(2*t)+3*sin(t) 5*sin(2*t)-sin(t); 3*sin(2*t)-sin(t) 5*sin(2*t)+sin(t);syms a b % 声明符号变量a,bIS=int(S,t,a, b) % 调用内置函数int对S从a到b求定

84、积分IS = (cos(a) - cos(b)*(cos(a) + cos(b) + 3), (cos(a) - cos(b)*(5*cos(a) + 5*cos(b) - 1) (cos(a) - cos(b)*(3*cos(a) + 3*cos(b) - 1), (cos(a) - cos(b)*(5*cos(a) + 5*cos(b) + 1)二、函数对向量的微分二、函数对向量的微分定义定义3 3 设有多元函数设有多元函数 。定义定义函数函数 对对 的微分的微分( (即即梯度梯度) )为向量为向量显然,梯度的各分量给出了标量函数在该分量上显然,梯度的各分量给出了标量函数在该分量上的变化率

85、,从而指出了此函数的的变化率,从而指出了此函数的最大增长率最大增长率。例例4 4 对双线性型对双线性型有有特别地,有特别地,有 对二次型对二次型 ,有有 特别地,当特别地,当 对称对称时,有时,有有有例例5 5 当当 对称时,对对称时,对二次泛函二次泛函因此求二次泛函因此求二次泛函 的极值问题转化为求方的极值问题转化为求方程组程组 的解,即二次泛函的解,即二次泛函 的稳的稳定定( (Stationary) )点是可能的极值点。点是可能的极值点。%exm508.msyms x1 x2 a b c d x=x1 ;x2,y=y1; y2z=y1 y2; %引入z的目的是简化结果,同理引入ATA=a

86、 b; c d ;AT=a c;b d;f=z *A*x; % % 线性型线性型线性型线性型f fR1=jacobian(f,x) % 调用内置函数jacobian求f对x的导数AT*yR1 = a*y1 + c*y2, b*y1 + d*y2 ans = a*y1 + c*y2 b*y1 + d*y2理论结果是列向量,理论结果是列向量,但显示为但显示为行向量行向量%exm508.m(续)(续)syms x1 x2 a b c d x=x1 ;x2,y=y1; y2z=y1 y2; %引入z的目的是简化结果,同理引入ATA=a b; c d ;AT=a c ; b df=z *A*x; % %

87、 线性型线性型线性型线性型f fR2=jacobian(f,y) % 调用内置函数jacobian求f对y的导数A*xR2 = a*x1 + b*x2, c*x1 + d*x2 ans = a*x1 + b*x2 c*x1 + d*x2理论结果是列向量,理论结果是列向量,但显示为但显示为行向量行向量%exm508.m(续)(续)syms x1 x2 a b c d x=x1 ;x2;z=x1 x2; %引入z的目的是简化结果,同理引入ATA=a b; c d ;AT=a c ; b df=z *A*x; % % 二次型二次型二次型二次型f fR3=jacobian(f,x) % 调用内置函数j

88、acobian求f对x的导数(A+AT)*xR3 = 2*a*x1 + b*x2 + c*x2, b*x1 + c*x1 + 2*d*x2 ans = 2*a*x1 + x2*(b + c) 2*d*x2 + x1*(b + c)理论结果是列向量,理论结果是列向量,但显示为但显示为行向量行向量定义定义6 6 设有多元函数设有多元函数 。定义定义函数函数 对对 的微分的微分( (即即行梯度行梯度) )为为行向量行向量定义定义7 7 行行向量值函数向量值函数 对列向量对列向量 的微分的微分为为Jacobi矩阵矩阵(行对列行对列)将梯度推广到将梯度推广到向量值函数向量值函数,我们有,我们有定义定义8

89、 8 列列向量值函数向量值函数 对行向量对行向量 的微分的微分为为Jacobi矩阵矩阵(列对行列对行)特别地,当特别地,当 时,有时,有Jacobi行列式行列式例例9 9 对对 , 有有例例10 10 对对 , 有有都是行对列都是行对列例例1111 推广例推广例4的结论。对的结论。对有有例例1212 链式法则链式法则例例 1313 (二重积分的坐标变换二重积分的坐标变换)直角坐标系下的二重积分直角坐标系下的二重积分变成了相应的极坐标下的二重积分变成了相应的极坐标下的二重积分经过变换经过变换定义定义1414 多元函数多元函数 对列对列向量向量 的二阶微分的二阶微分为为Hessian矩阵矩阵其其H

90、essian矩阵为矩阵为例例 15 15 当当 对称时,对对称时,对二次泛函二次泛函如果矩阵如果矩阵 还是正定的,并且存在还是正定的,并且存在 ,使,使得得 ,则由,则由 可知可知 是二次泛函的局部极小点。是二次泛函的局部极小点。%exm509.msyms x1 x2 a b c d x=x1 ;x2, z=x1 x2; %引入z的目的是简化结果R1=jacobian(z,x) % 调用内置函数jacobian求x对x的导数A=a b; c d;R2=jacobian(z*A,x) % 调用内置函数jacobian求xA对x的导数R1 = 1, 0 0, 1R2 = a, c b, d都是行向

91、量对列向量,都是行向量对列向量,返回的是返回的是Jacobi矩阵矩阵%exm509.m(续)(续)syms x1 x2 a b c d b1 b2 x=x1 ;x2;z=x1 x2; A=a b; b d; % A是对称矩阵B=b1;b2,BT=b1 b2;f=(1/2)*z*A*x-BT*x+c % 二次泛函 fR3=jacobian(f,x) %R3是列向量%列向量对行向量,这里返回的Jacobi矩阵是二次泛%函的Hessian矩阵,即对称矩阵AH=jacobian(R3,z)R3 = a*x1 - b1 + b*x2, b*x1 - b2 + d*x2 H = a, b b, d实际应用

92、中经常要考虑诸如矩阵的迹、矩阵的实际应用中经常要考虑诸如矩阵的迹、矩阵的行列式行列式等矩阵标量函数与矩阵元素值变化之间等矩阵标量函数与矩阵元素值变化之间的关系的关系,比如,比如扰动分析扰动分析中某个矩阵元素值的变中某个矩阵元素值的变化对矩阵的迹的影响等。化对矩阵的迹的影响等。矩阵标量函数显然可矩阵标量函数显然可理解为理解为 元的函数元的函数,即,即因此有必要将梯度推广到因此有必要将梯度推广到矩阵标量函数。矩阵标量函数。三、矩阵标量函数对矩阵的微分三、矩阵标量函数对矩阵的微分定义定义1616 设有矩阵标量函数设有矩阵标量函数 。函数函数 对对 的微分的微分为为梯度梯度矩阵矩阵例例 1818 对双

93、线性型对双线性型有有例例 1717 对矩阵的迹对矩阵的迹有有因此因此例例 1919 对矩阵乘积的迹对矩阵乘积的迹有有四、矩阵对矩阵的微分四、矩阵对矩阵的微分定义定义2020 设设矩阵值函数矩阵值函数 的元素的元素 都是矩阵标量函数。矩阵都是矩阵标量函数。矩阵函数函数 对对 的微分的微分指的是指的是 矩阵矩阵其中其中例例 2121 已知已知 ,设,设 ,求,求解:解: 因为因为所以所以 %exm510.msyms x1 x2 a11 a12 a21 a22 x=x1 ;x2;y=y1 ;y2;z=x1 x2;w=y1 y2;A1=a11 a12 ; a21 a22; f=z*A1*y % % 线

94、性型线性型线性型线性型f fR1=jacobian(f,A1) % 调用内置函数jacobian求f对A1的导数x*wR1 = x1*y1, x2*y1, x1*y2, x2*y2 ans = x1*y1, x1*y2 x2*y1, x2*y2理论结果是矩阵,理论结果是矩阵,但按列排序方式但按列排序方式显示为显示为行向量行向量%exm510.m(续)(续)syms a11 a12 a21 a22 a13 a23syms b1 b2 b3 A1=a11 a12 ; a21 a22; A2=a13 ; a23 ;A=A1 A2; b=b1 ; b2 ; b3 ;B=A*b% 调用内置函数jacob

95、ian求Ab对矩阵A1的导数R2=jacobian(B,A1) )% 调用内置函数jacobian求Ab对列向量A2的导数R3=jacobian(B,A2)R4=jacobian(B,A)R2 = b1, 0, b2, 0 0, b1, 0, b2 R3 = b3, 0 0, b3 R4 = b1, 0, b2, 0, b3, 0, b4, 0 0, b1, 0, b2, 0, b3, 0, b4理论结果是:理论结果是:R2 = R3 = b1, b2 b3 0, 0 0 0, 0 0 b1, b2 b3 R4 = b1, b2, b3, b4 0, 0, 0, 0 0, 0, 0, 0 b1

96、, b2, b3, b4输出结果是:输出结果是:7、矩阵函数的应用、矩阵函数的应用矩阵函数经常与函数矩阵(包括向量值函矩阵函数经常与函数矩阵(包括向量值函数及数及 矩阵)联系在一起。利用分析学矩阵)联系在一起。利用分析学的理论,可以将非线性问题近似成线性问的理论,可以将非线性问题近似成线性问题。事实上,用题。事实上,用“线性化线性化”处理处理非线性问非线性问题是一种重要的思维方式,比如控制中的题是一种重要的思维方式,比如控制中的线性系统理论,其中最典型的就是线性系统理论,其中最典型的就是线性微线性微分方程组在线性系统中的应用分方程组在线性系统中的应用。一、线性常系数齐次微分方程组一、线性常系数

97、齐次微分方程组线性常系数齐次微分方程线性常系数齐次微分方程的通解为的通解为将将 推广到向量,将系数推广到向量,将系数 推广推广到对角矩阵以及块对角矩阵,结论仍然成立到对角矩阵以及块对角矩阵,结论仍然成立吗?吗?此时有此时有对于任意系数矩阵对于任意系数矩阵 ,注意到,注意到Jordan分解分解令令 ,则方程组的,则方程组的最简解耦最简解耦为为因此因此从而从而定理定理1 1 线性常系数齐次微分方程组线性常系数齐次微分方程组的通解为的通解为这里这里 , 是常是常数矩阵,数矩阵,证明证明 由于由于两边积分得两边积分得因此因此例例 2 2 求求线性常系数齐次微分方程组线性常系数齐次微分方程组在下列初始条

98、件下的解:在下列初始条件下的解:解解: 方程组的矩阵形式为方程组的矩阵形式为这里这里根据定理根据定理1,其解为,其解为矩阵矩阵 的的Jordan分解为分解为 ,这里,这里这时这时因此所求微分方程组的解为因此所求微分方程组的解为二、线性常系数非齐次微分方程组二、线性常系数非齐次微分方程组线性常系数非齐次微分方程线性常系数非齐次微分方程的通解为的通解为将将 推广到向量,将系数推广到向量,将系数 推推广到任意矩阵,结论仍然成立吗?广到任意矩阵,结论仍然成立吗?定理定理 3 3 线性常系数非齐次微分方程组线性常系数非齐次微分方程组的通解为的通解为这里这里 ,其他与定理,其他与定理1 1相相同。同。两边

99、积分得两边积分得即即证明证明 用用 乘方程两边,并整理得乘方程两边,并整理得再用再用 乘方程两边,并整理即得结果。乘方程两边,并整理即得结果。例例 4 4 求求线性常系数非齐次微分方程组线性常系数非齐次微分方程组满足初始条件满足初始条件 的解,这里的解,这里解:解:矩阵矩阵 的的Jordan分解为分解为 ,这里这里因此因此因此所求微分方程组的解为因此所求微分方程组的解为%exm511.m A=-1 1 0 ;-4 3 0; 1 0 2; syms t % 声明符号变量t S=expm(A*t); S=simple(S) % 简化矩阵函数的结果 x0=1 1 3; xh=S*x0 xh=simp

100、le(xh)xh = -exp(t)*(t - 1) -exp(t)*(2*t - 1) exp(t)*(t + 3*exp(t)%exm511.m(续续)syms sf=exp(t); exp(t) ; exp(4*t) %自由项fg=exp(s); exp(s) ; exp(4*s)T=simple(expm(-A*s); % e(-As)h=simple(T*g) % e(-As)f(s)xp0=int(h,0,t) %从0到t求e(-As)f(s)的积分xp=S*int(h,0,t); %非齐次的特解xpxp=simple(xp)x=xh+xp; %非齐次的通解xx=simple(x)

101、h = s + 1 2*s + 1 exp(2*s) sxp = -(t*exp(t)*(t - 2)/2 -t*exp(t)*(t - 1) (exp(t)*(exp(3*t) - exp(t) + t2)/2x = -(exp(t)*(t2 - 2)/2 -exp(t)*(t2 + t - 1) (exp(t)*(2*t + exp(3*t) + 5*exp(t) + t2)/2%exm511.m(续)(续) 用用dsolve求解符号微分方程组求解符号微分方程组syms t x1 x2 x3 %声明符号变量x1,x2,x3=dsolve(Dx1=-1*x1+x2,Dx2=-4*x1+3*x

102、2,. Dx3=x1+2*x3,x1(0)=1,x2(0)=1,x3(0)=3)% .是续行符xh=x1;x2;x3 %齐次的通解xhxh = -exp(t)*(t - 1) -exp(t)*(2*t - 1) exp(t)*(t + 3*exp(t)%exm511.m(续)(续) 用用dsolve求解符号微分方程组求解符号微分方程组syms t x1 x2 x3 %声明符号变量x1,x2,x3=dsolve(Dx1=-1*x1+x2+exp(t), . Dx2=-4*x1+3*x2+exp(t),. Dx3=x1+2*x3+exp(4*t), . x1(0)=1,x2(0)=1,x3(0)=

103、3) % .是续行符x=x1;x2;x3 %非齐次的通解xx = -(exp(t)*(t2 - 2)/2 -exp(t)*(t2 + t - 1) (exp(t)*(2*t + exp(3*t) + 5*exp(t) + t2)/2线性定常连续系统线性定常连续系统的的状态方程状态方程为为其通解为其通解为三、应用:三、应用:线性定常系统的状态转移矩阵线性定常系统的状态转移矩阵这里第一项这里第一项(零输入响应零输入响应)是是由初始状态引起的由初始状态引起的系统自由运动系统自由运动,第二项,第二项(零状态响应零状态响应)是是由控制由控制输入输入 所产生的受控运动所产生的受控运动。由于变换矩阵由于变换

104、矩阵 起着一种起着一种状态转移的作用,称为状态转移的作用,称为状态转移矩阵状态转移矩阵。显然它显然它表征了从初始状态表征了从初始状态 到当前状态到当前状态 的的转移关系。而且从本质上看,无论是初始状态转移关系。而且从本质上看,无论是初始状态引起的运动(引起的运动(第一项第一项),还是由输入引起的运),还是由输入引起的运动(动(第二项第二项),都是一种状态转移,都可用状),都是一种状态转移,都可用状态转移矩阵来表示。实际上态转移矩阵来表示。实际上根据定义可以证明,状态转移矩阵满足根据定义可以证明,状态转移矩阵满足以及以及这与下列关系显然吻合:这与下列关系显然吻合:四、矩阵微分方程四、矩阵微分方程

105、很容易验证,很容易验证,矩阵微分方程矩阵微分方程的解为的解为这里这里 是未知函数矩阵。是未知函数矩阵。而且,可以成立而且,可以成立Jacobi恒等式恒等式:因此,当因此,当 为非奇异矩阵为非奇异矩阵时,方程时,方程 的的解都是非奇异的。解都是非奇异的。特别地,当特别地,当 时,方程时,方程 的解的解 称为称为 的的基本解矩阵基本解矩阵。Jacobi恒等式恒等式的证明:的证明:注意到注意到这说明方程这说明方程 的解的解 都可以用基本解矩都可以用基本解矩阵阵 来表示,即来表示,即令令 ,则,则那么基本解矩阵那么基本解矩阵 又如何表示呢?又如何表示呢?先退到常系数线性齐次微分方程组先退到常系数线性齐

106、次微分方程组它的解为它的解为因此我们猜测:因此我们猜测:令令 ,则,则将将 展开成矩阵幂级数:展开成矩阵幂级数:又因为又因为因此只有当因此只有当 时,时,才有才有并且在该条件下,方程并且在该条件下,方程 的解为的解为根据矩阵微分方程理论,根据矩阵微分方程理论,线性时变系统齐次线性时变系统齐次状状态方程态方程的通解应为的通解应为五、应用:五、应用:线性时变系统的状态转移矩阵线性时变系统的状态转移矩阵这里这里基本解矩阵基本解矩阵 为下列方程的解:为下列方程的解:基本解矩阵基本解矩阵 仍然起到状态转移的效果,仍然起到状态转移的效果,那么它是否还具有那么它是否还具有 的性质呢?的性质呢?将方程将方程

107、的通解记为的通解记为 ,则很容易验证则很容易验证此通解对初始条件是线性的此通解对初始条件是线性的,即,即因此,因此, 线性无关当且仅当线性无关当且仅当 也线性无关也线性无关注意到注意到因此因此这里矩阵这里矩阵 满足方程满足方程 ,因此就,因此就是基本解矩阵是基本解矩阵 。如果以方程如果以方程 的的 个线性无关解为列构成个线性无关解为列构成矩阵矩阵 ,那么容易验证,那么容易验证由此出发,显然也可以证明由此出发,显然也可以证明对对线性时变连续系统非齐次状态方程线性时变连续系统非齐次状态方程类比类比可知,其通解应为可知,其通解应为通解中,第一项通解中,第一项(零输入响应零输入响应)仍是仍是由初始状态

108、由初始状态 引起的系统自由运动引起的系统自由运动,第二项,第二项(零状态响应零状态响应)仍仍是是由控制输入由控制输入 所产生的受控运动。所产生的受控运动。前已提及,只有当前已提及,只有当 时,线性时变系统的状态响应才具有上述封闭时,线性时变系统的状态响应才具有上述封闭形式。但此条件一般不成立。因此这种统一的形式。但此条件一般不成立。因此这种统一的表示更具有理论意义。表示更具有理论意义。设设 ,则,则证明证明:因此因此两边积分,得两边积分,得对一个控制系统,存在对一个控制系统,存在kalman提出的两个基本问提出的两个基本问题题: 1)在有限时间内,控制作用能否使系统从初在有限时间内,控制作用能

109、否使系统从初始状态转移到要求的状态?始状态转移到要求的状态?此即控制作用对状态变此即控制作用对状态变量的支配能力(量的支配能力(状态的能控性问题状态的能控性问题)。)。 2)在有限时间内,能否通过对系统输出的测在有限时间内,能否通过对系统输出的测定来估计系统的初始状态?定来估计系统的初始状态?此即系统的输出量能否此即系统的输出量能否反映状态变量(反映状态变量(状态的能观测性问题状态的能观测性问题)。)。六、应用:六、应用:线性时变系统的能控性和能观测性线性时变系统的能控性和能观测性定义定义5 5 对于线性时变系统对于线性时变系统如果在任意有限时间区间如果在任意有限时间区间 内,存在控制内,存在

110、控制向量向量 ,将系统从初始状态,将系统从初始状态 转移到转移到任意终端状态任意终端状态 ,则称此,则称此系统是能控的系统是能控的。定理定理6 6 线性时变系统线性时变系统 在定义时间区间在定义时间区间 内状态完全能控的充要条件是内状态完全能控的充要条件是Gram矩阵矩阵如何判定系统的能控性呢?如何判定系统的能控性呢?定理定理6从理论上给出了系统是否完全能控的统从理论上给出了系统是否完全能控的统一判别准则,但用于实际则要计算状态转移矩一判别准则,但用于实际则要计算状态转移矩阵,显然困难。阵,显然困难。非奇异。我们称矩阵非奇异。我们称矩阵 为为能控性矩阵能控性矩阵。构造控制向量构造控制向量则则因

111、此因此这说明任何初始状态这说明任何初始状态 在时间在时间 内都内都可以被转移到零状态。可以被转移到零状态。对于线性定常系统对于线性定常系统假设假设 且且 ,则,则(Cayley-Hamilton定理定理)即有方程组即有方程组因此,如果因此,如果 矩阵矩阵 行满秩,则从行满秩,则从方程组方程组 可得控制信号可得控制信号 。行满秩行满秩。定理定理7 7 线性定常系统线性定常系统 在定义时间区间在定义时间区间 内状态完全能控的充要条件是内状态完全能控的充要条件是能控性矩阵能控性矩阵定义定义8 8 对于线性时变系统对于线性时变系统如果在任意有限时间区间如果在任意有限时间区间 内,能通过观内,能通过观察

112、系统的输出向量察系统的输出向量 而唯一地确定系统的而唯一地确定系统的初始状态初始状态 ,则称此,则称此系统是能观测的系统是能观测的。定理定理9 9 线性时变系统线性时变系统 在定义时间区间在定义时间区间 内状态完全能观测的充要条件是内状态完全能观测的充要条件是Gram矩阵矩阵如何判定系统的能观测性呢?如何判定系统的能观测性呢?定理定理9也从理论上给出了系统是否完全能观测也从理论上给出了系统是否完全能观测的统一判别准则,但用于实际也要计算状态转的统一判别准则,但用于实际也要计算状态转移矩阵,显然困难。移矩阵,显然困难。非奇异。我们称矩阵非奇异。我们称矩阵 为为能观测性矩阵能观测性矩阵因为因为所以所以从而从而所以当所以当 非奇异时可唯一确定非奇异时可唯一确定 对于线性定常系统对于线性定常系统假设假设 ,则,则 ,从而,从而(Cayley-Hamilton定理定理)即有方程组即有方程组由于矩阵由于矩阵 非奇异,因此当矩阵非奇异,因此当矩阵 列满列满秩时,由输出向量秩时,由输出向量 可得初始状态可得初始状态列满秩列满秩。定理定理1010线性定常系统线性定常系统 在定义时间区间在定义时间区间 内状态完全能观测的充要条件是内状态完全能观测的充要条件是能观测性矩阵能观测性矩阵

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号