吴受章最优控制讲授提纲

上传人:wt****50 文档编号:54827994 上传时间:2018-09-20 格式:PPT 页数:92 大小:1.30MB
返回 下载 相关 举报
吴受章最优控制讲授提纲_第1页
第1页 / 共92页
吴受章最优控制讲授提纲_第2页
第2页 / 共92页
吴受章最优控制讲授提纲_第3页
第3页 / 共92页
吴受章最优控制讲授提纲_第4页
第4页 / 共92页
吴受章最优控制讲授提纲_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《吴受章最优控制讲授提纲》由会员分享,可在线阅读,更多相关《吴受章最优控制讲授提纲(92页珍藏版)》请在金锄头文库上搜索。

1、最优控制讲授提纲,* 配合教材: 最优控制理论与应用吴受章编著 机械工业出版社 2008年,1,使用说明,讲课开始时,学生需人手一册教材,已可开讲。讲授提纲用幻灯片放映,仅起画龙点睛作用(若无幻灯片放映,可用板书代之)。关键是:任课教师是否习惯此种讲课方式。实践表明:学生的收效却更好。 任课教师都有自己的习惯、风格,都喜爱自己的讲稿,因此,只适宜于列出讲授提纲供参考,逐次的讲稿宜自己用Power Point编写。此时,教材和讲授提纲可供参照,并亦可各自按需补充些内容。此外,讲课进度的安排也因人而异,有40学时全讲课的,有压縮课时并添加大作业的,有写读文献的报告的,故不宜编写划一的讲稿(写了也是

2、白写)。,2,绪论,从经典的反馈控制到最优控制从特点看控制器设计经历的“改朝换代”,3,特 点 经典反馈控制 最优控制,上世纪40-50年代起的炮火控制 SISO,输入输出描写 低阶传递函数 应无未建模动态 手算,作图,憑经验 不计控制能耗 模拟器件实现 军工及民用工业,上世纪60年代起延伸至今的航空航天 MIMO,内部描写 低阶状态方程 应无未建模动态 计算机,优化,算法 考虑控制能耗 数字器件实现 航空航天工业,4,第1章 变分法,引言 变分问题求解的两条路 本章的重要性,5,泛函,定义 1-1(泛函)图 1-1 弧长 ,目标泛函定义 1-2(函数空间中的距离)图 1-2 曲线间的距离定义

3、 1-3(n级邻区和泛函的局部极值)图 1-3 泛函求局部极值定义 1-4(泛函的全局极值),6,变分的推演,泛函求极值从式(1-1)推导式(1-6)的过程: 写出目标值的差,式(1-2) 用导数中值定理,得式(1-5) 式(1-5)的第二项为高阶无穷小 改用变分记号,式(1-6),7,(续)变分的推演,式(1-1)的被积函数用 Taylor 级数展开后的线性主部,即式(1-6)第一项的被积函数 定义 1-5(函数的一次变分)式(1-7),式(1-8) 定义 1-6(泛函的一次变分)式(1-9),8,(续)变分的推演,定义 1-7(泛函的二次变分)式(1-10)泛函的高次变分,式(1-11)

4、泛函极值存在的必要条件,式(1-12) 泛函局部极大值存在的充分条件,式(1-13) 泛函局部极小值存在的充分条件,式(1-14),9,Euler方程和横截条件,泛函求极值从式(1-16)推导式(1-21)的过程: 用分部积分得式(1-18) 用推论1-1得式(1-19)及式(1-20) 用推论1-2得式(1-21) TPBVP(两点边值问题)例1-3,10,向量情况,泛函求极值从式(1-25)推导式(1-32)的过程: 成对应用式(1-18),得式(1-26) 分类及合并,得式(1-27) 仿式(1-21)及式(1-23),得式(1-30)及式(1-31) 向量形式,式(1-32),11,有

5、约束的情况,函数的约束优化与Lagrange乘子式(1-33) 化为无约束优化,式(1-34) 两个默认的特点 函数的向量约束优化与Lagrange乘子向量式(1-35),12,(续)有约束的情况,化为无约束优化, 式(1-37) 两个默认的特点 泛函的约束优化 约束方程变量多、方程少 化为无约束优化 定理1-1的叙述:式(1-39)与式(1-40)等价,13,(续)有约束的情况,定理1-1的证明过程: 为何要分两步走 第1步证明 式(1-40)改写为式(1-42) 泛函极值存在的必要条件,式(1-43) 结合约束方程求解,结果满足约束方程,式(1-40)的解即为式(1-39)的解 第2步证明

6、,14,(续)有约束的情况,式(1-39)的构成:式(1-25)及约束方程 式(1-25)所示泛函极值存在的必要条件,式(1-44) 对约束方程取一次变分,式(1-45)即式(1-46) 构造式(1-49) 式(1-44)的第一式与式(1-49)合成,得式(1-51) 用约束方程和式(1-51),构造式(1-52),15,(续)有约束的情况,式(1-53)与式(1-52)的差别,得式(1-55)及式(1-56),式(1-39)的解即为式(1-40)的解 两步证明的完成,才说明式(1-39)与式(1-40)完全等价 定理1-1推广到微分系统,16,端点可变的情况,两端可变可化为一端可变,终端可变

7、 目标值的差推演得式(1-61)利用积分中值定理及式(1-6),式(1-18)由式(1-61)得式(1-62) 图1-4与式(1-63) 从式(1-64)得式(1-65) 推广到式(1-67),17,变分的另一种定义,定义1-8(函数的一次变分) 定义1-9(泛函的一次变分)式(1-69) 对求导,得J的一次变分,式(1-71) 式(1-72)同式(1-9),18,变分与Frchet微分,定义1-10(Frchet微分)线性逼近的误差,式(1-74)对照图1-5及式(1-75)规定了线性逼近方式 Frchet微分,式(1-76) 计算Frchet微分的方法,式(1-77) 泛函的一次变分即Fr

8、chet微分,对照式(1-78),式(1-79),19,小结,泛函求极值变分常微分方程的TPBVP 本章仅为寻求极值曲线,并未涉及寻求极值曲面 变分法的现代进展为变分原理(不是第5章的最大值原理),20,第2章 连续系统最优控制,引言 了解受控对象建模提出概念性目标优化问题提法式(2-1)Bolza问题,Lagrange问题,Mayer问题 折衷优化 如何套用第1章公式,21,时间端点固定的情况,式(2-2)的背景 化为无约束优化问题式(2-3),Hamilton函数 式(2-3)取一次变分,分两部分式(2-7)由式(2-4)及式(2-6)组成 横截条件,伴随方程,耦合方程,状态方程,式(2-

9、10),22,(续)时间端点固定的情况,沿最优轨线H为常量的条件 横截条件三种情况 TPBVP 例2-1,例2-2,例2-3,例2-4,23,有终端函数约束的情况,式(2-60)的背景 化为无约束优化问题, 式(2-61) 式(2-61)取一次变分,式(2-63) 横截条件,伴随方程,耦合方程,状态方程,终端函数, 式(2-67) 例2-5,24,终时不指定的情况,式(2-78)的背景 化为无约束优化问题,式(2-79) 式(2-79)取一次变分,分三部分 式(2-84)由式(2-80),式(2-81)及式(2-83)组成 横截条件,伴随方程,耦合方程,状态方程,终端函数, 式(2-88) 例

10、2-6,25,考虑其它几种约束,积分约束化为微商约束和终态约束 状态和控制的等式约束 状态和控制的不等式约束用松弛变量化为状态和控制的等式约束 角隅条件,式(2-120),26,用符号数学工具箱 求TPBVP的解析解,见程序集,27,小结,TPBVP的解析解 多谢MATLAB的符号数学工具箱,它改变了求取TPBVP的解析解的面貌 要关注符号计算的进展(包括新版本MATLAB中的符号数学工具箱) 确定性最优控制开环与闭环不分,28,第3章 线性连续系统的 二次型调节器,引言 优化问题提法, 式(3-1) 物理意义 重视LQR的原因,29,有限时间(状态)调节器,时变情况 式(3-1)化为无约束优

11、化问题 泛函极值存在的必要条件:横截条件,伴随方程,耦合方程,状态方程 TPBVP,式(3-6)Hamilton矩阵(t) 式(3-7) 式(3-12) 矩阵Riccati微分方程,式(3-17),30,全状态反馈,Kalman增益,式(3-19) P(t)的性质 对称,半正定 P(t)的计算,Euler法 最优反馈控制的结构,图3-1 x(t)的重构,图3-2 对加权矩阵的要求,31,(续)有限时间(状态)调节器,(续)有限时间(状态)调节器,非时变情况 式(3-1) 式(3-1) 式(3-17) 式(3-17) 式(3-18) 式(3-18) 式(3-19) 式(3-19) P(t)的解析

12、解,式(3-28),几种解法 例3-1,例3-2 观察终时tf对Kalman增益K(t)的影响见程序集和图3-3,32,(续)有限时间(状态)调节器,P(t)的数值解见程序集,33,有限时间输出调节器,优化问题提法式(3-58) 矩阵Riccati 微分方程,式(3-60) 全状态反馈,Kalman增益K(t)式(3-62),34,无限时间输出调节器,优化问题提法,式(3-63) 定理3-1有4部份: (a) P(t)= Pbar=const的充要条件为(A , B)能稳定能观性分解,式(3-66)代入系数矩阵,式(3-64)即式(3-68)从式(3-69)的第二式、第三式和边界条件得 P12

13、(t)=O ,P22(t)=O,得式(3-70)不能观极点在A22中,不影响P(t),35,(续)无限时间输出调节器,设能观,不会影响证明P(t)= Pbar=const 从能控性分解式(3-71)出发 证必要条件(能稳定):设(A , B)不能稳定(不稳定极点不能控)不能控极点在A22中,输出z(t)和 J 都发散按式(3-25),P(t)不存在,Pbar不存在 证充分条件(能稳定):设能稳定(不稳定极点能控)式(3-73)说明P(t)有上界,36,(续)无限时间输出调节器,式(3-73)单调非减,得P(t)单调非减有唯一极限P(t)= Pbar=const (b) 若能稳定,能检测,则唯一

14、的Pbar半正定P(t)= Pbar=const,式(3-64)退化为矩阵Riccati代数方程,式(3-65),前已证有唯一极限Pbar 能检测(不能观极点稳定),不考虑不能观部分由式(3-24)及式(3-25)得 Pbar半正定(c) u(t)稳定的充要条件为能稳定,能检测,37,(续)无限时间输出调节器,证必要条件: 必需能稳定和能检测,否则不稳定极点不能控,不能观极点不稳定 证充分条件: 能控性分解式(3-71),得式(3-75) 从式(3-75)可写出式(3-76),解出P11(t) 能控性分解中的A11含能控的极点(包括不稳定的极点), A11-B1R-1(B1)TP11渐近稳定A

15、22含不能控的极点(但包括稳定的极点),38,(续)无限时间输出调节器,(A11,B1)能控包含(A11,B1)能稳定,按本定理(a) P11(t)=P11bar=const 的充要条件为(A11,B1)能稳定 最优反馈控制为式(3-77) 反馈系统为式(3-78) 分块上三角形矩阵的特征值取决于对角块各矩阵的,因A11-B1R-1(B1)TP11渐近稳定及A22渐近稳定,故反馈系统渐近稳定,39,(续)无限时间输出调节器,(d)设Q正定,Pbar正定的充要条件为能观 证必要条件(能观):设部分能观,能观性分解,式(3-66),在本定理(a)中有式(3-70)det P(t)=0, P(t)非

16、正定,Pbar非正定 证充分条件(能观):反设能观,但Pbar非正定存在x0 0 ,不加控制,却可使输出为0,荒谬,故Pbar 正定,40,(续)无限时间输出调节器,Pbar的解析解 令非异变换T,式(3-82) 对Hamilton矩阵可验证式(3-83) 式(3-84)表示 阵有特征值 式(3-85)表示 阵有特征值 - 阵无复特征值 模态阵M使 阵分块对角化,式(3-87) 有相异特征值时,分块对角化,41,(续)无限时间输出调节器,有重复特征值时,Jordan块从式(3-87) 式(3-92)Pbar=M21(M11)-1 见程序集 Pbar的数值解见程序集 用控制系统工具箱见程序集,42,使用 LQR的系统的稳定裕量,式(3-102)式(3-109),Kalman不等式单输入系统的Kalman不等式式(3-110) 式(3-111) 系统方框图,图3-6 开环传递函数与开环频率特性 图3-7,频率特性 幅度余量无限大 相位余量至少600 以全状态反馈为条件,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号