《智能控制chap》PPT课件.ppt

资源描述

《《智能控制chap》PPT课件.ppt》由会员分享，可在线阅读，更多相关《《智能控制chap》PPT课件.ppt（59页珍藏版）》请在金锄头文库上搜索。

1、第十一章迭代学习控制实际控制中存在一类轨迹跟踪问题它的控制任务是寻找控制律使得被控对象输出在有限时间上沿着整个期望轨迹实现零误差轨迹跟踪这列跟踪问题是具有挑战性的控制问题人们在处理实际场合中的重复操作任务时往往依据对象的可重复动态行为与期望行为的差距来调整决策通过重复操作使得对象行为与期望行为的配合达到要求这时衡量动态行为的指标是某种满意指标迭代学习控制 ILC IterativeLearningControl 的思想最初由日本学者Uchiyama于1978年提出 23 于1984年由Arimoto等人 24 做出了开创性的研究这些学者借鉴人们在重复过程中追求满意指标达到

2、期望行为的简单原理成功地使得具有强耦合非线性多变量的工业机器人快速高精度地执行轨迹跟踪任务其基本做法是对于一个在有限时间区间上执行轨迹跟踪任务的机器人利用前一次或前几次操作时测得的误差信息修正控制输入使得该重复任务在下一次操作过程中做得更好如此不断重复直至在整个时间区间上输出轨迹跟踪上期望轨迹迭代学习控制适合于具有重复运动性质的被控对象通过迭代修正达到某种控制目标的改善迭代学习控制方法不依赖于系统的精确数学模型能在给定的时间范围内以非常简单的算法实现不确定性高的非线性强耦合动态系统的控制并高精度跟踪给定期望轨迹因而一经推出就在运动控制领域得到了广泛的运用迭代学习控

3、制方法具有很强的工程背景这些背景包括执行诸如焊接喷涂装配搬运等重复任务的工业机器人指令信号为周期函数的伺服系统数控机床磁盘光盘驱动系统机械制造中使用的坐标测量机等由于迭代学习控制模拟了人脑学习和自我调节的功能因而是一种典型的智能控制方法 25 经历了三十多年的发展迭代学习控制已成为智能控制中具有严格数学描述的一个分支目前迭代学习控制在学习算法收敛性鲁棒性学习速度及工程应用研究上取得了很大的进展 11 1基本原理设被控对象的动态过程为 11 1 式中分别为系统的状态输出和输入变量为适当维数的向量函数其结构与参数均未知若期望控制存在则迭代学习控制的目标

4、为给定期望输出和每次运行的初始状态要求在给定的时间内按照一定的学习控制算法通过多次重复的运行使控制输入而系统输出第k次运行时式 11 1 表示为 11 2 跟踪误差为 11 3 迭代学习控制可分为开环学习和闭环学习开环学习控制的方法是第k 1次的控制等于第k次控制再加上第k次输出误差的校正项即 11 4 闭环学习策略是取第K 1次运行的误差作为学习的修正项即 11 5 式中 L为线性或非线性算子 11 2基本迭代学习控制算法Arimoto等首先给出了线性时变连续系统的D型迭代学习控制律 24 11 6 式中为常数增益矩阵在D型算法的基础上相继出现了P型 PI型 PD

5、型迭代学习控制律从一般意义来看它们都是PID型迭代学习控制律的特殊形式 PID迭代学习控制律表示为 11 7 式中为学习增益矩阵算法中的误差信息使用称为开环迭代学习控制如果使用则称为闭环迭代学习控制如果同时使用和则称为开闭环迭代学习控制此外还有高阶迭代学习控制算法最优迭代学习控制算法遗忘因子迭代学习控制算法和反馈前馈迭代学习控制算法等 11 3迭代学习控制的关键技术11 3 1学习算法的稳定性和收敛性稳定性与收敛性问题是研究当学习律与被控系统满足什么条件时迭代学习控制过程才是稳定收敛的算法的稳定性保证了随着学习次数的增加控制系统不发散但是对于学习控制系统而言仅仅

6、稳定是没有实际意义的只有使学习过程收敛到真值才能保证得到的控制为某种意义下最优的控制收敛是对学习控制的最基本的要求多数学者在提出新的学习律的同时基于被控对象的一些假设给出了收敛的条件例如 Arimoto在最初提出PID型学习控制律时仅针对线性系统在D型学习律下的稳定性和收敛条件作了证明 11 3 2初始值问题运用迭代学习控制技术设计控制器时只需要通过重复操作获得的受控对象的误差或误差导数信号在这种控制技术中迭代学习总要从某初始点开始初始点指初始状态或初始输出几乎所有的收敛性证明都要求初始条件是相同的解决迭代学习控制理论中的初始条件问题一直是人们追求的目标之一目前已

7、提出的迭代学习控制算法大多数要求被控系统每次运行时的初始状态在期望轨迹对应的初始状态上即满足初始条件 11 8 当系统的初始状态不在期望轨迹上而在期望轨迹的某一很小的邻域内时通常把这类问题归结为学习控制的鲁棒性问题研究 11 3 3学习速度问题在迭代学习算法研究中其收敛条件基本上都是在学习次数下给出的而在实际应用场合学习次数显然是没有任何实际意义的因此如何使迭代学习过程更快地收敛于期望值是迭代学习控制研究中的另一个重要问题迭代学习控制本质上是一种前馈控制技术大部分学习律尽管证明了学习收敛的充分条件但收敛速度还是很慢可利用多次学习过程中得到的知识来改进后续学习过程的速度

8、例如采用高阶迭代控制算法带遗忘因子的学习律利用当前项或反馈配置等方法来构造学习律可使收敛速度大大加快 11 3 4鲁棒性问题迭代学习控制理论的提出有浓厚的工程背景因此仅仅在无干扰条件下讨论收敛性问题是不够的还应讨论存在各种干扰的情形下系统的跟踪性能一个实际运行的迭代学习控制系统除了存在初始偏移外还或多或少存在状态扰动测量噪声输入扰动等各种干扰鲁棒性问题讨论存在各种干扰时迭代学习控制系统的跟踪性能具体地说一个迭代学习控制系统是鲁棒的是指系统在各种有界干扰的影响下其迭代轨迹能收敛到期望轨迹的邻域内而当这些干扰消除时迭代轨迹会收敛到期望轨迹 11 4机械手轨迹跟踪迭

9、代学习控制仿真实例11 4 1控制器设计考虑一个关节的机器人其动态性能可以由以下二阶非线性微分方程描述 11 9 式中为关节角位移量为机器人的惯性矩阵表示离心力和哥氏力为重力项为控制力矩为各种误差和扰动设系统所要跟踪的期望轨迹为系统第次输出为令在学习开始时系统的初始状态为学习控制的任务为通过学习控制律设计使第次运动误差减少采用三种基于反馈的迭代学习控制律 1 闭环D型 11 10 2 闭环PD型 11 11 3 指数变增益D型 11 12 11 4 2仿真实例针对二关节机械手介绍一种机器人PD型反馈迭代学习控制的仿真设计方法针对二关节机器人控制系统式 11 9

10、各项表示为干扰项为机器人系统参数为采用三种闭环迭代学习控制律其中为D型迭代学习控制为PD型迭代学习控制为变增益指数D型迭代学习控制两个关节的位置指令分别为和为了保证被控对象初始输出与指令初值一致取被控对象的初始状态为取PD型迭代学习控制即仿真结果如图11 1至图11 3所示图11 120次迭代学习的跟踪过程图11 2第20次迭代学习的位置跟踪图11 320次迭代过程中误差范数的收敛过程 11 5线性时变连续系统迭代学习控制11 5 1系统描述Arimoto等 24 给出了线性时变连续系统 11 13 的开环PID型迭代学习控制律 11 14 其中为学习增益矩阵 1

11、1 5 2控制器设计及收敛性分析定理1若由式 11 13 和式 11 14 式描述的系统满足如下条件 24 1 2 每次迭代初始条件一致即则当时有证明由式 11 13 及条件式 2 得则即系统满足初始条件非齐次一阶线性微分方程的解为取则由于则即将PID型控制律式 11 14 代入上式则第k 1次输出的误差为 11 15 利用分部积分公式令有 11 16 将式 11 16 代入式 11 15 得 11 17 将式 11 17 两端取范数有 11 18 式中根据范数的定义可知函数的范数为将式 11 18 两端同乘以并考虑到有 11 19 根据范数的定义函数的范数

12、为由于则有将式 11 19 的结果应用于下式得其中即 11 20 则 11 19 和 11 20 代入 11 18 得 11 21 其中由于则当取足够大时可以使因此定理得证如果将控制律式 11 14 中的改为则为闭环PID型迭代学习控制律同定理1的证明过程可证明闭环PID迭代学习控制律 11 5 3仿真实例考虑2输入2输出线性系统期望跟踪轨迹为由于取可满足定理1中的条件 1 在控制律式 11 14 中取系统的初始状态为在chap11 2sim mdl程序中选择Simulink的ManualSwitch开关将开关向下取PD型开环迭代学习控制律仿真

13、结果见图11 4至11 6所示将开关向上采用PD型闭环迭代学习控制律仿真结果见图11 7至11 9所示可见闭环收敛速度好于开环收敛速度图11 430次迭代学习的跟踪过程开环PD控制图11 5第30次迭代学习的位置跟踪开环PD控制图11 630次迭代过程中误差最大绝对值的收敛过程开环PD控制图11 730次迭代学习的跟踪过程闭环PD控制图11 8第30次迭代学习的位置跟踪闭环PD控制图11 930次迭代过程中误差最大绝对值的收敛过程闭环PD控制 11 6移动机器人轨迹跟踪迭代学习控制移动机器人是一种在复杂的环境下工作的具有自规划自组织自适应能力的机器人在移

14、动机器人的相关技术研究中控制技术是其核心技术也是其实现真正的智能化和完全的自主移动的关键技术移动机器人具有时变强耦合和非线性的动力学特征由于测量和建模的不精确加上负载的变化以及外部扰动的影响实际上无法得到移动机器人精确完整的运动模型通过对文 27 的控制方法进行详细推导及仿真分析研究一类移动机器人迭代学习离散控制的设计及仿真方法 11 6 1数学基础代表N维欧氏空间定义向量范数为 11 22 其中为阶实数矩阵定义矩阵范数为 11 23 其中为矩阵的最大特征值取定义范数为 11 24 11 6 2系统描述图11 10为移动机器人运动模型它在同一根轴上有两个独立的推

15、进轮机器人在二维空间移动点代表机器人的当前位置广义坐标定义为和为直角坐标系下的坐标为机器人的方位角当机器人的标定方向为地理坐标系的横轴正半轴时定义为0 移动机器人受不完全约束的影响而只能在驱动轮轴的方向运动点的线速度和角速度定义为和图11 10移动机器人运动模型根据图11 10 针对P点移动机器人的离散运动学方程可由下式描述 11 25 其中为采样时间机器人状态向量为速度向量为式 11 25 可写为 11 26 其中 11 27 如图11 10所示期望轨迹为运动轨迹跟踪的控制问题就是为确定使跟踪线速度和角速度误差分别为 11 28 11 29 移动机器人迭代

16、学习控制系统结构如图11 11所示图11 11移动机器人迭代学习控制系统结构移动机器人离散运动学方程可描述如下 11 30 11 31 其中为状态干扰为输出测量噪声为系统输出考虑迭代过程由 11 30 和 11 31 可得 11 32 11 33 其中为迭代次数为离散时间分别代表第次迭代的状态输入输出状态干扰和输出噪声机器人运动方程 11 32 和 11 33 满足下列性质和假设性质1 考虑理想情况取均为零则期望轨迹的方程可写为 11 34 11 35 性质2 矩阵函数满足Lipschitz条件为正常数 11 36 性质3 矩阵是有界的为正常数矩阵为的满秩矩阵假设1 假设2 干扰和噪声有界 11 37 其中为正常数假设3 在每一次迭代中轨迹都是从的邻域开始即 11 6 3控制律设计及收敛性分析迭代学习控制律设计为 11 38 对于第i次迭代跟踪误差信号为和为学习的增益矩阵满足通过控制律 11 38 使状态变量控制输入系统输出分别收敛于期望值定理1 考虑离散系统 11 32 和 11 33 满足假设1 3 采用控制律 11 38

展开阅读全文