智能控制之 迭代学习控制系统

上传人:ap****ve 文档编号:118730739 上传时间:2019-12-24 格式:PPT 页数:58 大小:1.28MB
返回 下载 相关 举报
智能控制之 迭代学习控制系统_第1页
第1页 / 共58页
智能控制之 迭代学习控制系统_第2页
第2页 / 共58页
智能控制之 迭代学习控制系统_第3页
第3页 / 共58页
智能控制之 迭代学习控制系统_第4页
第4页 / 共58页
智能控制之 迭代学习控制系统_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《智能控制之 迭代学习控制系统》由会员分享,可在线阅读,更多相关《智能控制之 迭代学习控制系统(58页珍藏版)》请在金锄头文库上搜索。

1、 第11章 迭代学习控制 实际控制中存在一类轨迹跟踪问题,它的控制任务是寻找控制律 ,使得被控对象输出 在有限时间 上沿着整个期望轨迹实现零 误差轨迹跟踪。这列跟踪问题是具有挑战性的控制问题。 人们在处理实际场合中的重复操作任务时,往往依据对象的可重复 动态行为与期望行为的差距来调整决策。通过重复操作,使得对象行 为与期望行为的配合达到要求。这时,衡量动态行为的指标是某种满 意指标。 迭代学习控制(ILC,Iterative Learning Control)的思想最初由 日本学者Uchiyama于1978年提出23,于1984年由Arimoto等人 24做出了开创性的研究。这些学者借鉴人们在

2、重复过程中追求满意 指标达到期望行为的简单原理,成功地使得具有强耦合非线性多变量 的工业机器人快速高精度地执行轨迹跟踪任务。其基本做法是对于一 个在有限时间区间上执行轨迹跟踪任务的机器人,利用前一次或前几 次操作时测得的误差信息修正控制输入,使得该重复任务在下一次操 作过程中做得更好。如此不断重复,直至在整个时间区间上输出轨迹 跟踪上期望轨迹。 迭代学习控制适合于具有重复运动性质的被控对象,通过迭代修 正达到某种控制目标的改善。迭代学习控制方法不依赖于系统的精确 数学模型,能在给定的时间范围内,以非常简单的算法实现不确定性高 的非线性强耦合动态系统的控制,并高精度跟踪给定期望轨迹,因而 一经推

3、出,就在运动控制领域得到了广泛的运用。 迭代学习控制方法具有很强的工程背景,这些背景包括:执行诸 如焊接、喷涂、装配、搬运等重复任务的工业机器人;指令信号为周 期函数的伺服系统;数控机床;磁盘光盘驱动系统;机械制造中使用 的坐标测量机等。 由于迭代学习控制模拟了人脑学习和自我调节的功能,因而是一 种典型的智能控制方法25。经历了三十多年的发展,迭代学习控制 已成为智能控制中具有严格数学描述的一个分支。目前,迭代学习控制 在学习算法、收敛性、鲁棒性、学习速度及工程应用研究上取得了很 大的进展。 11.1 基本原理 设被控对象的动态过程为 , (11.1) 式中, 、 、 分别为系统的状态,输出和

4、输入变量, 、 、 为适当维数的向量函数,其结构与参数均未知。若期望控 制 存在,则迭代学习控制的目标为:给定期望输出 和每次运 行的初始状态 ,要求在给定的时间 内,按照一定的学习控制 算法通过多次重复的运行,使控制输入 ,而系统输出 第k 次运行时,式(11.1) 表示为: (11.2) 跟踪误差为 (11.3) 迭代学习控制可分为开环学习和闭环学习。 开环学习控制的方法是:第k+1次的控制等于第k次控制再加上第k次 输出误差的校正项,即 (11.4) 闭环学习策略是:取第K+1次运行的误差作为学习的修正项,即 (11.5) 式中,L为线性或非线性算子。 11.2 基本迭代学习控制算法 A

5、rimoto 等首先给出了线性时变连续系统的D型迭代学习控制律24 (11.6) 式中, 为常数增益矩阵。在D 型算法的基础上,相继出现了P 型、 PI 型、PD 型迭代学习控制律。从一般意义来看它们都是PID型迭代 学习控制律的特殊形式,PID迭代学习控制律表示为 (11.7) 式中, 、 、 为学习增益矩阵。算法中的误差信息使用称为开环迭 代学习控制,如果使用 则称为闭环迭代学习控制,如果同时使用和则 称为开闭环迭代学习控制。 此外,还有高阶迭代学习控制算法、最优迭代学习控制算法、遗忘因子迭 代学习控制算法和反馈-前馈迭代学习控制算法等。 11.3 迭代学习控制的关键技术 11.3.1 学

6、习算法的稳定性和收敛性 稳定性与收敛性问题是研究当学习律与被控系统满足什么条件时,迭代学 习控制过程才是稳定收敛的。算法的稳定性保证了随着学习次数的增加,控 制系统不发散,但是,对于学习控制系统而言,仅仅稳定是没有实际意义的 ,只有使学习过程收敛到真值,才能保证得到的控制为某种意义下最优的控 制。收敛是对学习控制的最基本的要求,多数学者在提出新的学习律的同时 ,基于被控对象的一些假设,给出了收敛的条件。例如,Arimoto在最初提 出PID型学习控制律时,仅针对线性系统在D型学习律下的稳定性和收敛条件 作了证明 11.3.2 初始值问题 运用迭代学习控制技术设计控制器时,只需要通过重复操作获得

7、的受控对 象的误差或误差导数信号。在这种控制技术中,迭代学习总要从某初始点开 始,初始点指初始状态或初始输出。几乎所有的收敛性证明都要求初始条件 是相同的,解决迭代学习控制理论中的初始条件问题一直是人们追求的目标 之一。目前已提出的迭代学习控制算法大多数要求被控系统每次运行时的初 始状态在期望轨迹对应的初始状态上,即满足初始条件: (11.8) 当系统的初始状态不在期望轨迹上,而在期望轨迹的某一很小的邻域内时 ,通常把这类问题归结为学习控制的鲁棒性问题研究。 11.3.3 学习速度问题 在迭代学习算法研究中,其收敛条件基本上都是在学习次数 下 给出的。而在实际应用场合,学习次数 显然是没有任何

8、实际意 义的。因此,如何使迭代学习过程更快地收敛于期望值是迭代学习控 制研究中的另一个重要问题。 迭代学习控制本质上是一种前馈控制技术,大部分学习律尽管证 明了学习收敛的充分条件,但收敛速度还是很慢。可利用多次学习过 程中得到的知识来改进后续学习过程的速度,例如,采用高阶迭代控 制算法、带遗忘因子的学习律、利用当前项或反馈配置等方法来构造 学习律,可使收敛速度大大加快。 11.3.4 鲁棒性问题 迭代学习控制理论的提出有浓厚的工程背景,因此仅仅在无干扰 条件下讨论收敛性问题是不够的,还应讨论存在各种干扰的情形下系 统的跟踪性能。一个实际运行的迭代学习控制系统除了存在初始偏移 外,还或多或少存在

9、状态扰动、测量噪声、输入扰动等各种干扰。鲁 棒性问题讨论存在各种干扰时迭代学习控制系统的跟踪性能。具体地 说,一个迭代学习控制系统是鲁棒的,是指系统在各种有界干扰的影 响下,其迭代轨迹能收敛到期望轨迹的邻域内,而当这些干扰消除时 ,迭代轨迹会收敛到期望轨迹。 11.4 机械手轨迹跟踪迭代学习控制仿真实例 11.4.1控制器设计 考虑一个关节的机器人,其动态性能可以由以下二阶非线性微分方 程描述: (11.9) 式中: 为关节角位移量, 为机器人的惯性矩阵, 表 示离心力和哥氏力, 为重力项, 为控制力矩, 为各种 误差和扰动。 设系统所要跟踪的期望轨迹为 , 。系统第次输出为 令 。 在学习开

10、始时,系统的初始状态为 。学习控制的任务为通过学 习控制律设计 ,使第 次运动误差 减少。 采用三种基于反馈的迭代学习控制律: (1)闭环D型 (11.10) (2)闭环PD型: (11.11) (3)指数变增益D型: (11.12) 11.4.2 仿真实例 针对二关节机械手,介绍一种机器人PD型反馈迭代学习控制的仿 真设计方法。针对二关节机器人控制系统式(11.9),各项表示为: 干扰项为 机器人系统参数为 , , , 采用三种闭环迭代学习控制律,其中 为D型迭代学习控制, 为PD型迭代学习控制, 为变增益指数D型迭代学习控制。 两个关节的位置指令分别为 和 ,为了保证被控对象初始输 出与指

11、令初值一致,取被控对象的初始状态为 。取 PD型迭代学习控制,即 ,仿真结果如图11-1至图11-3所示。 图11-1 20次迭代学习的跟踪过程 图11-2 第20次迭代学习的位置跟踪 图11-3 20次迭代过程中误差范数的收敛过程 11.5 线性时变连续系统迭代学习控制 11.5.1 系统描述 Arimoto等24给出了线性时变连续系统 (11.13) 的开环PID型迭代学习控制律: (11.14) 其中 , , 为学习增益矩阵。 11.5.2 控制器设计及收敛性分析 定理1 若由式(11.13)和式(11.14)式描述的系统满足如下条件24: (1) ; (2)每次迭代初始条件一致,即 则当 时,有 , 。 证明: 由式(11.13)及条件式(2)得 则 ,即系统满足初始条件。 非齐次一阶线性微分方程 的解为: 取 ,则 由于 , ,则 即 将PID型控制律式(11.14)代入上式,则第k+1次输出的误差为: (11.15) 利用分部积分公式,令 ,有 (11.16) 将式(11.16)代入式(11.15),得 (11.17) 将式(11.17)两端取范数,有

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号