《智能控制chap》PPT课件.ppt

上传人:自*** 文档编号:126599448 上传时间:2020-03-26 格式:PPT 页数:59 大小:2.02MB
返回 下载 相关 举报
《智能控制chap》PPT课件.ppt_第1页
第1页 / 共59页
《智能控制chap》PPT课件.ppt_第2页
第2页 / 共59页
《智能控制chap》PPT课件.ppt_第3页
第3页 / 共59页
《智能控制chap》PPT课件.ppt_第4页
第4页 / 共59页
《智能控制chap》PPT课件.ppt_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《《智能控制chap》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《智能控制chap》PPT课件.ppt(59页珍藏版)》请在金锄头文库上搜索。

1、第十一章迭代学习控制实际控制中存在一类轨迹跟踪问题 它的控制任务是寻找控制律 使得被控对象输出在有限时间上沿着整个期望轨迹实现零误差轨迹跟踪 这列跟踪问题是具有挑战性的控制问题 人们在处理实际场合中的重复操作任务时 往往依据对象的可重复动态行为与期望行为的差距来调整决策 通过重复操作 使得对象行为与期望行为的配合达到要求 这时 衡量动态行为的指标是某种满意指标 迭代学习控制 ILC IterativeLearningControl 的思想最初由日本学者Uchiyama于1978年提出 23 于1984年由Arimoto等人 24 做出了开创性的研究 这些学者借鉴人们在重复过程中追求满意指标达到

2、期望行为的简单原理 成功地使得具有强耦合非线性多变量的工业机器人快速高精度地执行轨迹跟踪任务 其基本做法是对于一个在有限时间区间上执行轨迹跟踪任务的机器人 利用前一次或前几次操作时测得的误差信息修正控制输入 使得该重复任务在下一次操作过程中做得更好 如此不断重复 直至在整个时间区间上输出轨迹跟踪上期望轨迹 迭代学习控制适合于具有重复运动性质的被控对象 通过迭代修正达到某种控制目标的改善 迭代学习控制方法不依赖于系统的精确数学模型 能在给定的时间范围内 以非常简单的算法实现不确定性高的非线性强耦合动态系统的控制 并高精度跟踪给定期望轨迹 因而一经推出 就在运动控制领域得到了广泛的运用 迭代学习控

3、制方法具有很强的工程背景 这些背景包括 执行诸如焊接 喷涂 装配 搬运等重复任务的工业机器人 指令信号为周期函数的伺服系统 数控机床 磁盘光盘驱动系统 机械制造中使用的坐标测量机等 由于迭代学习控制模拟了人脑学习和自我调节的功能 因而是一种典型的智能控制方法 25 经历了三十多年的发展 迭代学习控制已成为智能控制中具有严格数学描述的一个分支 目前 迭代学习控制在学习算法 收敛性 鲁棒性 学习速度及工程应用研究上取得了很大的进展 11 1基本原理设被控对象的动态过程为 11 1 式中 分别为系统的状态 输出和输入变量 为适当维数的向量函数 其结构与参数均未知 若期望控制存在 则迭代学习控制的目标

4、为 给定期望输出和每次运行的初始状态 要求在给定的时间内 按照一定的学习控制算法通过多次重复的运行 使控制输入 而系统输出第k次运行时 式 11 1 表示为 11 2 跟踪误差为 11 3 迭代学习控制可分为开环学习和闭环学习 开环学习控制的方法是 第k 1次的控制等于第k次控制再加上第k次输出误差的校正项 即 11 4 闭环学习策略是 取第K 1次运行的误差作为学习的修正项 即 11 5 式中 L为线性或非线性算子 11 2基本迭代学习控制算法Arimoto等首先给出了线性时变连续系统的D型迭代学习控制律 24 11 6 式中 为常数增益矩阵 在D型算法的基础上 相继出现了P型 PI型 PD

5、型迭代学习控制律 从一般意义来看它们都是PID型迭代学习控制律的特殊形式 PID迭代学习控制律表示为 11 7 式中 为学习增益矩阵 算法中的误差信息使用称为开环迭代学习控制 如果使用则称为闭环迭代学习控制 如果同时使用和则称为开闭环迭代学习控制 此外 还有高阶迭代学习控制算法 最优迭代学习控制算法 遗忘因子迭代学习控制算法和反馈 前馈迭代学习控制算法等 11 3迭代学习控制的关键技术11 3 1学习算法的稳定性和收敛性稳定性与收敛性问题是研究当学习律与被控系统满足什么条件时 迭代学习控制过程才是稳定收敛的 算法的稳定性保证了随着学习次数的增加 控制系统不发散 但是 对于学习控制系统而言 仅仅

6、稳定是没有实际意义的 只有使学习过程收敛到真值 才能保证得到的控制为某种意义下最优的控制 收敛是对学习控制的最基本的要求 多数学者在提出新的学习律的同时 基于被控对象的一些假设 给出了收敛的条件 例如 Arimoto在最初提出PID型学习控制律时 仅针对线性系统在D型学习律下的稳定性和收敛条件作了证明 11 3 2初始值问题运用迭代学习控制技术设计控制器时 只需要通过重复操作获得的受控对象的误差或误差导数信号 在这种控制技术中 迭代学习总要从某初始点开始 初始点指初始状态或初始输出 几乎所有的收敛性证明都要求初始条件是相同的 解决迭代学习控制理论中的初始条件问题一直是人们追求的目标之一 目前已

7、提出的迭代学习控制算法大多数要求被控系统每次运行时的初始状态在期望轨迹对应的初始状态上 即满足初始条件 11 8 当系统的初始状态不在期望轨迹上 而在期望轨迹的某一很小的邻域内时 通常把这类问题归结为学习控制的鲁棒性问题研究 11 3 3学习速度问题在迭代学习算法研究中 其收敛条件基本上都是在学习次数下给出的 而在实际应用场合 学习次数显然是没有任何实际意义的 因此 如何使迭代学习过程更快地收敛于期望值是迭代学习控制研究中的另一个重要问题 迭代学习控制本质上是一种前馈控制技术 大部分学习律尽管证明了学习收敛的充分条件 但收敛速度还是很慢 可利用多次学习过程中得到的知识来改进后续学习过程的速度

8、例如 采用高阶迭代控制算法 带遗忘因子的学习律 利用当前项或反馈配置等方法来构造学习律 可使收敛速度大大加快 11 3 4鲁棒性问题迭代学习控制理论的提出有浓厚的工程背景 因此仅仅在无干扰条件下讨论收敛性问题是不够的 还应讨论存在各种干扰的情形下系统的跟踪性能 一个实际运行的迭代学习控制系统除了存在初始偏移外 还或多或少存在状态扰动 测量噪声 输入扰动等各种干扰 鲁棒性问题讨论存在各种干扰时迭代学习控制系统的跟踪性能 具体地说 一个迭代学习控制系统是鲁棒的 是指系统在各种有界干扰的影响下 其迭代轨迹能收敛到期望轨迹的邻域内 而当这些干扰消除时 迭代轨迹会收敛到期望轨迹 11 4机械手轨迹跟踪迭

9、代学习控制仿真实例11 4 1控制器设计考虑一个关节的机器人 其动态性能可以由以下二阶非线性微分方程描述 11 9 式中 为关节角位移量 为机器人的惯性矩阵 表示离心力和哥氏力 为重力项 为控制力矩 为各种误差和扰动 设系统所要跟踪的期望轨迹为 系统第次输出为令 在学习开始时 系统的初始状态为 学习控制的任务为通过学习控制律设计 使第次运动误差减少 采用三种基于反馈的迭代学习控制律 1 闭环D型 11 10 2 闭环PD型 11 11 3 指数变增益D型 11 12 11 4 2仿真实例针对二关节机械手 介绍一种机器人PD型反馈迭代学习控制的仿真设计方法 针对二关节机器人控制系统式 11 9

10、各项表示为 干扰项为机器人系统参数为 采用三种闭环迭代学习控制律 其中为D型迭代学习控制 为PD型迭代学习控制 为变增益指数D型迭代学习控制 两个关节的位置指令分别为和 为了保证被控对象初始输出与指令初值一致 取被控对象的初始状态为 取PD型迭代学习控制 即 仿真结果如图11 1至图11 3所示 图11 120次迭代学习的跟踪过程 图11 2第20次迭代学习的位置跟踪 图11 320次迭代过程中误差范数的收敛过程 11 5线性时变连续系统迭代学习控制11 5 1系统描述Arimoto等 24 给出了线性时变连续系统 11 13 的开环PID型迭代学习控制律 11 14 其中 为学习增益矩阵 1

11、1 5 2控制器设计及收敛性分析定理1若由式 11 13 和式 11 14 式描述的系统满足如下条件 24 1 2 每次迭代初始条件一致 即则当时 有 证明 由式 11 13 及条件式 2 得则 即系统满足初始条件 非齐次一阶线性微分方程的解为 取 则由于 则 即将PID型控制律式 11 14 代入上式 则第k 1次输出的误差为 11 15 利用分部积分公式 令 有 11 16 将式 11 16 代入式 11 15 得 11 17 将式 11 17 两端取范数 有 11 18 式中根据范数的定义可知 函数的范数为 将式 11 18 两端同乘以 并考虑到有 11 19 根据范数的定义 函数的范数

12、为 由于 则有 将式 11 19 的结果应用于下式 得 其中 即 11 20 则 11 19 和 11 20 代入 11 18 得 11 21 其中 由于 则当取足够大时 可以使 因此 定理得证 如果将控制律式 11 14 中的改为 则为闭环PID型迭代学习控制律 同定理1的证明过程 可证明闭环PID迭代学习控制律 11 5 3仿真实例考虑2输入2输出线性系统 期望跟踪轨迹为 由于 取 可满足定理1中的条件 1 在控制律式 11 14 中取 系统的初始状态为 在chap11 2sim mdl程序中 选择Simulink的ManualSwitch开关 将开关向下 取PD型开环迭代学习控制律 仿真

13、结果见图11 4至11 6所示 将开关向上 采用PD型闭环迭代学习控制律 仿真结果见图11 7至11 9所示 可见 闭环收敛速度好于开环收敛速度 图11 430次迭代学习的跟踪过程 开环PD控制 图11 5第30次迭代学习的位置跟踪 开环PD控制 图11 630次迭代过程中误差最大绝对值的收敛过程 开环PD控制 图11 730次迭代学习的跟踪过程 闭环PD控制 图11 8第30次迭代学习的位置跟踪 闭环PD控制 图11 930次迭代过程中误差最大绝对值的收敛过程 闭环PD控制 11 6移动机器人轨迹跟踪迭代学习控制移动机器人是一种在复杂的环境下工作的具有自规划 自组织 自适应能力的机器人 在移

14、动机器人的相关技术研究中 控制技术是其核心技术 也是其实现真正的智能化和完全的自主移动的关键技术 移动机器人具有时变 强耦合和非线性的动力学特征 由于测量和建模的不精确 加上负载的变化以及外部扰动的影响 实际上无法得到移动机器人精确 完整的运动模型 通过对文 27 的控制方法进行详细推导及仿真分析 研究一类移动机器人迭代学习离散控制的设计及仿真方法 11 6 1数学基础代表N维欧氏空间 定义向量范数为 11 22 其中为 阶实数矩阵 定义矩阵范数为 11 23 其中为矩阵的最大特征值 取 定义范数为 11 24 11 6 2系统描述图11 10为移动机器人运动模型 它在同一根轴上有两个独立的推

15、进轮 机器人在二维空间移动 点代表机器人的当前位置 广义坐标定义为 和为直角坐标系下的坐标 为机器人的方位角 当机器人的标定方向为地理坐标系的横轴正半轴时 定义为0 移动机器人受不完全约束的影响而只能在驱动轮轴的方向运动 点的线速度和角速度定义为和 图11 10移动机器人运动模型 根据图11 10 针对P点 移动机器人的离散运动学方程可由下式描述 11 25 其中为采样时间 机器人状态向量为 速度向量为 式 11 25 可写为 11 26 其中 11 27 如图11 10所示 期望轨迹为 运动轨迹跟踪的控制问题就是为确定 使跟踪 线速度和角速度误差分别为 11 28 11 29 移动机器人迭代

16、学习控制系统结构如图11 11所示 图11 11移动机器人迭代学习控制系统结构移动机器人离散运动学方程可描述如下 11 30 11 31 其中为状态干扰 为输出测量噪声 为系统输出 考虑迭代过程 由 11 30 和 11 31 可得 11 32 11 33 其中为迭代次数 为离散时间 分别代表第次迭代的状态 输入 输出 状态干扰和输出噪声 机器人运动方程 11 32 和 11 33 满足下列性质和假设 性质1 考虑理想情况 取均为零 则期望轨迹的方程可写为 11 34 11 35 性质2 矩阵函数满足Lipschitz条件 为正常数 11 36 性质3 矩阵是有界的 为正常数 矩阵为的满秩矩阵 假设1 假设2 干扰和噪声有界 11 37 其中 为正常数 假设3 在每一次迭代中 轨迹都是从的邻域开始 即 11 6 3控制律设计及收敛性分析迭代学习控制律设计为 11 38 对于第i次迭代 跟踪误差信号为 和为学习的增益矩阵 满足 通过控制律 11 38 使状态变量 控制输入 系统输出分别收敛于期望值 定理1 考虑离散系统 11 32 和 11 33 满足假设1 3 采用控制律 11 38

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号