复杂机电控制-迭代学习控制

资源描述

《复杂机电控制-迭代学习控制》由会员分享，可在线阅读，更多相关《复杂机电控制-迭代学习控制（38页珍藏版）》请在金锄头文库上搜索。

1、迭代学习控制 ILC (Iterative Learning Control),7.1 迭代学习控制概述 7.2 迭代学习控制律 7.3 迭代学习控制简单实例,遗传学习（Racial Learning）：具有生存能力的动物 ,使那些在它的一生中，能被它所经历的环境所改造的动物，一个能繁殖的动物，至少能够产生与它大略相似的动物，这种从一代到下一代的种族学习或系统发育学习. 学习控制系统：它能通过与被控对象和环境的闭环交互作用，根据过去获得的经验信息，逐步改进系统自身的未来性能。,迭代学习控制 ILC (Iterative Learning Control),1978年，Uchiyama （

2、内山）在一篇有关机器人控制的论文中提出ILC思想（日文杂志Repetive），因文章是日文发表的，当时并未引起人们的重视。 1984年，Arimoto （有本）和其合作者们将内山的初步思想加以完善，建立了实用的算法，从理论上证明了这种算法的可行性而成为正规的迭代学习控制理论，并以英文发表了他们的研究成果，迭代学习控制ILC(Iterative Learning Control）才得以推广。,迭代学习是模拟人的学习过程与特性，类似于人的“循序渐进”。 “Learning by trail”边学边干的学习规律，使得对被控对象的动力学描述和参数化估计的复杂计算均可以简化或省略。,第七章迭代学习控

3、制 ILC (Iterative Learning Control),7.1 迭代学习控制概述 7.2 迭代学习控制律 7.3 迭代学习控制简单实例,7.1 迭代学习控制概述,迭代学习控制适用的场合，以及与其它控制方法的区别 1.适合场合可用于不确定的对象或非线性系统，但系统动作过程应具有自己的重复性。 2.ILC和ANNC（人工神经网络控制）的区别 a.ANNC给定一样本，包含输入对应的输出结果。 b. ILC只给出期望的输出，需要获得合适的输入达到或接近期望的输出。两者通常都是离线使用学习结果。,7.1 迭代学习控制概述,3.ILC和最优控制的区别最优控制通过对描述的数学模型的理论

4、优化得到所需的控制量。 ILC是通过先前多次的实验结果改进，来获得最优的控制量。,7.1 迭代学习控制概述,4.ILC和自适应控制的区别两者都是用来解决系统不确定的问题，均基于在线的参数调整算法，都要使用与环境、对象闭环交互得到的实验信息。自适应控制是在线的控制，用于缓慢的时变特性以及新型的控制局势，对严重的非线性问题失效。 ILC的控制是在线的，而学习是离线的，适合于建模不良的非线性系统，但不宜用于时变动态系统。 ILC是在每次试验后离线实现控制，而自适应控制的算法是在线算法，且需要进行大量的计算。,自适应控制和常规的反馈控制和最优控制一样，也是一种基于数学模型的控制方法，所不同的只是自

5、适应控制所依据的关于模型和扰动的先验知识比较少，需要在系统的运行过程中去不断提取有关模型的信息，使模型逐步完善。具体地说，可以依据对象的输入输出数据，不断地辨识模型参数，这个过程称为系统的在线辩识。随着生产过程的不断进行，通过在线辩识，模型会变得越来越准确，越来越接近于实际。在这个意义下，控制系统具有一定的适应能力。比如说，当系统在设计阶段，由于对象特性的初始信息比较缺乏，系统在刚开始投入运行时可能性能不理想，但是只要经过一段时间的运行，通过在线辩识和控制以后，控制系统逐渐适应，最终将自身调整到一个满意的工作状态。再比如某些控制对象，其特性可能在运行过程中要发生较大的变化，但通过在线辩识和改变

6、控制器参数，系统也能逐渐适应。,7.1 迭代学习控制概述,ILC的定义 1.从控制的角度定义它是通过对具有重复性的被控对象系统，利用先前的控制经验尝试，以输出的轨迹与给定的期望轨迹偏差修正不理想的控制信号，最终找出一个理想的输入特性曲线，使得系统跟踪期望输出结果的能力提高，最终达到所期望的输出或接近于许可的输出。,7.1 迭代学习控制概述,2.数学描述ILC 在有限的时间域0,T内，给定的被控对象期望的响应为yd (t), t 0,T,寻找某种给定的控制量uk (t), t 0,T,使其响应yk (t), t 0,T, 在某种意义上对y0(t)（可理解为 yk-1(t)）有所改善，其

7、中k为寻找次数，这样的过程称为学习控制过程。,7.1 迭代学习控制概述,3.ILC过程的机理是寻找并求得动态控制系统的输入、输出之间比较简单的关系。执行每一个由前一步控制学习结束更新的控制过程。改善每一个控制过程，使其性能优于前一个过程。希望通过重复执行这种学习过程和记录全过程的结果，能够稳步改善受控系统的性能。,7.1 迭代学习控制概述,ILC的特点 ILC适用于某种具有重复学习运动的被控对象，每次都做同样的工作。可实现完全的跟踪。学习过程只需要测量实际的输出结果和期望的信号，对被控对象的动力学模型描述和参数估计的一些复杂计算均可简化或省略。在不明确已知（甚至未知）的被控对象动

8、力学特性的情况下设计控制器，故适合非线性系统。,7.1 迭代学习控制概述,5.在线控制负担小进行快速的运动控制，实时性好 6.具有记忆功能，遇到类似的控制功能时，它能根据记忆录中的任务，快速调整控制任务。 7.对干扰和系统的变化量有一定的鲁棒性。,7.1 迭代学习控制概述,四.适用工业领域具备重复运动的场合：计算机搬运，装配，生产线焊接工业，喷涂工艺，机器人数控加工中间的送进。,第七章迭代学习控制 ILC (Iterative Learning Control),7.1 迭代学习控制概述 7.2 迭代学习控制律 7.3 迭代学习控制简单实例,7.2 迭代学习控制律,一、ILC的被

9、控对象需满足的具体条件每次运行的时间间隔为固定的周期T; 期望的给定输出yd (t) 是 t0,T域内的已知函数; 每次运行前动力系统的初始状态Xk(0)相同，k是学习次数，k=(1.2.3); 每次运行的输出y k (t)均可测，误差值可获得e k (t) = yd (t) y k (t);,6. 系统的动力学结构在一次运行中保持不变,ILC在线性定常系统，线性时变系统和非线性的系统中均收敛，但对系统滞后等不收敛。,5. 下一次运行的给定uk+1(t) 满足以下递推条件：,一、ILC的被控对象需满足的具体条件,二、ILC的学习过程若第k次训练时期望输出与实际输出的误差为e k (t)

10、 = yd (t) y k (t); t0,T 第k+1次训练的输入控制 uk+1(t) 则为第 k 次训练的输入控制uk (t) 与输出误差e k (t) 的加权和uk+1(t) = uk (t) + we k (t),在ILC中，控制用的学习是通过对以往控制经验（控制作用与误差的加权和）的记忆实现的，算法的收敛性依赖加权因子w的确定。这种ILC的核心是系统不变的假设以及基于记忆单元间断的重复训练过程，学习规律极为简单。,反馈通道,控制器,被控对象,加权因子,反馈通道,控制器,被控对象,加权因子,+,+,+,+,+,+,+,-,-,-,-,+,记忆,学习控制器,学习控制器,可有多种不同的变

11、化,加权因子也可以用学习控制量代替即（可用于不同的控制方法）,ILC的学习过程,第 k次操作,第k+1次操作,第k+2次操作,7.2 迭代学习控制律三.迭代学习控制的任务给出系统的当前输入和当前输出，确定写个期望输入，使系统的实际输出收敛于期望值。,7.2 迭代学习控制律,四、迭代学习控制律两种基本形式的学习律是D型学习律和P型学习律，其中D型学习律是首先被提出来的一种。,单纯的D型学习律可调整的参数只有学习增益KD，当KD确定后，学习系统的跟踪性能和收敛速度也基本上随之确定，为了提高收敛速度，改善跟踪性能，需要在学习律中增添可调整的参数项，因而产生了PD型、DI型学习律、PID型学习

12、律，PID型学习律是三者中最为完善的学习律。,7.2 迭代学习控制律,迭代学习的PID控制律,7.2 迭代学习控制律,PID型学习控制律的增量算式: e k (t) = yd (t) y k (t) 对于采样时刻t = nT（T为采样时间）令,7.2 迭代学习控制律,令u0(t) = yd (t) ，将输出转化为增量形式：初始化条件为：,五、迭代学习控制律的算法流程 (1) 置k=0，给定并存储期望的轨迹yd (t)以及初始的控制u0(t), t0,T (2) 通过初始的定位操作，使系统初始输出位于yk(0)，相应的初态位于xk(0) (3) 对被控对象施加输入uk (t), t 0,T,

13、开始反复操作，同时采样并存储系统的输出yk (t)， t 0,T, (4) 计算输出的误差ek (t) =yd (t) - yk (t), t 0,T (5) 由学习控制律计算并存储新的控制输入uk+1(t) = uk(t)+ uk(t), t 0,T (6) 将uk+1(t)施加给系统，产生yk+1(t)，ek+1(t) (7) 检验迭代停止条件：yd(t)-y0(t),式中为给定的允许跟踪精度。若条件满足则停止运行，否则置k=k+1,转步骤(2),第七章迭代学习控制 ILC (Iterative Learning Control),7.1 迭代学习控制概述 7.2 迭代学习控制律 7.3

14、迭代学习控制简单实例,7.3 迭代学习控制简单实例,例如直流电动机驱动的单自由度线形机械系统，如下图所示为系统方框图，其中y (t)为电动机的角速度，u (t)为输入电压。,（1）系统描述该闭环系统用微分方程表示为：,其中,当初始时刻取为零时，方程的解为：,（2）控制任务在区间0, T上给定一个期望的角速度 y d (t)，寻求电压u (t)使得电机输出角速度y (t)在0, T上与y d (t)尽可能一致（3）确定输入数据选择任何一个输入电压u0 (t)，t0, T，将y d (t)和u0 (t)存入存储器中，通过初始定位操作，使系统位于y k (0) （4）施加初始的输入电压u0

15、(t)使系统运行得到y0(t)，则 e0 (t) = yd (t) - y0 (t),（5）以D型学习律计算新的输入电压，并获得下一次误差,（6）迭代过程,设期望轨迹为yd (t) = t , t0, 1,初始条件y k (t) = yd (t) (k =0, 1, 2,) 下，选取初始控制u0 (t) = 0，迭代输出轨迹如图所示。图中y9 (t)与yd (t)（红色的线）重合，即迭代第9次达到期望。,移动机器人轨迹跟踪迭代学习控制移动机器人是一种在复杂的环境下工作的具有自规划、自组织、自适应能力的机器人。在移动机器人的相关技术研究中，控制技术是其核心技术，也是其实现真正的智能化和完全的自主移动的关键技术。移动机器人具有时变、强耦合和非线性的动力学特征，由于测量和建模的不精确，加上负载的变化以及外部扰动的影响，实际上无法得到移动机器人精确、完整的运动模型。通过对迭代学习控制方法进行详细推导及仿真分析，研究一类移动机器人迭代学习离散控制的设计及仿真方法。,移动机器人运动模型,随迭代次数运动轨迹的跟踪过程,最后一次的位置跟踪,谢谢！,

展开阅读全文