基于伪逆的反复学习控制(翻译一)

上传人:工**** 文档编号:585949 上传时间:2017-04-05 格式:DOC 页数:13 大小:743.50KB
返回 下载 相关 举报
基于伪逆的反复学习控制(翻译一)_第1页
第1页 / 共13页
基于伪逆的反复学习控制(翻译一)_第2页
第2页 / 共13页
基于伪逆的反复学习控制(翻译一)_第3页
第3页 / 共13页
基于伪逆的反复学习控制(翻译一)_第4页
第4页 / 共13页
基于伪逆的反复学习控制(翻译一)_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《基于伪逆的反复学习控制(翻译一)》由会员分享,可在线阅读,更多相关《基于伪逆的反复学习控制(翻译一)(13页珍藏版)》请在金锄头文库上搜索。

1、基于伪逆的反复学习控制学习控制是用于一固定时间间隔内重复作用的跟踪控制的有效方法。本文给出一种反复学习控制算法,适用于一些具有扰动和初始误差的非线性非最小相位对象。该算法要求对一线性对象的近似转换而非精确转换。这种方法的一个优点是不需区分对象的输出。渐进轨迹误差的范围通过一精确的试验列出,并且可以看到其随着扰动范围持续的增大。该控制器的结构是这样的,其低频部分的轨迹汇合要比高频部分快。索引术语反复学习控制,非线性跟踪,伪逆。I. 绪论反复学习控制用到了一类自调整控制器,其某一特定任务的系统性能在同一任务先前性能的基础上逐渐改善和完美。学习控制的最常见应用是在工业生产的机器人控制领域,这里要求机

2、器人执行一个单一的任务,比方说反复在一给定轨迹下取放物体。单独一个反馈控制器时,相同的轨迹误差会一直在反复的试验中存在。相反,学习控制器可以利用前一次执行信息来改进下一次轨迹执行的性能。而在一些应用中,多次重复一个轨迹的要求不利于学习,所以我们将注意力集中在别的一些场合,那里来说学习控制是自然的解决方案。本文中我们在1提出一种反复学习控制算法的修正以使其适用于带有输入扰动和输出传感噪声的非线性非最小相位对象。在章节 出一个在起始位置描述一伪逆线性装置的学习控制器。在章节 出仿真例子以展示所提学习控制器的性能。最后,章节 全文总结。有扰动的非线性非最小相位对象本节中,我们为非线性系统提出一个鲁棒

3、迭代学习算法。我们仅考虑方(相同的输入和输出)时不变非线性系统。A 系统描述来考察一个在 x = 0 时起始近似稳定(也就是说线性对象的所有特征根都在复平面的左半部分)而且输入稳定的非线性系统这里 i 为 迭代系数, 是输入顺序集合, 及 ,。方程 表示系统反复随机的有界扰动;它可以是持续的,非可再生摩擦力,和状态独立的模型误差等等。 代表传感器噪声。所期待的轨迹 维持在有限的时间域。学习的目的是构建一个输入轨迹的顺序 如 ,这样 使系统在0,T 间“尽可能近的”跟踪轨迹 。我们做以下假设:(程 是连续可微的,而 是连续的。(,这里的 是 间的封闭子集。(统是第一渐进稳定和输入状态稳定。(备注

4、:如果系统不稳定,可以运用我们的方法使其稳定)。(动 和 分别由 制(也就是说, 且 ) 。(期待的轨迹 非常接近于轨迹 , 其满足以下方程:针对该系统,在图 给出一个反复学习控制。 1 所示的学习控制器的一个好的候选者可以这样获得,首先对对象进行线性化,然后用一个伪逆的线性装置作为学习控制器。现代的反复学习控制法则由因式 P,线性对象 ,其伴随矩阵 和时域 t0,T组成,也就是:注意到对所有的 i 如果 (注意在图 1 中,减因子 放置在汇合点之前) 。定义 : 由于非线性系统(1)是输入状态稳定(且 是连续的( ,因此这样定义一个因果关系的非线性输入到输出的映射P: 。因为 P 是第一状态

5、渐近稳定的(,我们定义一稳定时不变的输入到输出线性因式 , 需要对系统(1)在内 线 性 化 :图 1, 非 线 性 学 习 控 制 系 统 P: 非 线 性 对 象 , 学 习 控 制 器 , : 负 因 子这 里 , 因 此 ,。 由 于 且 A 为 赫 兹 【 在 ( 4) 中 】 , 我 们 可 以 用代 替 而 不 必 改 变 ( 4) 中 定 义 的 输 入 输 出 ( 映 射 , 因 此 得 到 的唯 一 映 射 是 11。定 义 : 考 察 伴 随 系 统 的 IO 映 射由 于 A 是 赫 兹 , 双 曲 线 的 ( 也 就 是 , 所 有 的 特 征 值 都 没 有 零 实

6、 部 ), 从 而 ( 5) 式 定 义了 唯 一 的 无 关 联 映 射 , 如 给 出 的 ( 参 见 附 录 ) 。 伴 随 系 统 满 足 忽略较高阶限制,我们可以在方程(1)的解 附 近 获 得 一 个 线 性 对 象 :这 里 。 因 为 ( 4) 是 稳 定 的 , 可以 根 据 李 亚 普 诺 夫 方 法 证 明 , 如 果 有 界 那 么 ( 6) 也 是 有 界 输 入 输 出 稳 定 的 。 注 意 , 这 里我 们 也 可 以 用 代 替 ( 如 ( 4) 中 ) 而 且 没 有 改 变 输 入 输 出 映 射 。定 义。 线 性 稳 定 系 统 ( 6) 有 解 并且

7、 定 义 了 一 个 线 性 输 入 输 出 映 射 : 。定 义 : 由 伪 逆 【 4】 的 观 念 启 发 , 我 们 通 过 下 面 的 线 性 因 子 来 定 义 学 习 控 制 器 :因 为 , 我 们 把 “近 似 反 转 ”称 为 的 伪 逆 。 为 简 单 起 见 , 下 文 把 伪 逆 称为 简 单 伪 逆 。 在 时 域 下 用 ( 4) 和 ( 5) :因 为 是 稳 定 的 , ( 8) 是 具 有 特 征 根 的 双 曲 线 , 因 此 , 【 2】 中且 是 无 关 联 的 。 在 ( 8) 中 解 , 我 们 可 以看 到 反 向 算 子 为 :上 面 系 统

8、的 特 征 根 的 连 续 函 数 。 在 极 限 为 双 曲 线 的 ( 因 为 A 为 赫 兹 ) 。 从 而我 们 通 常 对 双 曲 线 选 择 一 个 。 系 统 ( 9) 可 以 根 据 等 人 的 稳 定 无 关 解 方 法 解 决 。因 此 ,学 习 控 制 器 是 伪 逆 且 在 时 域 中 给 出 : 对 角 块 , 因 此 特 征 根 是 ( 9) 和 的 特 征 根 。 由 于 是 双 曲 线 的 , 因 此 双 曲 线 。 从 而 , 及 (10)所 描 述的 线 性 控 制 器 的 解 可 以 利 用 稳 定 无 关 解 2求 得 。 ( 使 用 时 而 不 是 时

9、 的 初 始 条 件可 以 通 过 控 制 ) 。 因 此 跟 踪 性 能 可 以 根 据 假 设 和得 到 改 善 。C 集 中 分 析定 义 1: 我 们 为 方 程 定 义 标 准 :注 意 意 味 着 和 是 等 价 的 标 准 。 集 中 结果 可 以 用 任 一 标 准 证 实 。导 致 的 标 准 :定 义 的 傅 立 叶 变 换 。条 件 1: ( 也 就 是 说 , 轴 上 没 有 确 定 或 者 非 确 定 的 零 点 ) , 遵 循。法 则 1: 如 果 假 设 ( 和 条 件 1 满 足 , 没 有 扰 动 ( 即 且 ) 和 初 始 误 差 () , 那 么 算 则

10、( 3) 导 出 了 一 个 输 入 顺 序 , 输 入 汇 合 于 。 如 果 , 及 初始 状 态 误 差 是 有 界 的 ( ) , 随 着 , 汇 合 于 。 球的 半 径 r 连 续 的 取 决 于 扰 动 , 和 初 始 误 差 界 限 。 如 果 存 在 一 个 具 有的 , 那 么 将 汇 合 于 期 望 的 输 入 解 。验证:验证依赖于对输入顺序应用不同的收缩映射定理5。验证的主要想法是在时 展 现 出 。 这 表 明 了 极 限 , 这 儿 为 扰 动 和 初 始 误 差 界 限 的 连 续 因 子 。 通 过 以 下 定 义 构 造 序 列: 为 简 单 起 见 下 文

11、 用 表 示 。 现 在 , 维 持 页 尾 所 示 的 从 ( 3) 到 关 断 器( 12) 的 线 性 。 在 6后 , 我 们 用 表 示 P 的 分 叉 , 也 即 满 足在 式 ( 13) 中 , 这 样 定 义 : 。 从 ( 13)式 , 我 们 可 以 发 现 s 就 是 , 为 表 示 , 我 们 重 写 ( 12) 如 下 :因为 是 ,这表明 ,如限制 和 :由假设 :,从而 。由(6) ,我们列写:因此,利用三角不等式, 及 的限制,我们得到。利用 等 式 ( 见 )。 用 乘 式 ( 15) , 定 义且 假 设 , 我 们 得 到 :注 意 到 对 一 常 数 ,

12、 在 上 较 大 值 , 我 们 有 :和(4)相似,可以证明:这里 为式(4)的输入。定义 :定义一线性因子 ,所以:根据式(6) ,因子 的输出为: ,且由式(4)因子 的输出为 。这表明因此,利用式(16) , (17) ,及 的范围,我们可以得到:列出压缩映射:由式(12) ,我们可以得到下文页底所示的方程。定义。从以下可看到,如果 满足条件 1,当 ,那么 。当 选择足够小,可以使得 任意小。令 且 ,( 傅立叶变换)如果条件 1 满足,那么 ,这里 0。重新考虑式(19) ,令,因此 。注意到:因此,我们可以写为, (利用式(19) ),当。随着 的选择,可以使得 任意小。如果相应

13、于 的传递函数确实恰当,那么在 时,条件 1 无法满足。那么随着1,而且,直观地,输入序列的高频部分会缓慢的汇合。在那种情况下,学习控制器得以以下方式加以修正:不是把 当作学习因子,而是把 当作修正后的学习控制器,这里 可以通过对 加入一个前馈期获得。因此,可以根据修正式(4)给出如下:这里 。修正后的因子满足条件 1 并且集总分析可以在 足够小时以相同的方式进行。从式(19)代人限制条件 ,且将式(19)乘以 我们可以在 上取大列写式(19)的 型如下:这里 为初始状态误差的标准范围。 和 分别为输入及输出扰动的标准范围。由于 ,当 足够小,我们可以发现 ,这使得 。因此,得到:。这里 包括

14、了控制器的初始状态误差和扰动的标准范围。因此,极限 ,即 ,如,这里 为收缩映射 的固定点,且 为半径,球心为 的开球体。如果没有扰动和初始误差, ,从而 汇合于。如果 如 ,收缩映射 的固定点 表示为没有 和初始误差的。如果 且 。这表明学习控制器的输出 为 0。因此,收缩一旦得以证实,可以看出 (如前定义)也是从 空间( )的封闭子空间到其自身的映射。因此, 为收缩映射。为说明这个,来考察一期望轨迹 。从式(2) ,因 , 。在式(12)中,如果考虑 那么,由于(这里 ) , 是从 附近一封闭球到其自身的收缩映射。注意, 附近球的尺寸必须足够小这样式(14)也得到满足。因此,如果初始轨迹位

15、于 附近, 对所有的 从其附近到其本身构成映射。不失一般性,我们考虑另一对 及 (如(2)所给) 。从连续性来说,尽管 充分接近 , 也从其附近到其本身构成映射。这便是 的动机。仿真结果具有输入扰动的仿真结果本节中,我们展示一个单输入单输出非线性非最小相位对象 P 的仿真研究,其起始渐进稳定,输入状态稳定,具有以下描述的输入扰动:首先,我们考虑没有输出扰动 。这样给出参考输出轨迹:0, 其他。通过线性化系统(21)这样定义 :由于线性控制器是非稳定的,我们应用稳定无关解方式2。我们引入 作为有界的输入扰动。 通常为限制于 间的随机数。 仿真图 2(a)和(b) 展示了两个反复后期望输出的近似完美的跟踪。注意高频部分缓慢汇合所引起的余差。具有输入输出扰动的仿真结果现在,我们引入 作为(21)所给的相同非线性系统的随机有界输出扰动。同时存在先前引入的输入扰动 。 仿真图图 3展示了三次反复后期望输出轨迹的良好跟踪。A 讨论这里的 案比1中给出的多了一些优点。在1中,线性对象的逆 被当做学习因子。这使得用输出的分叉颠倒系统成为必要。实际上,在具有输出传感噪声时分叉无法可靠的计算。进一步说,对象本

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 嵌入式开发/单片机

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号