神经网络讲义(第四章)

上传人:woxinch****an2018 文档编号:53923341 上传时间:2018-09-06 格式:PPT 页数:52 大小:420KB
返回 下载 相关 举报
神经网络讲义(第四章)_第1页
第1页 / 共52页
神经网络讲义(第四章)_第2页
第2页 / 共52页
神经网络讲义(第四章)_第3页
第3页 / 共52页
神经网络讲义(第四章)_第4页
第4页 / 共52页
神经网络讲义(第四章)_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《神经网络讲义(第四章)》由会员分享,可在线阅读,更多相关《神经网络讲义(第四章)(52页珍藏版)》请在金锄头文库上搜索。

1、神经网络控制器设计,4.1 引言 4.2 监督学习NN控制器 4.3 NNMRAC(Model-Reference Adaptive Control) 4.4 神经网络自校正控制(NNSTC) 4.5 NN直接自适应控制 4.6 NN-PID控制 4.7 NN-Fuzzy控制,引言,NN在控制器设计中的几条路 存在的几个问题 本章简介,与已有控制结构的结合,如:NN自适应控制(NN MRAC 、NN STR:直接、间接)、NN-PID、NN-IMC(PC) 与已有控制方法的结合,如:NN-Fuzzy控制、NN-expert控制 NN特有的控制器设计方法,如:监督学习控制(SNC)、评价学习控制

2、器(ACE)、无模型的控制器设计方法(单个元的或网络的,即按误差调整的),缺乏一种专门适用于控制的动态神经网络(目前方法:静处理动,不可避免的带来差分方程定阶问题) 稳定性、鲁棒型分析困难,学习控制(监督) NN自适应(MRAC和STR) NN-PID NN-无模型控制 NN-Fuzzy(思想) 有关稳定性的一些成果,监督学习NN控制器,问题的提出 SNC设计:控制系统结构思路实例,当对象动力学特性未知时系统可控,人的知识如何传递给控制装置? 解决思路:,利用专家控制、规则控制 采用监督(导师)NN控制(SNC),弄清人在控制过程中利用了过程或人本身的何种信息 构造NNC考虑问题:何种网络、结

3、构(层数)参数、训练方法(实时性、收敛性) SNC的训练过程在人进行控制时,将控制信号及过程收集起来以此为数据训练可以是离线的也可以是在线的,即人一边控制NNC一边学习训练结束后,网络实现了以参考信号及以往控制轴上y为网络输入,当前控制u为网络输出的I/O映射,即可实现正确控制,小车倒立摆系统的控制,数学model:令 为小车位置、速度、 杆角度、角速度,NN控制器为四层BP网4-16-4-1结构,S型作用参数,训练用数据: 输出输出值 控制区间 仿真时用:导师为线性或非线性的控制律取M=1kg,m=0.1kg,f=5.1kg/s,g=9.81m/,线性控制为状态反馈:训练20000次后NN可

4、实现线性律K=11.01,19.68,96.49,35.57 非线性:80000次 反馈线性化及解数据格 人控制:40000次 训练结束后,HSNC比人本身操作更好训练后,SNC还可继续在线学习以适应新的扰动、取得新的控制策略样本、增强对系统的全面了解。,问题及思路,问题:控制不成功,SNC为何 思路:引入评价学习的NNC,由ASE加上ACE构成,NN-MRAC,MRAC的思路 NN MRAC1)NN控制器2)控制框图3)例,一般控制系统可包含前馈和反馈控制器两种(前馈:由期望输出产生控制信号,反馈:由期望与实际之差产生控制信号),MRAC思路是给定期望响应的动态模型,利用期望与实际输出之差去

5、改变调节器参数,使对象+控制器形成的闭环系统对给定信号的响应与参考模型一致。当给定模型稳定时,闭环系统稳定并改善了动态响应。调节机构设计:可利用Lyapunov或Popov方法以保证闭环的稳定,NN控制器,辨识+再现控制器设计(淡化学习),间接控制 误差直接改变控制器参数(特定学习),直接控制淡化学习+自适应 NN MRAC,NNI-辨别器 NNC-控制器 NNI-对象辨识,目的、预报对象输出,做法: 准则:NNC-使 为小数 准则: 控制周期 辨别周期按常规自适应方法选取,系统NNI:BP网 2-20-10-1结构NNC:此时满足,神经网络自校正控制,STR基本思想 对象描述 一阶系统的一个

6、实例,基本思想,如果系统环境和模型的参数已知,则可采用适当方法获得某种意义下的最优控制器;若系统参数未知,则可用在线参数估计值来代替真实值(确定性等效原则)设计控制器,实现在线监控。,对象描述,SISO可反馈线性化的系统设 逆存在, 、 已知在 未知时,用 逼近,例引入NNNN的一步预板模型为:取: 则控制器为:,调整准则 令 , 系统,权系数修正公式,设隐层为 或 ,或 则,仿真例:一个元, ,1-10-10-1结构初值逐渐减小初始振荡,9000步以后2500步后仍有轻微振荡,NN直接自适应控制,基本概念 一种NN直接STC方案描述问题训练方案特点 基于单个自适应神经元的控制,基本概念,直接

7、自适应控制即直接根据对象的知识来调整控制器的内部参数,使得对象的输出误差尽量小间接:辨识模型直接:不辨识两种方案:1.基于MRAC2.基于STC,只要 维持足够高,可描述任意非线性系统设:NN为BP网络训练规则:为期望的对象输出 时对应的输入,问题 希望 ,此时 应确知,但P未知,而为训练NNC, 又该知 解决思路:将NNC与P看成一体,NN的最后一层(或几层)固定不变,用来描述对象,训练指标相应修改成Q为加权阵,Q0选择 使,梯度法,设控制器参数 空间计算 时,当 为网络最后一层(描述对象的)时,用下法为对象的Jacobian阵,未知,将 ,对于网络最后一层最后可得其它各层仍按标准BP算法修

8、正,无特定学习阶段,即没有依赖于辨识,直接控制效果设计控制器 控制参数调整为依赖时间的自适应过程例:小车倒立摆控制(动力学方程同前)Rouge-kutta法求解,步长0.001秒未时,失败该系统NMP系统4层BP 4-4-4-1结构,初始条件, 随机2040次后,可使平衡标度15分钟,单个自适应神经元描述 系统结构对r为定值系统学习方法 P为线性系统时稳定性分析,督促学习,监督与Hebb之组合a. b.增加小误差时 的敏感性,思想,设控制器等效为:将,即:Roche定理若在复平面环路上有在此环路上有相同数目的零点,设在,NN PID,直接NN PID常规NN PID NN PID间接NN PI

9、D结构学习算法流程,NN PID,采用BP网络 3-6-1结构输入学习方法,标准BP算法问题:要使网络之期望值不知先用 代替输出层:,隐层:讨论:1)本法不一定能保证系统稳定性与收敛性2)实时控制时,用到 计算慢,两个NN:NNC PID;NNI 辨识器,NNI:设3层BP网,NNC,学习,算法流程,(-0.1,0.1)随机值初始化NNC,NNI计算计算NN PID之修正NNI权值修正NNC权值1+t t,到2,NN-Fuzzy控制,Fuzzy控制的基本思想做法 间接NN PID 一个实例,基于人的经验,依据 进行表格化处理,控制规则为:if A then B形式,分为大、小、快、慢等,规则为

10、:ifand then A选作E,B选作EC(变化率)一般分成210档,通常取7档8档,NL,NM NS,NO PO PS PM PL具体计算时按隶属关系集,由具体数值 得到属于何种状态,控制变量也如此处理,美国Kosko教授为权威的几种做法,NN模拟Fuzzy系统中的各个模块,为Fuzzy化、推理、决策等 NN中引入Fuzzy逻辑,使之具有直接处理Fuzzy信息的能力例:NN的加权求和变成“并”与“交”等形式的Fuzzy逻辑运算,称为模糊神 经元,由两个NN组成,NNC:PID控制器单层网络:NNI:3层网络输入:输出:隐层:,小车倒立摆问题,和 为观测量; 为控制量; 为垂线右边,反之为 ; 方向向右,反之为 ; 的作用为抵消 为精确变量时,则 为精确数值为模糊变量时,为语言值 NB:negative Big,NM:negative middle NS:negative small ZE-zero PS:positive small,PM:positive middle PB:positive big 隶属函数范围,交叠范围为25%左右为益,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号