第3章 人工神经元网络控制论 -控制基础智能控制基础3.1 引言3.2 前向神经网络模型3.6 神经网络控制基础3.7 非线性动态系统的神经网络辨识3.8 神经网络控制的学习机制3.9 神经网络控制器的设计3.3 动态神经网络模型 3.10 单一神经元控制法目录23.6.1 引言v神经网络控制的优越性 v神经网络控制器的分类 v神经网络的逼近能力3神经网络控制的优越性 1神经网络可以处理那些难以用模型或规则描述的过程或系统2神经网络采用并行分布式信息处理,具有很强的容错性 3神经网络神经网络具有是本质的非线性系统4很强的信息综合能力5神经网络的硬件实现愈趋方便4神经网络控制器的分类 逆控制器 自适应网络控制器 前馈控制结构 自适应评价网络 混合控制系统 神 经 网 络 控 制 器5(1) 导师指导下的控制器6(2) 逆控制器 7(3) 自适应网络控制器 v模型参考自适应网络控制器 8(4) 前馈控制结构93.6.2 神经网络的逼近能力 v相关结论: 含一个隐层以上的多层前向传播神经网络不 仅可以以任意精度逼近连续函数本身,还可 以逼近函数的导数项 103.1 引言3.2 前向神经网络模型3.6 神经网络控制基础3.7 非线性动态系统的神经网络辨识3.8 神经网络控制的学习机制3.9 神经网络控制器的设计3.3 动态神经网络模型 3.10 单一神经元控制法目录113.7.1 辨识基础3.7.2 神经网络辨识模型的结构 3.7.3 非线性动态系统的神经网络辨识3.7 非线性动态系统的神经网络辨识 12vL.A.Zadeh曾经下过这样的定义:“辨识是在 输入和输出数据的基础上,从一组给定的模 型中,确定一个与所测系统等价的模型”。
v使用非线性系统的输入输出数据来训练神经 网络可认为是非线性函数的逼近问题 v多层前向传播网络能够逼近任意L2非线性函 数 3.7.1 辨识基础13v模型的选择 v输入信号的选择 v误差准则的选择 143.7.1 辨识基础3.7.2 神经网络辨识模型的结构 3.7.3 非线性动态系统的神经网络辨识3.7 非线性动态系统的神经网络辨识 153.7.2 神经网络辨识模型的结构 逆模型法 前向建模法16前向建模法v所谓前向建模法是利用神经网络来逼近非线 性系统的前向动力学模型 17逆模型法v直接法:18存在的问题v存在的问题n学习过程不一定是目标最优的 n一旦非线性系统对应关系不是一对一的,那么 不准确的逆模型可能会被建立 v克服方法193.7.1 辨识基础3.7.2 神经网络辨识模型的结构 3.7.3 非线性动态系统的神经网络辨识3.7 非线性动态系统的神经网络辨识 20并行结构串行结构根据可分离性和线性性,有4种结构辨识的两种结构21含线性部分的辨识问题(模型1、2 )模型1模型222线性部分的参数已知 23线性部分的参数未知 24线性部分学习方法v最小二乘法v其中v初始条件完全未知时,可取25非线性部分学习方法vBP学习26例3-8v考虑以下模型: y(k+1)=a·y(k)+b·y(k-1)+g(u) 其中a=0.3, b=0.6g(u)=u3+0.3u2-0.4uv试辨识该系统27解v线性部分,采用递推最小二乘学习法v非线性部分采用前向传播多层神经网络来逼 近。
选择神经网络结构为28辨识效果v校验输入信号 :29非线性可分离系统(模型3)30BP学习31例3- 9v考虑如下非线性离散系统:v求:采用双模型法解决该系统的辨识问题32两种方法的学习曲线v单一模型网络:v两模型网络:33两模型法的辨识效果343.1 引言3.2 前向神经网络模型3.6 神经网络控制基础3.7 非线性动态系统的神经网络辨识3.8 神经网络控制的学习机制3.9 神经网络控制器的设计3.3 动态神经网络模型 3.10 单一神经元控制法目录353.8 神经网络控制的学习机制 v神经元控制器的目的在于如何设计一个有效 的神经元网络去完成代替传统控制器的作用 ,使得系统的输出跟随系统的期望输出为 了达到这个目的,神经网络的学习方法就是 寻找一种有效的途径进行网络连接权阵或网 络结构的修改,从而使得网络控制器输出的 控制信号能够保证系统输出跟随系统的期望 输出 36分类v3.8.1 监督式学习n离线学习法n学习法n反馈误差学习法n多网络学习法v3.8.2 增强式学习371. 离线学习法 适合静态环境382. 学习法 适合模型已知的动态环境39学习方法 v采用最速下降法 假设设系统统的Jacobian矩阵阵已知403. 反馈误差学习法 适用于非线性系统线性绝对占优条件下的 网络学习 414. 多神经网络学习法1 v前向建模多网络控制 42多神经网络学习法2 v逆模型建模的多网络控制结构图 433.8.2 增强式学习 v利用当前控制是否成功来决定下一次控制该 如何走的学习方式。
v修正的办法是对某一成功的行为进行鼓励, 而对不成功的行为进行惩罚 v用神经网络来实现时, 则可在权值空间进行 调整443.1 引言3.2 前向神经网络模型3.6 神经网络控制基础3.7 非线性动态系统的神经网络辨识3.8 神经网络控制的学习机制3.9 神经网络控制器的设计3.3 动态神经网络模型 3.10 单一神经元控制法目录453.9.1 直接逆模型控制法 3.9.2 直接网络控制法 3.9.3 多网络自学习控制法 3.9 神经网络控制器的设计 463.9.1 直接逆模型控制法 训练结构示意图 47直接逆模型控制的结构示意图 运行于静态参数环境483.9.1 直接逆模型控制法 3.9.2 直接网络控制法 3.9.3 多网络自学习控制法 3.9 神经网络控制器的设计 493.9.2 直接网络控制法 50例3-10v考虑被控系统 假设动力学逆模型成立 ,为v试用直接网络控制法控制51解v构造神经网络结构为Π5,25,12,1 v输出单元层的神经元的激励函数为激励函数 为非线性被控系统、其余层的神经元为 Sigmoid激励元 v取η=0.05 v期望输出为: 52学习公式输出层 隐含层 53学习结果100次541摄动法2符号函数法 3前向神经网络方针模型法 4多网络自学习控制法 Jacobian矩阵的替代553.9.1 直接逆模型控制法 3.9.2 直接网络控制法 3.9.3 多网络自学习控制法 3.9 神经网络控制器的设计 563.9.3 多网络自学习控制法 v基本思想是利用逆动力学模型和系统的期望 输出yd(k+1)去构造一个期望的控制量ud(k), 从而解决了神经控制器Nc在系统模型未知情 况下的学习问题。
57多网络自学习控制法 58例3-11 v考虑非线性系统 v求:试用多神经自学习网络控制方法来设计 此系统的非线性控制器,要求系统的期望输 出为:59解v假设被控对象的逆动力学模型存在,即有:神经网络辨识器Ni的结构为 ; 神经网络控制器Nc的网络结构为 ; 输出神经元均为线性单元60曲线跟踪效果613.1 引言3.2 前向神经网络模型3.6 神经网络控制基础3.7 非线性动态系统的神经网络辨识3.8 神经网络控制的学习机制3.9 神经网络控制器的设计3.3 动态神经网络模型 3.10 单一神经元控制法目录623.10 单一神经元控制 式中,1>γ>0为衰减速率,η>0为学习速率, pi(t)表示递进学习策略63Hebbian学习习监监督学习习联联想式学习习 z(t) 是教师师信号,如控制误误差学习习策略64控制系统的一般形式65直接控制输出66增量式控制输出67增量式PID控制v如取 v可得自适应增量式PID控制68。