智能控制第七章神经控制系统

上传人:鲁** 文档编号:580333333 上传时间:2024-08-28 格式:PPT 页数:56 大小:776KB
返回 下载 相关 举报
智能控制第七章神经控制系统_第1页
第1页 / 共56页
智能控制第七章神经控制系统_第2页
第2页 / 共56页
智能控制第七章神经控制系统_第3页
第3页 / 共56页
智能控制第七章神经控制系统_第4页
第4页 / 共56页
智能控制第七章神经控制系统_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《智能控制第七章神经控制系统》由会员分享,可在线阅读,更多相关《智能控制第七章神经控制系统(56页珍藏版)》请在金锄头文库上搜索。

1、智智 能能 控控 制制Intelligent ControlIntelligent Control第七章第七章 神经控制系统神经控制系统(NeuralControlSystem) 7.1 神经网络神经网络 (NN)简介简介7.1.1 人工神经网络人工神经网络(ANN)(ANN)的起源与发展的起源与发展自自1960年威德罗年威德罗(Widrow)和霍夫和霍夫(Hoff)率先把神经网络用于率先把神经网络用于自动控制研究以来,对这一课题的研究艰难地取得一些进展。自动控制研究以来,对这一课题的研究艰难地取得一些进展。60年代末期至年代末期至80年代中期,神经网络控制与整个神经网络研年代中期,神经网络控

2、制与整个神经网络研究一样,处于低潮。究一样,处于低潮。80年代后期以来,随着人工神经网络研究的复苏和发展,对年代后期以来,随着人工神经网络研究的复苏和发展,对神经网络控制的研究也十分活跃。这方面的研究进展主要在神神经网络控制的研究也十分活跃。这方面的研究进展主要在神经网络自适应控制和模糊神经网络控制及其在机器人控制中的经网络自适应控制和模糊神经网络控制及其在机器人控制中的应用上。应用上。7.1.2 用于控制的人工神经网络用于控制的人工神经网络人工神经网络的特性人工神经网络的特性: 并行分布处理并行分布处理; ; 非线性映射非线性映射; ; 通过训练进行学习通过训练进行学习; ; 适应与集成适应

3、与集成; ;硬件实现硬件实现.(1)模式信息处理和模式识别;模式信息处理和模式识别;(2)最优化问题计算;最优化问题计算;(3)复杂系统控制;复杂系统控制;(4)通信。通信。人工神经网络的应用人工神经网络的应用: :7.2 人工神经网络的模型与结构人工神经网络的模型与结构7.2.1 生物神经元模型生物神经元模型 神经元的主要组成部分:细胞体、轴突、树突、突触等。神经元的主要组成部分:细胞体、轴突、树突、突触等。从生物控制论的角度,神经元作为控制和信息处从生物控制论的角度,神经元作为控制和信息处理的基本单元,具有以下几个重要功能和特点:理的基本单元,具有以下几个重要功能和特点:1) 1) 动态极

4、化原则;动态极化原则;2) 2) 时空整合功能;时空整合功能;3) 3) 兴奋与抑制状态;兴奋与抑制状态;4) 4) 脉冲与电位转换;脉冲与电位转换;5) 5) 突触延时和不应期。突触延时和不应期。7.2.2 人工神经元模型及其特性人工神经元模型及其特性人工神经元由多个输入人工神经元由多个输入xi,i=1,2,.,n和一个输出和一个输出y组成,组成,中间状态由输入信号的权和表示,而输出为:中间状态由输入信号的权和表示,而输出为:(7.1)式中,式中, j为神经元单元的偏置(阈值),为神经元单元的偏置(阈值),wji为连接权系数(对于为连接权系数(对于激发状态,激发状态, wji取正值,对于抑制

5、状态,取正值,对于抑制状态, wji取负值),取负值),n为输入信为输入信号数目,号数目,yj为神经元输出,为神经元输出,t为为时间,时间,f(-)为输出变换函数,为输出变换函数,有时叫做激发或激励函数,往有时叫做激发或激励函数,往往采用取往采用取0和和1值的二值函数值的二值函数或或形函数,见下图。形函数,见下图。图图7.1神经元模型神经元模型这三种函数都是连续和非线性的。一种二值函数可由下式表示:这三种函数都是连续和非线性的。一种二值函数可由下式表示:(7.2)一种常规的一种常规的形函数可由下式表示:形函数可由下式表示:(7.3)双曲正切函数如下式所示:双曲正切函数如下式所示:(7.4)图图

6、7.2神经元中的某些变换(激发)函数神经元中的某些变换(激发)函数(a)二值函数)二值函数(b)S形函数形函数(c)双曲正切函数)双曲正切函数7.2.3 人工神经网络的基本类型人工神经网络的基本类型1.人工神经网络的基本特性和结构人工神经网络的基本特性和结构人工神经网络的结构基本上分为两类,即递归(反馈)网络人工神经网络的结构基本上分为两类,即递归(反馈)网络和前馈网络。和前馈网络。基本特性基本特性ANN分类分类人工神经网络是一种具有下列特性的有向图:人工神经网络是一种具有下列特性的有向图:对于每个节点对于每个节点i 存在一个状态变量存在一个状态变量xi;从节点从节点j 至节点至节点i ,存在

7、一个连接权系统数存在一个连接权系统数wij;对于每个节点对于每个节点i ,存在一个阈值存在一个阈值 i;对于每个节点对于每个节点i ,定义一个变换函数定义一个变换函数:对于最一般的情况,对于最一般的情况,此函数取此函数取形式形式。递归(反馈)网络递归(反馈)网络:在递归网络中,多个神经元互连以组织在递归网络中,多个神经元互连以组织一个互连神经网络,如图一个互连神经网络,如图7.3所示。有些神经元的输出被反馈所示。有些神经元的输出被反馈至同层或前层神经元。至同层或前层神经元。Hopfield网络网络,Elman网络和网络和Jordan网络是递归网络有代表性的例子。网络是递归网络有代表性的例子。前

8、馈网络前馈网络:前馈网络具有递阶分层结构,由一些同层神经元前馈网络具有递阶分层结构,由一些同层神经元间不存在互连的层级组成。从输入层至输出层的信号通过单向间不存在互连的层级组成。从输入层至输出层的信号通过单向连接流通;神经元从一层连接至下一层,不存在同层神经元间连接流通;神经元从一层连接至下一层,不存在同层神经元间的连接,如图的连接,如图7.4所示。所示。图图7.3递归(反馈)网络递归(反馈)网络图图7.4前馈(多层)网络前馈(多层)网络2.人工神经网络的主要学习算法人工神经网络的主要学习算法有师学习有师学习有师学习算法能够根据期望的和实际的网络输出(对应于有师学习算法能够根据期望的和实际的网

9、络输出(对应于给定输入)间的差来调整神经元间连接的强度或权。有师学习给定输入)间的差来调整神经元间连接的强度或权。有师学习算法的例子包括算法的例子包括Delta规则、广义规则、广义Delta规则或反向传播算法规则或反向传播算法BP以及以及LVQ算法等。算法等。无师学习无师学习无师学习算法不需要知道期望输出。在训练过程中,只要向无师学习算法不需要知道期望输出。在训练过程中,只要向神经网络提供输入模式,神经网络就能够自动地适应连接权,以神经网络提供输入模式,神经网络就能够自动地适应连接权,以便按相似特征把输入模式分组聚集。便按相似特征把输入模式分组聚集。强化学习强化学习强化学习是有师学习的特例。它

10、不需要老师给出目标输出。强化学习是有师学习的特例。它不需要老师给出目标输出。强化学习算法采用一个强化学习算法采用一个“评论员评论员”来评价与给定输入相对应的神来评价与给定输入相对应的神经网络输出的优度(质量因数)。强化学习算法的一个例子是经网络输出的优度(质量因数)。强化学习算法的一个例子是遗传算法(遗传算法(GA)。)。7.2.4 人工神经网络的典型模型人工神经网络的典型模型续前表:续前表:7.3 人工神经网络示例及其算法人工神经网络示例及其算法人工神经网络的许多算法已在神经控制中获得广泛采用,下人工神经网络的许多算法已在神经控制中获得广泛采用,下面对几种比较重要的网络及其算法加以简要讨论。

11、面对几种比较重要的网络及其算法加以简要讨论。7.3.1 多层感知器多层感知器(MLP)多层感知器是最著名的前馈网络。图多层感知器是最著名的前馈网络。图7.4给出一个三层给出一个三层MLP,即输入层、中间(隐含)层和输出层。输入层的神经元只起到缓即输入层、中间(隐含)层和输出层。输入层的神经元只起到缓冲器的作用,把输入信号分配至隐含层的神经元。隐含层的每个冲器的作用,把输入信号分配至隐含层的神经元。隐含层的每个神经元神经元j(见图(见图7.1)在对输入信号加权)在对输入信号加权wij之后,进行求和,并计之后,进行求和,并计算出输出算出输出yj作为该和的作为该和的f 函数,即函数,即(7.5)反向

12、传播算法反向传播算法(BP)是一种最常采用的训练算法,另一种适是一种最常采用的训练算法,另一种适于训练于训练MLP的学习算法是遗传算法(的学习算法是遗传算法(GA)。)。反反向向传传播播算算法法是是一一种种最最常常采采用用的的训训练练算算法法,它它给给出出神神经元经元i和和j间连接权的变化间连接权的变化,如下式所示:,如下式所示:(7.6)式中,式中,为一称为学习速率的参数,为一称为学习速率的参数,为一取决于神经元为一取决于神经元j是否是否为一输出神经元或隐含神经元的系数。对于输出神经元,为一输出神经元或隐含神经元的系数。对于输出神经元,(7.7)对于隐含神经元,对于隐含神经元,(7.8)在在

13、上上述述两两式式中中, 表表示示所所有有输输入入信信号号对对神神经经元元j的的加加权权总总和和, 为神经元为神经元j的目标输出。的目标输出。另一种适于训练的学习算法是遗传算法(另一种适于训练的学习算法是遗传算法(GA)该该算算法法以以某某个个随随机机产产生生的的染染色色体体群群体体开开始始,并并应应用用基基因因算算子子产产生生新新的的更更为为合合适适的的群群体体。选选择择算算子子从从现现有有群群体体选选择择染染色色体体供供繁繁殖殖用用。交交叉叉算算子子通通过过在在随随机机位位置置切切开开染染色色体体并并交交换换切切开开后后续续位位置置内内的的成成分分,从从两两个个现现存存的的染染色色体体产产生

14、生两两个个新新的的染染色色体体。变变异异算算子子通通过过随随机机地地改改变变现现有有染染色色体体的的基基因因,产产生生新新的的染染色色体体。这这些些算算子子一一起起模模拟拟一一个个导导向向随随机机搜搜索索方方法法,此此方方法法最最终终能能够够求求得得神神经经网网络络的的目目标标输出。输出。7.3.2 数据群处理方法数据群处理方法(GMDH)网络网络图图7.6和图和图7.7分别表分别表示一个数据群处理方法示一个数据群处理方法网络及其一个神经元的网络及其一个神经元的细节。每个细节。每个GMDH神经神经元是一元是一N-Adalilne,即,即为一含有非线性预处理为一含有非线性预处理器的自适应线性元件

15、。器的自适应线性元件。训练网络包含训练网络包含下列过程:从输入层开下列过程:从输入层开始构造网络,调整每个始构造网络,调整每个神经元的权值,增加层神经元的权值,增加层数直至达到映射精度为数直至达到映射精度为止。止。图图7.6一个受训练的一个受训练的GMDH网络网络图图7.7一个神经元的详图一个神经元的详图7.3.3 自适应谐振理论自适应谐振理论(ART)网络网络1.ART-1版本版本图图7.8一个一个ART-1网络网络用于处理二值输入,从下图可以看出,一个用于处理二值输入,从下图可以看出,一个ART-1网络含有两层,网络含有两层,一个输入层和一个输出层。这两层完全互连,该连接沿着正向(自一个输

16、入层和一个输出层。这两层完全互连,该连接沿着正向(自底向上)和反馈(自顶向下)两个方向进行。底向上)和反馈(自顶向下)两个方向进行。当当ART-1网络在工作时,其训练是连续进行的,包括网络在工作时,其训练是连续进行的,包括8个步骤。个步骤。2.ART-2版本版本能够处理连续值输入。能够处理连续值输入。右图给出一个学习矢量量化网络,右图给出一个学习矢量量化网络,它由三层神经元组成,即输入转换层、它由三层神经元组成,即输入转换层、隐含层和输出层。该网络在输入层与隐含层和输出层。该网络在输入层与隐含层间为完全连接,而在隐含层与隐含层间为完全连接,而在隐含层与输出层间为部分连接,每个输出神经输出层间为

17、部分连接,每个输出神经元与隐含神经元的不同组相连接。元与隐含神经元的不同组相连接。图图7.9学习矢量化网络学习矢量化网络7.3.4 学习矢量量化学习矢量量化(LVQ)网络网络最简单的训练步骤如下:最简单的训练步骤如下:(1)预置参考矢量初始权值。预置参考矢量初始权值。(2)提供给网络一个训练输入模式。提供给网络一个训练输入模式。(3)计算输入模式与每个参考矢量间的计算输入模式与每个参考矢量间的Euclidean距离。距离。(4)更新最接近输入模式的参考矢量(即获胜隐含神经元的参考矢量)的权值。更新最接近输入模式的参考矢量(即获胜隐含神经元的参考矢量)的权值。如果获胜隐含神经元以输入模式一样的类

18、属于连接至输出神经元的缓冲器,那如果获胜隐含神经元以输入模式一样的类属于连接至输出神经元的缓冲器,那么参考矢量应更接近输入模式。否则,参考矢量就离开输入模式。么参考矢量应更接近输入模式。否则,参考矢量就离开输入模式。(5)转至转至(2),以某个新的训练输入模式重复本过程,直至全部训练模式被正确,以某个新的训练输入模式重复本过程,直至全部训练模式被正确地分类或者满足某个终止准则为止。地分类或者满足某个终止准则为止。7.3.5 Kohonen网络网络Kohonen网络或自组织特征映射网络含有两层,一个输入缓冲网络或自组织特征映射网络含有两层,一个输入缓冲层用于接收输入模式,另一为输出层。输出层的神

19、经元一般按正层用于接收输入模式,另一为输出层。输出层的神经元一般按正则二维阵列排列,每个输出神经元连接至所有输入神经元。则二维阵列排列,每个输出神经元连接至所有输入神经元。连接权值形成与已知输出神经元相连的参考矢量的分量。连接权值形成与已知输出神经元相连的参考矢量的分量。图图7.10Kohonen网络网络7.3.6 Hopfield网络网络Hopfield网络是一种典型的递归网络(见图网络是一种典型的递归网络(见图7.3)。下图表)。下图表示示Hopfield网络的一种方案。这种网络通常只接受二进制输入网络的一种方案。这种网络通常只接受二进制输入(或或)以及双极性输入以及双极性输入(+1或或-

20、1)。它含有一个单层神经元,每个神。它含有一个单层神经元,每个神经元与所有其它神经元连接,形成递归结构。经元与所有其它神经元连接,形成递归结构。Hopfield网络的训网络的训练只有一步。练只有一步。图图7.11一种一种Hopfield网络网络7.3.7 ElmanandJordan网络网络图图7.12Elman网络网络图图7.13Jordan网络网络图图7.12和图和图7.13分别示出分别示出Elman网络和网络和Jordan网络。这两种网网络。这两种网络具有与络具有与MLP网络相似的多层结构。在这两种网络中,除了普通网络相似的多层结构。在这两种网络中,除了普通的隐含层外,还有一个特别的隐含

21、层,有时称为上下文层或状态的隐含层外,还有一个特别的隐含层,有时称为上下文层或状态层;该层从普通隐含层(对于层;该层从普通隐含层(对于Elman网)或输出层(对于网)或输出层(对于Jordan网)接收反馈信号。网)接收反馈信号。7.3.8 小脑模型连接控制小脑模型连接控制(CMAC)网络网络CMAC网络可视为一种具有模糊联想记忆特性监督式(有导网络可视为一种具有模糊联想记忆特性监督式(有导师)前馈神经网络。图师)前馈神经网络。图7.14表示网络的基本模块。表示网络的基本模块。图图7.14CMAC网络的基本模块网络的基本模块CMAC由一系列映射组成:由一系列映射组成:(7.17)式中,式中,输入

22、矢量输入矢量,中间变量中间变量,联想单元矢量联想单元矢量,CMAC的输出的输出 h(S),h g f e。7.4 神经控制的结构方案神经控制的结构方案7.4.1 NN学习控制学习控制图图7.16给出一个给出一个NN学习控制的结构,包括一个导师(监督程学习控制的结构,包括一个导师(监督程序)和一个可训练的神经网络控制器(序)和一个可训练的神经网络控制器(NNC)。控制器的输入对)。控制器的输入对应于由人接收(收集)的传感输入信息,而用于训练的输出对应应于由人接收(收集)的传感输入信息,而用于训练的输出对应于人对系统的控制输入。于人对系统的控制输入。图图7.16基于神经网络的监督式控制基于神经网络

23、的监督式控制实现实现NN监督式控制的步骤如下:监督式控制的步骤如下:通过传感器和传感信息处理,调用必要的和有用的控制信息。通过传感器和传感信息处理,调用必要的和有用的控制信息。构造神经网络,即选择构造神经网络,即选择NN类型、结构参数和学习算法等。类型、结构参数和学习算法等。训练控制器,实现输入和输出间的映射,以便进行正确的训练控制器,实现输入和输出间的映射,以便进行正确的控制。控制。NN监督式控制已被成功应用于倒立摆小车控制系统。监督式控制已被成功应用于倒立摆小车控制系统。7.4.2 NN直接逆控制直接逆控制下图给出下图给出NN直接逆控制的两种结构方案。在图直接逆控制的两种结构方案。在图7.

24、17()中,中,网络网络NN1和和NN2具有相同的逆模型网络结构,而且采用同样的具有相同的逆模型网络结构,而且采用同样的学习算法。图学习算法。图7.17()为为NN直接逆控制的另一种结构方案,图直接逆控制的另一种结构方案,图中采用一个评价函数中采用一个评价函数(EF)。图图7.17直接逆控制直接逆控制NN直接逆控制采用受控系统的一个逆模型,它与受控系统直接逆控制采用受控系统的一个逆模型,它与受控系统串接以便使系统在期望响应(网络输入)与受控系统输出间得串接以便使系统在期望响应(网络输入)与受控系统输出间得到一个相同的映射。到一个相同的映射。7.4.3 NN自适应控制自适应控制NN自适应控制也分

25、为两类,即自校正控制自适应控制也分为两类,即自校正控制(STC)和模型参和模型参考自适应控制考自适应控制(MRAC)。STC和和MRAC之间的差别在于:之间的差别在于:STC根据受控系统的正和根据受控系统的正和(或)逆模型辨识结果直接调节控制器的内部参数,以期能够(或)逆模型辨识结果直接调节控制器的内部参数,以期能够满足系统的给定性能指标;在满足系统的给定性能指标;在MRAC中,闭环控制系统的期望中,闭环控制系统的期望性能是由一个稳定的参考模型描述的,而该模型又是由输入性能是由一个稳定的参考模型描述的,而该模型又是由输入输出对输出对确定的。确定的。1.NN自校正控制(自校正控制(STC)NN直

26、接自校正控制直接自校正控制该控制系统由一个常规控制器和一个具有离线该控制系统由一个常规控制器和一个具有离线辨识能力的识别器组成;后者具有很高的建模精度。辨识能力的识别器组成;后者具有很高的建模精度。NN直接自校正控制的直接自校正控制的结构基本上与直接逆控制相同。结构基本上与直接逆控制相同。NN间接自校正控制间接自校正控制本控制系统由一个本控制系统由一个NN控制器和一个能够在线修控制器和一个能够在线修正的正的NN识别器组成;下图表示出了识别器组成;下图表示出了NN间接间接STC的结构的结构。2.NN模型参考自适应控制模型参考自适应控制图图7.18间接自校正控制间接自校正控制NN直接模型参考自适应

27、控制直接模型参考自适应控制:图图7.19直接模型参考自适应控制直接模型参考自适应控制图图7.20间接模型参考自适应控制间接模型参考自适应控制间接模型参考自适应控制间接模型参考自适应控制:7.4.4 NN内模控制内模控制基于基于NN的内模控制的结构如下图所示,其中,系统模型的内模控制的结构如下图所示,其中,系统模型(NN2)与实际系统并行设置。反馈信号由系统输出与模型输出与实际系统并行设置。反馈信号由系统输出与模型输出间的差得到,然后由间的差得到,然后由NN1(在正向控制通道上一个具有逆模型在正向控制通道上一个具有逆模型的的NN控制器控制器)进行处理;进行处理;NN1控制器与系统的逆有关。控制器

28、与系统的逆有关。图图7.21NN内模控制内模控制7.4.5 NN预测控制预测控制1.NN预测控制的特点预测控制的特点具有预测模型、滚动优化和反馈校正等特点具有预测模型、滚动优化和反馈校正等特点。2.NN预测控制的结构预测控制的结构图图7.22预测控制预测控制下图表示出了下图表示出了NN预测控制的一种结构方案;图中,神经网络预测器预测控制的一种结构方案;图中,神经网络预测器NNP为一神经网络模型,为一神经网络模型,NLO为一非线性优化器。为一非线性优化器。NNP预测受控对象在一预测受控对象在一定范围内的未来响应:定范围内的未来响应:基于神经网络的预测控制算法步骤如下:基于神经网络的预测控制算法步

29、骤如下:(1)计算期望的未来输出序列:)计算期望的未来输出序列:(2)借助)借助NN预测模型,产生预测输出:预测模型,产生预测输出:(3)计算预测误差)计算预测误差:(4)求性能判据)求性能判据J的最小值,获得最优控制序列的最小值,获得最优控制序列u(t+j),j=0,1,2,., N;(5)采用)采用u(t)作为第一个控制信号,然后转至第()作为第一个控制信号,然后转至第(1)步。)步。如果在时刻(如果在时刻(tj)的预测误差定义为:)的预测误差定义为:那么非线性优化器那么非线性优化器NLO将选择控制信号将选择控制信号u(t)使二次性能判据)使二次性能判据J为最小:为最小:7.4.6 NN自

30、适应判断控制自适应判断控制NN自适应判断控制是由自适应判断控制是由Barto等提出的,并由等提出的,并由Anderson发发展的,它应用强化学习的机理。这种控制系统通常由两个网络展的,它应用强化学习的机理。这种控制系统通常由两个网络组成,即自适应判断网络组成,即自适应判断网络AJN和控制选择网络和控制选择网络CSN,如图,如图7.23所示。所示。图图7.23NN自适应判断控制自适应判断控制AJN的作用:的作用:通过不断的奖罚强化学习,使通过不断的奖罚强化学习,使AJN逐渐训练逐渐训练为一个熟练的教师;为一个熟练的教师;经过学习后,根据受控系统的当前状态和外经过学习后,根据受控系统的当前状态和外

31、部强化反馈信号部强化反馈信号(),AJN产生一强化信号,产生一强化信号,然后提供内部强化信号,以便能够判断当前控然后提供内部强化信号,以便能够判断当前控制作用的效果。制作用的效果。CSN的作用:的作用:CSN相当于多层前馈神经网络控相当于多层前馈神经网络控制器,它在内部强化信号的引导下进制器,它在内部强化信号的引导下进行学习。通过学习,行学习。通过学习,CSN根据系统编根据系统编码后的状态,选择下一个控制作用。码后的状态,选择下一个控制作用。7.4.7 基于基于CAMC的控制的控制CMAC是由是由Albus开发的,是近年来获得应用的几种主要神经开发的,是近年来获得应用的几种主要神经控制器之一。

32、把控制器之一。把CMAC用于控制有两种方案。用于控制有两种方案。第一种方案的结构如图第一种方案的结构如图7.24所示。在该控制系统中,指令信所示。在该控制系统中,指令信号、反馈信号均用作号、反馈信号均用作CMAC控制控制器的输入。控制器输出直接送至器的输入。控制器输出直接送至受控装置(对象)。受控装置(对象)。图图7.24基于基于CMAC的控制(的控制()图图7.25基于基于CAMC的控制(的控制()第二种方案的结构如图第二种方案的结构如图7.25所示。在该方案中,参考输出方所示。在该方案中,参考输出方块在每个控制周期产生一个期望块在每个控制周期产生一个期望输出。该期望输出被送至输出。该期望输

33、出被送至CMAC模块,提供一个信号作为对固定模块,提供一个信号作为对固定增益常规偏差反馈控制器控制信增益常规偏差反馈控制器控制信号的补充。号的补充。7.4.8 多层多层NN控制控制多层神经网络控制器基本上是一种前馈控制器。下图所示的多层神经网络控制器基本上是一种前馈控制器。下图所示的是一个普通的多层神经控制系统。该系统存在两个控制作用:前是一个普通的多层神经控制系统。该系统存在两个控制作用:前馈控制和常规控制。前馈控制由神经网络实现,前馈部分的训练馈控制和常规控制。前馈控制由神经网络实现,前馈部分的训练目标在于使期望输出与实际装置输出间的偏差为最小。现已提出目标在于使期望输出与实际装置输出间的

34、偏差为最小。现已提出多层多层NN控制器的三种结构:间接结构、通用结构和专用结构。控制器的三种结构:间接结构、通用结构和专用结构。图图7.26多层控制的一般结构多层控制的一般结构1.间接学习结构间接学习结构图图7.27所示的间接多层所示的间接多层NN控控制结构含有两个同样的神经网络,制结构含有两个同样的神经网络,用于训练。在本结构中,每个网用于训练。在本结构中,每个网络作为一个逆动态辨识器。训练络作为一个逆动态辨识器。训练的目标是要从期望响应的目标是要从期望响应d 中找到中找到一个合适的装置控制一个合适的装置控制。图图7.27间接学习结构的多层控制间接学习结构的多层控制2.通用学习结构通用学习结

35、构图图7.28通用学习结构通用学习结构图图7.28给出多层控制的通用学给出多层控制的通用学习结构,它使图习结构,它使图7.27中的中的y为为最小。该网络被训练使得装置输入最小。该网络被训练使得装置输入与与网络输出网络输出u*间的差别为最小。间的差别为最小。3.专用学习结构专用学习结构图图7.29专用学习结构专用学习结构多层多层NN控制的专用学习结构如下图所示。当神经网络控制的专用学习结构如下图所示。当神经网络训练时,期望输出训练时,期望输出是该网络的输入。采用误差反向传播是该网络的输入。采用误差反向传播(BP)方法,经过训练使期望输出方法,经过训练使期望输出与装置的实际输出与装置的实际输出之间

36、之间的差的差为最小为最小。7.4.9 分级分级NN控制控制基于神经网络的分级控制模型如下图所示。图中,基于神经网络的分级控制模型如下图所示。图中,为受控为受控装置的期望输出,装置的期望输出,为装置的控制输入,为装置的控制输入,为装置的实际输出,为装置的实际输出,u*和和y*为由神经网络为由神经网络和和给出的装置计算输入与输出。给出的装置计算输入与输出。该系统可视为由三部分组成。第一部分为一常规外反馈回路。该系统可视为由三部分组成。第一部分为一常规外反馈回路。第二部分是与神经网络第二部分是与神经网络连接的通道。系统的第三部分是神经网连接的通道。系统的第三部分是神经网络络,它监控期望输出,它监控期

37、望输出和装置输入和装置输入。图图7.30分级神经网络控制器分级神经网络控制器可把分级神经网络模型控制系统分为两个子系统,即基于正向可把分级神经网络模型控制系统分为两个子系统,即基于正向动力学辨识器的系统(见图动力学辨识器的系统(见图7.31)和基于逆向动力学辨识器的系)和基于逆向动力学辨识器的系统(见图统(见图7.32),并可以单独应用它们。),并可以单独应用它们。图图7.31基于正向动力学辨识器的控制系统基于正向动力学辨识器的控制系统图图7.32基于逆向动力学辨识器的控制系统基于逆向动力学辨识器的控制系统基于分级神经网络模型的控制系统具有下列特点:基于分级神经网络模型的控制系统具有下列特点:

38、该系统含有两个辨识器,一个用于辨识装置的动力学特性,该系统含有两个辨识器,一个用于辨识装置的动力学特性,另一个用于辨识装置的逆动力学特性。另一个用于辨识装置的逆动力学特性。存在一个主反馈回路,它对训练神经网络是很重要的。存在一个主反馈回路,它对训练神经网络是很重要的。当训练进行时,逆动力学部分变为主控制器。当训练进行时,逆动力学部分变为主控制器。本控制的最后效果与前馈控制的效果相似。本控制的最后效果与前馈控制的效果相似。7.5 模糊逻辑、专家系统及神经网络在控制中的集成模糊逻辑、专家系统及神经网络在控制中的集成7.5.1模糊神经网络原理模糊神经网络原理模糊系统与神经网络的比较:模糊系统与神经网

39、络的比较:表表7.5模糊系统与神经网络的比较模糊系统与神经网络的比较实现模糊神经网络组合的方法基本上分为两种。第一种方法实现模糊神经网络组合的方法基本上分为两种。第一种方法在于寻求模糊推理算法与神经网络示例之间的功能映射,而第二在于寻求模糊推理算法与神经网络示例之间的功能映射,而第二种方法却力图找到一种从模糊推理系统到一类神经网络的结构映种方法却力图找到一种从模糊推理系统到一类神经网络的结构映射。射。1.FNN的概念与结构的概念与结构图图7.33神经网络神经网络FNN3定义定义7.1一个正则模糊神经网络一个正则模糊神经网络(RFNN)为一具有模糊信号和为一具有模糊信号和或模糊权值的神经网络,即

40、(或模糊权值的神经网络,即(1)FNN1具有实数输入信号和模糊具有实数输入信号和模糊权值;(权值;(2)FNN2具有模糊集输入信号和实数权值;(具有模糊集输入信号和实数权值;(3)FNN3具有模糊集输入信号和模糊权值。具有模糊集输入信号和模糊权值。定义定义7.2混合模糊神经网络(混合模糊神经网络(HFNN)是另一类)是另一类FNN,它组合模,它组合模糊信号和神经网络权值,应用加和乘等操作获得神经网络输入糊信号和神经网络权值,应用加和乘等操作获得神经网络输入。设设FNN3具具有有同同图图7.33一一样样的的结结构构。输输入入神神经经元元1和和2的的输输入入分分别别为为模模糊糊信信号号,于是隐含神

41、经元,于是隐含神经元k的输入为:的输入为:而第而第k个隐含神经元的输出为:个隐含神经元的输出为:若若f 为一为一S形函数,则输出神经元的输入为:形函数,则输出神经元的输入为:最后输出为:最后输出为:2.FNN的学习算法的学习算法模糊反向传播算法模糊反向传播算法基于基于FNN3的模糊反向传播算法是由的模糊反向传播算法是由Barkley开发的。开发的。基于基于分割的反向传播算法分割的反向传播算法遗传算法遗传算法遗传算法能够产生一个最优的参数集合用于基于初始参数遗传算法能够产生一个最优的参数集合用于基于初始参数的主观选择或随机选择的模糊推理模型。的主观选择或随机选择的模糊推理模型。其它学习算法其它学

42、习算法模糊混沌(模糊混沌(fuzzychaos)以及基于其它模糊神经元的算法)以及基于其它模糊神经元的算法将是进一步研究所感兴趣的课题。将是进一步研究所感兴趣的课题。3.FNN的逼近能力的逼近能力基于模糊运算和扩展原理的基于模糊运算和扩展原理的RFNN不可能成为通用近似器,不可能成为通用近似器,而而HFNN因无需以标准模糊运算为基础则能够成为通用近似器因无需以标准模糊运算为基础则能够成为通用近似器。7.5.2模糊神经控制方案模糊神经控制方案这些方案主要分为两个方面,即结构上等价于模糊系统的这些方案主要分为两个方面,即结构上等价于模糊系统的NN控制以及功能上等价于模糊系统的控制以及功能上等价于模

43、糊系统的NN控制。控制。1.混合混合本方案中,神经网络与模糊集被独立地用于系统,两者之本方案中,神经网络与模糊集被独立地用于系统,两者之一作为另一者的预处理器。例如,模糊集用作神经网络的监督一作为另一者的预处理器。例如,模糊集用作神经网络的监督器(导师)或判据,以便改善学习的收敛性,如图器(导师)或判据,以便改善学习的收敛性,如图7.34所示。所示。图图7.34混合混合2.似神经模糊集(似神经模糊集(FAM)在这种方案中,在这种方案中,FNN采用由模糊集描述的模糊神经元。在采用由模糊集描述的模糊神经元。在基于知识的系统中,一个条件语句集合,规则基于知识的系统中,一个条件语句集合,规则集常常用于

44、表示从人类专家那里提取的知识。图集常常用于表示从人类专家那里提取的知识。图7.35给出一种给出一种结构。其中把输入参数聚集进模糊子空间,并由加结构。其中把输入参数聚集进模糊子空间,并由加权网络来辨识输入输出关系。权网络来辨识输入输出关系。图图7.35一种神经状模糊集的结构一种神经状模糊集的结构另一种似神经模糊系统另一种似神经模糊系统FAM(模糊联想记忆系统)是由(模糊联想记忆系统)是由Kosko提出的。提出的。3.自适应自适应在在FNN的发展过程中,提出了一种由神经网络实现的自适应的发展过程中,提出了一种由神经网络实现的自适应模糊逻辑控制器。该神经网络可视为从模糊系统到神经网络的一模糊逻辑控制

45、器。该神经网络可视为从模糊系统到神经网络的一种结构映射。模糊逻辑控制器的决策过程导致一个由三类子网络种结构映射。模糊逻辑控制器的决策过程导致一个由三类子网络构成的神经模糊网络,分别用于模式识别、模糊推理和控制综合,构成的神经模糊网络,分别用于模式识别、模糊推理和控制综合,如图如图7.36所示。所示。图图7.36的三个子网络的三个子网络另一种自适应另一种自适应FNN是基于自适应网络的模糊推理系统是基于自适应网络的模糊推理系统ANFIS。4.多层多层下图给出了一个用于控制与决策的五层模糊神经网络,其中,下图给出了一个用于控制与决策的五层模糊神经网络,其中,第第1层由输入语言节点组成,第层为输入项节

46、点,第层为规层由输入语言节点组成,第层为输入项节点,第层为规则节点,第层为输出项节点,第则节点,第层为输出项节点,第5层为输出语言节点。层为输出语言节点。图图7.37多层例子多层例子7.6 7.6 神经控制器的设计实例神经控制器的设计实例神经控制系统的设计一般应包括下列内容:神经控制系统的设计一般应包括下列内容: (1) (1) 建立受控对象的数学计算模型或知识表示模型。建立受控对象的数学计算模型或知识表示模型。(4) (4) 进行控制系统仿真试验,并通过试验结果改进设计。进行控制系统仿真试验,并通过试验结果改进设计。(3) (3) 设计神经控制器,包括控制器结构、功能表示与推理。设计神经控制

47、器,包括控制器结构、功能表示与推理。(2) (2) 选择神经网络及其算法,进行初步辨识与训练。选择神经网络及其算法,进行初步辨识与训练。 神经模糊自适应控制器的设计神经模糊自适应控制器的设计 1. 1. 控制器结构和工作原理控制器结构和工作原理+-+FC对象对象FIENNC图图7.42神经模糊自适应控制系统结构神经模糊自适应控制系统结构它它由由一一个个普普通通的的反反馈馈控控制制器器(FC)和和一一个个神神经经控控制制器器(NNC)组组成成,二二者的输入信号之和作为实际控制量对系统进行控制,即者的输入信号之和作为实际控制量对系统进行控制,即式中,式中, 是反馈控制器的输出;是反馈控制器的输出;

48、 神经控制器的输出,通常可描述为神经控制器的输出,通常可描述为 反馈控制器反馈控制器FCFC起着监控作用,在起着监控作用,在NNCNNC训练初期,训练初期,FCFC对系统实对系统实施启动控制,并保证闭环系统的稳定性。施启动控制,并保证闭环系统的稳定性。 神经控制器神经控制器NNCNNC是一个在线学习的自适应控制器,其作用是是一个在线学习的自适应控制器,其作用是综合系统的参考输入和跟踪误差,利用模糊推理机综合系统的参考输入和跟踪误差,利用模糊推理机FIEFIE的输出信的输出信号进行学习,不断逼近被控对象的逆动力学,使号进行学习,不断逼近被控对象的逆动力学,使FCFC的输出及其的输出及其变化趋于零

49、,从而逐步取消变化趋于零,从而逐步取消FCFC的作用,实现对系统的高精度跟的作用,实现对系统的高精度跟踪控制。踪控制。 2.神经控制器及其训练神经控制器及其训练 输输入入层层隐隐含含层层输输出出层层图图7.43NNC模型结构模型结构根据反馈误差学习法,网络权值的学习规则为:根据反馈误差学习法,网络权值的学习规则为: 为改善神经网络的学习效果,使为改善神经网络的学习效果,使NCC的输出变化与系统的运动特性相的输出变化与系统的运动特性相匹配,根据误差和误差变化,将系统的最终目标分解成若干分目标。匹配,根据误差和误差变化,将系统的最终目标分解成若干分目标。分目标学习误差由模糊推理机的一组模糊规则给出

50、分目标学习误差由模糊推理机的一组模糊规则给出NBNMNS0PSPMPBNBPBPBPBPMPMPS0NMPBPBPMPMPS0NSNSPBPMPMPS0NSNM0PMPMPS0NSNMNMPSPMPS0NSNMNMNBPMPS0NSNMNMNBNBPB0NSNMNMNBNBNB分目标学习误差规则表分目标学习误差规则表 为实现上述模糊推理规则,必须对为实现上述模糊推理规则,必须对FIE的输入变量进行模糊化处理,即将输的输入变量进行模糊化处理,即将输入变量从基本论域转化到相应的模糊论域。为此,引入入变量从基本论域转化到相应的模糊论域。为此,引入FC输出变量输出变量 及其变及其变化变量化变量 的量化

51、因子的量化因子 、FC的实时输出信号的实时输出信号及其变化及其变化经量化后的模糊变量经量化后的模糊变量、分别为分别为0124-55-6-4-2-136-3NBNMNSZRPBPMPS图图7.44FIE输入变量的隶属函数输入变量的隶属函数5-6-5-4-2-1012346-3NBPBPMPSZRNSNM图图7.45FIE输出变量的隶属函数输出变量的隶属函数在在控控制制过过程程中中,系系统统根根据据每每一一采采样样时时间间FC的的输输出出信信号号及及其其变变化化,有有图图7.44确确定定各各模模糊糊集集的的隶隶属属度度,然然后后利利用用模模糊糊推推理理规规则则表表7.6,确确定定图图7.45中中F

52、IE输输出出变变量量所所有有可可能能的的模模糊糊隶隶属属集集,并并以以重重心心法法进进行行模模糊糊判判决决,得得到到分分目目标标学学习误差习误差:确定分目标学习误差后,定义确定分目标学习误差后,定义NNC的训练误差函数如下的训练误差函数如下神经网络在线学习模糊自适应控制的算法如下:神经网络在线学习模糊自适应控制的算法如下:(1)初始化初始化FC及及NNC的结构、参数及各种训练参数。的结构、参数及各种训练参数。 (2) (2)在时刻在时刻,采样采样、,并计算系统输出偏差。,并计算系统输出偏差。(3)计算反馈控制器计算反馈控制器FC的输出信号的输出信号及其变化量及其变化量。(4)根据模糊推理规则,

53、求出根据模糊推理规则,求出NNC分目标学习误差分目标学习误差。(5)若若,修正,修正NNC的权值,否则,继续下一步。的权值,否则,继续下一步。(6)构造构造NNC的输入向量的输入向量,并计算其,并计算其输出输出。(7)计算控制器输出计算控制器输出,并送给被控对象,产生下一步输出,并送给被控对象,产生下一步输出。 (8) (8) 令令 ,对,对 进行移位处理,返回步骤进行移位处理,返回步骤(2)(2)高速列车运行过程的直接模糊神经控制高速列车运行过程的直接模糊神经控制1.模糊神经控制器模糊神经控制器控制器结构控制器结构图图7.49用于列车运行过程的模糊神经控制器的结构用于列车运行过程的模糊神经控制器的结构建立模糊关系建立模糊关系模糊推理模糊推理7.7神经控制系统应用举例神经控制系统应用举例2.列车运行过程的数学描述列车运行过程的数学描述3.模拟结果模拟结果基于提出的模糊神经控制器的列车运行过程闭环控制系统基于提出的模糊神经控制器的列车运行过程闭环控制系统如下图所示。如下图所示。图图7.51列车运行过程闭环控制系统框图列车运行过程闭环控制系统框图

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号