执行依赖启发式动态规划在同步发电机励磁系统中的应用

上传人:xzh****18 文档编号:44578202 上传时间:2018-06-14 格式:PDF 页数:4 大小:945.50KB
返回 下载 相关 举报
执行依赖启发式动态规划在同步发电机励磁系统中的应用_第1页
第1页 / 共4页
执行依赖启发式动态规划在同步发电机励磁系统中的应用_第2页
第2页 / 共4页
执行依赖启发式动态规划在同步发电机励磁系统中的应用_第3页
第3页 / 共4页
执行依赖启发式动态规划在同步发电机励磁系统中的应用_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《执行依赖启发式动态规划在同步发电机励磁系统中的应用》由会员分享,可在线阅读,更多相关《执行依赖启发式动态规划在同步发电机励磁系统中的应用(4页珍藏版)》请在金锄头文库上搜索。

1、?电气自动化?2011年第 33卷 第 2期电气传动和自动控制 El ec tric D rive 其次, 时间向后的算法产生巨大的计算量, 即? 维数灾?。使得该算法只电气传动和自动控制 El ec tric D rive 评价网络不但以系统状态作为输入, 同时也以控制变量作为输入, 输出 J(? )是对为代价函 数 J (? )的近似。ADHDP算法执行时并不需要模型网络来预测下一个时刻的系统状态, 所以该方法适用于系统模型难以得到的 情况, 这是该方法最显著的一个优势。图 1中的模型网络实际上表示的是被控对象, 它可以是实际系统, 也可以是实际系统的数 学模型或神经网络模型。评价网络通过

2、不断的学习使其输出近似代价函数 J。对于 一个可控系统, 如果神经网络收敛于正确的代价函数, 那么控制器将使系统稳定; 也就是说, 如果评价网络正确的近似收敛, 那么 采用 ADHDP结构的控制器将提供全局稳定的自适应控制。为了得到评价网络输出 J函数的近似值 J, 评价网络的误差定义为ec( k) = J(k) - ? J(k + 1) - U( k)( 5)Ec=1 2e2( k)( 6)以最小化 Ec为目标训练评价网络。由式 (7)更新评价网络的权值 wc( k + 1) = wc(k) + ?wc( k)( 7)其中,?wc(k) = lc(k)-?Ec( k) ?wc( k)=lc(

3、 t)-?Ec(k)?J( k + 1)?J( k + 1) ?wc(k)( 8)这里 lc是一个正的学习率。 为了优化所有代价 U( k)的累加和, 需要寻找函数 J的最小值或最大值, 这可以通过训练执行网络来实现。执行网络采用梯 度下降法更新执行网络的权值:w?(k + 1) = w?( k) + ?w?(k)( 9)?w?(k) = l?(k)-?E?( k) ?w?( k)= l?( k)-?E?(k)?J( k + 1)?J(k + 1) ?u( k)?u( k) ?w?(k)( 10)这里 la同样是一个正的学习率。 2? 单机无穷大系统? ? 为了方便分析, 将电力系统简化为电机

4、无穷大系统, 其系统 包括涡轮发电机, 涡轮, 调速器, 连接在无穷大母线上的传输线和包括励磁器、 自动调压器 (AVR)的励磁系统, 如图 2所示。图 2? 单机无穷大系统结构图图 2中 Re, Xe表示传输线参数, ? 表示角速度变化量, Um 表示无穷大母线上的电压, Vt表示发电机的端电压, Ve表示励磁器的输入电压, Vfd表示励磁器输出电压, Vref表示端电压参考值, Pref表示机械功率参考值, Pm表示涡轮输出功率。传统自动调压器和励磁器的传递函数框图如图 3所示。图 3? 励磁系统的传递函数结构图传统的自动调压器包括 PID补偿环节和限幅环节, 如图 3所示。其中, Tv1

5、, Tv2, Tv3和 Tv4是 PID调压补偿器的时间常数; Tv5是 输入滤波器时间常数; Te是励磁时间常数; Kav是自动调压器增益; Se是励磁器的饱和系数。 涡轮和调速器的传递函数框图如图 4所示。图 4? 涡轮和调速器的传递函数结构图涡轮部分包括伺服电机、 输入蒸汽部分和再加热部分。其中, Tg 1和 Tg2为相位超前补偿时间常数; Tg3为伺服时间常数, Tg4?电气自动化?2011年第 33卷 第 2期电气传动和自动控制 El ec tric D rive Tg5为再热时间常数; F 表示再热输入标么值; Kg为时间增益。 3? 基于执行依赖启发式动态规划 ( ADHDP)的

6、 设计 ? ? 本文将 ADHDP算法应用于励磁系统的自动调压器中, 用以 代替传统的自动调压器对励磁器进行控制。ADHDP的三个网络中, 模型网络即为实际的被控对象, 执行 网络和评价网络都采用三层前馈感知器型神经网络用反传算法来训练这个网络并更新它的权值。评价网络如下图 5所示, 输入 有 6个节点, 分别是输入为端电压变化量 ?Vt和执行网络输出的控制信号 ?Ve及它们的两个时间延迟值。隐藏层采用 sig moidal 神经元, 神经元的个数选择 8个。输出层采用线性神经元, 输出为函数 J。图 5? 评价网络结构图 评价网络的输入设为 Input_c, 输入层到隐藏层为ch1= wc1

7、? Input_c( 11) 式中 wc1为评价网络输入层到隐藏层的权值矩阵。隐藏层的转移函数选择双曲正切函数y =1- e- x 1+ e- x( 12)则隐藏层的输出为ch2=tansig( ch1)( 13) 隐藏层到输出层为J= wc2? ch2( 14) 式中 wc2为评价网络隐藏层到输出层的权值矩阵。执行网络的结构、 正向计算过程与评价网络基本相同, 隐藏 层也采用 sigmoidal神经元, 神经元的个数选择 8个, 输出层仍然 采用线性神经元。不同的是它的输入有 3个节点, 分别为端电压变化量 ?Vt和它的两个时间延迟值; 输出为控制信号 ?Ve, 而不是函数 J。效用函数 U

8、( t)又称为局部代价, 反映出每一步的控制效果, 它可以根据控制目标来定义, 定义的效用函数如式 ( 15)所示。U( t) = 0. 2 ( 0. 4?Vt( t) + 0 . 4?Vt( t- 1)+ 0 . 16?Vt( t- 2) ) 2( 15)4? 仿真控制及分析在 M atlab/Si mulink环境下中搭建的单机无穷大系统模型, 分别对传统自动调压器和基于 ADHDP算法的自动调压器进行仿 真控制。仿真采取分步仿真的方法, 时间步设为 0. 05s, 即在每个时间 步内, Si mulink中发电机的状态数据通过 ? To Workspace?模块和? From Works

9、pace?模块导出和导入到工作空间, M atlab的 M 文件 根据工作空间的状态数据进行计算, 更新执行网络和评价网络,得出对象的最优控制信号, 控制 Si mulink中的发电机。为保证仿 真的连续性, 同时记录各时间步的状态, 采用 M atlab的库函数 t , x, y =si m( n a me, t1 t2 )。 仿真操作的主要步骤如下:( 1) 初始化并导入初始值; ( 2) 记录 ?Vt( t)的值;( 3) 通过时间延迟获得 ?Vt( t- 1), ?Vt( t- 2), ?Vt( t- 3), 以 ?Vt( t), ?Vt( t- 1), ?Vt( t- 2)作为执行网

10、络的输入, 得到它的输出 ?Vt( t); ( 4) 通过时间延迟得到 ?Ve( t- 1), Ve( t- 2), Ve( t- 3); ( 5) 以 ?Vt( t), ?Vt( t- 1), ?Vt( t- 2)和 ?Ve( t), ?Ve( t-1), ?Ve( t- 2)作为评价网络的输入, 从而得到评价网络的输出J( t)值; ( 6) 以 ?Vt( t- 1), ?Vt( t- 2), ?Vt( t- 3)和 ?Ve( t- 1), Ve( t- 2), Ve( t - 3) 作为 执 行网 络 的输 入, 得 到 它 的输 出J( t- 1)值;( 7) 根据评价网络的权值更新等

11、式, 更新评价网络的权值; ( 8) ) . 循环步骤 2- 8, 直到仿真结束。 仿真过程对单机无穷大系统在 1s进行三相短路处理, 1. 1s切断短路, 得到传统自动调压器和基于 ADHDP算法的自动调压 器的控制效果, 如图 6和图 7所示。图 6? 三相短路时端电压的控制效果 图 6中实线部分为基于 ADHDP算法的控制效果, 虚线部分为传统控制方法的控制效果。由图 6中可以看出, 系统受到扰动 后, 同步发电机的端电压迅速下降, 基于 ADHDP 算法的控制效果相比传统控制的控制效果, 超调更小, 并能够使系统更快的达 到扰动前的稳定状态。(下转第 31页 )智能控制技术 Inte

12、lli g entC on tro lTechn i q ues?电气自动化?2011年第 33卷 第 2期Electrica lAutomation?31? ? ?由仿真结果如图 2、 图 3所示, 图 2和图 3中的 r( t)和 q( t)表明, 在对系统的建模误差和不确定干扰完全未知的情况下, 反演 滑模控制和反演自适应模糊滑模控制在关节角位移量跟踪性能上差别很小; 在消除抖动上, 反演自适应模糊滑模控制控制效果 明显较好。 4? 结论本文对带有建模误差和干扰的多关节机器人系统, 设计了反 演自适应滑模控制器, 并构造 Lyapunov函数, 证明了控制系统的稳定性。针对难以确定滑模控

13、制系统中不确定因素上界的问题, 采用模糊控制器在线估计不确定性上界值, 实现了对建模误差和干扰的自动跟踪, 削弱了抖振。仿真结果验证了所提出方法的有 效性和可行性。参? 考? 文? 献 1 ChaoH M, HuY M. Dynamical slidingmode control w ith applications tooutput tracking of mobile robots J. Control and Decision , 2001 ,16( 5) :565 568. 2 高为炳. 变结构控制的理论及设计方法 M . 北京: 科学出版社, 1998. 3 Slotine J J

14、, Sastry S S. Tracking control of nonlinear system using slidingsurfaces w ith application to robot manipulator J.I nternational Journal ofContro, l 1983 , 38( 2): 465 492. 4 BartoliniG, PisanoA, Punta E. A survey of applications of second-ordersliding mode control to mechanical systems J.Internatio

15、nal Journal ofContro, l 2003 , 76( 9): 875 892. 5 Ryu SH, Park JH, Auto-tuning of slidingmode control parameters usingfuzzy logic J. American ControlConference , 2001: 618 623 . 6 Huang S J , Huang K S, Chiou K C . Development and application of anovel radial basis function slidingmode controller J.

16、 M echatronics , 2003 , 13( 4): 313 329 . 7 穆效江, 陈阳舟. 多关节机器人的自适应模糊滑模控制 J. 控制工程, 2008, 15( 5): 620 622 . 8 Lin C K. Nonsingular ter m inal slidingmode controlof robotmanipulatorsusing fuzzywavelet networks J. IEEE Transactions on FuzzySystems , 2006 , 14( 6): 849 859 . 9 穆效江, 陈阳舟. 多关节机器人的神经滑模控制 J. 计算机工程与应用, 2009, 45( 11): 245 248 . 10 F JLin , PH Shen. A daptivebackstepping slidingmode control for linearinduction

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号