登月舱软着陆的非线性神经元控制

上传人:ji****72 文档编号:45692644 上传时间:2018-06-18 格式:PDF 页数:9 大小:251.40KB
返回 下载 相关 举报
登月舱软着陆的非线性神经元控制_第1页
第1页 / 共9页
登月舱软着陆的非线性神经元控制_第2页
第2页 / 共9页
登月舱软着陆的非线性神经元控制_第3页
第3页 / 共9页
登月舱软着陆的非线性神经元控制_第4页
第4页 / 共9页
登月舱软着陆的非线性神经元控制_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《登月舱软着陆的非线性神经元控制》由会员分享,可在线阅读,更多相关《登月舱软着陆的非线性神经元控制(9页珍藏版)》请在金锄头文库上搜索。

1、第 19卷 第 1期 1998年 1月 宇 航 学 报 JOURNAL OF ASTRONAUTICSVol.19 No. 1 Jan. 1998本文于 1995年 10月 11日收到* 航空科学基金资助课题登月舱软着陆的非线性神经元控制*阮晓钢(北京工业大学自动化系 北京 100022)摘 要 本文针对登月舱软着陆过程的控制问题 ,提出了一种非线性动态逆与状态反馈控制相结合的神经元控制系统设计方案。 该方案包含两分:(1) 借助前馈神经元网络通过学习逼近任意非线性映射的能力 , 建立被控系统的非线性动态逆神经元模型 , 用神经元网络实现被控非线性系统的线性化 ; (2) 在线性化模型的基础上

2、构造系统的神经元最优状态反馈控制器。 本文给出的仿真结果显示出神经计算学在航天飞行器控制问题中所具有的潜在能力。主题词 登月舱 软着陆 非线性系统 神经元控制 动态逆 状态反馈A NONLINEAR NEUROCONTROL SCHEME FOR LUNAR SOFT LANDINGRuan Xiaogang(Automation Department,Beijing Polytechnic Univ ersityBeijing 100022)Abstract A neurocontrol scheme for lunar soft landing is proposed in this pa

3、per, whichcombines nonlinear dynamic inversion with optimal state feedback.The scheme mainly consistsof two parts. First, the nonlinear dynamic inversion of the controlled object is modeled with anartificial neural network by means of its ability to learn to approximate any functions, and there-fore

4、, the controlled object is linearized by the neuralinversion model. Secondly, based on the lin-earized system another artificial neural network is used as a controller to realize certain optimalstate feedback controllaw. Finally, the effectiveness of the scheme described in this paper is in-vestigat

5、ed by computer simulation. The simulation results are encouraging and show that neuro-computation could play important role in control of the future spaceships.Key words Lunar modules Soft landing Nonlinear systems Neurocontrol Dynamicinversion State feedback1 引言 航天飞行器作为动力学系统 , 往往表现出强非线性、 柔性、 模型不精确或

6、模型未知等复杂特征 , 其控制也因此而变得非常困难。 近年来 , 随着神经计算学的发展 , 神经元控制( Neurocontrol) 作为新兴的智能控制技术开始渗入航空航天领域1- 2。人工神经元网络所具有的自学习自组织能力 , 为解决非线性、 模型不精确或模型未知系统控制问题提供了一条新的途径。本文针对登月舱软着陆过程控制问题 , 提出了一种非线性动态逆与状态反馈控制相结合的神经元控制系统设计方案。 该方案包含两个部分:( 1) 借助前馈神经元网络通过学习 逼近任意非线性映射的能力 , 建立被控系统的非线性动态逆神经元模型 , 用神经元网络实现被控非线性系统的线性化;( 2) 在线性化模型的

7、基础上构造系统的神经元最优状态反馈控制器。 非线性动态逆控制技术是处理非线性控制问题的一种有效方法 , 而该方法对被控 制对象数学模型的过分依赖 , 使其应用受到很大的限制。 本文应用神经元网络实现被控非线性系统的动态逆模型 , 使该方案在具有处理非线性问题的能力的同时 , 具有了处理模型不精确或模型未知问题的能力; 而系统的线性化又使文献 1 提出的神经元状态反馈控制方案易于实现。 本文以登月舱软着陆过程的控制为应用背景 , 对本文提出的方案进行了仿 真研究 , 仿真结果显示 , 神经元控制具有处理航天飞行器控制问题的潜在能力。2 登月舱模型及其软着陆控制问题2. 1 单变量非线性系统的数学

8、描述 考虑具有如下仿射型非线性微分方程数学模型的航天飞行器:x(t) = A(x) + B(x)u(t)( 2-1a)y (t) = Cx(t ) x0= x(t0)( 2-1b)其中:u (t) 为控制量 , y (t ) 为系统的运动轨迹 , x Rn, A Rn1, B Rn1, C R1 n。2. 2 控制问题的描述图 1 登月舱模型及运动设系统的期望运动轨迹为 yd(t ) , 则其控制问题定义为: 寻求某种控制律 u (t ) , 使泛函J =1 2tft0fJ(yd- y,u)dt( 2-2)趋于极小。最优控制问题 ( 2-2)在下面将被分解为 J( 1)和 J( 2)两个子最优

9、控制问题。2. 3 登月舱软着陆过程控制问题描述2. 3. 1 登月舱模型及其运动登月舱在月球表面软着陆是登月行动的重要环节之一。在软着陆过程中 , 假设登月舱相对于月球表 面的运动是垂直的(如图 1所示 ) , 并满足条件:1) 作用于登月舱的力只是其自身的重力和起制动作用的推力 F, 且 F= - Km。36宇航学报第 19卷2) 推进系统质量流速 m满足:- d m 0 (d 0)登月舱动态特性由如下非线性微分方程描述:y= - Kmm- g( 2-3)将式 ( 2-5) 化为式( 2-1) 所示的非线性状态微分方程:x(t ) =x1( t)x2( t)x3( t)A(x) =x2-

10、g0B(x) =0 - K /x31C=( 1, 0, 0)( 2-4)其中 , y= x1为登月舱距离月球表面的高度 , u (t) = m(t ) 为控制量。 参照阿波罗 11号飞船着陆段飞行数据3- 4, 有:1) 月球表面重力加速度 g= 1. 62m /s22) 比例系数 K= 80003) 初值条件 x0=x1( 0) x2( 0) x3( 0) T=156m 4. 9m /s 15000kg T (t0= 0) 2. 3. 2 登月舱陆着陆过程的控制目标令登月舱的期望降落过程为:yd(t ) = y ( 0) ( 1- e- 0. 0314t)( 2-5)这是一个使登月舱下降速度

11、呈指数衰减的过程 , 以保证登月舱安全地着陆。 当登月舱距离月球表面的高度趋近零时 , 其垂直降落的速度也趋近零。3 基于神经元网络的控制方案3. 1 神经元控制的理论基础3. 1. 1 BP神经元网络模型本文采用的神经元网络为如图 2所示的多输入 - 单输出三层 BP网络。图 2 BP神经元网络模型3. 1. 2 BP神经元网络算法( 1) 前向传递算法37第 1期阮晓钢: 登月舱软着陆的非线性神经元控制令 Nkj为第 k层第 j 个神经元 , Okj为 Nkj的输出 , kj为 Nkj的阈值 , wkji为联结 Nki与 Nk+ 1j的权系数 , Lk为网络第 k 层的节点数 , 则:vk

12、j=Lk- 1i= 1wk - 1jiOk- 1i- kjOkj=1/( 1+ e- vk i) k = 21 k =3( j = 1, 2, Lk,O1i= ri,k = 2, 3)( 3-1a)( 3-1b)( 2) 往回传播算法 ( BP学习算法 ) 设 BP网络有样本集合 S= (R(s), O(s)d) | s= 1,2, , N 。 令 O( s)为 BP网络在输入 R( s)=(r1, r2, rL0) 作用下的实际输出。 则 BP 网络的输出误差为:O(s)= O(s) d- O(s)( 3-2)定义能量函数E =Ni= 1O( s)2( 3-3)则按梯度下降原则 , 有 BP

13、学习算法:wkji= - T Ewkji (T 0) (i =1, 2, ,Lk; j =1, 2, , Lk+ 1,k =1, 2)( 3-4)3. 1. 3 BP神经元网络逼近映射的特性引理 3-1 :( Hecht-Nielsen 1989 5)给定任意 X 0和任意 L2函数 f:0, 1n Rn Rm, 存在一三层 BP神经元网络 , 其输入输出映射 h:0,1 RnRm可在任意 X 平方误差积分精度内逼近 f , 即: 0, 1n| f (x ) - h(x )|2dx 0 p = r( 4-4)则系统 ( 2-1) 在域 X 内可由非线性动态逆 u(t) = G(x) + Q(x

14、)v(t )( 4-5)线性化作如下伪线性系统Dry(t ) = v (t)( 4-6)证明: 按式 ( 4-2, 3) 定义可得39第 1期阮晓钢: 登月舱软着陆的非线性神经元控制Dry(t ) = a(r)(x) + b(r)(x)u(t)( 4-7)令 Q (x) =b( r)(x) - 1, G (x) =b(r)(x) - 1a(r)(x) , 则式( 4-5,6) 成立。(证毕 )4. 2 非线性动态逆模型的神经元网络实现4. 2. 1 动态逆 ANN1模型假设系统 ( 2-1) 精确的数学模型是未知的 , 则其精确的逆模型必定也是未知的。 但模型及逆模型的结构形式可为已知的。 这

15、时 , 采用人工神经元网络实现系统的逆模型就成为一种必要的和有意义的途径。由式 ( 4-4) 可知 , 系统 ( 2-1) 的动态逆是关于状态变量 x和输入变量 v (t) 的一种非 线性映射。由引理 3-1可知 , 非线性逆映射 ( 4-5) 可由一 BP神经网络的输入输出映射来逼近 , 即系统 ( 2-1) 非线性动态逆模型可用 BP神经元网络实现。 式 ( 4-5) 为 Rn+ 1 R的映射。因此 , ANN1输入层需要 n+ 1个神经元 , 输出层需要 1个神经元。 即 ANN1的输入向量 R=(v , xT)T, 输出量为 u。4. 2. 2 ANN1的训练由图 3及能量函数 ( 3

16、-3) 和 BP算法 ( 3-4) 可知 , 训练 ANN1的关键步骤是计算 ANN1的输出误差 u (t )。( 1) ANN1的离线训练设由系统( 2-1) 的输入输出实验数据中获取 N 组采样值(ud(s) , x (s) , y( r)(s) )(s= 1,2, N ) , 则可构造出样本点集合S =(R(s) ,ud(s) )| R(s) =(Dry (s) ,xT(s) )T,s=1, 2, , N ( 4-8)样本点集合 S以 ( y( r), x) 为输入 , 以 u为输出 , 反应了系统 ( 2-1) 的逆特性 , 可用于 ANN1的离线训练。令 u (s) 为 ANN1在输入 R (s) =(y( r)(s) , x (s) )T作用下的实际输出。则可求得用于训练 ANN1的输出误差:u(s) = ud(s) - u(s) (s=1, 2, ,N

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号