无人机追逃微分对策法课件

举报
资源描述
无人机追逃机动决策与任务协同算法研究无人机追逃机动决策与任务协同算法研究1主要内容主要内容第一章第一章 研究背景和意义研究背景和意义第二章第二章 无人机机动动作库的建立无人机机动动作库的建立第三章第三章 基于微分对策的单机追逃最优机动决策基于微分对策的单机追逃最优机动决策第四章第四章 双机对抗协同算法研究双机对抗协同算法研究2第一章第一章 研究的背景和意义研究的背景和意义1.意义:无人机以其“零伤亡”、“非接触”、“无流血”和超机动、大过载等特有优势,在最近的几次局部战争中大放异彩,其卓越的表现,尤其是其具有勿需考虑人员伤亡的优点,使无人机的作用得到了各大军事强国的高度重视。32.空战仿真基本流程图空战仿真基本流程图4国外的无人机发展国外的无人机发展神经元无人作战飞机神经元无人作战飞机 暗剑无人作战飞机暗剑无人作战飞机 X-45A 无人作战飞机无人作战飞机 X-45A 无人作战飞机无人作战飞机 53.机动决策算法研究机动决策算法研究64.多机任务协同算法研究多机任务协同算法研究博弈法、矩阵对策法、智能专家系统、博弈法、矩阵对策法、智能专家系统、人工神经网络(人工神经网络(ANN)、遗传算法、粒子群算法、)、遗传算法、粒子群算法、以及各种混合算法等。以及各种混合算法等。75.机动动作库设计方法研究机动动作库设计方法研究动作集是由一一系列单一机动动作系列单一机动动作构建并供决策系统使用,设计机动动作库机动动作库是基于机动库的实时轨迹实时轨迹生成的基础。NASA的学者根据空战最常用的机动方式提出了基本操纵动作库的概念,基本动作库主要包括 7 种基本动作:1)最大加速最大加速,2)最最大减速大减速,3)最大过载爬升最大过载爬升,4)最大过载俯冲最大过载俯冲,5)最大过载左转最大过载左转,6)最大过载右转最大过载右转,7)稳定飞行稳定飞行8第二章第二章 无人机机动动作库的建立无人机机动动作库的建立 2.1 坐标系坐标系2.2 无人机动力模型的建立无人机动力模型的建立 2.2.1 动力学模型的选取动力学模型的选取 2.2.2 三自由度模型的建立三自由度模型的建立2.3 机动动作库设计机动动作库设计92.1 坐标系坐标系1.地面坐标系Oxgygzg 2.航迹坐标系Oxkykzk (1)航迹倾角r(俯仰角)航迹轴 Oxk轴与水平面Oxgyg轴之间的夹角 欧拉角(2)航迹偏角x(偏航角)航迹轴 Oxk轴与水平面Oxgyg轴之间的投影与Oxg夹角 (通俗的说,指飞机前进方向与正北方向的夹角)(3)绕速度轴的滚转角u 航迹轴 Ozk轴沿纵轴(惯性坐标系)转过的角度 3.气流坐标系(速度坐标系)Oxayaza Oxa轴为飞行器相对空气的速度V的方向(无风,即Oxk轴方向),Oza轴在飞行器的对称平面内,且垂直于Oxa轴,Oya轴垂直于Oxaza平面 10坐标变换坐标变换地面坐标系到航迹坐标系转换矩阵变换次序先偏航先偏航再俯仰再俯仰最后滚转最后滚转112.2 无人机动力模型的建立无人机动力模型的建立2.2.1 动力学模型的选取 在研究无人机机动决策与轨迹生成时,选用 3 自由度质点动力学模型。将无人机视为一个质点,方程组中只包含了飞机的三个力方程和三个质心运动方程。2.2.2 三自由度模型的建立 作用在飞机上的外力有飞机的推力T,空气动力 A,飞机所受的重力W,根据牛顿第二定律有:1213图图 2-2 飞机后视受力图飞机后视受力图141516172.3 机动动作库设计机动动作库设计18192021第三章第三章 基于微分对策的单机追逃最优机动决策基于微分对策的单机追逃最优机动决策3.1 基于微分对策的追踪逃逸问题描述3.2 一对一追踪逃逸模型3.3 基于微分对策的最优机动决策的求解 3.3.1 求解方法描述 3.3.2 无约束下的时间最优无人机追逃机动决策3.3.3 动压-过载约束下的时间最优无人机追逃机动决策223.1 基于微分对策的追踪逃逸问题描述基于微分对策的追踪逃逸问题描述空战中一方试图使对方进入自己火力打击范围之内打击范围之内,另一方采取规避策略规避策略,试图远离远离对方的火力打击范围,这被称作是“追踪追踪-逃逸问题逃逸问题”,分为定性追逃定性追逃问题和定量追逃定量追逃问题两大类。定性追逃问题,追逃双方关心的不是支付的具体值的大小,而是某种结果能否实现能否实现。定量追逃问题是有具体的量化指标具体的量化指标,不同的追逃问题对应于不同的支付指标,针对不同的量化指标求解的最优解,即为双方的最优机动策略。本文,其量化指标可以为追逃双方的距离双方的距离,追逃双方的相对角度相对角度,追逃时间追逃时间等。基于微分对策的,微分对策定量追逃问题中,研究最多的是以时间时间为指标,相对距离相对距离作为约束约束的时间最优追踪逃逸问题。微分对策微分对策,乃是从状态到状态的转移状态到状态的转移,借助向量微分对策方程微分对策方程(或微分方程组)描述的具有连续时间的多级对策,微分对策是对策论在动态情况下的发展,所以又称之为动态对策。Differential games一书,在 1965 年出版。该书是世界上第一部微分对策专著,该书的出版标志着微分对策的诞生。2324微分对策,尚未微分对策,尚未有有一个通用的求解方法,一个通用的求解方法,一些一些数值求解的方法数值求解的方法和特点如和特点如下:下:231每种方法都只适用于某一类的微分对策问题(每种方法都只适用于某一类的微分对策问题(具体具体问题,具体分析问题,具体分析)梯度梯度法,法,次优次优法,法,摄动摄动法,法,多项式多项式法,法,参数参数法,法,泛函分析泛函分析法,法,线性反馈线性反馈解解本文采用本文采用双边极值双边极值原理将原理将微分对策最优机动微分对策最优机动求解问求解问题转化为一个题转化为一个两点边值问题两点边值问题,并使用,并使用配点法配点法来求解来求解其数值解,以得到无人机追逃其数值解,以得到无人机追逃最优机动策略和最优最优机动策略和最优机动轨迹。机动轨迹。25针对实际飞行性能,本文研究动压动压-过载约束过载约束下的基于微分对策微分对策的无人机最优机动决策最优机动决策问题,本文提出了一种利用动压与过载之间的关系动压与过载之间的关系,求解动压动压-过载约束下过载约束下基于微分对策的无人机最优机动决策算法,该算法不仅满足动压-过载约束,而且算法适用性适用性较好,除可以完成一对一一对一双方攻防空战最优机动决策外,也可以用于单方最优规避机动决策单方最优规避机动决策,同时对于多机空战多机空战,可以通过战斗分组转化为一对一空战,再使用本算法计算最优机动决策。该算法的模型接近实际空战模型,具有较高的实用价值。3.2 一对一追踪逃逸模型一对一追踪逃逸模型由第二章建立的无人机三自由度模型,可以建立纵向平面内的二维的追踪逃逸模型:2627283.3 基于微分对策的最优机动决策的求解基于微分对策的最优机动决策的求解基于微分对策的最优机动决策最优机动决策求解通常是将对策问题转化一个两点边值两点边值问题(其理论基础是最优控制领域的间接法间接法)。间接法的基础基础是拉格朗日乘子法拉格朗日乘子法和庞特里亚金的极小值原理庞特里亚金的极小值原理,极小值极小值又是其理论核心核心。使用间接法求解微分对策间接法求解微分对策问题步骤如下:(3)将问题转化为一个两点边值问题,求解该将问题转化为一个两点边值问题,求解该两点边值问题,即可获得双方最优策略及最优轨迹。两点边值问题,即可获得双方最优策略及最优轨迹。(1)建立哈密顿函数)建立哈密顿函数(2)推导最优一阶条件和二阶条件,求解双方的)推导最优一阶条件和二阶条件,求解双方的最优策略。最优策略。29配点法配点法无人机动力学方程为非线性微分方程非线性微分方程,很难求其解析解,寻求其数值解是一个可行方法,在数值求解此两点边值两点边值问题时,我使用配点法配点法进行求解。配点法又称多项式匹配法多项式匹配法,通过将求解区间分段求解区间分段,并使用特定的多项式来逼近逼近非线性方程,将原来的最优机动求解最优机动求解问题转化为非线性规划问题非线性规划问题,降低目标函数的病态程度,提高了收敛性和精度收敛性和精度。3.3.1 求解方法描述求解方法描述间接法是基于庞特里亚金的极小值庞特里亚金的极小值原理发展而来的微分对策双边极值原理微分对策双边极值原理,通过将微分对策最优机动控制最优机动控制的求解转换为一个两点边值一个两点边值问题。对于一个一般的微分对策问题,其求解过程如下:30313233微分对策求解时,解的存在性微分对策求解时,解的存在性(即(即鞍点鞍点的的存在性存在性)3.3.2 无约束下的时间最优无人机追逃机动决策无约束下的时间最优无人机追逃机动决策1.确定优化目标及约束优化目标及约束,追逃时间的最优问题,即追方希望在最优机动控制最优机动控制下,在最短最短的时间内追上逃方,而逃方希望在最优机动控制下尽可能的延长被捕获延长被捕获的时间,由此得到目标支付函数为:J=t f (3-34)为终端时刻自由的时间最优化问题。34式中d 为追方飞机的捕获半径,即追方和逃方的距离到达追方飞机的捕获距离,则认为对策结束。2、求解无约束无约束下基于微分对策双边最优机动决策 由上,首先由状态方程(3-13)及目标函数(3-34)构建哈密顿函数:3536根据微分对策的双方极值原理,令哈密顿函数对控制变量求一阶偏导得:根据微分对策的双方极值原理,令哈密顿函数对控制变量求一阶偏导得:3738式(3-56)(3-59)即为追逃双方的最优机动控制策略。由横截条件式(3-35)可知协态方程在终端时刻满足方程式:39403.3.3 动压动压-过载约束下的时间最优无人机追逃机动决策过载约束下的时间最优无人机追逃机动决策 在实际的飞行中,控制和状态总是免不了要受到一定的约束,对于无人作战飞机来说,动压和过载约束是常见的约束。对于控制系统的约束,可分为三类:控制约束,状态约束,控制控制约束,状态约束,控制-状态约束状态约束。在求解动压-过载约束下的时间最优追逃机动决策时,(1)根据动压和过载的关系,建立起动压约束与过载约束之间的关系,(2)将不等式约束不等式约束转化为等式等式约束约束,并将约束引入扩展的哈密顿函数哈密顿函数,通过求解带约束下的协态方程协态方程约束下的双方最优控制最优控制策略,从而求解带约束带约束下的双方最优机动轨迹最优机动轨迹。其算法流程图如图 3-8 所示:414243444546474849第四章第四章 双机对抗协同算法研究双机对抗协同算法研究 距离优势距离优势231角度优势角度优势效能优势效能优势 速度优势速度优势44.1 多机协同目标分配多机协同目标分配 攻击优势攻击优势5051525354554.2基于基于 BP 神经网络的双机任务协同算法神经网络的双机任务协同算法 4.2.1 BP 神经网络描述 BP神经网络具有很强的非线性映射能力,不需要任何的先验公式,只要隐含层节点规模足够,BP神经网络可以在任意误差范围内逼近其映射的非线性函数.56574.2.2 基于基于 BP 神经网络的目标分配神经网络的目标分配 585960训练样本获取,按照典型的空战态势为如下几种:61Thank you!62
展开阅读全文
温馨提示:
金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
相关资源
正为您匹配相似的精品文档
相关搜索

当前位置:首页 > 办公文档 > 教学/培训


电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号