第2章 数据融合与信息处理,1 概述2 基本原理3 分布式自适应动态数据融合,集成与融合,,新系统:升华、再生,融合:综合、互补,集成:基础、结构,,,图2.1 集成、融合关系图,数据融合,20世纪80年代诞生,主要解决多传感器信息处理问题,把分布在不同位置的多个同类或不同类传感器的局部、不完整的观察量加以综合,利用其互补性、冗余性,克服单个传感器的不确定性和局限性,提高整个传感器系统的有效性能,已形成对系统环境相对完整一致的感知描述,提高测量信息的精度和可靠性内涵的延展,不同方法获得的参量的综合,数据融合的三层定义,全空间,综合,互补,多传感器,动态信息处理,算法,,,,,,融合,,,图2.2 数据融合的3层定义,数据融合的内涵延展举例,红外和可见光图像融合?PET,MR,CT等模式图像间的融合?特征点、面、区域提取与基于体素方法的融合用于配准基于颜色、纹理、光度等特征的融合用于识别?基于颜色、面积、纹理等特征的融合用于分割?特征选择?,信息的互补问题,本质在于对不确定处理和精确处理的互补,复杂,并不是简单的代数相加运算包括信息表达方式上的、结构上、功能上的、不同层次上的互补把握不同信息的本质举例:特征点和体素/像素的互补?纹理和颜色的互补?时域、频域、复频域的互补?,数据融合的基本框架,信息源,信息转换、传递、交换,信息互补、综合处理,信息融合处理报告,,,,信息流:信息获取 信息预处理 信息融合 融合决策,2 多传感器数据融合的基本原理,N个不同类型的传感器收集观测目标的数据。
对传感器的输出数据(离散的或连续的时间函数数据,输出矢量,成像数据或一个直接的属性说明)进行特征提取的变换,提取代表观测数据的特征矢量对特征矢量进行模式识别处理(如聚类算法,自适应神经网,或其它能将特征矢量变换成目标属性判决的统计模式识别法等),完成各传感器关于目标的说明将各传感器关于目标的说明数据按同一目标进行分组,即关联利用融合方法将各一目标各传感器数据进行合成,得到该目标的一致性解释与描述2.1 数据融合的层次结构,数据层融合特征层融合决策层融合,数据层融合,全部传感器的观测数据直接进行融合,然后从融合的数据中提取特征矢量,并进行判断识别传感器必须同质优点:保持了尽可能多的原始信息缺点:处理的信息量大,处理实时性差数据层融合图例,待识别物体,图像数据,声音数据,气味数据,,,,传感器,传感器,传感器,统一的数据矩阵,,,,特征提取,,,决策,特征层融合,将每个传感器的观测数据进行特征抽取以得到一个特征矢量,然后将这些特征矢量融合起来,并根据融合得到的特征矢量进行判定优点:对通信带宽的要求较低缺点:由于数据丢失使其准确性有所下降,特征层融合图例,,待识别物体,图像数据,声音数据,气味数据,,,,传感器,传感器,传感器,统一的特征矩阵,,决策,特征提取,特征提取,特征提取,,,,,决策层融合,决策层融合是根据一定的准则以及每个决策的可信度作出最优决策。
每个传感器执行一个对目标的识别过程,将来自每个传感器的识别结果进行融合优点:对通信带宽要求最低缺点:产生的结果相对最不准确决策层融合图例,待识别物体,图像数据,声音数据,气味数据,,,,传感器,传感器,传感器,统一的决策结果,特征提取,特征提取,特征提取,,,,决策结果,决策结果,决策结果,,,,,,,各种融合层次的特性比较,2.2 数据融合的体系结构,集中式分布式混合式,集中式,将各传感器结点的数据都送到中央处理器进行融合处理优点:实时融合,精度高,解法灵活缺点:对处理器要求高,可靠性较低,数据量大,难以实现,集中式结构图示,传感器1,传感器2,传感器n,预处理,预处理,预处理,融合结点,,,,,,,分布式,各传感器利用自己的量测单独跟踪目标,将估计结果送到总站,总站再将子站的估计合成为目标的联合估计优点:对通信带宽要求低,计算速度快,可靠性和延续性好缺点:跟踪精度没有集中式高,分布式结构图示,传感器1,传感器2,传感器n,预处理,预处理,预处理,融合结点,,,,,,,局部判决,局部判决,局部判决,,,,2.3 多传感器融合系统的设计的注意问题,系统中传感器的类型、分辨率、准确率传感器的分布形式系统的通信能力和计算能力系统的设计目标系统的拓扑结构(包括数据),2.4 数据融合中的检测、分类和识别算法,基于物理的模型仿真估计:卡尔曼滤波、最大似然、最小方差句法:图像代数基于特征推理技术基于参数的方法:古典概率推理、贝叶斯方法、D-S理论、广义证据基于信息论的方法:神经网络、聚类、表决方法、熵、品质因数、相关量测基于知识的模型逻辑模板、基于知识的专家系统、模糊集,2.4.1 统计和估计方法,运用概率估计的方法获取不同信息源的融合权重包括:古典概率推理、卡尔曼滤波、贝叶斯准则、D-S证据理论、广义证据理论,古典概率推理,在给定的假设条件下,观测是来源于某一物体或事件的概率主要缺点:1)用于分类物体或事件的观测量的概率密度函数难以得到2)在多变量数据情况下,计算的复杂性加大3)一次只能评估两个假设条件4)无法直接应用先验似然这个有用的先验知识,卡尔曼滤波,是一种线性递推的滤波方法,将状态变量引入滤波理论,用信息干扰的状态空间模型代替通常滤波采用的协方差函数,并把状态空间描述与离散时间联系起来特点:基于最小二乘法的信息优化方法,运算量小,始于实时处理,用于目标跟踪、状态估计等中。
贝叶斯准则,利用样本提供的信息时也充分利用了先验知识,以先验分布为出发点,克服了古典统计中精度和信度预定,不依赖于样本的不合理性缺点:1)确定先验的似然函数非常困难2)当潜在具有多个假设事件并且是多个事件条件依赖时,计算将变的非常复杂3)各假设事件要求互斥4)不能处理广义的不确定问题,D-S证据理论,针对事件发生后的结果(证据)探求事件发生的主要原因(假设),分别通过各证据对所有的假设进行独立判断,得到各证据下各种假设的基本概率分配即mass函数,然后对某假设在各证据下的判断信息进行融合,进而形成“综合”证据下该假设发生的融合概率概率最大的假设即为判决结果特点:1)概率论的推广,能区分“不确定”、“不知道”2)要求各证据之间彼此独立,很难满足3)随着推理过程的增加,计算量也大大增加广义证据处理(generalized evidence processing, GEP),把决策空间分为若干个假设事件(命题),然后把贝叶斯方法扩展到此假设空间中在此方法中,来自非斥命题的证据可以使用贝叶斯公式融合,从而得到某一判决与D-S方法的不同之处在于:其概率分配值的赋予与融合是基于命题或假设事件的先验概率的。
2.4.2 基于信息论的融合方法,能把参数数据转换或映射到识别空间所有的这些方法都有着相同的概念,即识别空间中的相似是通过观测空间中参数的相似来反映的,但是却不能直接对观测数据的某些方面建立明确的识别函数包括:参数模板匹配、人工神经网络、聚类算法、表决算法、熵量测技术、品质因数、模式识别以及相关量测等技术,聚类分析法,在一定条件下,按照目标间的相似性把目标空间划分为若干子集,划分的结果应使表示聚类质量的准则函数为最大当用距离来表示目标间的相似性时,其结果降判别空间划分成若干区域,每一个区域相当于一个类别常用的距离函数有明氏距离、欧式距离、马氏距离、类块距离等包括:聚类分析法、表决法、神经网络法、参数模板匹配法、熵量测、品质因数、模式识别,等类间距离,离差平方和法(ward method)D2=WM-WK-WL即对异常值很敏感;对较大的类倾向产生较大的距离,从而不易合并,较符合实际需要表决法,由每个传感器提供对被测对象状态的一个判断,然后由表决方法对这些判断进行搜索,以找到一个由板书以上传感器“同意”的判断(或采取其它简单的判定规则),并宣布表决结果适合实时融合融合无偿较大,神经网络,非线性,自学习,自组织,并行性,容错性权值,学习收敛性,学习速度,网络模型,结构,等需要人为地根据融合对象的特点进行调整,参数模板匹配,把在一段时间内得到的多传感器数据与多个信息源按照预先选择好的条件进行匹配,然后判断观测量是否包含支持某一现象的证据,熵量测,来源于通信理论通过事件发生的概率来度量实践中所包含信息的重要程度。
度量信息价值的函数应具有这样的性质,即信息价值的大小与接受到该信息的概率成反比2.4.3 认知模型的数据融合方法,基于认知的模型试图通过模拟人的处理过程来自动实现决策的过程这包括:模拟人的处理过程来自动实现决策的过程模糊逻辑法逻辑模板法专家系统基于知识的系统模糊集理论,模糊逻辑法,隶属度函数,如正态函数、三角函数、梯形函数等隶属度函数是主观确定的,但其对模糊推理的影响并不大隶属度函数,若对论域(研究的范围)U中的任一元素x,都有一个数A(x)∈0,1与之对应,则称A为U上的模糊集,A(x )称为x对A的隶属度当x在U中变动时,A( x)就是一个函数,称为A的隶属函数隶属度A(x)越接近于1,表示x属于A的程度越高,A(x)越接近于0表示x属于A的程度越低用取值于区间 0,1的隶属函数A(x)表征x 属于A的程度高低隶属度属于模糊评价函数里的概念:模糊综合评价是对受多种因素影响的事物做出全面评价的一种十分有效的多因素决策方法,其特点是评价结 果不是绝对地肯定或否定,而是以一个模糊集合来表示 A(x )=表示模糊集“年老”的隶属函数,A表示模糊集“年老”,当年龄x≤50时A(x)=0表明x不属于模糊集A(即“年老”),当x ≥100时,A(x)=1表明x 完全属于A,当50くx〈100时,0〈A(x)〈1,且x越接近100,A(x)越接近1,x属于A的程度就越高。
这样的表达方法显然比简单地 说:“100岁以上的人是年老的,100岁以下的人就不年老更为合理专家系统,将人类专家的知识和经验以知识库的形式存入计算机,并模仿人类专家解决问题的推理方式和思维过程,运用人类的知识和经验对现实中的问题作出判断和决策具有采用类似自然语言的方式表达,易于理解和维护缺乏自学习自我完善能力,基于知识的系统,将规则或知名的专家知识结合起来实现自动对目标的识别包含以下4个部分:1)知识库,包括基本事实、算法和启发式规则等2)一个大型的包含动态数据的全局数据库3)一个控制结构或推理机制4)人机界面,模糊集理论,模糊集理论是将不精确知识或不确定性边界的定义引入到数学运算中来,它可以方便地将系统状态变量映射成控制量、分类或其他类型的输出数据允许知识或者身份边界的不确定性不累计所有输入输出,而只累计输出多传感器数据融合的特点,1)加强对多传感器的管理2)针对多传感器数据融合,建立统一的融合理论和广义融合模型3)研究不确定性融合推理方法和容错能力强、实时性好的高效融合模型4)解决数据配准、数据预处理、等问题,建立高效性能可靠的数据库管理系统和检索推理机制,利用成熟的辅助技术,建立面向具体应用需求的数据融合系统。
5)将人工智能技术引入到数据融合领域;利用集成的智能软计算方法,提高多传感器融合的性能6)利用有关的先验数据提高数据融合的性能,研究更加先进复杂的融合方法7)在多平台/单平台、多传感器背景下,建立计算复杂度低的数据处理模型和算法8)建立数据融合测试评估系统和多传感器管理体系9)工业化、商品化、专业化3 分布式自适应动态数据融合方法,3.1 测量模型和方法简述3.2 测量数据范围的推导3.3 最优范围的确定,3.1 测量模型和方法简述,,,,,,模块1,模块2,模块3,模块N,被测单元,各模块间相互传递测量数据,,,,,,本方法的特点,融合过程中考虑了测量时间小量误差对测量结果造成的影响,真正实现动态融合综合考虑了多传感器中各传感器测量精度对最终融合结果造成的不同影响可通过改变传感器的精度参数使融合变得不再“死板”,而是一个动态的过程,即方法可以“适应”各传感器的精度变化以“表决”的方法,综合各传感器的测量数据,判断各传感器是否处于正常的工作状态,以避免处于故障状态的传感器所测量的数据给最终融合带来的不良影响这也体现了该方法对测量环境变化的“适应”能力。