1. 引言
随着军事变革和指控系统的不断发展,现代战争已然从以单个武器装备性能为主的作战方式向以武器装备整体作战效能为主的网络中心战演变。指控系统是整个武器装备系统的核心与重要决策环节。如何从海量复杂的数据信息中提取、处理,得到有用情报,快速地形成作战方案是指控系统的核心功能,是作战胜利的关键环节。但在日益复杂的作战场景中,多传感器信息系统大量涌现 [1] [2] [3] ,所以数据信息来源、表现形式具有多样性。同时作战需要信息处理也具有时效性,这些都大大增加了信息处理分析的难度,人类大脑和传统数据库工具的综合处理能力已经无法应对这复杂的作战场景,信息融合技术便应运而生。
随着武器装备种类的不断增多以及武器装备性能的不断提高,多传感器信息融合的效果不尽相同,例如:融合航迹输出的时效性较差、多传感器对同一目标形成多条空情信息,不同目标形成一条空情信息等。如何评估空情信息融合效果从而通过负反馈提高融合算法精度是十分重要的。
本文对空情信息融合的结构、算法以及评估方法进行探讨与总结。
2. 信息融合模型
信息融合研究关键问题是模型和算法的设计,信息融合模型在不同的应用领域也是不尽相同的。
在1980年,Bowman提出了首个融合模型——Bowman Df&Rm模型。在1984年,美国国防部数据融合联合指挥实验室提出了在军事领域被广泛使用的JDL模型,用于综合不同来源的安全数据以提高目标识别和态势评估的准确性。JDL模型将数据融合的过程分力三级 [4] :第一级为目标优化,定位和目标识别;第二级为态势评估,主要利用第一级处理的结果构建态势图;第三级为威胁评估 [5] ,根据第二级处理的结果对环境中可能存在的威胁进行分析和评估。随着精确打击和远程打击武器出现,以及多武器、多平台的协同作战,对信息融合的准确性和实时性提出了更高的要求。于是在JDL模型的基础上提出了五级模型。第一级为检测级融合;第二级为位置级融合:第三级为目标识别级融合:第四级为态势估计(感知、理解、预测、估计);第五级为威胁估计。2005年后,各位学者开始将人的认知能力与信息融合系统紧密结合,让用户成为信息融合过程中的重要一环,更好的满足用户的需求。
3. 信息融合算法
信息融合算法目前大致可以分为三类:信号处理与估计理论方法、统计推理方法,以及人工智能方法。信号处理与估计理论方法包括最小二乘法、卡尔曼滤波算法、加权平均法、高斯滤波法、期望极大化算法等。统计推理方法包括贝叶斯推理、证据推理,支持向量机理论、随机集理论。人工智能方法包括神经网络、遗传算法、模糊逻辑、专家系统。
3.1. 最小二乘法
最小二乘法是将多个传感器的目标观测值进行拟合,并比较各个拟合函数针对不同传感器的目标观测值的误差平方和,最终使得误差平方和最小的拟合函数即为所求 [6] 。这种方法是直观的且在数学上是可解的,但是对于异常值问题,还需要使用其他方法进行融合。此外,最小二乘法往往不单独使用,一般与其他信息融合方法一起使用,或者用来评估信息融合方法的效果。
3.2. 卡尔曼滤波法
卡尔曼滤波为受到白噪声干扰的线性动态系统数据融合的最优估计 [7] [8] ,它主要用于融合低层次实时动态多传感器冗余数据。在航空领域,卡尔曼滤波解决了将雷达数据与惯性传感器数据结合起来得到飞机轨迹的整体估计的数据融合问题,还解决了对测量数据中外部引起的误差进行检测的数据拒绝问题。此后,卡尔曼滤波就成为了几乎每个机载航迹估计和控制系统设计的重要组成部分。此算法具有递推特性,因此不需要大量数据作为计算的支撑。但是对于多传感器信息融合,单单采用卡尔曼滤波还存在一些问题:1) 当面临对数据融合实时性要求很高且存在大量冗余信息的场景,数据维数剧增,计算耗时长,无法满足需求。2) 故障概率也随着传感器子系统的增加而增加,一旦出现故障未被及时发现会导致整个系统瘫痪。3) 错误或者不精确的模型可能会导致滤波发散。因此,常常将卡尔曼滤波和其他信息融合算法相结合使用增加算法的可靠性。
3.3. 加权平均法
加权平均法是最直接,最简单实用的信息融合方法。其具有易于实现,运算速度快,提高图像信噪比等优点,适合于动态环境。通过把来自每个传感器的目标观测值进行匹配处理以获得各自的权值,根据每个传感器所占权重进行加权平均后就可得到最终的信息融合结果。但是该方法需要对各个传感器性能以及目标观测值进行详细分析才可得到较为准确的融合结果。并且这种方法会削弱图像的对比度,使得图像的边缘变得模糊。因此,加权平均法一般作为辅助融合算法使用。
3.4. 贝叶斯推理
贝叶斯推理是较早应用于多传感器信息融合的方法 [9] [10] 。在信息融合过程中,先对各个传感器的目标观测值进行相容性分析,可以采用分布图法对可信度低的信息进行删除,将各个传感器作为一个贝叶斯估计,将各个单独物体的关联概率分布合成一个联合的后验概率分布函数,通过使该函数的似然函数最小,最终得到信息融合结果。该方法的优点在于对缺失的数据不敏感、对于小规模的数据表现较好,缺点在于对输入数据的表现形式较为敏感,对先验模型的准确性要求较高。
3.5. 证据推理
证据推理 [11] 是贝叶斯推理的扩充。证据推理主要针对不确定问题的处理,能够有效地区分未知信息和不确定信息对系统的影响,可以更好地处理来自不同传感器的相互独立的证据源信息,从而提高结果的准确性 [12] [13] 。基于证据推理的多传感器信息融合过程主要分为三步:第一步为目标合成,把来自每个传感器的目标观测值进行合成处理;第二步为推断,对传感器观测值进行推断,扩展成目标报告(即处理后的概率分布函数、可信度、释然度等);第三步为更新,在合成和推理之前,要先更新传感器的观测值。
相比于概率推理,证据推理所需的先验数据更直观且更容易获取。但是其也存在一定的局限性:1) 此方法需要证据必须是相互独立的,但是这有时很难得到满足;2) 证据合成规则的有效性和合理性存在一定的争议性;3) 在计算过程中可能会存在指数爆炸的问题。
3.6. 支持向量机理论
支持向量机(SVM)是一种用于分类和回归问题的监督学习算法。其算法思想是通过在特征空间中构造一个最优超平面把不同类别的样本分开。相比于其他需要大量经验的算法,支持向量机法有更加严格的数学理论基础,泛化能力更强。在基于支持向量机理论的多传感器信息融合过程中,可以通过数据清洗和预处理的方法提前删除异常值;特征选择与转换法对多传感器信息观测值进行特征重要性评估以及降维处理:将来自不同传感器数据的特征作为支持向量机的输入,进行模拟训练和分类预测,从而得到更加准确且有效的信息融合结果。该方法的优势在于:1) 能够处理高维数据:SVM方法可以选择不同的核函数将信息数据映射到高维空间,因此不会造成维数灾难;2) 适合小样本数据:SVM的处理结果与数据的分布有关,当数据量较小时,分布不均匀问题可以得到更好的处理;3) 可以处理非线性问题:SVM方法可以利用核函数将非线性问题转换为线性问题后再进行处理;4) 结果具有良好的解释性;5) 较强的泛化能力。劣势在于:1) 对噪声敏感;2) 对参数的选择敏感;3) 计算复杂度较高。
3.7. 神经网络
神经网络 [14] 是模拟人脑神经系统的功能,通过多个神经元的连接和计算实现非线性模型的组合和输出。神经网络具有以下特征:1) 非线性:因为神经网络中的每个神经元包含一个非线性的激活函数,此函数将输入信号进行非线性转换,从而使得神经网络可以处理非线性关系的数据。此处,神经网络层次结构和权重参数的调整也可以使其逐渐逼近非线性函数,从而进一步增强其非线性处理能力。2) 自适应性和自组织性:神经元之间连接具有多样性和可塑性,神经网络可以通过不断学习进行自组织以适应不同信息的处理要求。3) 容错能力:神经网络可以根据对象的主要特征进行识别。由于神经网络的以上特性刚好可以满足多传感器信息融合的处理要求,因此,神经网络被广泛应用。但其也存在局限性:1) 模型缺乏透明性,比较难以理解;2) 对输入数据和参数的选择比较敏感,选择不当会导致过拟合现象存在;3) 训练所需时间和资源较多。
3.8. 遗传算法
遗传算法通过模拟生物进化的过程来求解问题 [15] [16] 。生物种的基因对应优化问题中的变量组合,一个解则代表一个个体,通过生物基因的交叉和变异来改变种群的性状(函数值),通过进化过程中的优胜劣汰的原则挑选出优秀的个体(函数值大或小),最终通过选代的方式模拟生物的进化,得到一个适合生存于特定环境的种群,以此来求解出优化问题的全局最优解。基于遗传算法的多传感器信息融合问题求解充分考虑到各个数据来源之间的相关性,并通过选择、交叉、变异等操作优化各数据来源的权重,最终得到更优的信息融合结果。该方法的优势在于:1) 全局搜索能力较强.不易陷入局部最优解;2) 对于复杂问题的适应性较强,可以用于解决非线性、多维等问题;3) 灵活性较强,对于问题的具体形式不敏感;4) 具有并行性,可以利用多核计算机来加速其计算。劣势在于:1) 面对某些复杂问题,收敛速度更能会较慢;2) 融合结果比较依赖于参数的恰当设置。遗传算法与其他融合算法相结合是目前研究的热点方向。
3.9. 模糊逻辑
模糊逻辑是指模仿人脑的不确定性概念判断和推理思维方式对多传感器信息融合过程中的不确定性直接表示在推理过程中 [17] 。模糊逻辑是多值逻辑,在信息融合过程中,不确定性可以直接用模糊逻辑表示,再使用多值逻辑推理,根据模糊集合理论对各种命题进行合并,进而实现数据融合。该方法的优势在于:1) 面对不确定和模糊的信息时,其知识表达能力强,能够很好地处理上述信息,推理结果更加准确;2) 内在推理模型易于被理解;3) 灵活性较高,在命题中,可以根据具体的场景定义不同的真值,不单单只有真或者假。相比于传统逻辑,该方法劣势在于其真值虽然具有多样性,但是有时定义会造成歧义,计算资源需求也很大。神经网络和模糊逻辑均属于更加智能的信息融合方法,各有优劣,相比于神经网络,该方法劣势在于其获取知识较为困难,学习能力有限,当数据量较大时聚类困难。
随着智能技术的不断发展,神经网络,模糊逻辑等智能算法因为其非建模优势成为了研究的热点方向。上述融合算法均有各自的优势、劣势以及适合的应用场景,因此,各种融合算法的结合是未来的研究趋势。
4. 信息融合评估方法
信息融合的效果评估 [18] 对融合软件的论证、验收以及融合算法的改进都具有重要的指导意义信息融合指标主要可分为三类:第一类为该指标不能小于某一个固定值,例如:航迹融合正确率、航迹识别率、空情处理容量、空情处理强度等;第二类为该指标精度不能大于某一固定值,例如:速度精度,位置精度、航向精度等。第三类为该指标不能大于某一固定值,例如:系统处理时延、航迹虚关率、航迹零碎度、航迹漏关率等。对于不同类别的指标,评估方法也不尽相同。
4.1. 第一类指标的评估方法
对于第一类指标的评估,以航迹识别率为例进行说明。航迹识别率是指经过信息融合后,输出的目标属性正确的航迹数量与真实值的比值。假设航迹识别率要求不小于95%。由于空情信息融合的场景是不能被全部列举完的,即要求的含义是航迹识别率的均值是不小于95%。假设航迹识别率为一个服从正态分布的随机变量,原假设
,备择假设
。如果原假设成立,则航迹识别率达标,如果备择假设成立,则航迹识别率不达标。因为T分布常用于小样本估计呈正态分布且方差未知的总体的均值。所以可以用T分布来评估指标是否达标。假设对航迹识别率进行了n次试验得到一组样本值
,方差未知,样本均值
,服从正态分布
。由于方差未知,不能利用
来确定拒绝域,又因
是
的无偏估计,我们可以用
代替
,采用
(1)
作为检验统计量,该统计量服从自由度为
的T分布。根据定理可知:
(2)
根据查找
分布表得到拒绝域与接收域的临界值
,当检验统计量落入拒绝域
内,则航迹漏关率未达标,反之则达标。
4.2. 第二类指标的评估方法
对于第二类指标的评估,以速度精度为例进行说明。速度精度是指经过信息融合后,输出的速度与真实速度误差的标准差。假设速度精度要求不大于5%。设速度精度为一个服从正态分布的随机变量,原假设
,备择假设
。当一个随机变量服从标准正态分布,其平方值的和就服从卡方分布。采用
(3)
作为检验统计量,其服从自由度为
的卡方分布,根据定理可知:
(4)
根据卡方分布表得到拒绝域与接收域的临界值,当检验统计量落入拒绝域内,则速度精度未达标,反之则达标。
4.3. 第三类指标的评估方法
对于第三类指标的评估,以航迹漏关率为例进行说明。航迹漏关率是指经过信息融合后,输出的航迹中丢失的航迹数量与真实航迹数量的比值。假设航迹漏关率要求不大于5%。与第一类指标评估方法有相似处,设航迹漏关率为一个服从正态分布的随机变量,原假设
,备择假设
。假设对航迹漏关率进行了n次试验得到一组样本值
,方差未知,样本均值
,服从正态分布
。采用
(5)
作为检验统计量,该统计量服从自由度为
的T分布。根据定理可知:
(6)
根据查找
分布表得到拒绝域与接收域的临界值
,当检验统计量落入拒绝域
内,则航迹漏关率未达标,反之则达标。
空情信息融合的效果评估是各个指标的综合评估。首先将每个指标进行归一化,并根据指标的重要程度进行权重的分配,最终进行加权和得到评估得分。
5. 多传感器空情信息融合展望
1) 还需进一步研究统一且合理的多传感器信息融合模型。目前,信息融合模型的建立大多数是针对特定的问题而不具有通用性。因此建立统一的融合模型是未来的研究方向 [19] 。
2) 空情信息融合正确率和精度还都有待提高。来自于各个传感器的空情信息总是会存在虚假信息,干扰融合正确率和精度。面临此挑战,目前的融合算法还需进一步改进。
3) 还需进一步探索科学统一的多传感器信息融合评估体系。由于传感器种类较多且根据具体的场景所选择的融合模型也不同,因此较难实现统一的多传感器信息融合评估体系。
4) 空情信息的相关性在融合过程中需要被考虑。来自于多个传感器的信息常常有一定关联性,然而大部分融合算法要求信息具有独立性 [20] ,因此如何处理该问题是需要进一步研究的方向。
5) 空情信息融合中的典型问题仍待解决。例如:混合系统滤波、非线性估计、多目标跟踪等。
6. 结束语
随着作战需求的不断增多以及人工智能技术的不断发展,信息融合技术将得到更加深入的研究,为指控系统提供更有力、有效的决策优势。