1. 引言
武器系统作战运用数据主要包括各级指挥员对所属部(分)队的武器装备在作战中的指挥、控制与使用过程中产生、需要或关联的数据 [1] 。
武器系统在操作训练或实战演习过程中,会根据作战流程产生海量的作战运用数据,而作战运用数据的产生离不开相应的作战环境支撑,即不同的作战环境会产生不同数值的作战运用数据,因此在采集武器系统海量作战运用数据的过程中,必须要注明具体的作战环境,才能使得作战运用数据具有参考价值。但是目前部(分)队对积累的大量的各种作战环境数还停留在简单的人工记录、查询、统计和备份阶段,导致作战环境数据项名称容易重复或语义近似等问题,制约了采集数据的高效应用,数据利用率不高。解决此类问题首先就是要对大量的作战环境数据项进行系统分析和聚类梳理,以便为后续利用计算机等自动化设备进行数据处理和运用奠定基础。本文则尝试利用SOM神经网络 [2] 对作战环境数据项进行归类。
2. SOM神经网络的本质和特点
SOM (SOM, Self Organizing Feature Map)神经网络由一系列神经元组成网络节点,总共分为两层,即两者之间形成全连接的输入层和竞争层,其中,竞争层为二维平面阵列。SOM网络具有自组织、自学习的特点 [2] ,其网络结构如图1所示。
![](//html.hanspub.org/file/25-1541309x9_hanspub.png)
Figure 1. The general structure of SOM neural network
图1. SOM神经网络的一般结构组成
SOM神经网络具有相应的功能模块,共同完成自组织、自学习的过程 [3] ,即:
1) 处理模块。用于输入信号或某类自变量,形成完成相应判断功能的“判断函数”。
2) 选择比较模块。通过比较,选择某处理模块,该处理模块具有最大函数输出值。
3) 局部互联功能。通过局部互联,能同时激励某处理模块及其最邻近的处理模块。
4) 修正调整模块。用于修正或调整某处理模块的相应参数,提高特殊条件下的“容纳性”和“适应性”。
当学习开始后,竞争层中的神经元会逐一分辨出输入层里的神经元节点(前提是与其相邻近),同时获胜神经元的权值向量和其邻近神经元的权值向量会按照某种函数进行更新。通过网络的自组织、自学习训练,权值向量就会按照某种方式变得有规律可循,即前一次的权值向量更新结果作为下一次更新前的网络输入向量。如果某一节点位置发生变化,借助权值向量更新的作用,此变化将影响到该神经元的邻近神经元。一旦学习过程结束,就可以建立起一种最优的神经元节点布局,该布局里的每个权值向量都位于聚类中心,即完成了一次数据聚类任务 [3] [4] 。
3. 作战环境数据项归类
作战环境类数据资源是海量的,因此在梳理分类过程中,可能遇到不同单位,或者虽然
同一单位,但由于不同指挥员在不同时间和地点或者因为记录风格不同造成数据项名称重复或近似,导致种类繁多而不易归类,不利于数据资源的高效利用 [5] - [10] 。
比如,环境文件、环境数据、自然环境是属于同一类,而集结地域属于其它类,因此在实际梳理分类的基础上,环境文件、环境数据、自然环境应该合并为一类。这里利用SOM神经网络算法实现聚类。
3.1. 建立模型 [11] [12] [13] [14]
本案例给出了一个含有4个待聚类样本的数据集。每个样本有4个特征,分别为每个汉字四小部分的笔画数,如图2所示,归一化后的数据样本为:
应用SOM神经网络聚类的步骤 [15] [16] [17] [18] :
1) 选取其中
个输入神经元,并将该
个输入神经元到输出神经元的连接赋予较小的随机数权值。选取输出神经元
个“邻近神经元”集合
。其中,
表示时刻
的神经元
的“邻近神经元”的集合。随着学习的深入,集合会不断缩小。结合本例,即为选取数据样本。
2) 将
作为输入向量输入给输入层。即对数据样本进行学习,学习结束后,对具有最大输出的神经元标以该数据项名称的记号,并将待检样本作为新一轮输入向量输入到SOM神经网络中。
3) 计算映射层的权值向量和输入向量的欧式距离。通过计算得到一个胜出神经元(胜出神经元具有最小距离),记为
,与此同时也确定了其邻近神经元。
4) 调整胜出神经元
及其邻近神经元的权值。
式中
,随着时间变化逐渐下降到0。
5) 计算
,
,式中
一般为非线性函数。
6) 如达到聚类要求则学习过程结束;否则从步骤(2)开始,继续网络学习。
3.2. 结果分析
本文使用的SOM神经网络共有36个节点,即6 * 6结构。经过算法的运行和学习过程的模拟,我们得到了不同神经元之间的欧式距离情况,如图3所示:
![](//html.hanspub.org/file/25-1541309x28_hanspub.png)
Figure 3. Euclidean distance between different neurons
图3. 不同神经元间的欧式距离
其中36个蓝色节点代表SOM网络神经元,神经元之间连线如果标红,说明神经元直接连接;由36个节点相互构成的具有不同颜色的菱形,不同的颜色表示神经元之间距离的远近程度:当颜色原来越深,说明神经元之间的距离越来越远。比如神经元之间的距离较近时,用黄色表示;当变黑时,说明神经元之间的距离最远。图4中标蓝的神经元为学习过后,竞争胜出的神经元。
![](//html.hanspub.org/file/25-1541309x29_hanspub.png)
Figure 4. Competition winning neurons (blue)
图4. 竞争胜出神经元(蓝色)
经过学习,得到的聚类结果如表1所示:
![](Images/Table_Tmp.jpg)
Table 1. The clustering results of SOM network
表1. SOM网络聚类结果
当SOM网络的学习步数为10步时,样本集
中的每一个样本自成一类;当SOM网络的学习步数为30、50、100、200、500、1000步时,样本集
中的每一个样本同样自成一类,但是种类不一样了,可以看出随着SOM网络的学习步数逐渐增加,样本集中的每一个样本的归类越来越精确。
4. 结论与说明
一是对于本例,若输出神经元在输出层的位置与某数据项名称样本的位置相同,说明待检样本就是某数据项;若输出神经元在输出层的位置介于很多数据项名称之间,说明这几种数据项名称都有可能,具体取决于欧氏距离的大小。
二是SOM神经网络的算法学习步数影响网络的最终归类性能,本文通过10次学习过程就可以将样本集中的每一个样本完全分开,因此就没有必要增加学习步数了。
三是经过SOM神经网络对作战环境数据的分析归类,该方法比传统人工查询、记录、统计的分类速度更快。后续可以以本文的研究成果为基础,进一步对武器系统其它作战运用数据进行归类、分析和整合,以提高采集数据的利用率和应用效果,为数据采集应用平台的建立和运行奠定坚实基础。