1. 引言
复合材料是指由两种或两种以上不同化学成分或物理属性的材料根据应用需求人工组成的特殊材料。由于其复杂的内部结构及多种组成成分,导致其介质分布规律与传统金属材料存在显著差异 [1]。同时,不同组成成分、不同制造工艺甚至不同制造批次的复合材料之间,其抗疲劳特性、使用寿命等关键健康指标也有明显差别 [2] [3]。
电磁无损检测技术通过非接触的方式获得被测试件表面及内部结构信息及特征参数,检测系统通过电磁耦合方式工作,具有良好的安全性和较低的功耗,适合于在线检测及在役结构件的原位健康监测。然而,由于电磁场的“软场”特性,传统的电磁无损检测方法极易受到环境参数变化的影响,检测结果不稳定,这是限制其实现大规模应用的主要原因之一 [4]。同时,复合材料的异质性、各向异性以及个体差异对电磁检测方法也提出了新的挑战。
近几年来,人工智能理论以其在人脸识别 [5]、自然语言处理 [6]、目标探测 [7] 等领域的出色表现逐渐成为各相关领域的研究热点。利用人工智能理论及方法,通过反向传播的深度学习网络模型解耦复杂的电磁耦合物理模型,将电磁检测原始数据降维,获取其内部隐含的被测物场关键特征参数已经成为电磁无损检测领域最新的研究热点之一 [8] [9] [10]。
本文构建了平纹编织CFRP板材和角度敏感电磁传感器阵列的仿真模型,通过模拟现实中板材出现的不同种类的缺陷损伤,使用阵列传感器采集大量缺陷数据,建立缺陷数据库。将深度学习思想引入到检测系统中来,利用自编码器提取CFRP缺陷特征,实现缺陷识别并按照位置分类的目的。
2. 基于自编码器的电磁特征提取
实验针对平纹编织结构碳纤维增强复合材料,也就是CFRP的电磁特征提取及分类问题,利用深度学习思想,采用自编码器算法,提取CFRP结构件缺陷的电磁特征中的隐含信息,以此为基础达到缺陷检测并将其分类的目的。
2.1. 实验数据
本实验选取平纹编织结构CFRP作为被测对象,CFRP板材如图1所示。
图1中材料由两组纱线以垂直交叉的方式编织而成,延水平方向延伸的称为经纱,延垂直方向延伸的叫做纬纱。其中每根纱线的碳纤维数量约为12 K。依照样品图例建立平纹编织结构CFRP离散化电导率模型,如图2所示。
Figure 2. Discrete conductivity model of CFRP
图2. CFRP离散化电导率模型
图中的CFRP板材由经纬纱线的基本单元交替组成,按经纬线基本单元为单位分别设置不同的电导率。实验中以横纵坐标轴为分界线,将CFRP板材自然分成I、II、III、IV四个区域,并分别在每个区域内人为制造100个不同缺陷。四个区域共计缺陷400个,组成神经网络的训练集。每个缺陷均位于各自区域的不同位置。图2中示例缺陷尺寸为6 × 0.5 × 0.5 mm。经纬线电导率分布参数见表1。
Table 1. Geometric and physical parameters of the model
表1. 模型的几何和物理参数
由于CFRP材料电阻抗各向异性的特点,针对每个缺陷,将图3所示的电磁检测传感器阵列置于CFRP板面之上,传感器线圈基本参数见表1。使用有限元仿真模型,跟据电磁场分布规律,分析在正弦激励情形下,CFRP表面及内部电流密度分布以及传感器线圈阻抗变化的规律,计算并提取其上的电阻抗值作为实验数据。
在获取不同角度下传感器的感应电压及电流后,根据欧姆定律,求出传感器在每一个位置的阻抗值,将其存储为向量数据。通过分析传感器在不同位置阻抗实部变化,实现对CFRP裂纹缺陷位置的分类。
图3为6 × 6角度敏感的电磁检测传感器阵列,共36个150匝线圈。以紫色方框为界将其分为内外层两部分。紫色方框内的16个线圈称为内层线圈,方框外部的20个是外层线圈。采集实验数据时,以每个内层线圈为中心分别测量其周围8个线圈的阻抗值。以图6中蓝色线圈为例,先对其通入1 A电流,然后按顺时针顺序分别分时将周围的8个线圈也通入1 A电流,求得蓝色线圈和通电线圈的阻抗值之和。同理,其余15个内层线圈用同样的方法均可求得8个阻抗值。通过以上步骤可以获得16组含有8个阻抗值的向量,亦即16 × 8的矩阵。实验中用该类矩阵作为神经网络的输入数据,包括训练集400组和测试集80组向量。
2.2. 算法流程
自编码器,以下简称AE (Auto-Encoder),属于神经网络模型中的一种。如图4所示,AE网络结构大致可分为输入层、隐藏层和输出层3类神经元。
Figure 4. Schematic diagram of self encoder
图4. 自编码器示意图
基本的AE神经网络由编码器和解码器两部分组成,如图4所示。网络算法是先对输入向量
进行线性变换,在激活函数的作用下求得一个编码解
。一般选择形如式(1)的Sigmoid函数作为激活函数,编码器计算方法如式(2)所示。然后以式(2)的结果
,作为解码器的输入,得到重构的向量
,计算方法如式(3)。
(1)
(2)
(3)
公式(2)中,
是权重矩阵,
是权重矩阵 的转置矩阵,
和
分别是向量
和向量
的偏置。
AE的学习过程是无监督的,优化的目的是使重构后的向量
尽量与原输入向量
相等,也就是使重构后的代价函数最小,得到最优参数解
,
和
。
本实验中的网络采用1个输入层,3个隐藏层和一个Softmax分类层作为输出的网络结构,输入层维度为128维,3个隐藏层维度分别为100,100,500维,Softmax输出层维度为4维,即分为四类。
将仿真中得到的数据集输入到神经网络中,基本流程如图5所示:
Figure 5. Basic flow chart of data processing
图5. 数据处理基本流程图
数据集预处理的目的是为了加快神经网络的训练速度,并将原本的2维数据变成3维(另外1维表示的是批次)。实验数据集由训练集和测试集两部分组成,两部分分别进行预处理。细分后的每个小批量包含10个数据向量,若剩余小批量数据向量不能被整除,则全部置入最后一个小批量中。每次输入一个小批量数据后都会重新更新网络权重,所以将所有的数据集细分为小批量,也有利于网络权重的更新。
当提取一组数据的特征时,单层神经网络往往并不是最佳的模型结构。但含有多个隐藏层的深层神经网络又很难优化权重。如果初始权值取的比较合理,梯度下降法效果当然很好,但要找到适合的初始权值区间却比较困难。在初始权值较大的情况下,网络可能会陷入局部极小值;当初始权值较小时,又很难一次训练多个隐藏层。这就是为什么要预训练神经网络,应用预训练的算法可以使用更深层的神经网络。
图6中是只有一个隐藏层的受限Boltzmann机神经网络,左边一层神经元组成可见层(visible layer),用向量
表示该层神经元的值,
为其神经元的个数。右边一层的神经元组成隐藏层(hidden layer),用向量
表示其神经元的值,
为其神经元的个数。隐藏层和可见层之间是全连接的,隐藏层神经元之间是独立的,可见层神经元之间也是独立的。连接可见层与隐藏层的权重用矩阵
表示,
为可见层的第
个神经元与隐藏层的第
个神经元之间的连接权重。
在图6的单层神经网络中,提取了输入特征后,将其视为另一个单层神经网络的数据,即第一个单层神经网络的输出作为下一个神经网络的输入。这种逐步学习的方式可以根据需要重复多次。如果每层神经元的数目没有减少,并且其权值的初始值选择适当,每增加一个隐藏层都能提高模型的分类精度。当隐藏层数较高时,逐层学习网络参数的算法是训练深度网络权重非常有效的方法。网络的预训练过程适用于各种数据集,这也是逐步揭示低维非线性结构的有效方法。
Figure 6. Single layer RBM neural network
图6. 单层RBM神经网络
预训练部分使用训练集数据分别训练三个如图6中所示的单层RBM神经网络,每个RBM只有一个隐藏层。前一个RBM的学习特征被用作后一个RBM的输入数据,用于训练下一个RBM中的权重和偏置等参数。对于所有的数据,每个单隐藏层RBM在整个训练过程中被预训练50次。单独预训练的3个独立RBM如图7所示:
当上面的单层RBM神经网络全部训练完成后,使用链式规则将3个RBM展开,连接成一个深层神经网络,并把得到的权值和偏置全部赋给这个网络,作为初值。将最后一个隐藏层的输出接入Softmax层用作分类,如图8所示:
Figure 8. A deep neural network composed of three independent RBMs
图8. 由三个独立RBM展开堆叠成的深层神经网络
常见的分类算法有逻辑回归、支持向量机(SVM)等,但一般都用于二分类情形。相对于多分类问题,比如本实验中需要四分类就略有不同。在多分类场合中,当然也可以用多个二分类器组合成多分类,但这样解决多分类问题一般不如Softmax便利,因为Softmax的多个分类器是同时训练的,这样在效率上就优于需要训练多次的其他分类算法。其次,该使用Softmax分类器还是组合分类器,主要看各类别之间是否互斥。所谓互斥就是一个样本属于且只属于多个类别中的一个,或者一个样本只能属于一个类。如果互斥则用Softmax,如果不是互斥的则使用组合分类器。显然,实验中的数据是互斥的,所以使用Softmax更佳。
展开3个预训练好的RBM网络并接入Softmax层后,采用梯度下降法优化整个网络。当然,这里使用的是比较小的权重学习率,以避免过度调整预训练所得到的权值。微调神经网络与预训练过程的区别在于,预训练是非监督学习,利用编码器和解码器使代价函数减小来还原输入;微调过程属于监督学习。
3. 实验结果
利用基于AE算法进行无监督学习,对400个训练数据和80个测试数据进行了200个阶段的128-100-100-500网络学习后,由Softmax分类器将其分类。为了证明预训练的效果,分别运行了有无预训练的程序,误差结果如下图9所示:
Figure 9. Comparison chart of pre training or not
图9. 有无预训练对比图
图中有无预训练的两条下降曲线的训练条件是相同的,但经过预训练的黑色实线不仅下降迅速,而且误差更小,在20个周期后误差几乎为零。这说明网络预训练能够提高学习速度和分类精度。
除了实验不同的学习率、动量和权重衰减参数,还分别运行了由更多单个RBM连接成的更深层的AE神经网络,如图所示。图10中的三条不同曲线分别是包含2、3、4个隐藏层的神经网络,在经过200次微调后,并没有得到比含有3个隐藏层分类结果更优的网络。这表明,过多的隐藏层并不一定能得到更好的分类精度,相应的,还会浪费大量的计算资源和时间。对应的实验结果与识别正确率见表2。
4. 结论
本文针对CFRP材料各向异性的特点及全时多点检测的应用需求,建立了基于有限元方法的平纹编织结构CFRP检测系统模型。在模型中应用角度敏感电磁涡流阵列传感器,检测平纹编织结构CFRP不同缺陷损伤的阻抗值矩阵。通过在平纹编织结构CFRP板材上制造不同种类的缺陷,建立了CFRP缺陷数据库,以备对平纹编织结构CFRP板材缺陷进行更进一步的研究,更可以完善检测方法。
将深度学习的思想引入到电磁涡流检测中来,提出将结构件机–电耦合模型数据(有标签)和传感器阵列测量数据(无标签)相结合的半监督学习式健康监测机制。使用在平纹编织结构CFRP检测系统模型中得到的CFRP缺陷数据库,训练自编码器神经网络,利用该方法的关联层网络,找到不同物理参数表征层之间隐含的变量关系,并提取缺陷数据特征向量。通过特征向量的提取,可以用于缺陷分类。
实验中采用的神经网络以自编码器主体为,利用其编码部分提取缺陷特征,并由解码器对缺陷的位置进行识别。实验缺陷数据训练网络时主要采用RBM思想,分层分步对网络进行训练。而且在开始训练网络前,先通过预处理对数据分批打包,这样有利于加快网络训练速度。网络的输出层是一个Softmax分类器,将前层网络提取的缺陷数据特征输入其中,进行分类,效果良好。
致谢
在此真诚的向在我攻读硕士学位期间给予我帮助和关心的领导、老师、同学、家人和朋友们表示感谢。首先向我的导师张荣华副教授表示最衷心的感谢和最诚挚的敬意。感谢张老师在我硕士期间对我学习、生活等各方面的指导和帮助。他渊博的知识,丰富的实践经验,对新事物的浓厚兴趣,持续不断的创造力,坚持不懈的科研精神和对学生认真负责的态度深深地感染着我,激励和鞭策着我一路走到了今天。其次,感谢我的母亲大人,刘静文老师和高姨,梁警卫学长和我的三个“闺蜜”,从准备考研一直到毕业,是你们一直在背后默默的为我付出,支持我。再次,感谢欧阳e,是你提高了我的英语水平,并让我拥有了独一无二的夏天。另外,特别鸣谢张北洋和朱筱潇两位小朋友。最后,感谢为本论文审查、评阅付出辛勤劳动的老师们。