1. 引言
工业管道作为能源输送与化工生产的关键基础设施,其结构完整性直接关系到国家经济安全与生态环境的可持续发展。据统计,截至2024年底,我国长输油气管道总里程已突破19万公里,其中主干油气管网总里程超过10万公里[1]。随着管道运行年限的不断增长,大量服役时间较长的管道逐渐暴露出因长期服役、环境腐蚀及载荷作用等因素所引发的结构劣化问题。例如,持续的腐蚀作用会削弱管道的强度,外界物理干扰可能造成结构损伤,而地壳缓慢迁移亦会改变受力状态,最终引发变形甚至破裂。这些复杂因素共同作用,容易导致各类结构缺陷,进而诱发严重的安全事故[2]。因此,发展高效、智能、鲁棒的管道无损检测技术已成为工程实践的迫切需求。
在现有多种检测手段中,非接触式磁记忆检测技术因其无需接触被测体、响应灵敏与可连续扫描等特点,逐渐成为管道早期缺陷识别的重要手段[3]。其技术基础源于金属磁记忆效应,能够通过高灵敏度传感器捕捉管道表面磁场异常,判断应力集中于结构损伤区域[4]。该方法尤其适用于长距离、金属材质的输油气管道,在工程实践中展现出早期预警能力强、检测效率高、成本适中等综合优势,具有广阔的应用潜力[5]。在理想状态下,即管道结构均匀且不存在显著缺陷时,磁记忆信号分布通常呈平稳分布;而当存在应力集中、结构损伤或受到外部铁磁体干扰时,信号会发生异常波动,此类波动在数据中常表现为突出的局部极值特征。然而,在复杂工况下,外部干扰往往会引入难以判断的信号异常,限制了磁记忆检测在实际场景下的检测准确性与适用性[6]。
目前管道缺陷识别主要面临两个方面的挑战:一是检测技术层面,传统基于单一磁信号模态的方法对异常数据的识别鲁棒性较弱,难以区分实际缺陷与环境干扰;二是数据处理层面,传统依赖极值提取进行异常判断的方法[7],由于缺乏多源信息支撑,难以实现对缺陷的全面刻画与准确识别。此外,传统方法高度依赖人工经验进行分析,不仅效率低下,且结果往往具有较强的主观性与不确定性。
针对上述问题,近年来机器学习在异常检测领域展现出强大潜力。研究者提出了多种类型的异常检测算法,包括基于统计建模、聚类、密度估计以及深度神经网络等方法,分别适用于不同的数据特征分布和实际应用场景需求[8]。其中,孤立森林(Isolation Forest)作为一种典型的无监督方法,通过构建多棵随机划分树对样本进行孤立操作,能够高效识别高维空间中的全局异常数据点,具有无需标签、鲁棒性强和计算开销低等优点,因而被广泛应用于工业异常检测任务中。此外,为进一步提升检测精度与适应性,相关研究还在传统算法基础上提出了多种改进策略。例如,有研究者在传统DBSCAN聚类算法的基础上引入多目标优化机制,实现了工业大数据中的高精度异常点检测[9];另有学者结合信号去噪与参数自适应优化方法,构建了面向工业机器人状态监测的异常检测模型,整体识别精度超过97% [10]。这些研究成果表明,异常检测算法已在多个工业场景中展现出良好的应用效果,能够有效提升复杂系统中的故障识别能力与运行可靠性。
与此同时,随着深度学习在计算机视觉领域的快速发展,图像分类技术在工业检测与智能识别中的应用日益广泛,已成为关键的信息提取手段之一。在工程实践中,研究者采用多种分类模型以实现设备状态识别、缺陷判断及复杂环境下的智能控制等任务。例如,刘高华等人利用浅层全连接神经网络对图像进行分类,实现无人车的自主前进、左转和右转控制,验证了图像分类方法在实时智能控制中的有效应用[11]。朱建臣等人利用纹理特征和支持向量机实现轮胎及压痕图像的高效分类,展示了其在实际工程中的有效性和应用潜力[12]。在此背景下,YOLO (You Only Look Once)系列算法因其端到端结构、高速响应和良好的精度表现,在图像处理任务中获得广泛关注。尽管YOLO算法最初主要用于目标检测任务,但其轻量化的网络结构同样适用于图像分类任务,它能够对整幅图像进行快速判别并输出类别标签与置信度,省去了传统分类流程中繁琐的后处理步骤[13]。这一特性使得 YOLO 系列在工业干扰识别等实时性要求较高的场景中,展现出良好的应用前景。
为应对管道检测中单一模态方法在异常检测中存在的识别精度不足、人工分析效率低下,以及缺乏对异常来源的有效判别能力等问题,本文提出一种融合磁信号异常检测与图像识别的多模态智能管道检测方法。该方法设计了一套“全局建模–局部分析–图像验证”的多层异常识别框架。首先,采用孤立森林算法在高维特征空间中进行初步异常检测,并结合局部极值点提取机制,从中筛选出更具代表性的全局分布异常数据;随后,进一步引入滑动窗口分析与突变点检测方法,识别孤立森林难以覆盖的局部突变特征,以提升整体识别结果的准确性与稳定性。紧接着,引入基于YOLOv8n-cls的图像分类模型,对检测现场同步采集的图像数据进行二分类识别,用于判断磁信号异常点是否与外部铁磁干扰有关。图像分类结果被回写至已识别出异常的数据文件中,形成图像辅助校验机制,以进一步提升整体异常判定的准确性与可解释性。该方法不仅实现了从异常识别到干扰源剔除的全流程自动化处理,也增强了检测系统在复杂环境下的适应能力。实验结果表明,将磁信号异常检测结果与图像分类模型的识别结果进行融合分析后,对由外部干扰引起的异常点剔除率达到48%,提升了系统的误报抑制能力和检测可靠性,为工程实践中磁信号异常数据的识别与干扰剔除提供了一种新思路。
2. 实验方法与系统设计
本文研究方法如图1所示,主要分为五个阶段,涵盖从系统构建到数据处理与异常识别的全过程,具体包括设备研究与软件开发、数据采集与预处理、异常数据检测、图像模型辅助判定、结果分析与方法评估。设备研究与软件开发部分,自主研发并设计了非接触式磁记忆检测设备,搭配开发具有采集磁传感器数据、实时定位与同步图像记录功能的采集软件。数据采集与预处理部分,在模拟工况环境中布置多组外部干扰源,利用所开发系统同步采集磁信号、图像信息及位置信息。采集完成后,基于经纬度信息计算对应采集距离,并将磁信号按距离窗口进行均值处理,以降低数据波动对后续分析的影响。在异常数据检测阶段,利用孤立森林与局部分析算法对处理后的磁信号进行无监督建模,识别序列中显著偏离整体分布的异常点与局部突变的异常点,作为潜在缺陷或外部干扰的候选位置。模型验证与数据分析部分,引入基于YOLO的图像分类模型对采集图像进行辅助识别。结合图像结果分析磁信号异常点对应位置是否存在外部干扰物,从而排除由外部干扰引发的误判,提升缺陷识别的可靠性。结果分析部分,综合磁信号异常点与图像分类结果,对模型辅助筛查结果进行统计分析与人工验证,评估所提出方法在实验环境下的识别准确率与应用可行性。
Figure 1. Research method for multimodal anomaly detection and interference elimination
图1. 多模态异常识别与干扰剔除研究方法
2.1. 数据采集与预处理
本研究所使用的非接触式磁记忆检测装置由研究团队自主设计并组装,具备便携性强、非接触、高灵敏度等特点。设备采用模块化背负式结构,便于作业人员在管道沿线行进中进行连续检测。系统集成四个磁通门传感器与高精度定位模组,可同时采集三轴磁信号与位置信息。考虑人体操作稳定性及地下管道深度,传感器垂直布置为上下两组,分别距地面约50 cm和150 cm,以覆盖不同深度区域的磁场变化。为满足多源信息的同步采集需求,配套开发的数据采集软件基于模块化架构,分为硬件接口层、数据处理层与可视化层三个功能模块。硬件接口层负责与磁传感器、定位模块及图像采集设备的数据通信;数据处理层实现多源数据的时间同步、结构化处理与本地存储;可视化层实时渲染合成磁信号与数据量变化曲线,辅助现场作业人员进行检测状态监控与异常初筛。
数据采集:实验过程中,作业人员背负磁记忆检测装置沿管道方向匀速前进,系统同步采集四个磁通门传感器的三轴磁信号、定位姿态数据及环境图像。磁信号与位置数据以结构化格式实时写入本地CSV文件,采样频率为100 Hz。图像数据通过工业平板内置摄像头垂直向下采集,以每秒1帧频率自动截取并保存为JPG格式。通过时间戳与路径索引实现图像与磁信号数据的自动匹配,所有数据统一保存在实验目录下的指定文件结构中,确保多模态数据的一致性与可追溯性。
数据筛选说明:由于实验场管道铺设于地表,本文在数据分析阶段优先选取设备顶部距地表约150 cm的两个传感器数据。该传感器组不仅在空间位置上更接近管道常见埋深,且受环境干扰较小,更有助于提取符合实际应用场景的磁场变化特征。
数据预处理:基于磁传感器采集的三轴磁场数据,首先采用公式(1)计算各传感器的磁场矢量合成量,其中,Bx、By、Bz分别表示磁传感器在三个正交方向上的磁场分量,Btotal表示空间三维磁场的合成强度。随后对设备顶部两个传感器的合成数据取平均值,进而得到表征磁传感器特征的标准波形信号。结合数据中的经纬度信息,基于WGS-84椭球模型采用大地线距离公式计算每个采样点与起始点之间的空间距离,并将计算结果附加至数据表中,实现磁信号与行走距离的匹配关系。最终对同一时刻采集的多条传感器数据进行统一平均处理,确保每个行走距离点与图像及磁信号数据实现一一对应,为后续异常检测与图像关联分析提供数据基础。
(1)
2.2. 磁信号异常分析与分类模型构建
2.2.1. 磁信号数据异常特征提取
为提升管道检测中磁信号异常识别的准确性与鲁棒性,本文提出一种融合全局建模与局部突变分析的多策略异常检测方法。该方法结合孤立森林算法、局部极值分析及滑动窗口下的局部突变检测机制,旨在同时捕捉磁信号在整体分布结构与局部扰动特征中的异常表现,实现异常点识别的全局覆盖与局部精细化。
首先,采用孤立森林算法对处理后的磁信号序列进行全局建模。算法设置200棵隔离树,构建高密度的特征空间划分结构,并引入自适应采样策略动态调整最大采样数,在保证检测精度的同时优化计算效率。其输出包括每个数据点的异常得分及二元分类结果,其中预测为-1的数据点被标记为潜在异常,该方法能够有效识别全局分布中明显偏离正常模式的异常点,作为后续异常分析的基础候选集。
然而,孤立森林在处理连续磁信号时,常因局部扰动持续存在,导致相邻多个点被同时判定为异常,从而形成异常点堆积,降低定位精度。为减少冗余响应,本文引入局部极值分析机制。具体方法为:通过滑动窗口提取磁信号中的局部极大值与极小值,构建具有物理代表性的峰值候选集合,并与孤立森林判定的异常点取交集,仅保留同时被两者识别的点作为最终异常。该策略可有效抑制异常区域内的重复标记,提升异常定位的准确性与代表性。
此外,考虑到部分微小缺陷或干扰虽不具备全局异常特征,但在局部区域表现为剧烈波动,本文进一步引入基于滑动窗口的局部突变检测方法,作为对全局模型的有效补充。该方法首先对磁信号进行一阶绝对差分,构建变化率序列并依据其局部中位数与标准差设定自适应突变阈值。当某点的变化幅度超出其窗口内的均值波动范围时,即判定其为局部突变点。为避免与孤立森林检测重复,设定±5个样本的突变检测抑制半径,跳过已有异常标记点周边的突变判断,以保证不同策略间的互补性。
综合上述多种检测结果,本文构建最终异常判定指标Final_Anomaly,其判断逻辑如下:若某数据点同时被孤立森林检测为异常且被局部极值分析标记为峰值点,或该点在局部突变检测中被识别为突变异常,则该点被最终判定为异常;否则,视为正常点。该融合策略兼顾全局分布特征与局部结构扰动,具备较强的适应性与鲁棒性,能够有效提升管道磁信号异常检测系统的综合性能。
2.2.2. YOLO分类模型设计
本研究基于多模态管道检测实验方案,针对图像模态的特征需求构建了异常干扰识别的数据集,并设计了适用于异常图像判别任务的YOLOv8n-cls图像分类模型。图像采集采用垂直俯视视角,覆盖管道左侧2米范围内的布设干扰源区域,以获取其在不同位置、尺度和姿态下的图像特征。在数据采集过程中,操作人员沿预设路径缓慢移动,并根据现场场景变化主动调整拍摄角度与行进轨迹,确保采集到干扰物完整暴露、部分遮挡及多种空间朝向等多样化图像样本。共采集图像样本2200张,按照训练集与验证集9:1的比例进行划分,最终构建的图像数据集包含训练集2000张、验证集200张。为增强模型对图像差异的适应能力,引入了MixUp混合增强、颜色扰动与水平翻转等关键数据增强策略。训练采用Adam优化器,初始学习率设为0.001,图像输入尺寸为256 × 256,最大训练轮数为200。为防止过拟合,设置Early Stopping策略,当验证性能在50个连续轮次内无提升时自动停止训练,模型分类性能如表1所示。
Table 1. Model classification performance evaluation table
表1. 模型分类性能评估表
模型版本 |
训练样本数 |
整体准确率 |
有干扰类召回率 |
无干扰类召回率 |
说明 |
yolov8n-cls |
2000 |
94% |
92% |
96% |
模型整体分类准确,少量样本存在误判 |
3. 实验结果与分析
3.1. 实验设计
本研究提出并构建了一套基于磁传感器数据和视觉多模态数据融合的检测实验方案,设计并搭建了结构明确、布设标准的检测场景。实验场地选取于一处开阔平整区域。所使用的实验管道由5根每根长度为12米的Q235钢材短管拼接而成,整体长度为60米。在连接部位,即12米、24米、36米和48米处,均设置有焊缝特征点,用于模拟实际工况中的典型结构变化。实验场环境如下图2所示。
Figure 2. Figure of the experimental site environment
图2. 实验现场环境图
为满足磁信号干扰与视觉信息协同采集的实验需求,实验场景布设如图3所示。目标管道平铺于地表,选取其轴向15米至55米区间作为核心检测区域,以避免两端尖端效应对磁信号的影响,确保数据采集的稳定性与代表性。检测路径设置于管道左侧,作业人员沿该路径匀速直线行进,检测设备与管道壁保持约150 cm的横向距离。干扰源统一以垂直方式固定设置于距管道200 cm的位置,其轴向位置由随机数生成算法确定,确保每次实验中干扰元件以不同组合方式分布于检测区域,增强模拟场景的真实性与不确定性。
实验采用了5种不同规格的铁质干扰源,并依次编号为1号至5号,如图4所示。自左至右,其尺寸分别为:直径60 mm、壁厚4 mm、长度0.6 m;直径32 mm、壁厚3 mm、长度0.6 m;直径60 mm、壁厚4 mm、长度0.4 m;直径32 mm、壁厚3 mm、长度0.4 m;以及直径108 mm、壁厚4 mm、长度0.3 m。
Figure 3. Illustration of the experimental scene layout
图3. 实验场景布设示意图
Figure 4. Iron pipe interference source
图4. 铁管干扰源
以上干扰源设计充分考虑了实际工程中管道周边多规格金属物体的复杂分布特性。通过多样化规格和随机布设方式,有效模拟了复杂环境下的磁信号干扰场景,为后续磁信号与视觉数据的协同分析提供了真实且具挑战性的实验条件。
3.2. 实验结果分析
本文通过随机数生成算法确定干扰源的轴向布设位置,设计并实施了10组不同的干扰源布置方案。为保证实验结果的稳定性与可靠性,每组布置方案在相同条件下重复检测3次,共计完成30次检测任务。对原始数据进行预处理后,共提取并保留了2880个满足空间与图像同步要求的有效数据点。每个数据点均包含其对应的空间坐标信息与一帧同步采集的图像数据,为后续多模态分析提供基础支撑。由于所采用的异常检测算法属于无监督方法,无法直接区分异常的具体类型,因此本实验通过“检测点与真实异常位置的空间接近度”进行匹配评估。具体而言,当算法识别的异常点与预设异常(如干扰源、焊缝等)在空间上满足±0.5 m的容差范围时,认为该点被正确识别。表2汇总了本实验中异常检测算法在识别外部干扰源与焊缝特征方面的性能表现。
Table 2. Summary of anomaly detection algorithm results
表2. 异常检测算法识别汇总
异常类型 |
来源说明 |
累计数量 |
正确匹配数量 |
识别率(基于位置匹配) |
干扰源异常点 |
干扰源由人工布设,共
10组 × 5个 × 3次 |
150 |
121 |
80.7% |
焊缝异常点 |
焊缝共3处,30次检测
累计统计 |
90 |
81 |
90.0% |
为分析磁信号变化与异常点在空间上的对应关系,本文选取设备顶部两个传感器的合成磁场强度数据,绘制了基于行进距离的磁场强度二维曲线图。同时,结合优化后的多阶段异常检测算法,对磁信号序列中存在显著波动的位置进行了识别,使用红色圆点标注出算法判定的异常位置。
实验结果表明,异常检测算法所识别出的异常点在空间分布上与实际干扰源与焊缝位置高度一致,展现出良好的空间定位能力。在某次实验中,干扰源分别布设于管道的18米、27米、32米、42米与51米处,焊缝位置则位于24米、36米与48米。算法在上述区域均识别出明显的磁场异常响应,相关结果如图5所示。经多组实验统计,该方法对铁管类干扰的检测准确率达到80.7%,对焊缝异常的识别率为90%。上述结果表明,所提异常检测方法具备良好的空间一致性判别能力和工程适用性,能够为管道缺陷的非接触式识别提供有效支持。
Figure 5. Anomaly data detection results
图5. 异常数据检测结果
在异常检测算法初步筛选出潜在异常数据后,本文进一步引入预先训练好的图像分类模型,对这些异常点进行图像层面的识别分析,旨在剔除由外部干扰引起的误判异常。具体操作上,通过遍历异常数据文件中对应的图像路径,将每个异常点所对应的图像输入训练完成的模型进行推理,模型基于图像内容将其划分为“有干扰”与“无干扰”两类,并将分类结果及置信度写入异常检测结果中。这一过程实现了磁信号与图像信息的多模态融合,不仅为异常检测结果提供了可靠的标签支持,也提升了结果的可解释性与可追溯性。
为评估图像分类模型在辅助剔除异常点方面的实际效果,本文构建对比分析,比较引入图像模型前后异常数据的剔除数量与比例。实验中,异常检测算法共识别出229个潜在异常点。在引入图像分类模型后,其中110个异常点被进一步识别为“有干扰”的类别,并据此予以剔除。具体剔除效果及相关指标如表3所示,反映了图像模型在干扰点识别中的辅助能力。
Table 3. Comparison of interference anomaly point removal results assisted by image classification model
表3. 图像分类模型辅助剔除干扰异常点结果对比
方法 |
异常总数 |
剔除数 |
剔除率 |
单一异常检测算法 |
229 |
- |
- |
异常检测 + 图像分类 |
229 |
110 |
48% |
结果表明,图像分类模型在辅助识别干扰类异常方面表现出良好效果。通过引入图像信息的多模态融合策略,有效增强了异常检测系统对外部干扰的识别能力与鲁棒性,从而在降低误判风险的同时提升了整体检测的准确性与可靠性。
需要指出的是,表中所示的剔除数量为图像模型与异常检测算法共同识别结果的交集,不能直接反映图像模型的全部识别能力。部分被图像模型识别为“有干扰”的图像,其对应数据未被异常检测算法判定为异常,因而未计入本次剔除统计。因此,该剔除率仅表征图像分类模型在异常检测结果覆盖范围内的辅助识别能力。
4. 结论与展望
本文针对非接触式磁记忆检测在复杂环境应用中易受外部干扰影响、数据量大且人工分析效率低等问题,提出了一种融合图像分类模型的多模态辅助分析方法。本方法首先利用孤立森林与局部分析算法对磁信号数据进行初步异常筛选,以提高异常定位效率。随后,结合对同步采集图像的分类识别,成功剔除了部分由外部干扰导致的异常数据。
实验结果表明,在30组检测任务中,磁信号异常检测算法识别出的异常点与预设干扰源在空间位置上的匹配率达到80.7%,对焊缝结构的匹配率为90%。图像分类模型的准确率为94%,将其识别结果与磁信号异常检测结果进行融合分析后,对由外部干扰引起的异常点剔除率提升了48%。实验结果验证了所提方法在异常点空间定位与误报抑制方面的有效性,能够在一定程度上提升磁检测数据分析的准确性与可靠性。
需要指出的是,本文方法的验证主要基于人工构建的实验场景与控制条件下的采集数据,适用范围仍具有一定局限性,所构建模型的泛化能力与实际工况下的鲁棒性尚需进一步评估。未来工作将从以下几个方面展开:一是优化图像分类模型结构,引入注意力机制和多尺度特征提取模块,进一步提升复杂环境下的图像识别能力;二是探索更高效的数据融合策略,实现图像与磁信号在特征层或决策层的深度协同;三是扩大数据集规模,采集更多来自实际工况下的多源样本,以增强模型的泛化能力并加速其在工程场景中的应用推广。
NOTES
*通讯作者。