1. 引言
随着近年来车载状态参数采集设备投入增多,如何在使用过程中,对设备工作状态实时监测,在出现故障时能够快速定位故障设备的所在位置,确保任务进行的连贯性和数据采集的完整性,成为亟需解决的难题。由于车载电子设备的集成化水平较高,故障成因难于判断,定位难度较大,单凭经验和定性分析已经无法满足修理需要。基于此,本文通过深入分析设备工作原理,梳理了设备故障模式与成因并对设备故障程度进行分类,设计并实现了对设备故障诊断及快速定位方法,为后续车载电子设备的故障诊断系统研制提供了方法思路。
2. 设备工作原理
2.1. 系统总体设计思路
车载状态参数采集设备主要用于实现车辆通用参数(包括音频、视频、卫星定位、航向、三轴姿态、振动、速度、加速度、温度、湿度、气压、噪声等参数和武器系统专用总线数据)的实时采集、储存、解析、处理、传输和数据综合信息显示,为实时显示和量化数据评估提供技术支撑,并为维修人员提供维修建议和数据分析基础。
2.2. 设备功能组成
车载状态参数采集设备由主机箱和专用功能模块组成,硬件参考VPX总线架构式设计,主要包括音视频采集处理模块、位置姿态测量模块、环境参数采集模块、专用总线采集模块、振动测量模块、4G数据传输模块、宽幅电源转换模块、低温电池模块、数据交换背板模块等组成。各功能模块板卡通过专用连接器与数据交互传输背板模块连接,背板为各模块统一供电,并提供网络交换平台实现各模块间数据传输,以总线方式向各模块提供精密时间同步信号,实现各采集测量功能。考虑现场有限的使用条件和多样化的数据采集需求,设备按照功能集成、小型便携的设计原则,以灵活组合的方式完成各类被试车辆、各种数据的采集、存储与传输功能。架构采用模块化、通用化、组合化设计,可根据现场情况互换各功能插板,并可进行板级互换,各功能模块可独立工作也可重叠使用。设备组成如图1所示。
![](//html.hanspub.org/file/6-2990289x9_hanspub.png)
Figure 1. Equipment composition block diagram
图1. 设备组成框图
2.3. 设备故障模式与成因
车载状态参数采集设备按故障发生模式一般可分为渐进性故障和突发性故障 [1]。渐进性故障从故障发生的过程来看是一种损耗性故障,车载状态参数采集设备主要用于伴随测试任务,需要与被试车辆一起经历高温、高湿、强腐蚀等外部恶劣环境、滨海、戈壁、沙漠、湿热、高原、极寒等极端恶劣天气以及设备机械震动、电磁辐射、热疲劳等内部因素。设备在这种极端环境的使用过程中导致的故障,其趋势有一定的可预测性。可以采用理论模型法、累计应力分析法等进行预测,也可以通过日常维护保养延长设备使用寿命,减少故障发生次数。
突发性故障从故障发生的过程来看是一种随机性故障,它发生的条件是不可预测的,故障成因是随机的,故障时机是分散的 [2]。车载状态参数采集设备作为高精密电子设备,使用频次高,使用环境复杂多变,在这种相对恶劣的条件下,故障成因主要包括以下几个方面:长期机动运输、野外库存条件恶劣、使用维护不当等;内部成因有线缆故障、制造缺陷、元器件失效等。多年使用记录表明,元器件故障大约占设备故障成因的70%左右,是目前对故障成因影响最大的因素之一。元器件主要故障如表1所示。
![](Images/Table_Tmp.jpg)
Table 1. Function module main fault table
表1. 功能模块主要故障表
3. 专用功能模块编码设计
3.1. 总体设计思路
检测过程中,设备以伴随的形式跟随被测车辆按照既定规程进行动作,同时设备内部采用快速插拔设计,方便用户快速更换。这种通用化、模块化的设计,能够提高设备的复用率、提高维修更换时间,但是也会导致设备各测量模块地理空间上定位困难。例如,当上位机接收到某个功能模块故障报警时,无法准确获取其所在设备的槽位位置,这必将影响一线操作人员更换故障模块的及时性。基于此,本文设计了唯一设备码结合槽位码的方式实现设备功能模块物理定位,在数据交换背板对每个槽位进行硬件编码并设定不同地址,各功能模块插入槽位后读取该编码进行地址设置,便于数据交换通信,同时有效避免人为设置地址的不便和冲突。当发现某个功能模块发生故障时,可以立刻通过上位机接收到槽位码和故障诊断数据的IP地址找到此时该模块的实际位置,进行维修或更换。
3.2. 设备编码设计
数据交换背板设计6个功能槽位,不区分专用功能采集模块和电源/电池模块,各板卡可任意插入。通过对每台设备背板地址和背板上的槽位进行编码,相当于确定了每台设备每个槽位的唯一编号,实现对故障模块的物理定位,如表2所示。
![](Images/Table_Tmp.jpg)
Table 2. Device address and slot address design
表 2. 设备地址和槽位地址设计表
每个背板通过六位二进制码对设备地址进行编码,设备1地址为000001,设备2地址为000010,以此类推。背板用三位ABC来表示槽位编号,通过上拉电阻形式,对槽位进行编码,000表示从左至右第一槽位,001表示第二槽位,以此类推。背板上电后,各模块根据槽位编码,自动识别所在槽位,模块初始化时,对内网网卡进行IP设定,每个IP都包含所在设备和槽位的地址信息。
3.3. 槽位编码设计
考虑模块互换性设计,各专用功能模块能够灵活插于背板任何一个槽位上工作,将所有槽位的引脚采用标准化设计,每个槽位通过3位引脚进行编码,便于模块识别。具体引脚定义如表3所示。
![](Images/Table_Tmp.jpg)
Table 3. Pin diagram of the backplane slot
表 3. 背板槽位引脚表
4. 故障快速定位及检测方法
通过对车载状态参数采集设备使用需求分析和故障分析,通过机内自检测(Built in test, BIT)设计 [3],为系统和设备提供故障检测、定位和隔离的自检测手段,同时,为自动测试设备(Automatic Test Equipment, ATE)预留检测接口。
4.1. 嵌入式测试性设计
根据对功能电路的故障分析,在进行测试性设计时首先在关键功能电路引出测试点,并对具有边界扫描结构的芯片进行菊花链设计;对测试性设计电路则是以不影响功能电路工作为前提,并考虑占用最少的电路板面积,增加了选通开关、嵌入式控制器和EEPPORM3个模块。其中,选通开关用于切换功能逻辑电路运行和嵌入式测试运行;嵌入式控制器是测试性电路的主控模块;EEPPROM用于存放自测试和嵌入式测试结果。测试性设计电路如图2所示。
![](//html.hanspub.org/file/6-2990289x10_hanspub.png)
Figure 2. Embedded testability overall design scheme
图2. 嵌入式测试性总体设计方案
1) CPU功能检查
CPU功能检查主要进行CPU运算能力和CPU周围资源(RAM, FLASH, SSD)的检测。CPU周围资源检测主要通过对RAM、FLASH和SSD等周围资源进行读写测试完成。CPU用标识数据写特定地址,再读取特定地址数据进行比较。
2) 电源电路测试性设计
专用功能模块电源除了为模块本身供电外,同时为嵌入式控制模块供电。为了保证在功能电路发生电源故障的时候,嵌入式控制电路的电源不受其影响,对电源电路进行冗余设计,功能电路电源与测试控制电路的电源各自独立。
功能电路采用电压求和BIT的方法实现快速故障检测,对各路电源电压衰减后求和,将求和信号与允许电压范围进行比较,如果比较通过则认为电源情况正常,如果比较结果超过允许范围,则认为电源出现异常。在电路板上电工作后,首先进行电源检测,若该项测试不通过,直接给出报警信号,无需进行其他测试项。
3) IO通道测试性设计
IO通道测试采用环绕BIT设计,即CPU发送数据至通道1,然后经由通道2将该数据回读,进行比较。如果数据一致,说明CPU至IO连接器没有故障。
4) CAN通信通道测试性设计
专用总线采集模块2路CAN接口,本身采用了冗余设计,在测试性设计时设计成环绕BIT,即以CAN1发送数据,CAN2接收数据的方式测试CAN通信通道故障。
5) 接口功能激励测试设计
激励测试主要针对离散量输入信号,正常工作模式时,A点与C点连接,输入信号经比较器与基准信号比较后产生高低电平进CPU采集,BIT模式时,B点与A点连接,激励信号经比较器与基准信号比较后产生高低电平进CPU采集。原理图如图3所示。
4.2. 功能模块故障定位设计
背板通过设计六个上拉式电阻实现对每台设备的地址编码,通过改变电阻的通断情况实现每条电路上的0或1的编码,电路原理图如图4所示。
每块背板上留有8各槽位,其中2个为网络地址交换机,其余6个为各测量模块槽位。在每个槽位上通过焊接三个定值电阻的方式实现3位二进制数编码,电路原理图如图5所示。
![](//html.hanspub.org/file/6-2990289x13_hanspub.png)
Figure 5. Schematic diagram of fixed resistance
图5. 定值电阻原理图
通过上述方式可以实现每台设备每个槽位地址的精确定位。例如某音视频采集模块插入设备地址编码为000001、槽位地址编码为001的背板槽位中,该模块自动读取当前编码进行地址设置,由于编码具有唯一性,故该模块的地址也具有唯一性。用户通过上位机软件读取当前测量模块地址即可知道该模块所在的设备位置和槽位位置,从而实现测量模块的定位。
4.3. 故障诊断树设计
为方便用户掌握各测量模块故障情况,及时确定故障类型,设计了一种基于故障逻辑树的快速诊断方法 [4]。故障诊断树逻辑图如图6所示。
![](//html.hanspub.org/file/6-2990289x14_hanspub.png)
Figure 6. Fault diagnosis logic tree diagram
图6. 故障诊断树逻辑图
以惯性导航模块为例,长方形代表状态监测点,里面包括监测点名称和实时数值。长方形监测点之上圆角方形为监测点数据监测条件,各个监测点之间使用“与”“或”逻辑进行判断。多边形为故障诊断结果,包括故障名称和维修建议,同时针对各个诊断结果,上位机软件将详细信息展示,用户可通过这些信息进行针对性维修。
5. 软件设计及实现
5.1. 工作流程
系统启动后加载配置数据,进入登录页面,登录验证通过后,获取用户权限进入主界面,各个功能模块按照业务要求处理各自的业务,处理完成后输出业务数据。工作流程图如图7所示。
上位机程序发送状态读取指令分别到位置姿态测量模块、环参/振动/专用总线采集模块、4G数据传输模块和主测量模块,各个模块接到指令后,按照状态数据获取规则读取各组成部分的状态数值,打包为标准网络协议数据包发送到上位机程序进行显示。上位机程序发送设置指令到各个模块,指令包括IP设置、存储空间告警阈值等,各个模块接到指令后,按照指令类型设置相应参数。上位机程序发送故障诊断指令到各个模块,各个模块接到指令后,按照故障诊断获取规则读取各组成部分的故障情况,打包为标准网络协议数据包发送到上位机程序进行显示。
5.2. 实现结果与分析
以音视频采集模块为例,主页面展示局域网中在线板卡的概要信息,包括模块名称①、编号②、IP地址③、心跳计数④、板卡端数据管理服务状态(及FTP服务是否连接)⑤、参数设置服务连接状态⑥、状态监测服务连接状态⑦、音视频查看选项⑧和状态监测项的数值列表⑨。软件界面如图8所示。
故障诊断界面如图9所示。在故障诊断树中,用户通过点击故障点查看系统给出的维修建议,详细内容显示在界面右上角。
![](//html.hanspub.org/file/6-2990289x16_hanspub.png)
Figure 8. Measurement module software interface diagram
图 8. 测量模块软件界面图
![](//html.hanspub.org/file/6-2990289x17_hanspub.png)
Figure 9. Fault diagnosis tree interface diagram
图9. 故障诊断树界面图
通过在上位机软件中的故障诊断,在确定了故障内容的解决方法后,用户即可通过测量模板卡IP地址回溯找到该板卡当前所在设备号和槽位号,进行维修或者更换。
6. 结束语
本文针对大规模车辆维修中使用地域广、设备数量多的问题,提出了一种对包含多个功能模块的车载状态参数采集设备的故障监测和快速定位方法。利用各功能模块槽位背板进行编码,实现各功能模块的物理地址定位。设计了故障诊断逻辑树,用户通过上位机软件快速找到故障原因,然后通过对测量模块的IP地址回溯定位到故障模块位置,针对性进行处理 [5]。实际使用表明,该方法有效地缩短了在任务进行中维修车载状态参数采集设备的时间,确保了数据采集的完整性,而且有助于技术人员加深对设备工作原理的理解,具有明显的经济效益 [6],同时为之后的数据采集设备的研制提供了有益思路。