1. 引言
机载激光扫描系统是近些年来发展起来的一种新型主动式探测技术,该技术能够在较短的时间内大量道路及道路两侧大量点云数据[1] [2]。智慧化、数字化城市建设的关键基础信息包括道路三维场景信息,对于无人驾驶、道路养护、城市规划等具有重要意义。作为道路场景信息中的关键要素,杆状物根据功能的不同可划分为行道树、路灯、指示牌、线杆等,当前,道路场景中的杆状物信息主要通过GNSS-RTK、全站仪等传统测量技术获取,存在成本高、作业效率低、三维信息不全等缺陷。随着机载激光扫描技术的发展,应用该技术进行道路场景中三维信息获取成为了可能,并且逐渐取代传统道路测量技术。然而,如何从海量道路场景点云数据中自动化识别与区分不同种类的杆状物仍然是一个研究难点,学者们针对杆状物的分类提取也进行了一系列研究,并取得了积极的成果,如邹晓亮等[3]通过点云投影面积进行线杆提取,该方法简单,效果不错,但是受扫描距离、格网限制较大;Yan L等[4]使用形状与先验信息的滤波器检测非地面点,提取杆状物;也有学者[5]从杆状物强度信息与几何信息出发,对指示牌进行了分类,但是该方法过度依赖强度信息,普适性不高;Guan H等[6]将数字图像的方法引入杆状物分类这种中,但是精度损失较大;Li D等[7]利用反射强度、形状、大小等特征进行杆状物分类,但是该方法受不同形状的干扰较大。根据现有研究现状可知,针对杆状物的研究较多且提取效果较好,但是针对不同杆状物的空间形态分析与分类的研究很少,基于此,本文在现有研究基础上,通过提取杆状物多种特征并构建杆状物特征向量集,构建基于支持向量机(support vector machine, SVM)的杆状物分类模型,从而实现道路场景中杆状物分类识别。
2. 点云预处理
机载激光扫描的对象为道路场景中所有地形、地物要素,采集激光点云中包含大量地面点,本文研究目标为非地面点,因此以杆状物的非地面点为兴趣目标,为提升后续杆状物的提取效率,首先将地面点移除。移除地面点的滤波方法主要有基于分割、基于表面、基于形态学以及基于斜率的滤波。由于本文的研究重点为不同杆状物的相互分离与提取,因此无需对地面点进行精细滤波。本文去除地面点首先可以设置局部范围内的最低点为地面点;其次划分所有激光点为若干个二维格网,将格网内最低点视为地面点,判定其余点与最低点高差;最后根据高差大小判定地面点与非地面点,删除地面点,保留非地面点。
3. 杆状地物特征向量
机载激光点云数据主要包含以下几类信息,一是强度信息(I),二是颜色信息(R、G、B),三是GPS时间(T),四是坐标信息(X、Y、Z)。通过单个激光点体现出杆状物信息,因此要对杆状物对象的所有组成激光点进行聚类,根据聚类单元特征值建立特征向量F,本文将根据聚类单元点云数、最小包围盒体积、拟合平面总残差与均方根误差、方向特征向量、不同平面投影密度建立特征向量。
不同聚类单元在点云数上与最小包围盒体积上存在差异,因此可将聚类单元数n与最小包围盒体积v作为聚类单元特征值。
不同杆状物的形态特征差别较大,使用最小二乘法对杆状物点一定范围内点进行表面拟合,满足点与拟合平面垂直距离最小,平面拟合的参数方程为:
(1)
式中,x、y、z为变量;A、B、C为参数。
将点与拟合平面的距离作为残差,表示为:
(2)
式中,i为残差。
总残差与残差均方根误差表示为:
(3)
式中,为总残差;为残差均方根误差;n为点数。
采用主成分分析算法对杆状物点云X、Y、Z矩阵进行奇异值分解,提取方向特征值a1、a2、a3,为解决不同地物方向特征值量纲不同,对特征值归一化处理:
(4)
式中,m1、m2、m3为处理后特征向量。
杆状物不同投影面面积较大,因此对投影面进行格网化处理,格网尺寸为0.2 m × 0.2 m,3个方向的投影密度Dm1、Dm2、Dm3可使用聚类单元点数量与投影面积比值确定。
综合前文所述,可根据10个特征值构成特征向量F,
。
4. SVM分类
4.1. SVM分类模型
SVM分类模型是基于统计学理论发展而来,是鲁棒性最好的一种导式机器学习分类算法。SVM分类模型通常用于线性可分样本集与非线性可分样本集的分类,对于线性可分样本集,SVM通过构建一个平面,在保证平面至样本集集合边界距离最大的前提下实现两类地物分割,该平面也称为超平面。对于线性不可分样本集,将样本从低维空间转至高维空间,并进行两类地物分割。
线性可分样本集
,超平面、支持向量距离为
,判决函数为:
(5)
式中,yi( )为判决函数;wi为分类面权重系数;b为位移项,决定了超平面与原点的距离。
SVM处理线性样本集的情况要比非线性可分问题更多,引入惩罚因子C与非负松弛变量对非线性可分问题中的超平面进行优化:
(6)
(7)
为了能够将低维度样本集向高维度空间映射,引入核函数K,同时能够降低内积计算复杂度,结果表示为:
(8)
式中,(xi)为映射函数。
根据式(7),得到判决函数:
(9)
式中,
为样本集拉格朗日乘子,w*是
为最优解时的最优分类面权重系数,采用k折交叉验证方法确定最优惩罚系数C与核函数参数g。
4.2. 杆状物分类
仅依靠机载原始点云无法进行SVM模型分类,为提升分类模型的运算效率,同时为提升分类准确性,首先对原始机载激光扫描点云数据进行预处理,包括点云分段、地面点移除。将所有激光点划分为若干个二维格网,确定格网内最低点为地面点,判定格网内剩余点与最低点高差,设置高差阈值,将满足阈值条件的点判定为地面点,实现地面点与非地面点分类。在非地面点的基础上,根据聚类单元点云数、最小包围盒体积、拟合平面总残差与均方根误差、方向特征向量、不同平面投影密度建立特征向量。使用特征向量进行SVM模型训练并建立分类模型,最后,使用训练好的最优SVM模型进行杆状物分类。本文仅设计杆状物的分类,采用提取杆状物作为样本,统一存放相同样本,本文杆状物提取具体工作流程如图1所示。
1) 对机载原始点云进行预处理,移除大量地面点,为后续杆状物分类提供基础;
2) 不同杆状物点具有不同的形态特征,确定能够将杆状物进行区分你的特征值;
3) 根据聚类单元特征值建立特征向量;
4) 赋予不同杆状物特有标签(行道树——1,路灯——2,指示牌——3,线杆——4);
5) 杆状物样本集与测试集制作,样本集数量对分类结果产生重要影响;
6)为消除不同特征值间的量纲差异性,对不同特征值进行标准化处理;
7) 交叉验证样本集,以获取最优惩罚系数C与核函数参数g;
8) 创建SVM模型,分析模型的分解结果,配置不同特征值组合与样本集数量进行试验对比。
Figure 1. Technical route for extracting rod-shaped substances in this article
图1. 本文杆状物提取技术路线
5. 试验分析
5.1. 试验区选取
选取某段城市道路作为实验区,该段道路长度约为0.95 km,实验区采用中海达ARS-1000L激光测量系统采集点云数据作为测试集,相邻扫描线间隔为0.02 m,点云数据采集时间为2023年6月2日。测试集中共有403个杆状物,包括行道树、路灯、指示牌、线杆,其中行道树253个,路灯68个,指示牌46个,线杆36个,如图2所示,测试集概况如表1所示。使用已有数据集作为样本集,已有数据集中杆状物共有1000个,作为样本训练集。
Figure 2. Experimental area point cloud
图2. 试验区点云
Table 1. Overview of experimental area data
表1. 试验区数据概况
参数类别 |
参数 |
激光系统 |
中海达ARS-1000L |
数据采集时间 |
2023-06-02 |
续表
脉冲频率/kHz |
200 |
采集往返数 |
Double |
全长/km |
5.3 |
5.2. 参数寻优与精度对比
在Matlab2012a环境下,采用libSVM库函数实现SVM分类模型,分类核函数为径向基函数,将特征值构建特征矩阵F作为模型输入进行模型训练。采用5对折交叉验证得到最优C值与g值分别为19.235、5.196,使用训练好的SVM分类模型判别测试集,设置不同训练轮数,分类精度与耗时统计结果如表2所示。
Table 2. Classification accuracy for different training rounds
表2. 不同训练轮数的分类精度
训练轮数 |
行道树 |
路灯 |
指示牌 |
线杆 |
分类耗时/s |
整体分类精度/% |
500 |
95.34 |
89.32 |
64.46 |
98.22 |
25 |
91.77 |
1000 |
95.83 |
87.67 |
66.82 |
97.93 |
43 |
93.09 |
1500 |
96.33 |
87.01 |
68.56 |
98.00 |
64 |
93.13 |
2000 |
96.43 |
87.67 |
73.49 |
98.08 |
87 |
93.99 |
3000 |
96.43 |
87.34 |
80.04 |
98.08 |
136 |
94.19 |
5000 |
96.43 |
87.68 |
84.86 |
98.15 |
219 |
94.23 |
通过表2可知,4种杆状物分类结果中,路灯与指示牌的分类精度更低,主要原因在于试验区内路灯与指示牌的种类更多,同类杆状物在形态上具有多种差异性,如指示牌种类中有禁令指示牌、警告指示牌以及指路牌等,这种差异性直接导致了分类难度的增加。行道树与线杆的形态较为单一,其中行道树主要为树冠与树干组成,树冠呈近似圆的分布形态,树干呈具有一定胸径范围的竖直杆状,线杆主要呈笔直杆状,因此,针对这两类杆状物,分类模型的效果较好,当训练轮数为5000时,行道树与线杆的分类精度分别能够达到96.43%、98.15%。
Figure 3. Classification effect of rod shaped objects
图3. 杆状物分类效果
杆状物整体分类效果如图3所示,局部特征放大结果如图4所示,分类模型能够将大部分杆状物正确分类,但是同时存在少量错误分类,如实际地物为指示牌,但将其错误分类为路灯;实际地物为指示牌,将其错误分类为线杆;实际地物为路灯,将灯头部分错误分类为指示牌,将灯杆部分错误分类为线杆;地物的行道树少量树冠错误分类为指示牌;部分地物存在点云缺失,因此造成分类错误。
(a) (b)
(c) (d)
Figure 4. Partial enlarged view of classification results
图4. 分类结果局部放大图
SVM模型杆状物分类试验中,设置不同的特征值组合与样本集数量,统计不同特征值组合的分类精度,结果如表3所示。
Table 3. Classification accuracy/% under different condition configurations
表3. 不同条件配置下的分类精度/%
组合 |
特征值组合 |
样本集数量 |
500 |
700 |
1000 |
1 |
,,m1,m2,m3 |
83.90 |
89.02 |
90.97 |
2 |
,,d1,d2,d3 |
85.81 |
90.81 |
91.78 |
3 |
v,m1,m2,m3,d1,d2,d3 |
77.67 |
91.77 |
92.97 |
4 |
n,m1,m2,m3,d1,d2,d3 |
75.70 |
90.21 |
92.11 |
5 |
n,v,,,m1,m2,m3,d1,d2,d3 |
91.77 |
92.14 |
93.09 |
共设置5种不同的特征值组合,样本集数量分别为500、700、1000,通过表3可知,在样本集数量一定时,随着特征值的增加,分类精度不会产生明显变化。随着样本集数量的增加,分类精度有较大幅度提升,表明分类精度受样本集数量的影响要多于特征值。通过组合1、2可知,不同平面投影密度特征较点云特征向量对杆状物分类精度的提升作用更为明显,通过组合3、4可知,最小包围盒体积特征较点云总数特征对杆状物分类精度的提升作用更为明显,对比5个组合得到,若要构建优越的SVM分类模型,不仅要有足够的杆状物特征,同时样本集数量也尤为重要。
6. 结束语
本文以机载激光扫描点云数据为研究对象,通过分析道路两侧杆状物的空间特征与几何特征,获取9种特征并构建准确的SVM分类模型对行道树、路灯、指示牌、线杆进行分类,试验结果显示,本文构建的最优SVM分类模型的杆状物整体分类精度最高能够达到94.23%。然而,本文分类模型仍然存在部分不足,一方面表现在对地物的完整性较高,地物不完整时易造成错分、漏分;一方面表现在当样本集的种类、数量不足时,会产生特征相似杆状物错误分类的情况;最后一方面表现在对杆状物的孤立性要求较高,无法有效准确识别分类出组合地物。实际应用中,仍然存在将一些非杆状物识别为杆状物的现象,例如将少量粗细均匀的树桩错误提取为杆状物。因此,下一步的研究重点将放在样本集完善、克服点云缺失以及组合杆状物的分割问题上。