1. 引言
极光是太阳风所携带的高能带电粒子与地球高空大气层中的中性气体相撞而产生的唯一能够通过肉眼观测到的具有极区特征的地球物理现象。极光的合理分类对研究空间天气和太阳风——磁层之间的耦合作用具有极其重要的意义。
2004年,Syrjäsuo等人 [1] 对加拿大CANOPUS (Canadian Auroral Network for the Open Program Unified Study)项目 [2] 的数据进行分析后,将全天空极光图像分为三种典型的极光形态:弧型(auroral arcs)、斑块型(patchy auroras)和欧米伽型(Omega-bands)。在他们的工作中,首先对极光图像进行分割和极光区域检测,然后使用傅里叶描述子来提取极光图像的形状特征。该类方法由于仅关注极光图像的轮廓结构,适用于形状单一、轮廓明确的极光弧,很难应用于具有复杂结构极光图像的分类问题中。
针对上述问题,随后出现了基于子空间分解的极光图像分类方法 [3] ,该类方法对极光图像应用主分量分析(PCA)、线性判别分析(LDA)进行分解,其分解系数作为极光特征实现分类。与基于轮廓结构的方法相比,子空间分解适合于具有复杂结构极光图像的分类,但是,其特征的表示能力与分类精度有限,达不到实际应用的要求。
一些研究者将图像分析中的纹理识别方法应用到极光分类中,主要关注极光图像中的纹理特征,高凌君等 [4] 首先提取极光样本图像的Gabor特征,利用K-均值聚类算法进行训练样本选择,然后引入AdaBoost算法进行分类器的构建实现极光图像的检测。韩慎苗等 [5] 采用多阶统计特征结合小波分解,通过提取图像的灰度分布、灰度共生矩阵和行程长度矩阵等特征来表征纹理信息,并结合KNN和后向神经网络(BPNN)进行自动分类。该类方法分类精度普遍高于基于子空间分解的极光图像分类方法,但是,对噪声干扰与极光图像的位置、角度及尺度变化较为敏感,分类精度还不能完全满足应用的要求。
在数字图像分析领域,局部不变描述符,如尺度变换不变特征(SIFT)、局部二值模式(LBP)在机器视觉的相关应用领域,如图像区域匹配、目标检测、基于内容的图像检索等表现出很好的性能,为了进一步提升极光分类的分类精度及对噪声干扰的鲁棒性,Wang等 [6] 把局部二值模式(LBP)和分块策略相结合来获得极光图像的特征描述,采用K-近邻分类器(KNN)将极光分为弧状、帷幔状、热斑点状和射线状四种类型,随后,Yang [7] 等对上述LBP极光特征进行了改进,提出一种ULBP算子提取极光图像的局部不变特征空间,并应用隐马尔可夫模型(HMM) 实现极光分类。该类方法获得了较高的分类精度,但对极光位置、方向变化和噪声干扰的鲁棒性仍然达不到应用的要求。而在实际应用中,同类极光在天空中出现的位置会发生变化,其相对于采集设备的角度也会发生变化。另外,由于灯光、星光等或采集设备自身的因素,生成的极光图像会带有一定的噪声。因此,如何提取与表示分类能力强、对极光位置、方向变化和噪声干扰的稳定性好的极光特征仍然是该领域极具挑战性的问题。
本文针对上述问题,提出一种极光全局特征的提取方法,该特征对极光位置、方向的变化具有不变性,而且对噪声干扰具有较高的稳定性。仿真实验表明,本文算法分类精度明显高于现有的基于局部特征的分类方法,对噪声干扰及极光图像位置、方向的鲁棒性显著高于现有方法,而且计算效率较高,可以应用于极光图像的自动分类中。
2. 本文算法
给定极光图像
,首先通过下式对其进行Radon变换,Radon变换可以理解为图像函数
沿包含该函数的平面内的一组直线的线积分有 [8]
(1)
其中,
是单位脉冲函数,
代表坐标原点
到直线的距离,
代表直线与
轴之间的夹角(或直线的法线与轴的夹角)(如图1所示)。
然后,对极光图像
的Radon变换结果
,定义角
对应的每个方向灰度积分的相对变换强度
作为极光特征
(2)
其中,
为
的行数,
为每列的均值,有
![](//html.hanspub.org/file/11-1540745x25_hanspub.png)
Figure 1. Radon transform of a two-dimensional function f(x, y)
图1. 二维函数
的Radon变换
(3)
对计算所得的相对变换强度
序列进行循环移位,使得其最大值位于首位,将该相对变换强度序列作为极光特征,根据Radon变换定义,该特征序列反映了极光图像各方向的积分强度变化情况,极光图像的分类标准也是依据于极光的形状,而这些形状变化会反映到各方向的积分强度变化上,因此,该极光特征可以很好的体现分类标准。另外,由于该特征来源于对极光图像全部象素的积分变换,应属于图像的全局特征。
可以证明,该特征具有如下性质:
1) 具有对极光出现位置变化的平移不变性
如果
表示的极光图像为原极光图像
平移量为
的平移结果,根据(1)式,
的Radon变换
为
(4)
令
,
,有
(5)
令
,有
(6)
其中,
为原图像
对应的Radon变换,可以看出,极光出现位置变化会导致Radon变换结果在
方向的平移,如果极光图像全部在观察域内,
的所有数据都会出现在
,只是位置不同,所以有
(7)
(8)
2) 具有对极光出现方向变化的旋转不变性
如果
表示的极光图像为原极光图像
以中心为轴旋转
度的旋转结果,有
(9)
根据(1)式,
的Radon变换
为,
(10)
令
,
,则
,
,有
(11)
可以看出,图像的旋转只会导致变换结果在
方向的平移,也就是特征值不变,只是序列顺序发生了变化,对
序列进行循环移位,使得其最大值位于首位,可以对其方向进行归一化,实现方向不变。当然,上述结论是基于连续积分推导的,在实际计算中,由于旋转本身会带来图像的重新采样,所以会有一定误差存在。
3) 对高期噪声的鲁棒性较高
假设图像
被均值为0和方差为
的加性噪声
所污染,则有如下关系:
(12)
那么
(13)
根据Radon变换是对图像的线性积分,在连续的情况下,在各点和各个方向上噪声的Radon变换是一个常量,并且该常量等于噪声的均值,也就是0,所以就有:
(14)
这意味着零均值的加性噪声在图像Radon变换以后没有什么影响。考虑到实际情况中,图像是由有限个点组成的,于是有如下关系:
(15)
其中
是图2所示的内截圆半径,
是投影信号的信噪比,
是原始信号的信噪比。从上式可以看出,相对于原图像来说信噪比增加了
,在实际当中
是一个很大的值,如果
的话,则
。由此可见,该算法对加性噪声的鲁棒性较强。
3. 实验结果与分析
本文所用的实验数据是中国北极黄河站极光观测系统采集的全天空极光数据,原始图像大小为
的灰度图像,经过一系列图像预处理(包括暗电流、灰度增强、旋转和噪声)后,用于实验仿真的极光图像为
的灰度图像。本数据库拥有四种类型的极光图像,分别为弧状、帷幔状、射线状和热斑点状。如图3所示。
实验所用的数据集包括2000幅手动标记过的极光图像,每种极光类型有500幅。实验所用计算机配置为:Intel(R) Core(TM)2 Duo CPU,1.99GB内存。实验所运行的软件环境为MatlabR2010a,操作系统为Windows xp。设计了五个实验验证所提出的极光图像的特征提取方法的有效性。实验中每一类极光图
![](//html.hanspub.org/file/11-1540745x77_hanspub.png)
Figure 2. Diagram for calculations in the Radon domain
图2. Radon 变换的示意图
![](//html.hanspub.org/file/11-1540745x81_hanspub.png)
![](//html.hanspub.org/file/11-1540745x80_hanspub.png)
![](//html.hanspub.org/file/11-1540745x79_hanspub.png)
(a) (b) (c) (d)
Figure 3. Typical categories of aurora: (a) arc aurora; (b) drapery aurora; (c) radial aurora; (d) hot-spot aurora
图3. 极光典型类别;(a) 弧状极光;(b) 帷幔状极光;(c) 射线状极光;(d) 热斑点状极光
像取出100张作为训练集,其余400张作为测试集。
3.1. 本文所提方法与传统方法的对比实验
为了有效的避免过学习以及欠学习状态的发生,本实验利用基于m重交叉验证(m-fold Cross Validation)下的最近邻(NN)分类器来评价其分类精度。m重交叉验证具体操作是将原始极光数据均分成m组,将每个子集数据分别做一次验证集,其余的m−1组子集数据作为训练集,这样会得到m个模型,用这m个模型最终的验证集的分类准确率的平均数作为此m重交叉验证下分类器的性能指标。为了探讨训练样本数目对实验结果的影响,实验中m的值从5递增取到15。对于一个给定的m,实验独立重复200/m倍,共进行200次实验以得到一个可信的结果。
本实验用来测试本文所提特征提取方法的分类精度,并且将目前最具代表性的特征提取方法均匀局部二值模式(ULBP)作为对比。实验中ULBP的特征向量长度为59(P = 8,R = 2)。实验结果如图4所示,可以看出Radon变换的基本分类正确率高于ULBP。
3.2. 对极光图像进行平移的对比实验
鉴于极光图像的特殊性,本实验需要对极光图像先进行加黑框操作再做平移,平移后两种方法的正确率如表1所示,从而可得Radon变换的平移不变性更佳。
3.3. 对极光图像进行旋转的对比实验
为了验证本文所提方法的旋转不变性,将数据集中的每一张极光图像都进行1到180度中一个随机角度的旋转,然后对比基于两种特征提取方法下的正确分类率。实验结果如表2所示,从表中可以看出Radon变换的旋转不变性略优于传统方法ULBP。
3.4. 对极光图像进行加噪的对比实验
本实验的设计是为了验证所提方法的抗噪性,用均值为0,方差v从0以0.2的步长增加到1的高斯噪声去感染数据集中的每一幅极光图像,之后进行特征提取及分类实验对比。从图5的实验结果可以得出ULBP在加噪情况下分类正确率急剧下降,而相同情况下Radon变换表现出较好的抗噪性。
3.5. 特征提取的时间复杂度对比
评价一个算法的有效性,除了正确率,效率也是至关重要的一个因素,故而设计本实验来对比两种方法的时间复杂度,表3的实验结果表明本文的方法在时间复杂度上远远低于ULBP方法,几乎减少了近6倍。综合以上实验可以看出,本文的方法在分类精度和分类效率上都有极大的改善。
![](//html.hanspub.org/file/11-1540745x82_hanspub.png)
Figure 4. Basic classification accuracy
图4. 基本分类正确率
![](Images/Table_Tmp.jpg)
Table 1. Classification accuracy of translation
表1. 平移分类正确率
![](Images/Table_Tmp.jpg)
Table 2. Classification accuracy of rotation
表2. 旋转分类正确率
![](Images/Table_Tmp.jpg)
Table 3. Feature extraction time of the two algorithms
表3. 两种算法的特征提取时间
4. 总结
本文提出一种新的、全局的特征提取方法用于极光图像分类,为极光研究领域提供了新的有效工具。为了验证所提方法的可用性,文中设计了五个实验与传统的用于极光图像特征提取的方法均匀局部二值模式进行比较。实验结果表明,本文所提方法在平移、旋转和加噪情况下的分类精度均高于传统方法,同时大大减小了特征提取的时间复杂度。考虑到极光图像的拍摄环境和复杂结构,这种鲁棒性较好的特征提取方法更有利于对极光的进一步研究。
目前为止,极光的分类研究所依据的极光分类机制完全是依靠人的主观判断,通过手工标记极光图像来评估分类精度,这样的分类机制并不一定是对极光最真实的分类。而聚类分析是探索数据的本质特征,从而避免了这一问题,所以在接下来的工作中可以考虑将聚类分析应用到海量极光数据的分析中来。