岭估计在二次曲面高程拟合模型数据处理中的应用
The Application of Ridge Estimation in Data Processing of Quadric Surface Elevation Fitting Model
DOI: 10.12677/AAM.2021.1011434, PDF, HTML, XML, 下载: 320  浏览: 500 
作者: 周 彬:贵州大学矿业学院,贵州 贵阳;贵州水利水电职业技术学院,贵州 贵阳;杜 宁:贵州大学矿业学院,贵州 贵阳;黄 筱, 刘开奋, 王沿儒:中国电建集团贵阳勘测设计研究院有限公司,贵州 贵阳
关键词: 岭估计高程拟合二次曲面模型岭参数选取Ridge Estimation Elevation Fitting Quadric Surface Model Ridge Parameter Selection
摘要: 在测量工作中,由于参数过多、观测结构不合理等各种原因,会导致各参数之间存在近似线性关系,此时经典的最小二乘模型解算结果会失真。本文通过二次曲面高程拟合模型着重讨论岭估计在最小二乘模型失效的情况下解算结果的可靠性,总结岭参数的求解方法,并验证其解算的可靠性。
Abstract: In the measurement work, due to too many parameters, unreasonable observation structure and other reasons, there will be an approximately linear relationship between the parameters. At this time, the solution results of the classical least squares model will be distorted. In this paper, through the elevation fitting quadric surface model, the reliability of the solution result of ridge estimation in the case of the failure of the least square model is discussed, the solution method of ridge parameters is summarized, and the reliability of its solution is verified.
文章引用:周彬, 杜宁, 黄筱, 刘开奋, 王沿儒. 岭估计在二次曲面高程拟合模型数据处理中的应用[J]. 应用数学进展, 2021, 10(11): 4087-4093. https://doi.org/10.12677/AAM.2021.1011434

1. 引言

通过GPS测量可以得到待测点的大地高,如果测区地势平坦、范围较小,可以采用多项式曲面拟合模型来拟合待测点正常高,其中较为常见的为二次曲面模型。但在实际生产中,由于参数的选择、观测条件的限制、结构设计的不合理等会导致参数之间有近似共线性,这使得法方程矩阵 N = B T B 接近奇异,此时我们称法方程为病态方程,为解决法方程病态时的最小二乘估计问题,有许多学者进行过探索,如基于Neumann级数的有偏估计方法、靶向改变法方程矩阵和基于LIU估计的迭代新方法等 [1] [2] [3]。

但是在众多有偏估计之中,岭估计、广义岭估计、主成分估计的影响最大。在岭估计的探索当中,学者对岭参数的选择方法不断创新,使得岭估计在实际应用中硕果累累,尤其是在周跳探测、高频GNSS钟差、GPS数据处理、高程拟合等领域获得了较高的可靠性 [4] [5] [6] [7] [8]。

2. 岭估计

2.1. 岭估计的原理

岭估计(Ridge Estimation)是Hoerl和Kennard与1970年提出来的,是目前最有影响力的有偏估计方法。其模型为:

L = B X + Δ , Δ ~ N ( 0 ~ σ 2 I ) (1)

其对应的解为:

X ^ ( k ) = ( N + k I ) 1 B T P L (2)

式中k为大于零的任意常数,称为岭参数,而 N = B T P B 。可以看出,当k的选择不同,就会得到不同的岭估计,当 k = 0 时,为最小二乘估计。

2.2. 岭估计的性质

为了讨论岭估计的性质,将(1)式改写为以下形式:

L = B X + Δ = A Y + Δ (3)

其中: A = B G Y = G T X G = ( G 1 , G 2 , , G t )

G i ( i = 1 , 2 , , t ) B T B 对应于特征值 λ 1 , λ 2 , , λ t 的标准正交化特征向量,且满足

A T A = ( B G ) T ( B G ) = G T B T B G = Λ = diag ( λ 1 , λ 2 , , λ t ) (4)

式(4)称之为Gauss-Markov模型的典则形式,Y称为典则参数。

则典则参数Y的最小二乘估计和岭估计分别为:

Y ^ LS = ( A T A ) 1 A T L = Λ 1 G T B T L Y ^ ( k ) = ( A T A + k I ) 1 A T L = ( Λ + k I ) 1 G T B T L (5)

2.3. 岭参数的选择

在岭参数的选择上,国内学者进行了相关研究,较为常见的有U曲线法、行列式法和正则化法,还有部分学者将以上方法进行比较,确定最终岭参数 [9] [10] [11] [12]。

引进岭估计的目的是减少均方误差,统计学家己经证明了当 k > 0 时,

MSE ( X ^ ( k ) ) < MSE ( X ^ LS ) (6)

因此在均方误差意义下,岭估计可改进最小二乘估计。对于岭参数k的选择,一直困扰着学者们,由于岭参数的选择在于使均方误差更小,即

MSE ( X ^ ( k ) ) = σ 0 2 i = 1 t λ i ( λ i + k ) 2 + k 2 i = 1 t y i 2 ( λ i + k ) 2 (7)

最小,而Y,X未知,故不能用求极值的方法求取岭参数的值。国内外学者们经过不断探索,提出了许多岭参数的选择和求解的方法,如岭迹法、双h公式法。

1) 岭迹法:

就是以岭估计 X ^ i 的分量 X ^ i ( k ) ( i = 1 , 2 , , t ) 作为岭参数k的函数,将t条岭迹画函数图像,选择使t条岭迹都处于较为稳定状态下的那个k值作为岭参数。

2) 双h公式法:

k = h 1 σ ^ 0 2 X ^ LS T G X ^ LS + h 2 σ ^ 0 2 (8)

当取 G = I h 1 = t h 2 = 0 时,上式就变为了Hoerl-Kennard-Baldwin公式:

k = t σ ^ 0 2 X ^ LS T X ^ LS (9)

2.4. 二次曲面模型

通过GPS测量获得的高程属于大地高,已知大地高和正常高的关系为:

H = H r + ξ (10)

其中:H代表大地高, H r 代表正常高, ξ 代表高程异常。

二次曲面模型可以表示为:

ξ ( x , y ) = A 1 + A 2 x + A 3 y + A 4 x y + A 5 x 2 + A 6 y 2 (11)

由式(10)可知:

ξ ( i ) = H i H r i , i = 1 , 2 , 3 , 4 , 5 , , n (12)

其中: H i 代表第i个点的大地高, H r i 代表第i个点的正常高。

根据式(11)和式(12),可列出误差方程:

V = B A ξ (13)

式(13)中各项矩阵的表达式为:

ξ = [ ξ 1 ξ 2 ξ n ] V = [ V 1 V 2 V n ] A = [ A 1 A 2 A 3 A 4 A 5 A 6 ] B = [ 1 x 1 y 1 x 1 y 1 x 1 2 y 1 2 1 x 2 y 2 x 2 y 2 x 2 2 y 2 2 1 x n y n x n y n x n 2 y n 2 ] (14)

3. 岭估计的算例分析

本算例取自某工程实测数据,已知12个控制点,经GNSS静态观测获得这12个点的大地高,通过四等三角高程测量获得这12个点的正常高。这12个控制点的坐标及高程如表1所示。

取H2、H4、H5、H16、H17、H45、H46和H49共8个点进行模型参数计算点,H15、H18、H19和H21共4个点作为检核点,已知模型参数为6个,则多余观测量为2个。

B T B 的6个特征值为:

λ 1 = 4.8177 × 10 9 , λ 2 = 4.2623 × 10 3 , λ 3 = 1.8878 × 10 9 , λ 4 = 3.1617 × 10 17

λ 5 = 1.3791 × 10 22 , λ 6 = 6.1291 × 10 26

Table 1. Coordinates of known point

表1. 已知点坐标

按照条件数的计算公式可知,条件数为:

p = λ max λ min = 6.1291 × 10 26 4.8177 × 10 9 = 1.2722 × 10 35

由于该算例中条件数远大于1000,可以认为该方程组为病态方程组 [13],具有严重的复共线性。

3.1. 岭估计的解算

本文采用岭迹法和双h公式法对本算例进行解算:

1) 岭迹法

利用Matlab编程计算最小二乘拟合结果和岭估计拟合结果,将岭参数的范围控制在0~2内,步长设置为0.01,得到的岭迹图如图1(a)所示。由岭迹图可以看出,当k仅有极小扰动时,各参数解算结果就基本稳定。为便于观察,将k = 0去除后重新绘制得到岭迹图如图1(b)所示,根据图1(b)可知,在k = 0.2时,各数值已基本稳定,可取k = 0.2。

(a) (b)

Figure 1. Ridge trace

图1. 岭迹图

Table 2. Solution results

表2. 解算结果

2) 双h公式法

G = I h 1 = t h 2 = 0 ,由式(8)可计算出k = 3.0。

现将按照经典最小二乘模型及二种岭估计的k值求解方程组,结果见表2

3.2. 结果分析

根据解算结果可知:

1) 该模型复共线性强,最小二乘拟合结果失真,均方误差很大,计算结果不准确。

2) 该模型岭估计求解时,就均方误差而言,相对最小二乘模型均有很大优化,但岭迹法小于双h公式法解算的结果。

3) 该模型岭估计求解时,就解算精度而言,相对最小二乘模型均有很大优化,但岭迹法优于双h公式法解算的结果。

4. 结论

本文通过岭估计原理和二次曲面模型的阐述、岭估计参数的选择和实例计算,在岭估计的选择和可靠性方面得出如下结论:

第一,在病态方程组中,如果最小二乘拟合结果失真,那么均方误差将很大。采用岭估计方法对病态方程组进行处理后,可减小均方误差,并提高解算结果的可靠性。

第二,由双h公式法的原理可知,其求取的k值比较单一,通过该方法得到的高程残差约为0.06 m,精度较低,难以满足实际生产工作需要。而岭迹法在确定k值时,通过调整参数变化的步长,绘制岭迹图,所对应的解能较好地呈现其总体解的情况,本文通过选取k = 0.2,得到的高程残差绝对值小于0.035 m,可以满足实际生产工作需要,效果比双h公式法好。所以岭迹法相对于双h公式法,可直接选择均方误差较小的值作为岭参数,能够获得较高精度的解。

第三,在采用岭迹法的时候,判断岭迹图何时趋于平稳受人为因素影响,没有统一的标准,所以导致同种方法所产生的结果也可能因人而异。

参考文献

[1] 杨秋伟, 白志超, 李翠红. 基于Neumann级数的有偏估计方法[J]. 大地测量与地球动力学, 2020, 40(5): 512-516.
[2] 王飞, 沈丹, 孙嘉聪. 岭参数K的选择方法[J]. 数学学习与研究, 2020(6): 133.
[3] 黄荣臻, 朱宁, 邓超海, 张茂军. 线性回归模型的一类新约束型LIU估计[J]. 西南师范大学学报(自然科学版), 2019, 44(11): 1-10.
[4] 章繁, 刘长建, 冯绪等. 一种基于拓展岭估计的北斗三频周跳实时处理方法[J]. 武汉大学学报(信息科学版), 2020, 45(1): 62-71.
[5] 吴光明, 鲁铁定. 病态总体最小二乘靶向奇异值修正法[J]. 大地测量与地球动力学, 2019, 39(8): 856-862.
[6] 杭礼辉, 葛俊祥, 张艳艳. 基于奇异值比值的正则化矩阵修正方法[J]. 现代雷达, 2019, 41(4): 54-58+62.
[7] 刘金灵. 一类改进广义岭估计的实例研究[J]. 应用数学进展, 2021, 10(1): 92-97.
[8] 章繁, 刘长建, 冯绪, 李林阳, 王方超. 一种基于拓展岭估计的北斗三频周跳实时处理方法[J]. 武汉: 大学学报(信息科学版), 2020, 45(1): 62-71.
[9] 顾勇为, 归庆明, 韩松辉. 基于信噪比的正则化方法及其在GPS快速定位中的应用[J]. 中国科学: 物理学 力学 天文学, 2010, 40(5): 663-668.
[10] 刘雁雨. 有偏估计理论研究及其在GPS数据处理中的应用[D]: [硕士学位论文]. 郑州: 中国人民解放军信息工程大学, 2005.
[11] 鲁洋为, 王振杰. 用U曲线法确定岭估计中的岭参数[J]. 导航定位学报, 2015, 3(3): 132-134+138.
[12] 罗伟钊. 基于抗病态和抗差的高精度坐标转换解算方法研究[D]: [硕士学位论文]. 长沙: 中南大学, 2014.
[13] 陶本藻. 测量数据处理的统计理论与方法[M]. 北京: 测绘出版社, 2007.