1. 引言
非参数回归模型被广泛地应用到诸如生物学、化学和经济学等学科领域中。其一般形式往往写成
, (1)
其中m是回归函数,误差
满足
,
,x是解释变量,总假设对应不同观测值的误差是独立同分布的。
对于误差的分布,若有附加的信息能改善统计分析的有效性。例如,在正态误差的假定下,精确或最优的检验在很多情形下可以得到。一个典型的例子是误差分布在正态分布的假设下,考虑回归函数m的拟合优度检验问题(见文献 [1] [2] [3])。因此,误差分布的正态性检验,即检验(2)是重要的。近期的有Jurečková, Picek & Sen (2003) [4],Sen, Jurečková & Picek (2003) [5],这两篇文章是基于Shapiro & Wilk (1965) [6] 检验统计量的思想用残差构造检验。Jurečková, Picek (2007) [7] 进一步利用Shapiro & Wilk (1965) [6] 检验统计量的思想,通过标准化的残差构造了检验统计量。而Natalie & Holger (2006) [8] 利用最小二乘残差的经验过程,以Kolmogorov-Smirnov (KS)检验统计量为基础,结合Bootstrap方法研究了误差分布的拟合优度检验。Marie & Simos G (2007) [9] 用最小二乘残差构造经验特征函数,以L2-型距离研究了误差分布的拟合优度检验。Christensen & Sun (2010) [10],Christensen & Lin (2015) [11] 和Hattab & Christensen (2018) [12] 利用残差的部分和构造检验统计量。
本文要研究的问题是
. (2)
关于检验(2)涉及到两个重要的量,一是样本;二是检验统计量。上述文献中,都是利用模型的最小二乘残差(OLS)来构造检验,这是一类重要的方法。但是存在着如下问题,即在正态原假设下,易知OLS残差向量有奇异的正态分布,并且向量的分量之间不再是独立同分布的。显然,用OLS残差来构造检验,特别是利用残差作为新的样本,用已有的如Shapiro-Wilk检验来构造检验时略显得不自然,因为像Shapiro-Wilk等检验原来构造的基础是来自于同一个分布的独立样本。其次,利用的检验统计量大多是基于EDF的检验统计量,具体见下节。
为解决第一个问题,Theil [13] 提出了一种最优线性无偏尺度残差(BLUS),证明了在正态原假设下,BLUS残差向量不同于OLS残差,有非奇异的正态分布,并且向量的分量之间是独立同分布的。
关于检验统计量,Zhao (2009) [14] 利用样本分位点和来自于原假设分布的随机样本分位点的距离构造了一种新的检验,在简单假设和复合假设下,模拟结果显示,构造的检验统计量有较好的检验功效。
鉴于上面的分析,下面以Zhao (2009, 2014) [14] [15] 的检验统计量为基础,以BLUS残差作为新样本,构造非线性模型误差分布的拟合优度检验统计量。
2. BLUS残差
对于线性模型(3),
, (3)
回归系数的最小二乘估计为
,用e表示与误差向量ε有关的OLS残差,则有
. (4)
由此可得,
,
。
按照Theil (1968) [13],BLUS残差是由下面步骤得到的:
首先,选择矩阵M的主对角元素中最小的k个元素,按照这k个元素所在行的位置重新排列观测值y,不妨将它们放在开始的前k个位置(Ramsey (1969) [16])。这样便将原模型分块得到
, (5)
, (6)
其中(6)式中左上角的I是k × k单位矩阵,右下角的I是
单位矩阵。
其次,计算矩阵
的特征根
和相应的特征向量
。
最后,计算BLUS残差
,这里的
是对应(5)式中的误差项的分块残差向量。
此时在原假设(2)下,BLUS残差向量
。下一节的检验都是以此为新的样本来构造检验的。记
为BLUS残差的次序统计量,
,F0(x)是标准正态分布。
3. 检验统计量
选择的检验统计量基于经验分布函数的有KS统计量
, (7)
和AD统计量
, (8)
其中
,考虑到原假设的均值为0,误差方差的参数估计选择
。
基于样本次序统计量或样本分位点的检验统计量有 Shapiro & Wilk检验统计量
, (9)
其中
,
,
是来自
的样本次序统计量。
基于de Wet and Venter [17] 思想构造的统计量
, (10)
其中
,
是标准误差方差的估计。
del Barrio, Couesta-Albertos, Matrán, Rodríguez-Rodríguez (1999) [18] 提出的基于L2-Wasserstein距离构造的统计量
, (11)
Zhao (2009) [14] 模拟结果显示,以样本随机距离方法构造的检验,两种不同的参数估计方法得到的检验,其功效相差不大,故而此处仅选择基于最小距离的参数估计方法构造的检验作为研究的新检验。即选择检验统计量为:
, (12)
其中
是来自于标准正态分布的容量为m的样本所对应的次序统计量。
是尺度不变的。同样的理由,可以取
的q分位点和期望作为检验统计量。这里我们仅选取q = 0.05, q = 0.50, q = 0.95作为分位点统计量
。利用BLUS残差求解各个检验统计量的临界值算法详见Zhao (2014) [15] 中的算法,此处略去。
4. 数值模拟
假设回归函数足够的光滑,则总可以在某个点x0处将未知的回归函数展开成泰勒级数。选择上节给出的检验统计量构造检验,检验水平为5%。根据假设,回归函数可以在某个点x0处展开成
,
其中rk是余项。本节的x0 = 0.2,k取1,4。考虑的非线性模型为
, (13)
, (14)
, (15)
Xi与
相互独立,并来自于均匀分布,对给定的样本容量,这些值为常数。误差变量ε按照下述设定的备择分布抽取。
当k = 1时,取备择分布
第一组:误差服从非正态分布,有自由度为3的卡方分布χ2 (3),形状参数为1.5的Gamma分布函数Gamma(1.5),双指数分布Laplace(0, 1),Cauchy(0, 1)。
第二组:异方差,此时考虑的模型是
, (16)
, (17)
, (18)
这里的
服从均匀分布U(0, 50),
。同时,误差变量ε分别服从Logistic(0, 1),Cauchy(0, 1),N(0, 1)和Laplace(0, 1)。
当k = 4 时,取备择分布
上述第一组和下面的第三组:回归误差具有非零均值的离群点,有
,
和高杠杆离群点,即
,
.
在这一小节中,样本容量取n = 20, 50,经验的检验功效是10,000次模拟得到的。模拟结果分别放在表1~4中。
当k = 1时,如表1,表2所示:
![](Images/Table_Tmp.jpg)
Table 1. The level is 5%, the sample size is 20, three models, the regression function is approximated by first order polynomial, the error distribution is normal distribution
表1. 水平为5%,样本容量为20,三个模型,回归函数一阶多项式近似,误差分布为正态分布假设下的检验功效
a误差ε,F1(x):ε服从Cauchy分布;F2(x):ε服从Laplace分布;F3(x):ε服从Logistic分布,F4(x):ε服从标准正态分布;σ~U(0, 50)。
bG(1.5):形状参数为1.5的Gamma分布。
![](Images/Table_Tmp.jpg)
Table 2. The level is 5%, the sample size is 50, three models, the regression function is approximated by first order polynomial, the error distribution is normal distribution
表2. 水平为5%,样本容量为50,三个模型,回归函数一阶多项式近似,误差分布为正态分布假设下的检验功效
a误差
,F1(x):
服从Cauchy分布;F2(x):
服从Laplace分布;F3(x):
服从Logistic分布;F4(x):
服从标准正态分布;σ~U(0, 50)。
bG(1.5):形状参数为1.5的Gamma分布。
1) 对于这三个非线性模型,当备择分布是非正态分布函数时,
的检验功效显著地比其它的检验高;
与T2在容量为20时,两者的检验功效相差不大,但在容量为50时,对非对称备择分布,BCMR,T2,W和
相差不大,对于对称备择分布,T2最好,次之为
。总之在新检验的对手中,T2最好,次之为BCMR,Shapiro-Wilk检验好于另外两个经典统计量。
2) 对于备择分布为N(0, 1),此时的检验功效即为第一类错误的概率,从表1,表2中可知,在不同的非线性模型中,所有的检验在不同的样本容量下,基本充分的利用了5%的检验水平。
3) 对第二组的备择分布,即异方差的情形,
的检验功效显著地比其它的检验高,其它的结果类似于(1)中的结果。
当k = 4时,从表3,表4中不难发现模拟结果有所变化,具体是:
![](Images/Table_Tmp.jpg)
Table 3. The level is 5%, the sample size is 20, three models, the regression function is approximated by fourth-order polynomial, the error distribution is normal distribution
表3. 水平为5%,样本容量为20,三个模型,回归函数四阶多项式近似,误差分布为正态分布假设下的检验功效
aG(1.5):形状参数为1.5的Gamma分布。
bF1(x):εi~N(8, 1), i = 1, 2, 3且x11 = x12 = x13 = x14 = 2;F2(x):εi~N(8, 1), i = 1, …, 5且x11 = x12 = x13 = x14 = 2;F3(x):εi~N(8, 1), i = 1, 2, 3且εj~N(0, 1), i = 4, …, n;F4(x):εi~N(8, 1), i = 1, …, 5且εj~N(0, 1), i = 6, …, n。
![](Images/Table_Tmp.jpg)
Table 4. The level is 5% , the sample size is 50, three models, the regression function is approximated by fourth-order polynomial, the error distribution is normal distribution
表4. 水平为5%,样本容量为50,三个模型,回归函数四阶多项式近似,误差分布为正态分布假设下的检验功效
aG(1.5):形状参数为1.5的Gamma分布。
bF1(x):εi~N(8, 1), i = 1, 2, 3且x11 = x12 = x13 = x14 =2;F2(x):εi~N(8, 1), i = 1, …, 5且x11 = x12 = x13 = x14 =2;F3(x):εi~N(8, 1), i = 1, 2, 3且εj~N(0, 1), i = 4, …, n;F4(x):εi~N(8, 1), i = 1, …, 5且εj~N(0, 1), i = 6, …, n。
4) 对于模型(13, 14, 15),当样本容量为20时,对于非正态备择分布,
的检验功效显著地比其它的检验高;
与T2在容量为20时,两者的检验功效相差不大,但在容量为50时,对非对称备择分布,BCMR,T2,W和
相差不大,但对于对称备择分布,T2最好,次之为
。总之在新检验的对手中,T2最好,次之为BCMR,Shapiro-Wilk检验好于另外两个经典统计量。
5) 对于备择分布为N(0, 1),结果类似于(2)。
6) 对第三组中的备择分布
且
,在样本容量为 20 时,新的检验中
表现最好,但与
,
相差不大。与比较的检验相比,差别也不大,其中BCMR和W稍好。而
表现差一些。但在样本容量为50时,除了模型(13)中,
的检验功效最好外,其它两个模型的检验的功效规律不变,但模型(13, 15)的所有检验的功效在减少。备择分布为
且
时,结果类似。对于另外两种备择,各个检验在样本容量不同时,检验功效变化比较大。这说明在有离群点的备择分布下,如果回归函数展开的项数越多,检验的规律越不清楚。
7) 比较同一个模型下,备择分布为非正态分布时,各个检验的功效都随着回归函数展开的项数增加而减少。这说明回归函数估计的精度影响到了检验的功效,但各个检验的功效的大小关系没有因为回归函数展开的项数变化而变化。
5. 结束语
基于BLUS残差,利用残差顺序统计量和伪随机样本顺序统计量之间的差异,构造了分位数类型统计量和条件期望类型检验统计量,用于检验非线性模型的误差分布正态性。仿真结果表明,本文提供的检验方法有较好的检验功效。当然,如何在众多的检验中选择出更优的检验,分位点类型检验有没有恰当的选择标准?对于非线性模型中误差分布的拟合优度检验问题,回归函数的局部多项式展开项数有无合适的判断准则?都是值得进一步研究的问题。
致谢
作者非常感谢相关文献对本文的启发以及审稿专家提出的宝贵意见。