1. 引言
方差在统计应用中常常被理解为风险,估计方差变点的发生能够有效地监测风险的变化,避免不必要的损失。目前关于方差变点模型问题研究已获得一批重要理论成果。例如Gombay (1996)在独立随机误差条件下,构造了方差变点累积和(Cumulative Sum,简记CUSUM)型估计量,并获得变点估计量的极限分布等重要理论结果 [1] ;Inclán和Tiao (1994)在独立正态随机误差条件下,基于迭代的累积平方和(ICSS)算法,提出了关于方差变点的检测步骤 [2] ;Chen和Gupta (1997)利用Schwarz信息准则(SIC)构造方差变点SIC估计量,并获得估计量的极限分布 [3] ;Lee和Park (2001)、Lee (2003)等将Inclán和Tiao的结果扩展到误差由独立随机变量构造的无限移动平均过程 [4] [5] ;Qin (2017)等同样考虑误差由独立随机变量构造的无限移动平均过程,获得方差变点CUSUM型估计量的强收敛性和迭代算法 [6] 。陈璐(2019)建立简单的独立序列模型,构造均值方差变点位置的CUSUM型估计量,研究了独立序列均值方差变点估计问题 [7] 。房炜杰(2020)研究了方差变点的加权累积和估计的一些极限性质 [8] 。朱慧敏(2022)基于混合误差序列,研究方差变点模型CUSUM型估计量的相合性问题 [9] 。
有关测量误差的方差多变点的估计问题研究较少。因此估计测量误差模型中方差多变点的位置是一个重要且具有挑战性的统计问题。
测量误差模型中关于变点的研究,Chang和Huang (1997)应用了似然比方法对测量误差模型中变量Xj的均值是否存在变点进行了检验,并给出了均值变点的极大似然估计 [10] 。王黎明(2002)应用了似然比方法对测量误差回归模型中回归系数是否存在变点进行了检验,并给出了回归系数变点的极大似估计 [11] 。You (2006)对测量误差模型中回归系数的变点进行了研究 [12] 。而关于测量误差模型中方差变点的研究很少,Dong (2013, 2016)分别用特征函数法 [13] 和非参数的U统计量法 [14] 研究了测量误差模型中的方差变点的估计量及其收敛速度。
Horváth和Kokoszka (1997)应用CUSUM方法对单变量序列中的变点进行估计时,在数值模拟过程中发现调节参数对变点估计的精确度有显著影响 [15] 。Fremdt (2013)对单变量序列是否存在变点提出了改进的CUSUM型检验统计量,数据模拟过程发现当调节参数
时变点检验效果更稳健 [16] 。谭常春和江敏(2020)利用蒙特卡洛方法研究了CUSUM型统计量中调节参数对单变量序列均值变点估计效果的影响 [17] 。沙达克提·艾力(2023)对方差变点用特征函数构造了一个含有调节参数的“CUSUM型估计量”,研究了方差变点估计量的弱(强)相合性以及收敛速度 [18] 。本文在Gombay (1994)的基础上构造含有调节参数的CUSUM型估计量,研究方差变点估计量的相合性以及收敛速度。结合“二元分割法”推广至多个方差变点的估计。最后,对2008年1月~2024年1月原油价格的涨跌幅周数据进行实证分析。
2. 模型与主要结果
考虑含有测量误差的方差变点模型:
,假设
是一组含有一个方差变点的测量误差模型,观测值满足,
(1)
其中:
为常数,若
,则未知时刻
称为含测量误差模型中的方差变点。当
时,表明不存在方差变点。
为独立随机误差序列,满足
,
,
,方差变点
的CUSUM型估计量
定义为
(2)
(3)
其中
,且必存在L,使得
。
注:当
时,(3)式为Gombay (1996) CUSUM型估计量。
变点位置
和变点估计量
取值介于1和n之间,为研究
与
之间的准确性问题,将其转化为研究
与
之间的相合性问题。不失一般性,假设存在一个整数
满足
,其中
为x取整符号。则方差变点位置
的CUSUM型估计量
定为
(4)
本节将讨论方差变点CUSUM型估计量
与
的相合性问题。记
,且不是一般性假设
。
定理1 考虑方差变点模型(1),设
是模型(1)的独立的观测值,且该模型中的测量误差
的方差在未知时刻
发生改变,则
(i) 由(4)定义的方差变点的估计量
是
的弱相合估计,且
依概率成立,其中:
。
(ii)
是
的强相合估计,且
a.s。其中:
。
其中:
是满足
的慢变函数,
与
是满足
的非负函数。
引理1 [19] (Hoeffding不等式)假设
,
,
,
,
,则对于
,
,
如果存在着
,使得
,
,那么对任意的
,
特别地,若当
,则
,那么,
定理1(i)的证明:
(5)
由切比雪夫不等式,知
由中心极限定理知:
在(5)式中
和
项相比,
是主项。即:
。
当
时,有:
(6)
当
时,有:
(7)
由(6)式有:
(8)
对于
,有:
(9)
从(6)~(9)式知,当n充分大时,
若令
由拉格朗日中值定理知,
记:
,
。
(10)
由三角不等式,
(11)
结合(10)式,并由
的定义知
,则有
(12)
即
。
结合(1)和(4)式有,
(13)
由于
以及
,所以
因此,
(14)
令
,记
,
,由引理1,我们有,
(15)
同理,
(16)
对于
,由于
,必存在M > 0,使得
,
(17)
同理,
(18)
因此必存在常数C,有,
这意味着
是
的弱相合估计。由式(15)~(18)进一步可得,
(19)
若
时,则有:
依概率成立,其中:
是一个趋于
的慢变函数。
定理1 (ii)的证明:由(19)式知,
若取
,则有
,由Borel-Cantelli引理知
几乎处处收敛到
。且
a.s。成立。
3. 含测量误差的方差多变点的估计
若模型(1)中存在m个变点,且变点个数m已知,则模型(1)转化为
(20)
再结合二元分割法将上述方法推广到多变点的情形,则模型(20)中的方差多变点估计具体步骤如下:
步骤一:对全体数据利用(4)式估计出第一个变点
;
步骤二:变点
将数据分成两个子序列,第一部分为
,第二部分为
,在这两段样本内分别计算
和
;
步骤三:比较
和
的大小,选择两者中较大的那个,并选择较大的所对应的k值,记为
;
步骤四:重复步骤2和步骤3,直到m个变点被估计出来。
4. 调节参数
的取值对应变点位置估计的影响分析
为了研究调节参数
对变点估计量的影响,用Matlb软件进行模拟分析,假设变点真实位置
分别为
,共九种情形,取
,
,
,调节参数
取值(0, 1)上的格子点,步长为0.01;重复模拟次数m = 1000;样本容量n选取为1000。
假设测量误差
,i.i.d~N(0, 1)此处为了方便起见,在给定调节参数
时,记第i次重复的所得到的变点估计量为
,
;取
的均值作为对应调节参数下的变点估计量,并记为
,即
(21)
图1给出了真实变点位置
分别在
时,调节参数
与变点估计量
的关系。
表1给出了真实变点位置
分别在
时,不同调节参数
下得到的变点估计量的均值(mean),标准差(std),众数(mode),中位数(median)。
![](Images/Table_Tmp.jpg)
Table 1. The mean, standard deviation, mode and median of the change point estimator given by (21) when the adjustment parameter γ ∈ ( 0 , 0.9 ) and step size is 0.1
表1. 调节参数
,步长为0.1时,由(21)给定的变点估计量的均值、标准差、众数、中位数
注1:从图1和表1中我们都可以发现,当变点位置靠近端点(
)时,变点估计值与真实值之间有一定的偏差;
注2:当
时,变点估计量与真实值最接近,都优于无调节参数(
)时的情况;
注3:当
,
时的模拟,跟上述模拟效果相差不大,由于篇幅限制,不再列出图表解释了。
5. 实证分析
基于上述模拟结果,选取调节参数
,以2008年1月~2024年1月原油价格的涨跌幅周数据(数据来源于https://cn.investing.com)作为研究对象,结合“二元分割法”并应用含有调节参数的“CUSUM型估计量”对原油价格涨跌幅的方差变点进行估计,样本量
。首先应用(4)式含有调节参数的“CUSUM型估计量”对这832个原油价格涨跌幅数据进行方差变点估计,得到变点的估计值见表2所示,得到的变点估计值都是60,所对应的实际时间是2009年2月28日,出现变点的原因时美国次贷危机出现,宏观经济拉低了原油的需求,导致2008年油价暴跌。OPEC于2008年9、11、12月均宣布减产,这个减产幅度尚不足以抵消过剩,加之刺激经济的政策在短时内还未能显现作用,宏观经济依旧疲软,因此至2009年1~2月,油价延续了这一周期的下行趋势,跌入该周期低位,因此价格出现波动。
![](Images/Table_Tmp.jpg)
Table 2. The first variance change point estimated by CUSUM estimators under different adjustment parameters γ and corresponding actual time
表2. 不同的调节参数
下CUSUM型估计量估计的第一个方差变点的估计值及对应的实际时间
应用“二元分割法”,变点60 (即2009年2月22日)将2008年1月~2024年1月原油价格涨跌幅的832个周数据一分为二,得到2008年1月~2009年2月和2009年3月~2024年1月两个子序列,由于2008年1月~2009年2月的样本量少,不作为研究对象。应用(4)式含有调节参数的“CUSUM型估计量”对2009年3月~2024年1月进行方差变点估计,样本量为771,得到的方差变点估计值见表3所示。对应的实际时间为2020年2月23日,出现变点的原因主要是2020年初,全球疫情的爆发使得原油再度暴跌。
![](Images/Table_Tmp.jpg)
Table 3. The second variance change point estimated by CUSUM estimators under different adjustment parameters γ and corresponding actual time
表3. 不同的调节参数
下CUSUM型估计量估计的第二个方差变点估计值及对应的实际时间
图2给出了2008年1月~2024年1月原油价格的涨跌幅周数据的方差变点(红线所示),这与实际情况相符。
![](//html.hanspub.org/file/37-2623756x222_hanspub.png?20240307092650576)
Figure 2. Variance change point of weekly data on the rise and fall of crude oil prices from January 2008 to January 2024
图2. 2008年1月~2024年1月原油价格涨跌幅周数据的方差变点
6. 结论
本文对含有测量误差的方差变点模型构造了含有调节参数的CUSUM型估计量,并研究了方差变点估计量的相合性和收敛速度,结合“二元分割法”推广至多个方差变点的情况。模拟发现,当
时变点估计量与真实值最接近而且明显优于无调节参数(
)时的情况。并进一步应用含有调节参数的CUSUM型估计量对原油价格涨跌幅的方差变点进行了实证分析,结果表明基于调节参数CUSUM型估计量得到的方差变点与实际相符。
基金项目
新疆维吾尔自治区自然科学基金项目(2023D01A37, 2022D01A219)。
NOTES
*通讯作者。