含测量误差的方差模型的多变点的估计

doi:10.12677/AAM.2024.132083

期刊菜单

含测量误差的方差模型的多变点的估计
Estimation of Variable Points of Variance Model with Measurement Error

DOI: 10.12677/AAM.2024.132083, PDF, HTML, XML, 科研立项经费支持
作者: 沙达克提·艾力：新疆师范大学数学科学学院，新疆乌鲁木齐
关键词: 测量误差；方差变点；调节参数；相合性；二元分割法；Measurement Error； Variance Change Point； Adjustment Parameters； Consistency； Binary Segmentation Method

摘要: 本文讨论当已知含测量误差的方差模型存在变点时，对方差变点给出了一个含有调节参数的“CUSUM型估计量”，研究了方差变点统计量的弱(强)相合性，得到收敛速度。结合“二元分割法”将其推广至多个方差变点的估计。模拟研究发现含调节参数γ∈(0.3,0.7)的CUSUM型估计量的精确度要优于无调节参数(γ=0)的CUSUM型估计量的精确度。进一步，对原油价格涨跌幅进行实证分析验证了本文方法的有效性和可行性。

Abstract: This article discusses when it is known that variance models with measurement errors have change points, a “CUSUM-type estimator” with adjustment parameters is given for the variance change point. The weak (strong) consistency of variance change point estimator is studied, and the conver-gence rate is obtained. It is extended to the estimation of multiple variance change points by using binary segmentation method. The simulation results show that the accuracy of CUSUM type estima-tor with adjustment parameter γ∈(0.3,0.7) is better than that of CUSUM type estimator without adjustment parameter γ=0 . Furthermore, the validity and feasibility of this method are verified by an empirical analysis of the rise and fall of crude oil prices.

文章引用：沙达克提·艾力. 含测量误差的方差模型的多变点的估计[J]. 应用数学进展, 2024, 13(2): 877-890. https://doi.org/10.12677/AAM.2024.132083

1. 引言

方差在统计应用中常常被理解为风险，估计方差变点的发生能够有效地监测风险的变化，避免不必要的损失。目前关于方差变点模型问题研究已获得一批重要理论成果。例如Gombay (1996)在独立随机误差条件下，构造了方差变点累积和(Cumulative Sum，简记CUSUM)型估计量，并获得变点估计量的极限分布等重要理论结果 [1] ；Inclán和Tiao (1994)在独立正态随机误差条件下，基于迭代的累积平方和(ICSS)算法，提出了关于方差变点的检测步骤 [2] ；Chen和Gupta (1997)利用Schwarz信息准则(SIC)构造方差变点SIC估计量，并获得估计量的极限分布 [3] ；Lee和Park (2001)、Lee (2003)等将Inclán和Tiao的结果扩展到误差由独立随机变量构造的无限移动平均过程 [4] [5] ；Qin (2017)等同样考虑误差由独立随机变量构造的无限移动平均过程，获得方差变点CUSUM型估计量的强收敛性和迭代算法 [6] 。陈璐(2019)建立简单的独立序列模型，构造均值方差变点位置的CUSUM型估计量，研究了独立序列均值方差变点估计问题 [7] 。房炜杰(2020)研究了方差变点的加权累积和估计的一些极限性质 [8] 。朱慧敏(2022)基于混合误差序列，研究方差变点模型CUSUM型估计量的相合性问题 [9] 。

有关测量误差的方差多变点的估计问题研究较少。因此估计测量误差模型中方差多变点的位置是一个重要且具有挑战性的统计问题。

测量误差模型中关于变点的研究，Chang和Huang (1997)应用了似然比方法对测量误差模型中变量X_j的均值是否存在变点进行了检验，并给出了均值变点的极大似然估计 [10] 。王黎明(2002)应用了似然比方法对测量误差回归模型中回归系数是否存在变点进行了检验，并给出了回归系数变点的极大似估计 [11] 。You (2006)对测量误差模型中回归系数的变点进行了研究 [12] 。而关于测量误差模型中方差变点的研究很少，Dong (2013, 2016)分别用特征函数法 [13] 和非参数的U统计量法 [14] 研究了测量误差模型中的方差变点的估计量及其收敛速度。

Horváth和Kokoszka (1997)应用CUSUM方法对单变量序列中的变点进行估计时，在数值模拟过程中发现调节参数对变点估计的精确度有显著影响 [15] 。Fremdt (2013)对单变量序列是否存在变点提出了改进的CUSUM型检验统计量，数据模拟过程发现当调节参数 $γ \in (0, 0.5)$ 时变点检验效果更稳健 [16] 。谭常春和江敏(2020)利用蒙特卡洛方法研究了CUSUM型统计量中调节参数对单变量序列均值变点估计效果的影响 [17] 。沙达克提·艾力(2023)对方差变点用特征函数构造了一个含有调节参数的“CUSUM型估计量”，研究了方差变点估计量的弱(强)相合性以及收敛速度 [18] 。本文在Gombay (1994)的基础上构造含有调节参数的CUSUM型估计量，研究方差变点估计量的相合性以及收敛速度。结合“二元分割法”推广至多个方差变点的估计。最后，对2008年1月~2024年1月原油价格的涨跌幅周数据进行实证分析。

2. 模型与主要结果

考虑含有测量误差的方差变点模型： $1 \leq k_{0} < n$ ，假设 ${X_{1}, X_{2}, \dots, X_{i}}$ 是一组含有一个方差变点的测量误差模型，观测值满足，

$X_{i} = {\begin{cases} μ + σ_{1} e_{i}, 1 \leq i \leq k_{0}; \\ μ + σ_{2} e_{i}, k_{0} + 1 \leq i \leq n . \end{cases}$ (1)

其中： $μ$ 为常数，若 $σ_{1}^{2} \neq σ_{2}^{2}$ ，则未知时刻 $k_{0}$ 称为含测量误差模型中的方差变点。当 $k_{0} = n$ 时，表明不存在方差变点。 $e_{1}, \dots, e_{n}$ 为独立随机误差序列，满足 $E e_{i} = 0$ ， $E e_{i}^{2} = 1$ ， $1 \leq i \leq n$ ，方差变点 $k_{0}$ 的CUSUM型估计量 $\hat{k}$ 定义为

$\hat{k} = \underset{1 \leq k \leq n}{\arg \max} | U_{k} |$ (2)

$U_{k} = {(\frac{k (n - k)}{n^{2}})}^{1 - γ} (\frac{1}{k} \sum_{i = 1}^{k} {(X_{i} - \bar{X})}^{2} - \frac{1}{n - k} \sum_{i = k + 1}^{n} {(X_{i} - \bar{X})}^{2}),$ (3)

其中 $\bar{X} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}$ ，且必存在L，使得 $| X_{j} | \leq L$ 。

注：当 $γ = 0$ 时，(3)式为Gombay (1996) CUSUM型估计量。

变点位置 $k_{0}$ 和变点估计量 $\hat{k}$ 取值介于1和n之间，为研究 $k_{0}$ 与 $\hat{k}$ 之间的准确性问题，将其转化为研究 $\frac{\hat{k}}{n}$ 与 $\frac{k_{0}}{n}$ 之间的相合性问题。不失一般性，假设存在一个整数 $τ_{0} \in (0, 1)$ 满足 $k_{0} = [τ_{0} n]$ ，其中 $[x]$ 为x取整符号。则方差变点位置 $τ_{0}$ 的CUSUM型估计量 $\hat{τ}$ 定为

$\hat{τ} = \frac{\hat{k}}{n} = \frac{1}{n} \underset{1 \leq k \leq n}{\arg \max} | U_{k} | .$ (4)

本节将讨论方差变点CUSUM型估计量 $\hat{τ} = \frac{\hat{k}}{n}$ 与 $τ_{0} = \frac{k_{0}}{n}$ 的相合性问题。记 $δ = σ_{1}^{2} - σ_{2}^{2}$ ，且不是一般性假设 $δ > 0$ 。

定理1 考虑方差变点模型(1)，设 $X_{j}, j = 1, \dots, n$ 是模型(1)的独立的观测值，且该模型中的测量误差 ${e_{j}}$ 的方差在未知时刻 $k_{0}$ 发生改变，则

(i) 由(4)定义的方差变点的估计量 $\hat{τ}$ 是 $τ_{0}$ 的弱相合估计，且 $\lim_{n \to \infty} | \hat{τ} - τ_{0} | g_{1} (n) = 0$ 依概率成立，其中： $g_{1} (n) = n^{\frac{1}{2}} l^{- 1} (n)$ 。

(ii) $\hat{τ}$ 是 $τ_{0}$ 的强相合估计，且 $\lim_{n \to \infty} | \hat{τ} - τ_{0} | g_{2} (n) = 0$ a.s。其中： $g_{2} (n) = n^{\frac{1}{2}} {(\log n)}_{}^{- \frac{1}{2}} l^{- 1} (n)$ 。

其中： $l (n)$ 是满足 $\lim_{n \to \infty} l (n) = \infty$ 的慢变函数， $g_{1} (n)$ 与 $g_{2} (n)$ 是满足 $\lim_{n \to \infty} g_{j} (n) = \infty$ 的非负函数。

引理1 [19] (Hoeffding不等式)假设 $0 \leq X_{j} \leq 1$ ， $μ_{j} = E (X_{j})$ ， $\bar{X} = \frac{1}{n} \sum_{j = 1}^{n} X_{j}$ ， $μ = E (\bar{X})$ ， $S_{j} = \sum_{j = 1}^{j} X_{i}$ ，则对于 $0 < x < 1 - μ$ ，

$P (\bar{X} - μ \geq x) \leq P (\max_{1 \leq j \leq n} (S_{j} - E S_{j}) \geq n x) \leq \exp {- 2 n x^{2}}$ ,

如果存在着 $a_{j} \leq b_{j}$ ，使得 $a_{j} \leq X_{j} \leq b_{j}$ ， $j = 1, 2, \dots, n$ ，那么对任意的 $x > 0$ ，

$P (\bar{X} - μ \geq x) \leq P (\max_{1 \leq j \leq n} (S_{j} - E (S_{j})) \geq n x) \leq \exp {\frac{- 2 n^{2} x^{2}}{\sum_{j = 1}^{n} {(b_{j} - a_{j})}^{2}}} .$

特别地，若当 $| X_{j} | \leq L$ ，则 $b_{j} - a_{j} = 2 L$ ，那么，

$P {\max_{1 \leq j \leq n} | S_{j} - E S_{j} | > n x} \leq \exp {\frac{- 2 n^{2} x^{2}}{\sum_{k = 1}^{n} {(2 L)}^{2}}} = \exp {\frac{- n x^{2}}{2 L^{2}}} .$

定理1(i)的证明：

$\begin{matrix} U_{k} = {(\frac{k (n - k)}{n^{2}})}^{1 - γ} (\frac{1}{k} \sum_{i = 1}^{k} {(X_{i} - \bar{X})}^{2} - \frac{1}{n - k} \sum_{i = k + 1}^{n} {(X_{i} - \bar{X})}^{2}) \\ = {(\frac{k (n - k)}{n^{2}})}^{1 - γ} (\frac{1}{k} \sum_{i = 1}^{k} {((X_{i} - μ) + (μ - \bar{X}))}^{2} - \frac{1}{n - k} \sum_{i = k + 1}^{n} {((X_{i} - μ) + (μ - \bar{X}))}^{2}) \\ = {(\frac{k (n - k)}{n^{2}})}^{1 - γ} [(\frac{1}{k} \sum_{i = 1}^{k} {(X_{i} - μ)}^{2} + \frac{2 (μ - \bar{X})}{k} \sum_{i = 1}^{k} (X_{i} - μ) + {(μ - \bar{X})}^{2}) \\ - (\frac{1}{n - k} \sum_{i = k + 1}^{n} {(X_{i} - μ)}^{2} + \frac{2 (μ - \bar{X})}{n - k} \sum_{i = k + 1}^{n} (X_{i} - μ) + {(μ - \bar{X})}^{2})] \end{matrix}$

$\begin{matrix} = {(\frac{k (n - k)}{n^{2}})}^{1 - γ} (\frac{1}{k} \sum_{i = 1}^{k} {(X_{i} - μ)}^{2} - \frac{1}{n - k} \sum_{i = k + 1}^{n} {(X_{i} - μ)}^{2}) \\ - {(\frac{k (n - k)}{n^{2}})}^{1 - γ} 2 (μ - \bar{X}) (\frac{1}{k} \sum_{i = 1}^{k} (X_{i} - μ) + \frac{1}{n - k} \sum_{i = k + 1}^{n} (X_{i} - μ)) \\ = U_{k, 1} + U_{k, 2} . \end{matrix}$ (5)

由切比雪夫不等式，知

$P (| (\bar{X} - μ) | > ε) \leq \frac{var (\bar{X})}{ε^{2}} \leq \frac{α \max {\frac{σ_{1}^{2}}{n}, \frac{σ_{2}^{2}}{n}}}{ε^{2}} \to 0, n \to \infty .$

由中心极限定理知：

$\frac{1}{k} \sum_{i = 1}^{k} (X_{i} - μ) = O (1), \frac{1}{n - k} \sum_{i = k + 1}^{n} (X_{i} - μ) = O ( 1 )$

在(5)式中 $U_{k, 1}$ 和 $U_{k, 2}$ 项相比， $U_{k, 1}$ 是主项。即： $U_{k} = U_{k, 1} + o (1)$ 。

当 $k \leq k_{0}$ 时，有：

$\begin{matrix} E U_{k, 1} = {(\frac{k (n - k)}{n^{2}})}^{1 - γ} E (\frac{1}{k} \sum_{i = 1}^{k} {(X_{i} - μ)}^{2} - \frac{1}{n - k} \sum_{i = k + 1}^{n} {(X_{i} - μ)}^{2}) \\ = {(\frac{k (n - k)}{n^{2}})}^{1 - γ} (\frac{1}{k} \sum_{i = 1}^{k} E {(X_{i} - μ)}^{2} - \frac{1}{n - k} \sum_{i = k + 1}^{k_{0}} E {(X_{i} - μ)}^{2} - \frac{1}{n - k} \sum_{i = k_{0} + 1}^{n} E {(X_{i} - μ)}^{2}) \\ = {(\frac{k (n - k)}{n^{2}})}^{1 - γ} (σ_{1}^{2} - \frac{k_{0} - k}{n - k} σ_{1}^{2} - \frac{n - k_{0}}{n - k} σ_{2}^{2}) \\ = τ (1 - τ_{0}) {[τ (1 - τ)]}^{- γ} δ . \end{matrix}$ (6)

当 $k > k_{0}$ 时，有：

$\begin{matrix} E U_{k, 1} = {(\frac{k (n - k)}{n^{2}})}^{1 - γ} E (\frac{1}{k} \sum_{i = 1}^{k} {(X_{i} - μ)}^{2} - \frac{1}{n - k} \sum_{i = k + 1}^{n} {(X_{i} - μ)}^{2}) \\ = {(\frac{k (n - k)}{n^{2}})}^{1 - γ} (\frac{1}{k} \sum_{i = 1}^{k_{0}} E {(X_{i} - μ)}^{2} + \frac{1}{k} \sum_{i = k_{0} + 1}^{k} E {(X_{i} - μ)}^{2} - \frac{1}{n - k} \sum_{i = k + 1}^{n} E {(X_{i} - μ)}^{2}) \\ = {(\frac{k (n - k)}{n^{2}})}^{1 - γ} (\frac{k_{0}}{k} σ_{1}^{2} + \frac{k - k_{0}}{k} σ_{2}^{2} - σ_{2}^{2}) \\ = τ_{0} (1 - τ) {[τ (1 - τ)]}^{- γ} δ . \end{matrix}$ (7)

由(6)式有：

$E U_{k_{0}, 1} = {[τ_{0} (1 - τ_{0})]}^{1 - γ} δ .$ (8)

对于 $U_{k, 2}$ ，有：

$\begin{matrix} E U_{k, 2} = E [{(\frac{k (n - k)}{n^{2}})}^{1 - γ} 2 (μ - \bar{X}) (\frac{1}{k} \sum_{i = 1}^{k} (X_{i} - μ) - \frac{1}{n - k} \sum_{i = k + 1}^{n} (X_{i} - μ))] \\ = {[τ (1 - τ)]}^{1 - γ} E [2 (μ - \bar{X}) (\frac{1}{k} \sum_{i = 1}^{k} (X_{i} - μ) - \frac{1}{n - k} \sum_{i = k + 1}^{n} (X_{i} - μ))] \\ = o (1) . \end{matrix}$ (9)

$E U_{k} = E U_{k, 1} + E U_{k, 1} = {\begin{cases} τ (1 - τ_{0}) {[τ (1 - τ)]}^{- γ} δ + o (1), 1 \leq i \leq k_{0}, \\ τ_{0} (1 - τ) {[τ (1 - τ)]}^{- γ} δ + o (1), k_{0} + 1 \leq i \leq n, \end{cases}$

从(6)~(9)式知，当n充分大时，

$\begin{array}{l} | E U_{k_{0}} | - | E U_{k} | \\ = {\begin{cases} {[τ_{0} (1 - τ_{0})]}^{1 - γ} δ - τ (1 - τ_{0}) {[τ (1 - τ)]}^{- γ} δ, 1 \leq i \leq k_{0}, \\ {[τ_{0} (1 - τ_{0})]}^{1 - γ} δ - τ_{0} (1 - τ) {[τ (1 - τ)]}^{- γ} δ, k_{0} + 1 \leq i \leq n, \end{cases} \\ = {\begin{cases} {(1 - τ_{0})}^{1 - γ} δ [τ_{0}^{1 - γ} - τ^{1 - γ} (1 - τ_{0}) {(1 - τ)}^{- γ}], 1 \leq i \leq k_{0}, \\ {(τ_{0})}^{1 - γ} δ [{(1 - τ_{0})}^{1 - γ} - τ_{0}^{γ} τ^{- γ} {(1 - τ)}^{1 - γ}], k_{0} + 1 \leq i \leq n, \end{cases} \\ = {\begin{cases} {(1 - τ_{0})}^{1 - γ} δ [τ_{0}^{1 - γ} - τ^{1 - γ} {(\frac{1 - τ_{0}}{1 - τ})}^{γ}], 1 \leq i \leq k_{0}, \\ {(τ_{0})}^{1 - γ} δ [{(1 - τ_{0})}^{1 - γ} - {(1 - τ)}^{1 - γ} {(\frac{τ_{0}}{τ})}^{γ}], k_{0} + 1 \leq i \leq n, \end{cases} \\ \geq {\begin{cases} {(1 - τ_{0})}^{1 - γ} δ [τ_{0}^{1 - γ} - τ^{1 - γ}], 1 \leq i \leq k_{0}, \\ {(τ_{0})}^{1 - γ} δ [{(1 - τ_{0})}^{1 - γ} - {(1 - τ)}^{1 - γ}], k_{0} + 1 \leq i \leq n, \end{cases} \end{array}$

若令 $f_{1} (τ) = τ^{1 - γ}, (0 < γ < 1), f_{2} (τ) = {(1 - τ)}^{1 - γ}, (0 < γ < 1)$ 由拉格朗日中值定理知，

$| E U_{k_{0}} | - | E U_{k} | \geq {\begin{cases} {(1 - τ_{0})}^{1 - γ} (1 - γ) τ_{0} (τ_{0} - τ) δ, k < k_{0}, \\ {(τ_{0})}^{1 - γ} (1 - γ) {(1 - τ_{0})}^{- γ} (τ - τ_{0}) δ, k > k_{0}, \end{cases}$

记： $\bar{τ} = (1 - γ) {[τ_{0} (1 - τ_{0})]}^{- γ}$ ， $α = \min {τ_{0}, 1 - τ_{0}}$ 。

$| E U_{k_{0}} | - | E U_{k} | \geq \bar{τ} | τ - τ_{0} | α δ$ (10)

由三角不等式，

$\begin{matrix} | U_{k_{0}} | - | U_{k} | \leq | U_{k} - E U_{k} | + | E U_{k} | + | U_{k_{0}} - E U_{k_{0}} | - | E U_{k_{0}} | \\ \leq 2 \max_{1 \leq k \leq n} | U_{k} - E U_{k} | - | E U_{k_{0}} | + | E U_{k} |, \end{matrix}$ (11)

结合(10)式，并由 $\hat{k}$ 的定义知 $| U_{\hat{k}} | \geq | U_{k_{0}} |$ ，则有

$\bar{τ} | \hat{τ} - τ_{0} | α δ \leq | E U_{k_{0}} | - | E U_{\hat{k}} | \leq 2 \max_{1 \leq k \leq n} | U_{k} - E U_{k} |$ (12)

即 $\bar{τ} | \hat{τ} - τ_{0} | α δ \leq 2 \max_{1 \leq k \leq n} | U_{k} - E U_{k} |$ 。

结合(1)和(4)式有，

$\begin{array}{l} \max_{1 \leq k \leq n} | U_{k} - E U_{k} | \\ \leq \max_{1 \leq k \leq n} | U_{k, 1} - E U_{k, 1} + U_{k, 2} - E U_{k, 2} | \\ \leq \max_{1 \leq k \leq n} | U_{k, 1} - E U_{k, 1} | + \max_{1 \leq k \leq n} | U_{k, 2} - E U_{k, 2} | \\ = \max_{1 \leq k \leq n} [{(\frac{k (n - k)}{n^{2}})}^{1 - γ} | \frac{1}{k} \sum_{i = 1}^{k} ({(X_{i} - μ)}^{2} - E {(X_{i} - μ)}^{2}) - \frac{1}{n - k} \sum_{i = k + 1}^{n} ({(X_{i} - μ)}^{2} - E {(X_{i} - μ)}^{2}) |] \\ + \max_{1 \leq k \leq n} [2 | μ - \bar{X} | {(\frac{k (n - k)}{n^{2}})}^{1 - γ} | \frac{1}{k} \sum_{i = 1}^{k} ((X_{i} - μ) - E (X_{i} - μ)) - \frac{1}{n - k} \sum_{i = k + 1}^{n} ((X_{i} - μ) - E (X_{i} - μ)) |] \end{array}$

$\begin{array}{l} \leq \max_{1 \leq k \leq n} \frac{1}{k} | \sum_{i = 1}^{k} ({(X_{i} - μ)}^{2} - E {(X_{i} - μ)}^{2}) | + \max_{1 \leq k \leq n} \frac{1}{n - k} | \sum_{i = k + 1}^{n} ({(X_{i} - μ)}^{2} - E {(X_{i} - μ)}^{2}) | \\ + 2 (μ - \bar{X}) \max_{1 \leq k \leq n} \frac{1}{k} | \sum_{i = 1}^{k} (X_{i} - E (X_{i})) | + 2 (μ - \bar{X}) \max_{1 \leq k \leq n} \frac{1}{n - k} | \sum_{i = k + 1}^{n} (X_{i} - E (X_{i})) | \\ ≜ I_{1} + I_{2} + I_{3} + I_{4} \end{array}$ (13)

由于 $δ \neq 0$ 以及 $\bar{τ} \neq 0$ ，所以

$| \hat{τ} - τ_{0} | \leq \frac{2 \max_{1 \leq k \leq n} | U_{k} - E U_{k} |}{\bar{τ} α δ}$

因此，

$\begin{array}{l} P (| \hat{τ} - τ_{0} | > ε) \\ \leq P (\frac{2 \max_{1 \leq k \leq n} | U_{k} - E U_{k} |}{\bar{τ} α δ} > ε) \\ \leq P (I_{1} > \frac{ε \bar{τ} α δ}{8}) + P (I_{2} > \frac{ε \bar{τ} α δ}{8}) + P (I_{3} > \frac{ε \bar{τ} α δ}{8}) + P (I_{4} > \frac{ε \bar{τ} α δ}{8}) \end{array}$ (14)

令 $Y_{i} = X_{i} - μ$ ，记 $T_{k} = \sum_{i = 1}^{k} Y_{i}^{2}$ ， $T_{n - k} = \sum_{i = k + 1}^{n} Y_{i}^{2}$ ，由引理1，我们有，

$I_{1} = \max_{1 \leq k \leq n} \frac{1}{k} | \sum_{i = 1}^{k} (Y_{i}^{2} - E Y_{i}^{2}) | = \max_{1 \leq k \leq n} \frac{1}{k} | T_{k} - E T_{k} |$

$\begin{matrix} P {I_{1} > \frac{ε \bar{τ} α δ}{8}} = P {\max_{1 \leq k \leq n} \frac{1}{k} | T_{k} - E T_{k} | > \frac{ε \bar{τ} α δ}{8}} \\ \leq P {\max_{1 \leq k \leq n} | T_{k} - E T_{k} | > \frac{n ε \bar{τ} α δ}{8}} \\ \leq \exp {- \frac{n}{2} {(\frac{ε \bar{τ} α δ}{8 L})}^{2}} \to 0, n \to \infty . \end{matrix}$ (15)

同理，

$\begin{matrix} P {I_{2} > \frac{ε \bar{τ} α δ}{8}} = P {\max_{1 \leq k \leq n} \frac{1}{n - k} | T_{n - k} - E T_{n - k} | > \frac{ε \bar{τ} α δ}{8}} \\ \leq P {\max_{1 \leq k \leq n} | T_{n - k} - E T_{n - k} | > \frac{n ε \bar{τ} α δ}{8}} \\ \leq \exp {- \frac{n}{2} {(\frac{ε \bar{τ} α δ}{8 L})}^{2}} \to 0, n \to \infty . \end{matrix}$ (16)

对于 $I_{3}, I_{4}$ ，由于 $| X | \leq L$ ，必存在M > 0，使得 $| μ - \bar{X} | \leq M$ ，

$\begin{matrix} P {I_{3} > \frac{ε \bar{τ} α δ}{8}} = P (2 | (μ - \bar{X}) | \max_{1 \leq k \leq n} \frac{1}{k} | \sum_{i = 1}^{k} (X_{i} - E (X_{i})) | > \frac{ε \bar{τ} α δ}{8}) \\ \leq P (\max_{1 \leq k \leq n} \frac{1}{k} | \sum_{i = 1}^{k} (X_{i} - E (X_{i})) | > \frac{ε \bar{τ} α δ}{16 M}) \\ \leq \exp {- \frac{n}{2} {(\frac{ε \bar{τ} α δ}{16 M})}^{2}} \to 0, n \to \infty . \end{matrix}$ (17)

同理，

$\begin{matrix} P {I_{4} > \frac{ε \bar{τ} α δ}{8}} = P (2 | (μ - \bar{X}) | \max_{1 \leq k \leq n} \frac{1}{n - k} | \sum_{i = 1}^{k} (X_{i} - E (X_{i})) | > \frac{ε \bar{τ} α δ}{8}) \\ \leq P (\max_{1 \leq k \leq n} \frac{1}{n - k} | \sum_{i = 1}^{k} (X_{i} - E (X_{i})) | > \frac{ε \bar{τ} α δ}{16 M}) \\ \leq \exp {- \frac{n}{2} {(\frac{ε \bar{τ} α δ}{16 M})}^{2}} \to 0, n \to \infty . \end{matrix}$ (18)

因此必存在常数C，有，

$P (| \hat{τ} - τ_{0} | > ε) \leq 4 \exp {- \frac{n}{2} {(\frac{ε \bar{τ} α δ}{C})}^{2}} \to 0, n \to \infty .$

这意味着 $\hat{τ}$ 是 $τ_{0}$ 的弱相合估计。由式(15)~(18)进一步可得，

$P (g_{1} (n) | \hat{τ} - τ_{0} | > ε) \leq 4 \exp {- \frac{n}{2} {(\frac{ε \bar{τ} α δ}{C g_{1} (n)})}^{2}} .$ (19)

若 $g_{1} (n) = n^{\frac{1}{2}} l^{- 1} (n)$ 时，则有： $\lim_{x \to \infty} | \hat{τ} - τ_{0} | g_{1} (n) = 0$ 依概率成立，其中： $l (n)$ 是一个趋于 $\infty$ 的慢变函数。

定理1 (ii)的证明：由(19)式知，

$\sum_{i = 1}^{n} P (g_{2} (n) | \hat{τ} - τ_{0} | > ε) \leq 4 \sum_{i = 1}^{n} \exp {- \frac{n}{2} {(\frac{ε \bar{τ} α δ}{C g_{2} (n)})}^{2}},$

若取 $g_{2} (n) = n^{\frac{1}{2}} {(\log n)}_{}^{- \frac{1}{2}} l^{- 1} (n)$ ，则有 $\sum_{i = 1}^{n} \exp {- \frac{n}{2} {(\frac{ε \bar{τ} α δ}{C g_{2} (n)})}^{2}} < \infty$ ，由Borel-Cantelli引理知 $\hat{τ}$ 几乎处处收敛到 $τ_{0}$ 。且 $\lim_{n \to \infty} | \hat{τ} - τ_{0} | g_{2} (n) = 0$ a.s。成立。

3. 含测量误差的方差多变点的估计

若模型(1)中存在m个变点，且变点个数m已知，则模型(1)转化为

$X_{i} = {\begin{cases} μ + σ_{1} e_{i}, i = 1, 2, \dots, k_{1}; \\ μ + σ_{2} e_{i}, i = k_{1} + 1, \dots, k_{2}; \\ ⋮ \\ μ + σ_{m} e_{i}, i = k_{m - 1} + 1, \dots, k_{m}; \\ μ + σ_{m + 1} e_{i}, i = k_{m} + 1, \dots, n . \end{cases}$ (20)

再结合二元分割法将上述方法推广到多变点的情形，则模型(20)中的方差多变点估计具体步骤如下：

步骤一：对全体数据利用(4)式估计出第一个变点 ${\hat{k}}_{1}$ ；

步骤二：变点 ${\hat{k}}_{1}$ 将数据分成两个子序列，第一部分为 $Y_{1}, Y_{2}, \dots, Y_{{\hat{k}}_{1}}$ ，第二部分为 $Y_{{\hat{k}}_{1} + 1}, Y_{{\hat{k}}_{1} + 2}, \dots, Y_{n}$ ，在这两段样本内分别计算 $\max_{1 \leq k \leq {\hat{k}}_{1}} | U_{k} (t) |$ 和 $\max_{\hat{k} \leq k \leq n} | U_{k} (t) |$ ；

步骤三：比较 $\max_{1 \leq k \leq {\hat{k}}_{1}} | U_{k} (t) |$ 和 $\max_{\hat{k} \leq k \leq n} | U_{k} (t) |$ 的大小，选择两者中较大的那个，并选择较大的所对应的k值，记为 ${\hat{k}}_{2}$ ；

步骤四：重复步骤2和步骤3，直到m个变点被估计出来。

4. 调节参数 $γ$ 的取值对应变点位置估计的影响分析

为了研究调节参数 $γ$ 对变点估计量的影响，用Matlb软件进行模拟分析，假设变点真实位置 $τ_{0}$ 分别为 $0.1, 0.2, \dots, 0.9$ ，共九种情形，取 $μ = 1$ ， $σ_{1} = 1$ ， $σ_{2} = 2$ ，调节参数 $γ$ 取值(0, 1)上的格子点，步长为0.01；重复模拟次数m = 1000；样本容量n选取为1000。

假设测量误差 $X_{i}, i = 1, 2, \dots, n$ ，i.i.d~N(0, 1)此处为了方便起见，在给定调节参数 $γ$ 时，记第i次重复的所得到的变点估计量为 $\hat{τ} (i, γ)$ ， $i = 1, 2, \dots, m$ ；取 $\hat{τ} (i, γ)$ 的均值作为对应调节参数下的变点估计量，并记为 $\hat{τ} (γ)$ ，即

$\hat{τ} (γ) = \frac{1}{m} \sum_{i = 1}^{m} \hat{τ} (i, γ)$ (21)

图1给出了真实变点位置 $τ_{0}$ 分别在 $0.1, 0.2, \dots, 0.9$ 时，调节参数 $γ$ 与变点估计量 $\hat{τ} (γ)$ 的关系。

表1给出了真实变点位置 $τ_{0}$ 分别在 $0.1, 0.2, \dots, 0.9$ 时，不同调节参数 $γ$ 下得到的变点估计量的均值(mean)，标准差(std)，众数(mode)，中位数(median)。

Figure 1. When $σ_{1} = 1$ , $σ_{2} = 2$ , the relationship between the adjustment parameter $γ$ and the change point estimator $\hat{τ} (γ)$ under the change point position $τ_{0}$ of different true values

图1. $σ_{1} = 1$ , $σ_{2} = 2$ 时，不同真实值变点位置 $τ_{0}$ 下调节参数 $γ$ 与变点估计量 $\hat{τ} (γ)$ 之间的关系

Table 1. The mean, standard deviation, mode and median of the change point estimator given by (21) when the adjustment parameter γ ∈ ( 0 , 0.9 ) and step size is 0.1

表1. 调节参数 $γ \in (0, 0.9)$ ，步长为0.1时，由(21)给定的变点估计量的均值、标准差、众数、中位数

注1：从图1和表1中我们都可以发现，当变点位置靠近端点( $τ_{0} = 0.1, 0.9$ )时，变点估计值与真实值之间有一定的偏差；

注2：当 $γ \in (0.3, 0.7)$ 时，变点估计量与真实值最接近，都优于无调节参数( $γ = 0$ )时的情况；

注3：当 $σ_{1} = 1$ ， $σ_{2} = 3$ 时的模拟，跟上述模拟效果相差不大，由于篇幅限制，不再列出图表解释了。

5. 实证分析

基于上述模拟结果，选取调节参数 $γ \in (0.3, 0.7)$ ，以2008年1月~2024年1月原油价格的涨跌幅周数据(数据来源于https://cn.investing.com)作为研究对象，结合“二元分割法”并应用含有调节参数的“CUSUM型估计量”对原油价格涨跌幅的方差变点进行估计，样本量 $n = 832$ 。首先应用(4)式含有调节参数的“CUSUM型估计量”对这832个原油价格涨跌幅数据进行方差变点估计，得到变点的估计值见表2所示，得到的变点估计值都是60，所对应的实际时间是2009年2月28日，出现变点的原因时美国次贷危机出现，宏观经济拉低了原油的需求，导致2008年油价暴跌。OPEC于2008年9、11、12月均宣布减产，这个减产幅度尚不足以抵消过剩，加之刺激经济的政策在短时内还未能显现作用，宏观经济依旧疲软，因此至2009年1~2月，油价延续了这一周期的下行趋势，跌入该周期低位，因此价格出现波动。

Table 2. The first variance change point estimated by CUSUM estimators under different adjustment parameters γ and corresponding actual time

表2. 不同的调节参数 $γ$ 下CUSUM型估计量估计的第一个方差变点的估计值及对应的实际时间

应用“二元分割法”，变点60 (即2009年2月22日)将2008年1月~2024年1月原油价格涨跌幅的832个周数据一分为二，得到2008年1月~2009年2月和2009年3月~2024年1月两个子序列，由于2008年1月~2009年2月的样本量少，不作为研究对象。应用(4)式含有调节参数的“CUSUM型估计量”对2009年3月~2024年1月进行方差变点估计，样本量为771，得到的方差变点估计值见表3所示。对应的实际时间为2020年2月23日，出现变点的原因主要是2020年初，全球疫情的爆发使得原油再度暴跌。

Table 3. The second variance change point estimated by CUSUM estimators under different adjustment parameters γ and corresponding actual time

表3. 不同的调节参数 $γ$ 下CUSUM型估计量估计的第二个方差变点估计值及对应的实际时间

图2给出了2008年1月~2024年1月原油价格的涨跌幅周数据的方差变点(红线所示)，这与实际情况相符。

Figure 2. Variance change point of weekly data on the rise and fall of crude oil prices from January 2008 to January 2024

图2. 2008年1月~2024年1月原油价格涨跌幅周数据的方差变点

6. 结论

本文对含有测量误差的方差变点模型构造了含有调节参数的CUSUM型估计量，并研究了方差变点估计量的相合性和收敛速度，结合“二元分割法”推广至多个方差变点的情况。模拟发现，当 $γ \in (0.3, 0.7)$ 时变点估计量与真实值最接近而且明显优于无调节参数( $γ = 0$ )时的情况。并进一步应用含有调节参数的CUSUM型估计量对原油价格涨跌幅的方差变点进行了实证分析，结果表明基于调节参数CUSUM型估计量得到的方差变点与实际相符。

基金项目

新疆维吾尔自治区自然科学基金项目(2023D01A37, 2022D01A219)。

NOTES

^*通讯作者。

参考文献

[1]	Gombay, E., Horváth, L. and Husková, M. (1996) Estimators and Tests for Change in Variances. Statistics & Risk Mod-eling, 14, 145-160. [Google Scholar] [CrossRef]
[2]	Inclan, C. and Tiao, G.C. (1994) Use of Cu-mulative Sums of Squares for Retrospective Detection of Changes of Variance. Journal of the American Statistical Asso-ciation, 89, 913-923. [Google Scholar] [CrossRef]
[3]	Chen, J. and Gupta, A.K. (1997) Testing and Locating Variance Change Points with Application to Stock Prices. Journal of the American Statistical Asso-ciation, 92, 739-747. [Google Scholar] [CrossRef]
[4]	Lee, S. and Park, S. (2001) The Cusum of Squares Test for Scale Changes in Infinite Order Moving Average Processes. Scandinavian Journal of Statis-tics, 28, 625-644. [Google Scholar] [CrossRef]
[5]	Lee, S., Ha, J., Na, O., et al. (2003) The Cusum Test for Parameter Change Time Series Models. Scandinavian Journal of Statistics, 30, 781-796. [Google Scholar] [CrossRef]
[6]	Qin, R., Liu, W. and Tian, Z. (2017) A Strong Convergence Rate of Estimator of Variance Change in Linear Processes and Its Applications. Statistics, 51, 314-330. [Google Scholar] [CrossRef]
[7]	陈璐, 魏岳嵩, 尉梦珂. 独立序列均值与方差变点的估计[J]. 电脑知识与技术, 2019, 15(4): 218-220.
[8]	房炜杰, 金百锁. 方差变点的加权累积和估计的极限性质[J]. 中国科学技术大学学报, 2020, 50(4): 389-395.
[9]	朱慧敏, 王梓楠, 高敏, 等. 方差变点模型CUSUM型估计量的相合性[J]. 山东大学学报(理学版), 2023, 58(7): 106-114.
[10]	Chang, Y.P. and Huang, W.T. (1997) Inferences for the Linear Errors-in-Variables with Change-Point Models. Journal of the American Statistical Association, 92, 171-178. [Google Scholar] [CrossRef]
[11]	王黎明. 测量误差模型只有一个变点的检验和估计[J]. 应用概率统计, 2002, 18(4): 385-392.
[12]	You, J., Zhou, Y. and Chen, G. (2006) Corrected Local Polyno-mial Estimation in Varying-Coefficient Models with Measurement Errors. Canadian Journal of Statistics, 34, 391-410. [Google Scholar] [CrossRef]
[13]	Dong, C., Miao, B., Tan, C., Wei, D. and Wu, Y. (2013) An Estimate of a Change Point in Variance of Measurement Errors and Its Convergence Rate. Communications in Statistics—Theory and Methods, 44, 790-797. [Google Scholar] [CrossRef]
[14]	Dong, C., Tan, C., Jin, B. and Miao, B. (2016) Inference on the Change Point Estimator of Variance in Measurement Error Models. Lithuanian Mathematical Journal, 56, 474-491. [Google Scholar] [CrossRef]
[15]	Horváth, L. and Kokoszka, P. (1997) The Effect of Long-Range Dependence on Change-Point Estimators. Journal of Statistical Planning and Inference, 64, 51-81. [Google Scholar] [CrossRef]
[16]	Fremdt, S. (2014) Asymptotic Distribution of the Delay Time in Page’s Sequential Procedure. Journal of Statistical Planning & Inference, 145, 74-79. [Google Scholar] [CrossRef]
[17]	谭常春, 江敏. CUSUM型统计量中调节参数对变点估计效果的影响分[J]. 中国科学技术大学学报, 2020, 50(7): 920-928.
[18]	沙达克提∙艾力, 董翠玲. 测量误差模型方差多变点的估计及收敛速度[J]. 理论数学, 2023, 13(11): 3262-3271.
[19]	Hoeffding, W. (1963) Probability Inequalities for Sums of Bounded Random Variables. Journal of the American Statistical Association, 58, 13-30. [Google Scholar] [CrossRef]

为你推荐

友情链接