部分线性变系数测量误差模型的约束Liu估计

doi:10.12677/AAM.2023.121003

期刊菜单

部分线性变系数测量误差模型的约束Liu估计
Restricted Liu Estimatoion in Partially Linear Varying Coefficient Measurement Error Model

DOI: 10.12677/AAM.2023.121003, PDF, HTML, XML, 下载: 286 浏览: 468 科研立项经费支持
作者: 李静：中国劳动关系学院应用技术学院，北京；安佰玲：淮北师范大学数学科学学院，安徽淮北
关键词: 部分线性变系数模型；测量误差模型；Liu估计；Profile最小二乘估计；Partially Linear Varying Coefficient Model； Measurement Error Model； Liu Estimator； Profile Least-Squares Approach

摘要: 本文考虑部分线性变系数测量误差模型的估计问题，同时考虑线性部分自变量存在多重共线性和线性部分存在约束条件时两种情形，基于校正的profile最小二乘技术与Liu估计方法，分别构造了未知参数分量的Liu估计和约束Liu估计，并研究了所提估计量的渐进性质。

Abstract: This paper considers estimation of semiparametric partially linear varying coefficient measure-ment error model when the problem of multicollinearity exists and linear restrictions on the pa-rameter components are available. Based on the corrected profile least-squares approach and Liu estimation method, the Liu estimator and the corresponding restricted Liu estimator for the para-metric component are constructed, and their statistical properties are given.

文章引用：李静, 安佰玲. 部分线性变系数测量误差模型的约束Liu估计[J]. 应用数学进展, 2023, 12(1): 15-20. https://doi.org/10.12677/AAM.2023.121003

1. 引言

测量误差模型是统计学和计量经济学领域的重点研究内容之一，近二十年来，半参数测量误差模型的研究得到了越来越多的关注。本文研究如下的带有测量误差的半参数部分线性变系数模型

${\begin{cases} Y = X^{T} β + Z^{T} α (U) + ε \\ V = X + ξ \end{cases}$ (1)

其中，Y为因变量观测量， $Z, X$ 和U分别为自变量观测值， $β = {(β_{1}, β_{2}, \dots, β_{p})}^{T}$ 为模型中线性部分的未知待估系数， $α (\cdot) = {(α_{1} (\cdot), α_{2} (\cdot), \dots, α_{q} (\cdot))}^{T}$ 为模型中变系数部分的未知系数函数。 $ε$ 是均值为零的模型误差，测量误差 $ξ$ 与 $(Y, X, Z, U)$ 独立，有 $E ξ = 0, C o v (ξ) = Σ_{ξ}$ ，一般假定协方差矩阵 $Σ_{ξ}$ 已知。

对于模型(1)，You和Chen (2006) [1] 基于部分线性变系数模型的profile最小二乘估计提出了一种校正估计方法，Wei (2012) [2] 在这个估计方法的基础上对模型(1)考虑了未知参数分量 $β$ 的约束估计，并讨论了对应的约束检验问题。

使用多元回归模型分析实际数据时，不同自变量之间往往存在较强的线性关系，我们将这种现象称之为多重共线性。多种共线性会导致模型推断的错误，比如最小二乘估计虽然在理论上还有无偏估计，但方差很大，基于实际数据得到的估计结果表现为回归系数的正负号与实际问题相反，回归系数估计值的绝大致异常大等。为了解决多重共线性问题，一方面可以在变量选择上进行深入分析，采用删除一些自变量的方式。另一方面，构造有偏估计用以降低估计量的均方误差，目前得到研究较多的有偏估计有岭估计、主成分估计和Liu估计。对于测量误差模型，由于自变量不能精确观测，其有偏估计的研究也相对复杂，因为目前研究结果相对较少，有关的结果可参考文 [3] [4] [5]。对于半参数测量误差模型的有偏估计，文 [6] [7] [8] 针对部分线性测量误差模型分别研究了岭估计和Liu估计。对于模型(1)，文 [9] 构造了模型(1)的岭估计。基于以上研究，本文主要给出模型(1)的Liu估计和对应的约束Liu估计，并给出估计量的渐近性质。

论文第2节将构造参数分量的Liu估计，并给出所提估计量的渐近性质。第3节将构造参数分量的约束Liu估计并研究其性质。定理的证明在第4节给出。结论将在第5节给出。

2. 参数分量的Liu估计

为了构造模型的Liu估计和约束Liu估计，首先介绍You和Chen (2006) [1] 针对模型(1)提出校正Profile 最下二乘法估计，我们要在这个估计方法的基础构造有偏估计。记 ${Y_{i}, X_{i}, Z_{i}, U_{i}}_{i = 1}^{n}$ 为来自模型(1)的样本数据，这里先假设自变量 $X$ 可以被精确观测，则有如下的模型

$Y_{i} = X_{i}^{T} β + Z_{i}^{T} α (U_{i}) + ε_{i}, i = 1, 2, \dots, n .$ (2)

假定参数分量 $β$ 已知，则模型(2)可等价写成如下形式的变系数模型

$(Y_{i} - X_{i}^{T} β) = α_{1} (U_{i}) Z_{i 1} + \dots + α_{q} (U_{i}) Z_{i q} + ε_{i}$ (3)

采用局部线性光滑方法对模型(43)进行估计。假设系数函数 ${α_{j} (\cdot), j = 1, 2, \dots, q}$ 二阶连续可导，对于 $u_{0}$ 附近的点u，由Taylor展开可得

$α_{j} (u) \approx α_{j} (u_{0}) + {α^{'}}_{j} (u_{0}) (u - u_{0}), j = 1, 2, \dots, q$ (4)

其中 ${α^{'}}_{j} (u) = \partial α_{j} (u) / \partial u$ ， ${(α_{j} (u_{0}), {α^{'}}_{j} (u_{0})), j = 1, 2, \dots, q}$ 的局部加权最小二乘估计可通过极小化下式得到

$\sum_{i = 1}^{n} {((Y_{i} - X_{i}^{T} β) - \sum_{j = 1}^{q} (α_{j} (u_{0}) + {α^{'}}_{j} (u_{0}) (U_{i} - u_{0})) Z_{i j})}^{2} K_{h} (U_{i} - u_{0})$ (5)

其中核函数 $K_{h} (\cdot) = K (\cdot / h) / h$ ，h是窗宽。

为了方便叙述，记

$Y = [\begin{matrix} Y_{1} \\ Y_{2} \\ ⋮ \\ Y_{n} \end{matrix}], X = [\begin{matrix} X_{1}^{T} \\ X_{2}^{T} \\ ⋮ \\ X_{n}^{T} \end{matrix}], D_{u_{0}} = [\begin{matrix} Z_{1}^{T} & \frac{U_{1} - u_{0}}{h} Z_{1}^{T} \\ Z_{2}^{T} & \frac{U_{2} - u_{0}}{h} Z_{2}^{T} \\ ⋮ & ⋮ \\ Z_{n}^{T} & \frac{U_{n} - u_{0}}{h} Z_{n}^{T} \end{matrix}];$

以及 $W_{u_{0}} = d i a g (K_{h} (U_{1} - u_{0}), K_{h} (U_{2} - u_{0}), \dots, K_{h} (U_{n} - u_{0}))$ ，那么可得系数函数 $α (u_{0})$ 的局部线性估计为

$\hat{α} (u_{0}) = (\begin{matrix} I_{q} & 0_{q} \end{matrix}) {D_{u_{0}}^{T} W_{u_{0}} D_{u_{0}}}^{- 1} D_{u_{0}}^{T} W_{u_{0}} (Y - X β)$ (6)

其中矩阵 $I_{q}$ 和 $0_{q}$ 分别为q维的单位阵和元素全为零的矩阵。用得到的 $\hat{α} (U_{i})$ 代替(2)中系数函数 $α (U_{i})$ ，经过简单整理可得如下的线性模型

${\bar{Y}}_{i} = {\bar{X}}_{i}^{T} β + ε_{i}, i = 1, 2, \dots, n$ (7)

其中 $\bar{Y} = {({\bar{Y}}_{1}, \dots, {\bar{Y}}_{n})}^{T} = (Ι_{n} - S) Y$ ， $\bar{X} = {({\bar{X}}_{1}, \dots, {\bar{X}}_{n})}^{T} = (Ι_{n} - S) X$ ，

$S = [\begin{matrix} (\begin{matrix} Z_{1}^{T} & 0 \end{matrix}) {[D_{U_{1}}^{T} W_{U_{1}} D_{U_{1}}]}^{- 1} D_{U_{1}}^{T} W_{U_{1}} \\ (\begin{matrix} Z_{2}^{T} & 0 \end{matrix}) {[D_{U_{2}}^{T} W_{U_{2}} D_{U_{2}}]}^{- 1} D_{U_{2}}^{T} W_{U_{2}} \\ ⋮ \\ (\begin{matrix} Z_{n}^{T} & 0 \end{matrix}) {[D_{U_{n}}^{T} W_{U_{n}} D_{U_{n}}]}^{- 1} D_{U_{n}}^{T} W_{U_{n}} \end{matrix}]$

如果自变量 $X_{i}$ 能被精确观测，那么对上面得到的模型(7)使用最小二乘法可以直接得到 $β$ 的估计。然而，模型(1)中得不到自变量 $X_{i}$ 的观测值，得到的观测数据实际是 $V_{i}$ ，直接用 $V_{i}$ 来直接代替 $X_{i}$ 对模型(7)进行估计，由于测量误差的存在，所构造的估计不是相合估计量。对于由于测量误差带来的这一问题，You和Chen (2006) [1] 对Profile最小二乘估计进行校正，得到了如下的校正估计

$\hat{β} = \arg \min_{β \in R^{p}} [{(\bar{Y} - \bar{V} β)}^{T} (\bar{Y} - \bar{V} β) - n β^{T} Σ_{ξ} β] = {({\bar{V}}^{T} \bar{V} - n Σ_{ξ})}^{- 1} {\bar{V}}^{T} \bar{Y}$ (8)

其中 $V = {(V_{1}, \dots, V_{n})}^{T}$ ， $\bar{V} = (I_{n} - S) V$ 。

类似于普通线性回归模型中Liu估计量的构造，构造如下的辅助函数

$F_{1} (β) = {(\bar{Y} - \bar{V} β)}^{T} (\bar{Y} - \bar{V} β) - n β^{T} \sum_{ξ} β + {(d \hat{β} - β)}^{T} (d \hat{β} - β)$ (9)

$F_{1} (β)$ 关于 $β$ 求导，并令其偏导数等于0，有

$\frac{\partial F_{1} (β)}{\partial β} = - 2 {\bar{V}}^{T} (\bar{Y} - \bar{V} β) - 2 n \sum_{ξ} β - 2 (d \hat{β} - β) = 0$ (10)

整理可得参数分量 $β$ 的Liu估计

${\hat{β}}_{L i u} = {({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p})}^{- 1} ({\bar{V}}^{T} \bar{Y} + d \hat{β}) = {({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p})}^{- 1} ({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + d I_{p}) \hat{β}$ (11)

下面给出所提估计量 ${\hat{β}}_{L i u}$ 的渐近性质。定义 $Γ (u) = E (Z Z^{T} | U = u), Φ (u) = E (Z X^{T} | U = u)$ ， $Σ_{1} = E {{[X_{1} - Φ^{T} (U_{1}) Γ^{- 1} (U_{1}) Z_{1}]}^{\otimes^{2}}}$ 以及 $Σ_{2} = E {[X_{1} - Φ^{T} (U_{1}) Γ^{- 1} (U_{1}) Z_{1} + ξ_{1}] (ε_{1} - ξ_{1}^{T} β) + Σ_{ξ} β}^{\otimes^{2}}$ ， $A^{\otimes^{2}}$ 表示 $A A^{T}$ 。

定理1. 若第4节中的假设A.1~A.6成立，参数分量 $β$ 的Liu估计有如下性质

$\sqrt{n} ({\hat{β}}_{L i u} - β) \overset{D}{\to} N (0, Σ_{1}^{- 1} Σ_{2} Σ_{1}^{- 1}) .$

该结论表明基于校正Profile最小二乘估计方法的 ${\hat{β}}_{L i u}$ 的渐近性质与Profile最小二乘估计 $\hat{β}$ 的相同。

3. 参数分量的约束Liu估计

本节考虑考虑如下的线性约束条件

$A β = b$ (12)

其中A是 $k \times p$ 维的已知矩阵，且 $r a n k (A) = k$ ，b是 $k \times 1$ 维的已知向量。下面构造部分线性变系数测量误差模型(1)在约束条件(12)下的约束Liu估计。

构造如下的辅助函数

$F_{2} (β, λ) = {(\bar{Y} - \bar{V} β)}^{T} (\bar{Y} - \bar{V} β) - n β^{T} \sum_{ξ} β + {(d \hat{β} - β)}^{T} (d \hat{β} - β) + 2 λ^{T} (A β - b)$ (13)

其中 $λ$ 是k维Lagrange乘子。针对函数 $F_{2} (β, λ)$ 关于 $β$ ， $λ$ 分别求导，并令偏导数等于0，有

$\frac{\partial F_{2} (β, λ)}{\partial β} = - 2 {\bar{V}}^{T} (\bar{Y} - \bar{V} β) - 2 n \sum_{ξ} β - 2 (d \hat{β} - β) + 2 A^{T} λ = 0$ (14)

和

$\frac{\partial F_{2} (β, λ)}{\partial λ} = A β - b = 0$ (15)

(14)式整理可得

$β = {\hat{β}}_{L i u} - {({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p})}^{- 1} A^{T} λ$ (16)

将(16)式带入(15)，有下式成立

$b = A {\hat{β}}_{L i u} - A {({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p})}^{- 1} A^{T} λ$ (17)

如果 $A {({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p})}^{- 1} A^{T}$ 可逆，则有 $λ$ 的估计为

$\hat{λ} = {[A {({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p})}^{- 1} A^{T}]}^{- 1} (A {\hat{β}}_{L i u} - b)$ (18)

将上式代入(16)，可得 $β$ 的约束Liu估计为

${\hat{β}}_{L i u}^{R} = {\hat{β}}_{L i u} - {({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p})}^{- 1} A^{T} {[A {({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p})}^{- 1} A^{T}]}^{- 1} (A {\hat{β}}_{L i u} - b)$ (19)

对于 ${\hat{β}}_{L i u}^{R}$ ，显然有 $A {\hat{β}}_{L i u}^{R} = b$ 。

下面给出所提估计量 ${\hat{β}}_{L i u}^{R}$ 的渐近性质。

定理2. 若第4节中的假设A.1~A.6成立， ${\hat{β}}_{L i u}^{R}$ 有如下性质

$\sqrt{n} ({\hat{β}}_{L i u}^{R} - β) \overset{D}{\to} N [0, (I_{p} - D) Σ_{1}^{- 1} Σ_{2} Σ_{1}^{- 1} {(I_{p} - D)}^{T}] .$

$D = Σ_{1}^{- 1} A^{T} {[A Σ_{1}^{- 1} A^{T}]}^{- 1} A$

该结论表明基于校正Profile最小二乘估计方法的约束Liu估计 ${\hat{β}}_{L i u}^{R}$ 与Wei (2012) [2] 中提出的约束估计的渐近分布相同。

4. 定理的证明

下面给出定理1和定理2成立需要的条件，这些条件是You和Chen (2006) [1] 采用过的。

(A.1) 随机变量U具有有界支撑 $Π$ ，其密度函数 $f (\cdot)$ 在其支撑上满足Lipschitz连续，且不为0。

(A.2) 对于任一 $U \in Ω$ ，矩阵 $E (z z^{T} | U)$ 为非奇异， $E (z z^{T} | U)$ ， $E {(z z^{T} | U)}^{- 1}$ 和 $E (z x^{T} | U)$ 都是Lipschitz连续的。

(A.3) 存在 $s > 2$ 使得 $E {‖ x ‖}^{2 s} < \infty$ 和 $E {‖ z ‖}^{2 s} < \infty$ ，对于 $ε < 2 - s^{- 1}$ 使得 $n^{2 ε - 1} h \to \infty$ 。

(A.4) ${α_{j} (\cdot), j = 1, \dots, q}$ 二阶连续可导。

(A.5) 函数 $K (\cdot)$ 为对称密度函数，具有紧支撑。

(A.6) $n h^{8} \to 0$ 和 $n h^{2} / {(\log n)}^{2} \to \infty$ 。

引理1 若假设A.1~A.6成立，参数分量 $β$ 的校正最小二乘估计有如下性质

$\sqrt{n} (\hat{β} - β) \overset{D}{\to} N (0, Σ_{1}^{- 1} Σ_{2} Σ_{1}^{- 1}) .$

该引理是You和Chen (2006) [1] 的定理3.1。

定理1的证明。

由You和Chen (2006) [1] 中的引理A.3和A.4，可得

$\frac{1}{n} ({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p}) \overset{p}{\to} Σ_{1}, \frac{1}{n} ({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + d I_{p}) \overset{p}{\to} Σ_{1}$

再由引理1，利用Slutsky定理，可得

$\sqrt{n} ({\hat{β}}_{L i u} - β) \overset{D}{\to} N (0, Σ_{1}^{- 1} Σ_{2} Σ_{1}^{- 1}) .$

定理2的证明。

由You和Chen (2006) [1] 中的引理A.3和A.4，可得

$\frac{1}{n} ({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p}) \overset{p}{\to} Σ_{1}$

从而有

${({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p})}^{- 1} A^{T} {[A {({\bar{V}}^{T} \bar{V} - n \sum_{ξ} + I_{p})}^{- 1} A^{T}]}^{- 1} A \overset{p}{\to} D$

利用Slutsky定理，可得

$\sqrt{n} ({\hat{β}}_{L i u}^{R} - β) \overset{D}{\to} N [0, (I_{p} - D) Σ_{1}^{- 1} Σ_{2} Σ_{1}^{- 1} {(I_{p} - D)}^{T}] .$

5. 总结

本文主要研究了部分线性变系数测量误差模型的Liu估计问题，针对线性部分自变量存在多重共线性这一问题构造了有偏估计方法，同时也考虑了线性约束下的Liu估计。本文只考虑了线性部分的自变量的多重共线性问题，没有考虑变系数部分存在多重共线性的问题，这在实际问题分析中同样重要，将是以后研究的方向。

基金项目

中国劳动关系学院教育教学改革立项项目(JG1406)；2020年度安徽高等学校自然科学项目(KJ2020A1200)。

参考文献

[1]	You, J.H. and Chen, G.M. (2006) Estimation of a Semiparametric Varying-Coefficient Partially Linear Errors-in-Va- ria-bles Model. Journal of Multivariate Analysis, 97, 324-341. https://doi.org/10.1016/j.jmva.2005.03.002
[2]	Wei, C.H. (2012) Statistical Inference for Restricted Partially Linear Varying Coefficient Errors-in-Variables Models. Journal of Statistical Planning and Inference, 142, 2464-2472. https://doi.org/10.1016/j.jspi.2012.02.041
[3]	Shalabh, G.G. and Misra, N. (2007) Restricted Regression Estimation in Measurement Error Models. Computational Statistics & Data Analysis, 52, 1149-1166. https://doi.org/10.1016/j.csda.2007.05.011
[4]	Saleh, A.K.Md.E. and Shalabh (2014) A Ridge Regression Estimation Approach to the Measurement Error Model. Journal of Multivariate Analysis, 123, 68-84. https://doi.org/10.1016/j.jmva.2013.08.014
[5]	Ghapani, F., Rasekh, A.R. and Babadi, B. (2016) The Weighted Ridge Estimator in Stochastic Restricted Linear Measurement Error Models. Statistical Papers, 59, 709-723. https://doi.org/10.1007/s00362-016-0786-3
[6]	李静, 李雪艳. 半参数EV模型的岭估计[J]. 统计与管理, 2016(2): 15-16.
[7]	Emami, H. (2018) Ridge Estimation in Semiparametric Linear Measurement Error Models. Linear Algebra and Its Applications, 552, 127-146. https://doi.org/10.1016/j.laa.2018.04.016
[8]	张婷婷. 部分线性测量误差模型的Liu估计[D]: [硕士学位论文]. 重庆: 重庆大学, 2020.
[9]	曹连英, 毕琳. 变系数部分线性误差变量模型的岭估计[J]. 统计与决策, 2020(24): 25-27.

为你推荐

友情链接