基于自回归协方差阵的似乎不相关模型参数的线性贝叶斯估计

doi:10.12677/AAM.2019.83059

期刊菜单

基于自回归协方差阵的似乎不相关模型参数的线性贝叶斯估计
The Linear Bayesian Estimation of Parameters in Seemingly Unrelated Model Based on Covariance Autoregressive Matrix

DOI: 10.12677/AAM.2019.83059, PDF, HTML, XML,
作者: 马晓玲, 胡锡健：新疆大学数学与系统科学学院，新疆乌鲁木齐
关键词: 似乎不相关模型；自回归模型；线性Bayes估计方法；均方误差准则；Seemingly Uncorrelated Model； Autoregressive Model； Linear Bayesian Estimation Method； Mean Square Error Criterion

摘要: 在本文中，构造了已知协方差矩阵结构的均值–协方差似乎不相关模型，该均值–协方差模型考虑了具有时间相关性的自回归模型，并得到该模型参数的线性Bayes估计。在均方误差矩阵准则下对与广义最小二乘估计方法和线性Bayes估计方法进行了对比，通过模拟验证了相对于广义最小二乘估计方法的优良性。

Abstract: In this paper, we propose a mean-covariance seemingly uncorrelated model with known covariance structures. The mean-covariance model is used to describe the autoregressive model with time correlation, and the parameters of this model were estimated by using linear Bayesian estimate. Under the criterion of mean square error matrix, the generalized least squares estimation method and the linear Bayes estimation method were compared; with respect to the generalized least squares estimation method, the superiority of Bayes Linear Estimator is verified by simulation.

文章引用：马晓玲, 胡锡健. 基于自回归协方差阵的似乎不相关模型参数的线性贝叶斯估计[J]. 应用数学进展, 2019, 8(3): 531-539. https://doi.org/10.12677/AAM.2019.83059

1. 引言

Zellner [1] [2] 首次提出了似乎不相关模型(seemingly unrelated regression，简称SUR)；一般研究不同区域或不同因素之间的相关关系，通过随即扰动项相互关联建立这种相关关系，在实际生活中，纵向数据有时也存在着某种相关联系，因此我们研究具有时间异质性的似乎不相关模型。线性贝叶斯方法最早是由Rao [3] [4] 提出的，主要是在参数的线性类中利用最优化方法选取能使线性估计Bayes风险达到最小的一种方法，该方法假定参数的先验分布的二阶矩存在；Gruber [5] 研究了线性回归模型中可估参数的线性Bayes估计；张伟平等人 [6] 研究了多元线性模型的线性贝叶斯无偏估计的优越性；李胜宏等人 [7] 在给定的先验信息条件下得到了似乎不相关模型的参数Bayes估计，并在均方误差和PC准则下，比较了线性贝叶斯估计与最小二乘估计的优良性；宋慧明 [8] 讨论了半相依回归模型参数的Bayes线性无偏估计及与广义最小二乘估计方法相比较的优良性。

在纵向数据的研究中，群集数据的一个特征是其数据之间是相关的。魏凤荣 [9] 曾将均值协方差模型与似乎不相关模型相结合，讨论了其极大似然估计方法；对于协方差矩阵模型的研究中，有些学者引入

了自回归模型 [10] ，其表现形式 $C o v (ε_{i k}, ε_{i j}) = σ^{2} ρ^{| k - j |}$ 。

本文将具有时间相关性的似乎不相关模型与自回归模型相结合，利用线性Bayes估计方法对参数进行估计。

2. 模型介绍

${\begin{cases} Y_{i} = X_{i} β_{i} + ε_{i} \\ E (ε_{i}) = 0, E (ε_{i} ε_{j}^{T}) = v_{i j} I_{n}, i, j = 1, 2, 3. \end{cases}$ (1)

其中i表示第i个时期， $Y_{i}$ 是 $n_{i} \times 1$ 维的被解释列向量， $X_{i}$ 是已知的 $n_{i} \times (p_{i} + 1)$ 的解释变量矩阵，且是列满秩的，即 $r a n k (X_{i}) = p_{i} + 1, i = 1, 2, 3$ ； $β_{i}$ 是 $(p_{i} + 1) \times 1$ 维的未知回归系数向量； $ε_{i}$ 是 $n_{i} \times 1$ 维随机扰动的列向量，并假定随机扰动项的均值为0，其协方差阵是均值协方差阵 $V = (v_{i j}) > 0$ 是未知的。并假设 $β, ε$ 是相互独立的。为方便起见， $V = σ^{2} ρ^{| i - j |}$ 是对称正定矩阵。令 $σ^{2} = 1$ ， $n_{1} = n_{2} = n_{3} = n$

$Y_{i} = {(y_{i 1}, y_{i 2}, \dots, y_{i n_{i}})}^{T}, β_{i} = {(β_{i 1}, β_{i 2}, \dots, β_{i n_{i}})}^{T}, ε_{i} = {(ε_{i 1}, ε_{i 2}, \dots, ε_{i n_{i}})}^{T} .$

$X_{i} = [\begin{matrix} 1 & X_{i 11} & \dots & X_{i 1 p_{i}} \\ 1 & X_{i 21} & \dots & X_{i 2 p_{i}} \\ ⋮ & ⋮ & ⋱ & ⋮ \\ 1 & X_{i n 1} & \dots & X_{i n p_{i}} \end{matrix}], i = 1, 2, 3.$

用矩阵表示(1)式为：

即

${\begin{cases} Y_{3 n \times 1} = X_{3 n \times p} β_{p \times 1} + ε_{3 n \times 1} \\ E (ε) = 0, \sum = cov (ε) = V \otimes I_{n} \end{cases}$ (2)

3. 三个时期似乎不相关模型参数的线性贝叶斯估计

由模型(2)可知回归系数的广义最小二乘估计为：

${\hat{β}}_{G L S} = {(X^{T} Σ^{- 1} X)}^{- 1} X^{T} Σ^{- 1} Y$ (3)

为求(2)式参数的线性贝叶斯估计，假设参数 $β$ 的先验分布为 $π (β)$ ，并满足条件：

$E (β) = [\begin{array}{l} μ_{1} \\ μ_{2} \\ μ_{3} \end{array}] = μ, cov (β) = [\begin{matrix} φ_{1}^{2} I_{p_{1}} & 0 & 0 \\ 0 & φ_{2}^{2} I_{p_{2}} & 0 \\ 0 & 0 & φ_{3}^{2} I_{p_{3}} \end{matrix}] = Ψ$ (4)

其中 $μ$ ， $φ_{1}$ ， $φ_{2}$ 均已知。

假设所求的参数 $β$ 的线性贝叶斯估计是在以下线性类中产生的最优：

$Γ = {{\hat{β}}_{B E} = C Y + a : C 是 p \times 3 n 的矩阵, a 是 p \times 1 维向量}$

并选取损失函数： $L (\hat{β}, β) = {(\hat{β} - β)}^{T} (\hat{β} - β)$

相对应的风险函数为：

$\begin{matrix} R (\hat{β}, β) = E [L (\hat{β}, β)] = \min_{C, a} R (\hat{β}, β) = \min_{C, a} E [{(\hat{β} - β)}^{T} (\hat{β} - β)] \\ = \min_{C, a} t r [E {(\hat{β} - β)}^{T} (\hat{β} - β)] \end{matrix}$

定理1. 在Gauss-Markov条件下，设待估参数的先验分布的二阶矩存在且是无偏估计，其风险函数在某线性类中可以找到最优解，则该参数的线性Bayes估计为：

${\hat{β}}_{B E} = {\hat{β}}_{G L S} - {(X^{T} Σ^{- 1} X + Ψ^{- 1})}^{- 1} Ψ^{- 1} ({\hat{β}}_{G L S} - μ)$

其中 ${\hat{β}}_{G L S}$ 是广义最小二乘估计式， $μ, Ψ$ 的表现形式如(4)式。

证明：

由 $β$ 的无偏性可知 $E (\hat{β} - β) = 0 \Rightarrow a = (I - C X) μ$

为求最小的C矩阵，让其风险函数达到最小，即

$\begin{matrix} R (\hat{β}, β) = E {{[C Y + a - β]}^{T} [C Y + a - β]} \\ = E {{[C (Y - X μ) - (β - μ)]}^{T} [C (Y - X μ) - (β - μ)]} \\ = t r E {[C (Y - X μ) - (β - μ)] {[C (Y - X μ) - (β - μ)]}^{T}} \\ = t r {C E (X β - X μ + ε) {(X β - X μ + ε)}^{T} C^{T} + Ψ - C X Ψ - Ψ X^{T} C^{T}} \\ = t r {C (X Ψ X^{T} + Σ) C^{T} + Ψ - C X Ψ - Ψ X^{T} C^{T}} \end{matrix}$

令

$\frac{\partial R (\hat{β}, β)}{\partial C} = 0$

有 $C = Ψ X^{T} {(X Ψ X^{T} + Σ)}^{- 1}$

由矩阵公式： ${(A + B C B^{Y})}^{- 1} = A^{- 1} - A^{- 1} B {(B^{T} A^{- 1} B + C^{- 1})}^{- 1} B^{T} A^{- 1}$

从而有

$\begin{matrix} C = Ψ X^{T} {(X Ψ X^{T} + Σ)}^{- 1} \\ = Ψ X^{T} Σ^{- 1} - Ψ X^{T} Σ^{- 1} X {(Ψ^{- 1} + X^{T} Σ^{- 1} X)}^{- 1} X^{T} Σ^{- 1} \\ = {(X^{T} Σ^{- 1} X + Ψ^{- 1})}^{- 1} X^{T} Σ^{- 1} \end{matrix}$

又因为 $I - C X = {(X^{T} Σ^{- 1} X + Ψ^{- 1})}^{- 1} Ψ^{- 1}$

所以有：

$\begin{matrix} {\hat{β}}_{B E} = C Y + a = C Y + (I - C X) μ \\ = {(X^{T} Σ^{- 1} X + Ψ^{- 1})}^{- 1} X^{T} Σ^{- 1} Y + {(X^{T} Σ^{- 1} X + Ψ^{- 1})}^{- 1} Ψ^{- 1} μ \\ = {(X^{T} Σ^{- 1} X + Ψ^{- 1})}^{- 1} [X^{T} Σ^{- 1} Y + Ψ^{- 1} μ] \\ = {(X^{T} Σ^{- 1} X + Ψ^{- 1})}^{- 1} [(X^{T} Σ^{- 1} X + Ψ^{- 1}) {\hat{β}}_{G L S} - Ψ^{- 1} ({\hat{β}}_{G L S} - μ)] \\ = {\hat{β}}_{G L S} - {(X^{T} Σ^{- 1} X + Ψ^{- 1})}^{- 1} Ψ^{- 1} ({\hat{β}}_{G L S} - μ) \end{matrix}$ (5)

下证无偏性：

由广义最小二乘估计的无偏性知 $E ({\hat{β}}_{G L S}) = β$ 所以有

$\begin{matrix} E ({\hat{β}}_{B E}) = E [{\hat{β}}_{G L S} - {(X^{T} Σ^{- 1} X + Ψ^{- 1})}^{- 1} Ψ^{- 1} ({\hat{β}}_{G L S} - μ)] \\ = β - {(X^{T} Σ^{- 1} X + Ψ^{- 1})}^{- 1} Ψ^{- 1} E ({\hat{β}}_{G L S} - μ) \\ = β \end{matrix}$

4. 线性贝叶斯估计的优良性

均方误差矩阵下的线性Bayes估计的优良性

定义4.1设参数向量 $θ$ 的一个估计量为 $\hat{θ}$ ，则 $\hat{θ}$ 的均方误差定义为：

$M S E (\hat{θ}) = E [{(\hat{θ} - θ)}^{T} (\hat{θ} - θ)]$ ，而 $M (\hat{θ}) = E [(\hat{θ} - θ) {(\hat{θ} - θ)}^{T}]$ 称为 $\hat{θ}$ 的均方误差矩阵。设 ${\hat{θ}}_{1}, {\hat{θ}}_{2}$ 是参数向量 $θ$ 的两个不同的估计，如果 $M ({\hat{θ}}_{1}) \geq M ({\hat{θ}}_{2})$ 或 $M S E ({\hat{θ}}_{1}) \geq M S E ({\hat{θ}}_{2})$ ，则称 ${\hat{θ}}_{1}$ 在MSEM准则(或MSE准则)下优于 ${\hat{θ}}_{2}$ 。

显然，MSEM准则比MSE准则的判别效果要强，一个估计量在MSEM准则下优于另一个估计量，则在MSE准则下也成立，反之不然。

定理2： ${\hat{β}}_{G L S}$ 、 ${\hat{β}}_{B E}$ 分别表示参数 $β$ 的广义最小二乘估计和线性贝叶斯估计，且分别满足(3)式和(5)式，则有：

$M ({\hat{β}}_{G L S}) > M ({\hat{β}}_{B E})$

证明：由(5)式和均方误差矩阵定义可知

$\begin{matrix} M ({\hat{β}}_{G L S}) = E [({\hat{β}}_{G L S} - β) {({\hat{β}}_{G L S} - β)}^{T}] = E {[({\hat{β}}_{G L S} - β) {({\hat{β}}_{G L S} - β)}^{T}] | β} \\ = var ({\hat{β}}_{G L S}) = {(X^{T} Σ^{- 1} X)}^{- 1} \end{matrix}$

$\begin{matrix} M ({\hat{β}}_{B E}) = E [({\hat{β}}_{B E} - β) {({\hat{β}}_{B E} - β)}^{T}] \\ = E {[({\hat{β}}_{G L S} - β) - W ({\hat{β}}_{G L S} - μ)] {[({\hat{β}}_{G L S} - β) - W ({\hat{β}}_{G L S} - μ)]}^{T}} \\ = M ({\hat{β}}_{G L S}) + W E ({\hat{β}}_{G L S} - μ) {({\hat{β}}_{G L S} - μ)}^{T} W^{T} - W E ({\hat{β}}_{G L S} - μ) {({\hat{β}}_{G L S} - β)}^{T} \\ - E ({\hat{β}}_{G L S} - β) {({\hat{β}}_{G L S} - μ)}^{T} W^{T} \\ = M ({\hat{β}}_{G L S}) + W Q_{2} W^{T} - W Q_{1} - Q_{1}^{T} W^{T} \end{matrix}$

其中：

$W = {[{(X^{T} Σ^{- 1} X)}^{- 1} + Ψ^{- 1}]}^{- 1} Ψ^{- 1}$

$\begin{matrix} Q_{2} = E ({\hat{β}}_{G L S} - μ) {({\hat{β}}_{G L S} - μ)}^{T} = cov ({\hat{β}}_{G L S}) \\ = E [cov ({\hat{β}}_{G L S}) | β] + cov [E ({\hat{β}}_{G L S}) | β] \\ = E [cov ({\hat{β}}_{G L S}) | β] + Ψ \end{matrix}$ (7)

$E [cov ({\hat{β}}_{G L S}) | β] = E [{(X^{T} Σ^{- 1} X)}^{- 1}] = {(X^{T} Σ^{- 1} X)}^{- 1}$ (8)

将(8)式代入(7)式得：

$Q_{2} = {(X^{T} Σ^{- 1} X)}^{- 1} + Ψ$ (9)

(10)

将(9)、(10)式带入(6)式得：

$M ({\hat{β}}_{B E}) = M ({\hat{β}}_{G L S}) - {(X^{T} Σ^{- 1} X)}^{- 1} W^{T} - W {(X^{T} Σ^{- 1} X)}^{- 1} + W [{(X^{T} Σ^{- 1} X)}^{- 1} + Ψ] W^{T}$

所以

$\begin{array}{l} M ({\hat{β}}_{G L S}) - M ({\hat{β}}_{B E}) \\ = {(X^{T} Σ^{- 1} X)}^{- 1} W^{T} + W {(X^{T} Σ^{- 1} X)}^{- 1} - W [{(X^{T} Σ^{- 1} X)}^{- 1} + Ψ] W^{T} \\ = W {{(X^{T} Σ^{- 1} X)}^{- 1} {(W^{T})}^{- 1} + W^{- 1} {(X^{T} Σ^{- 1} X)}^{- 1} - [{(X^{T} Σ^{- 1} X)}^{- 1} + Ψ]} W^{T} \\ = W {{(X^{T} Σ^{- 1} X)}^{- 1} {(W^{T})}^{- 1} + Ψ (X^{T} Σ^{- 1} X + Ψ^{- 1} - Ψ^{- 1} + Ψ^{- 1}) {(X^{T} Σ^{- 1} X)}^{- 1} - [{(X^{T} Σ^{- 1} X)}^{- 1} + Ψ]} W^{T} \\ = W {{(X^{T} Σ^{- 1} X)}^{- 1} (X^{T} Σ^{- 1} X + Ψ^{- 1}) Ψ^{- 1}} W^{T} = W {{(X^{T} Σ^{- 1} X)}^{- 1} + Ψ^{- 1}} W^{T} > 0 \end{array}$

其中 ${(X^{T} Σ^{- 1} X)}^{- 1} + Ψ^{- 1}$ 是对称正定矩阵。

5. 模拟实验

5.1. 实验设计

取模拟试验方程组为表示不同时期即 $T = 1, 2, 3$ 的三个时间异质性问题的似乎不相关模型，每个时期的参数个数为 $p_{i} = 3$ ，其中包含常系数，三个时期参数总个数为 $p = \sum_{i = 1}^{3} p_{i} = 9$ ，其中自变量的观测值 $X_{1}, X_{2}, X_{3}$ 都是 $n \times p$ 维的矩阵并分别取自不同的分布： $X_{1} \sim U (0, 5), X_{2} \sim N (0, 5), X_{3} \sim U (0, 3)$ ，且每个自变量都是列满秩矩阵即 $r a n k (X_{i}) = 3, i = 1, 2, 3$ 。

对广义最小二乘估计方法设定参数 $β$ 初值：

$β_{1} = {(0.6 5, 1 .3, 2.4)}^{T}, β_{2} = {(0.6 5, 1 .3, 2.4)}^{T}, β_{3} = {(0.6 5, 1 .3, 2.4)}^{T}$

随即扰动项 $ε$ 满足特殊的均值——协方差矩阵 $V = σ^{2} ρ^{| k - l |}, k, l = 1, 2, 3$ 。其中k，l表示时期。

在模拟中分别取各个时期的相关关系 $ρ$ 为0.2，0.4，0.6，0.8。并令 $σ^{2} = 1$ ，用线性Bayes估计方法对参数 $β$ 估计时须设定参数的先验信息，我们假定参数 $β$ 的均值与协方差矩阵分别为：

$μ = [\begin{array}{l} μ_{1} \\ μ_{2} \\ μ_{3} \end{array}] = [\begin{array}{l} {(0 .651 .32 .4)}^{T} \\ {(0 .651 .32 .4)}^{T} \\ {(0 .651 .32 .4)}^{T} \end{array}]$ 、 $Ψ = [\begin{matrix} 0.05 I_{p_{1}} & 0 & 0 \\ 0 & 0.1 I_{p_{2}} & 0 \\ 0 & 0 & 0.25 I_{p_{3}} \end{matrix}]$

由于线性Bayes的估计方法依赖于先验信息的设定，在此假定每个时期的各参数均值与真实值相同，然后分别用广义最小二乘估计方法与线性Bayes估计方法得到 $\hat{β}$ 的估计值。

5.2. 拟合效果的评价指标

分别选取绝对偏差的均值和均方误差均值作为拟合效果的评价指标。重复试验下的N个参数估计值的平均值为：

$\bar{\hat{β}} = \frac{1}{N} \sum_{j = 1}^{N} {\hat{β}}_{j}$

绝对偏差表示为： $B i a s ({\hat{β}}_{j}) = | {\bar{\hat{β}}}_{j} - \hat{β} |$ ，

绝对偏差的均值表示为： $M B i a s (\hat{β}) = \frac{1}{N} \sum_{j = 1}^{N} B i a s ({\hat{β}}_{j})$ 。

在N次重复试验下，系数估计值的均方误差为：

$M S E (\hat{β}) = \frac{1}{N} \sum_{k = 1}^{N} {({\hat{β}}^{(k)} - {\bar{\hat{β}}}^{(k)})}^{2}$

当 $M B i a s (\hat{β})$ 和 $M S E (\hat{β})$ 的值越小时，说明系数函数估计的精确度越高。

${\hat{β}}_{G L S}$ 表示广义最小二乘估计， ${\hat{β}}_{B E}$ 表示线性Bayes估计。

5.3. 实验结果及分析

为了更全面的考察线性Bayes估计的有效性，重复试验 $N = 500$ 次，分别计算广义最小二乘方法和线性Bayes估计方法下的 $M B i a s (\hat{β})$ 和 $M S E (\hat{β})$ 的值，在给定广义最小二乘均值及线性Bayes均值条件下，

我们分别得到在已知相关系数 $ρ$ 情况下参数广义最小二乘估计值及线性Bayes估计值，为了方便比较，把各模拟结果列表如表1：

Table 1. The estimates of two estimates and their means of absolute deviation

表1. 两种估计的估计值及其绝对偏差均值

从表中我们可以看出，两种估计方法的估计值都比较接近初值的设定，但线性Bayes估计方法的绝对偏差均值和均方误差都小于广义最小二乘估计方法所计算的结果，说明线性Bayes估计方法的估计结果更精确。

相关系数 $ρ$ 的变化范围在(−1,1)之间，在模拟过程中给 $ρ$ 取了几个特殊值，我们不难从表中发现，随着 $ρ$ 的增大，两种方法的估计值越接近真实值，并且两个方法的绝对偏差均值和均方误差都是逐渐缩小，说明不同时期之间是存在着相关性的，且具有较强的相关性。

6. 结论

本文在 $ρ$ 已知的情况下，通过用线性Bayes估计方法和广义最小二乘估计方法得到三个时期含有不同维度的自变量的估计表达式，并用均方误差矩阵准则得到线性Bayes估计方法的优良性；随后在模拟

过程中通过 $M B i a s (\hat{β})$ 和 $M S E (\hat{β})$ 两个指标作为两种估计方法的拟合指标，分析出线性Bayes估计方法比

广义最小二乘估计方法拟合效果好。

NOTES

^*第一作者。

^#通讯作者。

参考文献

[1]	Zellner, A. (1962) An Efficient Method of Estimating Seemingly Unrelated Regressions and Tests for Aggregation Bias. Publications of the American Statistical Association, 57, 348-368. [Google Scholar] [CrossRef]
[2]	Zellner, A. (1963) Estimators for Seemingly Unrelated Regression Equations: Some Exact Finite Sample Results. Publications of the American Statistical Association, 58, 977-992. [Google Scholar] [CrossRef]
[3]	Rao, C.R. (1973) Linear Statistical Inference and Its Applications. 2nd Edition, Wiley, New York. [Google Scholar] [CrossRef]
[4]	Rao, C.R. (1980) Some Comments on the Minimum Mean Square Error as a Criterion of Estimation. Statistics & Related Topics, Ottawa, 5-8 May 1980, 123-143. [Google Scholar] [CrossRef]
[5]	Gruber, M.H.J. (1990) Regression Estimators, A Comparative Study. Academic Press, Boston.
[6]	Zhang, W.-P., Wei, L.-S. and Chen, Y. (2012) The Superiorities of Bayes Linear Un-biased Estimator in Multivariate Linear Models. Acta Mathematicae Applicatae Sinica (English Series), 28, 383-394. [Google Scholar] [CrossRef]
[7]	李胜宏, 周占功. 相依回归系统参数的Bayes估计[J]. 江苏科技大学学报(自然科学版), 2006, 20(5): 32-36.
[8]	宋慧明. 半相依回归模型参数的Bayes估计[D]: [硕士学位论文]. 合肥: 中国科学技术大学, 2006.
[9]	魏凤荣. 似乎不相关回归方程组中参数的极大似然估计[J]. 系统工程理论与实践, 1999, 19(2): 62-64.
[10]	Littell, R.C., Pendergast, J. and Natarajan, R. (2000) Modelling Covariance Structure in the Analysis of Repeated Measures Data. Statistics in Medicine, 19, 1793-1819. [Google Scholar] [CrossRef]

为你推荐

友情链接