1. 引言
关于随机变量Y小于随机变量X的概率的估计和推导问题,起源于应力强度模型,它是由Bimbaxmi于1956年提出来的,主要是讨论应力和强度相互作用的效果。应力定义为引起元件、装置和材料失效的载荷,强度定义为当承受外部载荷和环境时,元件装置或材料能满意地完成规定的任务而没有失效的能力。一般地,机械产品的强度和工作应力均为随机变量,可靠性定义为影响失效的应力没有超过控制失效的强度的概率,在使用中,当Y表示应力,X代表强度时,则装置的可靠性的数学形式可以描述为
。后来
也在其他领域有了不同的意义,例如在生物特征学中,若Y代表患者接受药物A治疗后的剩余寿命,X代表患者接受药物B治疗后的剩余寿命,如果让患者来选择药物,则患者主要通过
的值来选择使用何种药物。
指数分布作为一类典型的分布在工业生产、医学、机械工程、桥梁工程等领域常用来描述变量的分布,本文基于单参数和双参数指数分布来研究
。Owen,Craswell和Hanson (1964) [1] 利用非参数正态近似的方法给出了当X和Y分别为服从正态分布的相互独立的随机变量时
的置信限,Enis和Geisser (1971) [2] 利用Bayes方法给出了单参数指数分布的
的估计,Tong (1977) [3] 给出了当X和Y分别服从单参数指数分布时
的一致最小方差无偏估计,Chaos (1982) [4] 给出了
的极大似然估计及其均方误差,D. S. Bai和Y. W. Hong (1992) [5] 给出了大样本单参数情况下此问题的渐近分布,本文在已有文献的基础上,构造了两变量服从单参数指数分布时
的广义枢轴量,给出检验问题的解析解以及频率性质证明。利用Bayes方法得到当两变量服从单参数指数分布时
的置信区间,并与大样本近似估计方法和Bootstrap重抽样方法进行了对比。
2. 变量为单参数指数分布情形
当随机变量X与Y分别服从单参数指数分布且相互独立时,有:
2.1. 广义推断的方法
Tsui K. W.,Weerahandi [6] 和Weerahandi [7] 提出了广义推断的理论,并且给出广义推断方法来求检验的广义p值及参数的广义置信区间。
设
与
分别为从指数分布总体
和
中抽取的样本,由于
与
是独立的充分统计量,且有:
因此可构造广义枢轴量:
(1)
其中:
分别是
和
的样本观测值,因此可以得到参数T的广义枢轴量:
(2)
容易证明
确实是T的广义枢轴量。
考虑假设检验问题:
(3)
其中
为已知常数,则对于假设检验问题(3)可给出广义p值为:
其中
是给定样本下参数的广义枢轴量的观测值,
自由度为2n的卡方分布的分布函数。根据假设检验与区间估计的一一对应关系,我们可以得到T的置信系数为
单侧置信下限:
其中
是自由度为2m的卡方分布的分布函数。因此,T的置信系数为
的置信区间为
,其中
满足:
另外,由于
与
是独立的充分统计量,且有:
即:
其中
、
,则可以得到
的广义枢轴量为:
其中W是服从自由度为2m和2n的F分布,
与
分别是
,
的观测值,由此有:
下面给出关于假设检验问题(3)的广义p值检验犯第一类错误的概率以及参数的双侧置信区间覆盖概率的算法。我们通过Monte Carlo方法来实现。
i) 分别从两个指数分布总体中抽取样本量分别为m和n的样本,得到观测值
:
ii) 计算
:
iii) 产生
与
的实现值;
iv) 按(1)和(2)给出的公式计算
;
v) 重复步骤(iii)-(iv) M次,得到M个
的值,将这一系列
从小到大排列,取其
分位点与
分位点,分别记为
,得到参数T的一个双侧广义置信区间。计算M个
中小于等于真值T的比率,作为假设检验问题(3)的广义p值;
vi) 重复步骤i)~v) L次,计算这L次得到的T的广义置信区间中包含真实值的个数,作为置信区间的覆盖概率,计算广义p值小于0.05的概率,作为检验犯第一类错误的概率。
频率性质
下面给出可靠性参数广义置信区间的频率性质。根据文献 [8] ,有如下引理:
引理1:设
是
的Fiducial模型,
是
的正规参数函数,在Q下
的分布是
的Fiducial分布。记
为
的Fiducial分布函数,若
是Fiducial分布的
分位数,
,则有:
对所有
成立,即作为
的置信下限,
具有频率意义下的实际置信水平
。
定理1:单参数指数分布可靠性参数
的广义置信区间具有频率意义下的实际置信水平
,即
。
证明:
其中,
表示
的分布函数。由于:
根据枢轴方程
,设
,其中
分别与
独立同分布。根据引理1,上式可表示为:
其中,
是
的分布函数。同理
因此
。得证。
2.2. 基于渐近正态的大样本方法
设
与
分别为从指数分布总体
和
中抽取的样本,由于
,
的极大似然估计分别为:
则根据极大似然估计的不变性得到T的极大似然估计为:
(4)
下面考虑在大样本情况下T的极大似然估计的渐近分布,根据D. S. Bai和Y. W. Hong (1992),令
,其中
和
分别表示从两个指数分布总体抽取的样本数。令
,当
时,有
,因此,
。这样,我们可以得到参数T的近似置信区间
其中
是标准正态分布的
分位点。
对于假设检验问题(3),得到检验的p值为:
其中,
是标准正态分布的累积分布函数。
2.3. Bootstrap-t方法
Bootstrap方法最早是由斯坦福大学教授Efron于1977年提出的,该方法认为经验分布函数能够较好地拟合总体分布,下面给出基于bootstrap方法的指数分布可靠性参数的区间估计中较常用的一种方法,Bootstrap-t区间估计 [9] 。
记
是T的极大似然估计,
是
的方差估计,
是通过Boostrap样本得到的T的极大似然估计,
是
的方差的Bootstrap估计。
i) 分别从两个指数分布总体抽取样本量为
和
的样本集合,记为
、
;
ii) 通过样本
、
利用公式(4)求出
;
iii) 分别从
与
中再抽取样本量为
和
的Bootstrap样本,记为
和
;
iv) 通过样本
和
求出
;
v) 重复步骤(iii)-(iv) M次,得到M个
,从小到大排序,取其
分位点
与
分位点
,得到参数T的一个双侧Bootstrap置信区间
;
vi) 重复步骤i)~v) L次,计算这L次得到的T的置信区间中包含真实值的概率,作为置信区间的覆盖概率。
2.4. Bayes方法
通过抽取的样本
,
可以得到似然方程为:
取
、
的先验分布为非信息先验分布:
因此在给定X、Y下,
和
的后验分布函数为:
(5)
(6)
得到
和
的后验分布分别是参数为
和
的伽玛分布。
我们通过Monte Carlo模拟来确定T的置信区间,下面给出具体算法:
i) 通过公式(5)和(6)产生
和
;
ii) 通过得到的
,计算得到T;
iv) 重复步骤(i)-(ii) M次,得到
,并将它们从小到大排序;
v) 取其
分位点与
分位点,得到参数T的一个置信区间;
vi) 重复步骤i)~v) L次,计算这L次得到的置信区间中包含真实值T的概率作为置信区间的覆盖概率。
3. 模拟与结论
我们通过模拟研究来比较四种方法所得到的置信区间和假设检验的表现。在模拟设计中,分别取两样本量为(5,5),(15,10),(20,15),(0,30)。M取5000,L取2000,相关参数的选定在表格中给出。其中,CP表示覆盖概率,IL表示区间长度,GV代表文章所提出的广义枢轴量方法,LS代表基于大样本近似估计方法,TIR表示检验犯第一类错误的概率。从表1~表3的模拟结果可以看出,对于单参数指数分布,广义推断、大样本方法和Bayes方法的覆盖概率在样本量较小的情况下具有好的表现,且广义推断方法和Bayes方法得到的平均置信长度较小,二者的效果更好,Bootstrap方法随着样本量的增加,覆盖概率会逐渐接近名义水平。同时对于单参数指数分布情况下的假设检验问题,给出了不同方法的检验犯第一类错误的概率以及检验的功效,从表4和表5的模拟结果可以看出,广义推断方法和Bayes方法的检验犯第一类错误的概率在名义水平附近,且当样本量较小时,效果也很令人满意。观察表6与表7的结果发现,广义推断方法检验的功效与渐进正态的大样本方法和Bayes方法的功效没有显著差异,小于Bootstrap方法的功效,原因是在这些情况下Bootstrap方法犯第一类错误的概率大于名义水平。另外,当效应的真值原理原假设时,广义p值检验的功效趋于1的速度与其他三种方法的速度是相近的。
![](Images/Table_Tmp.jpg)
Table 1. The main coverage probability and average confidence length of the two-sided confidence interval of the single-parameter exponential distribution parameter T 95%
表1. 单参数指数分布的参数T的95%双侧置信区间的主要覆盖概率和平均置信长度
![](Images/Table_Tmp.jpg)
Table 2. The main coverage probability and average confidence length of the two-sided confidence interval of the single-parameter exponential distribution parameter T 95%
表2. 单参数指数分布的参数T的95%双侧置信区间的主要覆盖概率和平均置信长度
![](Images/Table_Tmp.jpg)
Table 3. The main coverage probability and average confidence length of the two-sided confidence interval of the single-parameter exponential distribution parameter T 95%
表3. 单参数指数分布的参数T的95%双侧置信区间的主要覆盖概率和平均置信长度
![](Images/Table_Tmp.jpg)
Table 4. The probability of making the first type of error in hypothesis test
表4. 检验犯第一类错误的概率
![](Images/Table_Tmp.jpg)
Table 5. The probability of making the first type of error in hypothesis test
表5. 检验犯第一类错误的概率
![](Images/Table_Tmp.jpg)
Table 6. The power of the hypothesis test
表6. 检验的功效
![](Images/Table_Tmp.jpg)
Table 7. The power of the hypothesis test
表7. 检验的功效
根据上述结果可以发现,广义推断方法在可靠性参数推断的区间估计与假设检验方面的表现都很好,此优点在样本量很小的情况下更为显著,另外广义枢轴量法可以用于构造讨厌参数存在时兴趣参数的置信区间以及解决带讨厌参数的假设检验问题,因此当传统频率学派方法无法给出精确方法且大样本难以获取时,广义推断方法可以有效地解决这类问题。