统计假设检验-检验理论

假设检验

闲居

考虑一个size水平为α的假设检验,其中原假设为H0:θΘ0Θ  vs  H1:θΘ1=Θ/Θ0.

功效函数

在参数假设检验中,功效函数β(θ)定义为当真实参数等于θ时拒绝原假设H0的概率。因此,功效函数的图像是在保持原假设固定,然后改变真实参数的值来得到的曲线图。用于评估在当前样本下,我们最优的假设θ应该取什么值。假设W(Θ0)是拒绝域,则β(θ)=Pθ{(X1,,Xn)W(Θ0)}

举一个简单的例子,假设我想检验的原假设为假设真实参数等于0,即H0:θ=0。如果对应功效函数在θ=1处的值为β(1)=0.5,它表示如果真实参数等于1,那么该检验方法有50%的概率拒绝(错误的)H0

功效

功效的定义与功效函数有点区别,它是指在H0为假时,拒绝原假设的概率,也就是备择假设空间的功效函数值(β(θ),θΘ1)。或者叫在备择假设成立时,样本落在拒绝域的概率。

影响功效的三个因素:1)所用的显著性水平α;2)对总体中感兴趣的效应强度;3)用于探测该效应的样本容量。 # 无偏检验 我们把功效函数β满足如下条件的检验称为无偏检验,即

β(θ)α,θΘ0
β(θ)α,θΘ1.
直观理解是真实值落在备择假设空间时的功效比size水平更高,真实值落在原假设空间时的功效函数值比size水平更低。

举一个简单的例子,比如我们使用标准的t检验来检验H0:θ0H1:θ>0.显著性水平α=0.05的标准的拒绝规则为Tn>1.645。假设我们仍然使用该规则来检验H0:θ=0  vs  H1:θ0,则该检验就是一个有偏的检验,当θ(,0)时,我们可以证明β(θ)<α

为了更加具体地解释无偏检验和有偏检验,我们假设XiN(θ,1)。 检验H0:θ0的t统计量为Tn=nX¯并且

n(X¯θ)N(0,1).
因此,β(θ)=P(Tn>1.645)=P(n(X¯θ)>1.654nθ)=1Φ(1.645nθ).

1)当θΘ1,即θ>0,则有

β(θ)1Φ(1.6450)=10.95=α.

2)当θΘ0,即θ0,则有

β(θ)1Φ(1.6450)=10.95=α.
从而对于这个检验问题,t检验是无偏检验。

而检验H0:θ=0的t统计量仍为Tn=nX¯β(θ)=1Φ(1.645nθ).

可以看出:当θΘ1并且趋近于负无穷时,β(θ)0,故对于这个检验问题,该检验方法是有偏的。

注:证明检验的无偏性,只需证明两点:
1)备择假设为真时的功效比size水平更高;
2)原假设为真时的功效函数值比size水平更低。

统计检验的理论分析

检验理论常常考虑如下几个方面:

1)第一类错误可以控制在名义水平(或者以下):最理想的情况是证明在原假设为真时,检验统计量收敛到一个已知的分布(当然这个分布也可以在bootstrap意义上已知的),即H0为真时,有

supα(0,1)|P(Tn>t1α)α|=o(1).
有时只能得到保守检验方法,我们只能证明:
P(Tn>t1α|H0)α.

2)检验的无偏性:这属于功效分析(Power analysis)的范畴。即证明:

β(θ)α,θΘ0
β(θ)α,θΘ1.

3)最小信号强度:这一块也属于功效分析的范畴。这是分析真实参数满足什么信号条件时,功效函数可以趋近于1。假设H0:θ=0和可分集G(c)={θ:|θ|n1/2c},我们证明对于任意ϵ>0,有

infθG(2+ϵ)β(θ)1.
其中n1/2(2+ϵ)称为最小信号强度。