估计量(estimator)
目录 |
估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。在一项应用中,依据估计量算出的一个具体的数值,称为估计值。
1.无偏性
估计量是一个随机变量,对一次具体的观察或试验的结果,估计值可能较真实的参数值有一定偏离,但一个好的估计量不应总是偏小或偏大,在多次试验中所得估计量的平均值应与参数的真值相吻合,这正是无偏性的要求。
【定义1】 设(X1,X2,...,Xn)为来自总体X的样本,为总体的未知参数,为θ的一个估计量.若对于任意有
(1)
则称为θ的无偏估计量.记
称bn以作为θ的估计的偏差,当 时,称为θ的有偏估计量,若则称是θ的渐近无偏估计.
无偏性的意义是,用一个估计量去估计未知参数θ,有时候可能偏高,有时候可能偏低,但是平均来说它等于未知参数θ。
【定理1】 设对总体X,有E(X) = μ,D(X) = σ2从总体X中抽取样本X1,X2,...,Xn用,S2分别表示样本均值和样本修正方差,则
(1)是 μ 的无偏估计量;
(2)S2是 σ2的无偏估计量.
证 由题设,E(Xi) = μ,D(Xi) = σ2(i = 1,2,...,n),且诸Xi独立。于是有
(1),即是总体均值μ的无偏估计量。
(2)因总体X的期望E(X) = μ和方差D(X) = σ2存在,则
故S2是总体方差σ2的无偏估计量.
但对,有
若n很大时,则很接近1,表明 不是 σ2 的无偏估计,而是σ2的渐近无偏估计。
【例1】 设总体X的k阶矩存在,(X1,X2,...,Xn)为来
自总体X的样本,试证明不论总体X服从什么分布,k阶样本矩是k阶总体矩μk的无偏估计.
证 X1,X2,...,Xn与X同分布,故有
即有
【例2】 设总体X服从参数为λ的指数分布,其概率密度为
其中参数λ > 0 但未知,又设X1,X2,...,Xn为来自总体X的样本,试证和nZ = n[min(X1,X2,...,Xn)]都是1 / λ的无偏估计.
证 因E,所以是1 / λ的无偏估计量.而Z = [min(X1,X2,...,Xn)]具有概率密度
故知E(Z) = 1 / nλ,从而E(nZ) = 1 / λ,即nZ也是1 / λ的无偏估计量
此例结果表明,一个未知参数可以有不同的无偏估计量.值得注意,若 是 θ的无偏估计,g(θ)是θ的函数,不一定是g(θ)的无偏估计.
【例3】 试证样本标准差S不是总体标准差 σ 的无偏估计.
证 因为σ2 = E(S2) = D(S) + [E(S)]2,注意到,所以,于是 ,这表明尽管S2是σ2的无偏估计,但S不是总体标准差σ的无偏估计.用样本标准差S去估计总体的标准差 σ ,平均来说是偏低了.
2.有效性
用样本统计量作为总体参数的估计量,其无偏性是重要的,但同一参数的无偏估计不是唯一的,还应该从中选取最好的.例如,从总体X中抽取样本X1,X2,X3,则是总体均值 μ 的无偏估计.考虑E(Xi) = μ,则每个Xi也都是 μ 的无偏估计.还有 , 其数学期望也是μ,它也是μ的无偏估计。
一般只要, 就是μ的无偏估计.这么多无偏估计中哪一个更好一些呢?这就有了有效性的概念.
对于参数 θ 的无偏估计量,其取值应在真值附近波动,我们自然希望它与真值之间的偏差越小越好,也就是说无偏估计量的方差越小越好.
【定义2】 设与均为未知参数θ的无偏估计量,若
(2)
则称 比 有效
【定理2】 总体均值μ的所有线性无偏估计中,以最为有效。
证 μ的所有线性无偏估计,中 其方差
要求这个方差的最小值,相当于求函数,在条件下的最小值.这是一个条件极值问题,用拉格朗日乘数法,令
由
得
即c1 = c2 = ... = cn
代入,则。
这是唯一驻点,应是极小值点,亦是最小值点,即当时,达到最小,即
为方差最小值.这表明在总体均值μ的所有线性无偏估计中,以最为有效.
【例4】(续例2)在例2的条件下,试证当时,θ的无偏估计量 比无偏估计量nZ有效.
证 因为,所以.再由Z的密度函数可得,故有。当时 ,故比nZ有效.
在θ的所有无偏估计量中,若是具有最小方差的无偏估计量,则称为θ的一致最小方差无偏估计量最优无偏估计量.
可以证明,无偏估计量的方差的下界D0(θ)为
当时,就是θ的最优无偏估计量.这里,f(x,θ)表示连续型随机变量的概率密度或离散型随机变量的概率函数.
【例5】 设总体X服从参数为λ的泊松分布,X1,X2,...,Xn是来自该总体的一个样本,求参数λ的极大似然估计量 ,并证明 是参数λ的最优估计量.
解 设样本的一个观察值为X1,X2,...,Xn,则似然函数
令
得
由于,故是参数λ的无偏估计量.
又因
lnf(x;λ) = − λ + xlnλ − ln(x!)
所以
因此,,即是参数λ的最优估计量
3.一致性
上面从无偏性和有效性两个方面讨论了选择估计量的标准,但它们都是在固定样本容量竹的前提下提出的.容易想象,如果样本容量越大,样本所含的总体分布的信息应该越多,我们希望随着样本容量的增大,估计量的值能够稳定于待估参数的真值,估计量的这种性质称为一致性.
【定义3】设为参数θ的估计量,若对于任意及任意ε > O,有
(3)
即依概率收敛于θ,则称为θ的一致估计量(或相合估计量).
【例6】证明样本k阶原点矩 是总体k阶原点矩的一致估计.
证由于X1,X2,...,Xn相互独立与X同分布,所以对任意, 也相互独立与Xk同分布.因此,由大数定律,对于任意ε > 0,有
此表明Ak是 μk的一致估计量.
进而,若待估参数θ = g(μ1,μ2,...,μk),其中g(·)为连续函数,则θ的估计量(这里Ak为样本k阶原点矩)是θ的一致估计量。由此可证,样本方差 S2 是总体方差σ2 的一致估计量。