本
文
摘
要
本周的习题课主要介绍区间估计的解题技巧,主要分为以下几个部分
枢轴量法的基本解题步骤小样本情况单一正态总体的置信区间均匀分布的置信区间指数分布的置信限大样本情况Bernoulli分布的置信区间Poisson分布的置信区间两个正态总体的置信区间习题解析这一篇文章名义上是习题课,其实本质上是为了复习数理统计中的区间估计的相关知识,所以会有一定的背景也可以说的知识介绍。不要看上面的几个部分里面习题解析放在最后一个其实它所占的比重是最大的。
枢轴量法的基本解题步骤
找一个与待估参数 g(\theta) 无关的统计量 T ,一般它是一个很好的点估计。注意我们这里通常找的统计量 T 是充分完备统计量,这个概念要追溯到上一篇数理统计习题课的文章,或者是该参数的MLE(但这种情况很少,主要原因是不好进行下一步)
isle:数理统计习题课3.2120 赞同 · 2 评论文章设法找出 关于T 和 g(\theta) 的函数 S(T,g(\theta)) 使得这个函数的分布 F(x) 与 \theta 无关, S 就被称为枢轴量注意到如果 T 如果是充分完备统计量那么其包含样本的信息就比较完全,或者说完全包含了样本的信息。注意到寻找 S 的过程本质上就是一个凑的过程,在笔者看来如果用充分完备统计量去凑可能可能可以达到事半功倍的效果。
适当地选取两个常数c,d,使得对于给定的 \alpha\in(0,1) 有 P_{\theta}\{c\leq S(T,g(\theta))\leq d\}=1-\alpha 也即 F(d)-F(c)=1-\alpha 其中 F(x) 为 S 对应的分布,一般我们取 d=F_{\alpha/2},c=F_{1-\alpha/2} 将不等式 c\leq S(T,g(\theta))\le d 改写成 \bar{\theta}_L(X)\le g(\theta)\le \bar{\theta}_U(X) 则这个区间就是 g(\theta) 对应的置信水平为 1-\alpha 的置信区间后面两步操作就是简单的套路型操作在此就不过多阐述了。
小样本情况
单一正态总体的置信区间
对于正态总体 X_i\sim N(\mu,\sigma^2), i=1,...,n
单一正态总体置信区间结论均匀分布的置信区间
对于均匀分布总体X_i\sim U(0,\theta), i=1,...,n
\theta 的置信水平为 1-\alpha 的置信区间为 [\frac{X_{(n)}}{d},\frac{X_{(n)}}{c}] ,当 d=1,c=\sqrt[n]{\alpha} 时其长度最小
均匀分布的置信区间求解方法指数分布的置信限
对于指数分布总体X_i\sim E(\lambda), i=1,...,n
参数 \lambda 的置信水平为 1-\alpha 的置信上限为 \chi_{\alpha}^{2}/2n \bar{T}
指数分布的置信限的求解过程大样本情况
Bernoulli分布的置信区间
对于Bernoulli总体 X_i\sim B(1,p), i=1,...,n
注意到由中心极限定理 \frac{\sum_{i=1}^{n}{X_i}-np}{\sqrt{np(1-p)}}\to N(0,1)\ \ n\to \infty
由 P\{-u_{\alpha/2}\le\frac{T_n-np}{\sqrt{np(1-p)}}\le u_{\alpha/2}\}\approx1-\alpha 可以解出
分别代表置信上下限Poisson分布的置信区间
对于Poisson总体 X_i\sim P(\lambda), i=1,...,n
注意到由中心极限定理 \frac{\sum_{i=1}^{n}{X_i}-n\lambda}{\sqrt{n\lambda}}\to N(0,1)\ \ n\to \infty
由 P\{-u_{\alpha/2} \le \frac{\sum_{i=1}^{n}{X_i}-n\lambda}{\sqrt{n\lambda}}\le u_{\alpha/2}\}\approx1-\alpha 可以解出
分别代表置信上下限两个正态总体的置信区间
设 X_i\sim N(\mu_1,\sigma_1^2),Y_j\sim N(\mu_2,\sigma_2^2),i=1,...,m,j=1,...,n
设样本均值分别为 \bar{X}=\sum_{i=1}^{m}{X_i}/m,\bar{Y}=\sum_{i=1}^{n}{Y_i}/n 样本方差分别为 S_{1m}^2=\sum_{i=1}^{m}{(X_i-\bar{X})^2}/(m-1),S_{2n}^2=\sum_{j=1}^{n}{(Y_j-\bar{Y})^2}/(n-1)
我们下面来讨论 \delta=\mu_1-\mu_2 的置信区间
所有可能的情况好啦,至此预备知识部分已经介绍完成了。下面进入正题部分,习题解析。
习题解析
本部分选取几道有特点的习题,在本章中也有一些循规蹈矩的题目,在此就不再赘述了。
题目分析
首先要假设某大学正副教授的住房面积满足正态总体,其次再分析什么量是已知的,在本题中正副教授住房面积的样本均值和样本方差是已知的,总体均值和总体方差是未知的。最后再根据上面的预备知识,套用公式即可。
题目解答
(1)总体均值 \mu_1 在置信水平为0.95的情况下的置信区间为 [\bar{X}-t_{\alpha/2}(n-1)\frac{S_{n1}}{\sqrt{n}},\bar{X}+t_{\alpha/2}(n-1)\frac{S_{n1}}{\sqrt{n}}] ,其中 \bar{X}=115.4,S_{n1}=15.8,n=60,\alpha=0.05
(2)总体均值 \mu_2 在置信水平为0.95的情况下的置信区间为 [\bar{Y}-t_{\alpha/2}(n-1)\frac{S_{n2}}{\sqrt{n}},\bar{Y}+t_{\alpha/2}(n-1)\frac{S_{n2}}{\sqrt{n}}] ,其中 \bar{Y}=89.3,S_{n2}=21.3,n=60,\alpha=0.05
(3)由题意知 \sigma_1=S_{n1},\sigma_2=S_{n2} 则 \delta=\mu_1-\mu_2 的置信区间为 [\bar{Z}\mp t_{\alpha/2}(m+n-2)\frac{\sqrt{\sum_{i=1}^{n}{(Z_i-\bar{Z})^2}}}{\sqrt{n(n-1)}}] 其中 Z_i=X_i-Y_i 将相应的参数代入计算就可以得出结论
这道题还有另外一种估计方法:
由于 \theta=\frac{\sigma_2^2}{\sigma_1^2} 已知,那么置信区间的估计也可以是 [\bar{Y}-\bar{X}\mp t_{\alpha/2}(m+n-2)\sqrt{\frac{m\theta+n}{mn(m+n-2)}(Q _1^2+\frac{Q_2^2}{\theta})}]
但是我们要考虑一下哪一个置信区间的估计是比较适合于计算的,很明显是第二个置信区间的估计比较符合实际,这是因为原题目中没有给出具体的样本是什么,只是给出了样本均值和样本方差,而第一个估计要确切的知道每一个样本的值才能得出具体的置信区间,所以选择第二个估计的置信区间更好。
这道题总结一下最重要的是要分清楚题目中的条件是处于哪一种情况,然后正确的选择合理的置信区间最后代入参数求解即可。
题目分析
该题目乍一看非常难以下手,但是如果考虑到随机变量 X\\ \end{array} \right. ">Y_i=\chi\{X_i \le X\}=\left\{ \begin{array}{l} 1,\ X_i\le X\\ 0,\ X_i>X\\ \end{array} \right. 这道题就迎刃而解
题目解答
Y_i\sim B(1,p),\ p=P\{X_i\le X\}=F(x) 这里是大样本情况,那么我们就可以直接用结论:
代入参数算出置信区间
题目分析
这道题是总体方差 \sigma^2 已知的情况,但是我们要求的是置信区间的长度,所以就要再加一步计算区间长度的计算。
题目解答
置信区间为 [\bar{X}-\frac{\sigma}{\sqrt{n}}u_{\alpha/2},\bar{X}+\frac{\sigma}{\sqrt{n}}u_{\alpha/2}] ,为使区间长度小于L,只用满足下面条件 2u_{\alpha}\frac{\sigma}{\sqrt{n}}\le L 简单化简一下即可求出n的最小值
下面给出几道有一定技巧性的题目,虽说有技巧性但是也有一定的规律可循,下面来看一下这类题目:
题目分析
这道题的计算思路在于两个正态总体中 \mu_1,\mu_2 未知,估计参数 \sigma_1^2/\sigma_2^2 的方法,可以说是完全一样,我们这里回顾一下这样的估计方法
下面我们用这种类似的方法解决这道题
题目解答
X_i\sim E(\lambda_1),Y_i\sim E(\lambda_2),i=1,..,n,j=1,...,m
2\lambda_1\sum_{i=1}^{n}{X_i}\sim \chi^2(2n),2\lambda_2\sum_{j=1}^{m}{Y_j}\sim \chi^2(2m)
\frac{2\lambda_1\sum_{i=1}^{n}{X_i}/2n}{2\lambda_2\sum_{j=1}^{m}{Y_j}/2m}\sim F(2n,2m)
即 P\{\frac{\bar{X}}{\bar{Y}}F_{1-\alpha/2}(2m,2n)\le\frac{\lambda_2}{\lambda_1}\le \frac{\bar{X}}{\bar{Y}}F_{\alpha/2}(2m,2n)\}=1-\alpha
题目分析
先找关于该正态总体的充分完备统计量,然后用这个充分完备统计量去找UMVUE,最后由大样本情况求解方式来算出相应的置信区间
题目解析
由于 \epsilon_i\sim N(0,\sigma^2) 则 X_i\sim N(\frac{\theta}{2}t_i^2,\sigma^2) ,那么有 f(x_1,...,x_n;\theta)=\frac{1}{\sqrt{2\pi \sigma^2}}exp\{\frac{-\sum_{i=1}^{n}{x_i^2}}{2\sigma^2}\}exp\{-\frac{\sum_{i=1}^{n}{\frac{\theta^2}{4}}t_i^4}{2\sigma^2}\}exp\{\frac{\sum_{i=1}^{n}{\theta t_i^2 x_i}}{2\sigma^2}\}
则充分完备统计量为 \sum_{i=1}^{n}{t_i^2X_i} 由此可以看出 \theta 的UMVUE为 \frac{2\sum_{i=1}^{n}{t_i^2X_i}}{\sum_{i=1}^{n}{t_i^4}}
则由大样本情况的做法有
P\{-u_{\alpha/2}\le \frac{ \hat{\theta} -E{\hat{\theta}}}{\sqrt{Var\hat{\theta}}} \le u_{\alpha/2}\}=1-\alpha
其中 Var(\hat{\theta})=\frac{4\sigma^2}{{\sum_{i=1}^{n}{t_i^4}}}, E\hat{\theta}=\theta 则由此可以解出 \theta 的置信区间
题目分析
(1)首先寻找该分布的充分完备统计量,其次找到一个UMVUE(这里我们提一句,(1)题中的UMVUE是均匀分布的UMVUE这个内容在上一篇的习题课可以找到),然后将该均匀分布的随机变量的范围中的参数用变换去除,再然后将变换后的随机变量转换为UMVUE,找出这个UMVUE的密度函数,最后将密度函数代入求解置信区间。
(2)(3)也是首先寻找充分完备统计量,其次作一个随机变量的变换,并且计算出变换后的随机变量的密度函数,最后将密度函数代入求解。
注意本题需要用到一些次序统计量的PDF的结论可以在上一篇习题课中查询到
题目解答
(1)可以得到 \theta 的充分完备统计量为 (X_{(1)},X_{(n)}) ,并且有 E\frac{X_{(1)}+X_{(n)}}{2}=\theta ,则其为 \theta 的UMVUE
令 Y_i=X_i-\theta 那么有 Y_i\sim U(-1/2,1/2) 注意到 Y_{(i)}=X_{(i)}-\theta 则有 (Y_{(1)},Y_{(n)}) 的联合密度为