本
文
摘
要
本篇文章主要介绍了统计学推断统计中最重要两部分:参数估计与假设检验的区别与应用,重点介绍总体均值的区间估计以及假设检验中的总体均值的假设检验:
统计学中推断统计的主要内容
说到参数估计与假设检验就不得不提大数定理与中心极限定理,大数定理证明了样本平均值趋近于总体平均值的趋势,而中心极限定理量化了样本平均值趋向于总体平均值的概率,即给出了样本平均值落在一定区间内的概率。具体内容可阅读之前的文章,连接见下方。
也正由此引出了点估计与区间估计的区别:
点估计直接以样本指标的实际数值作为相应总体参数的估计值,而区间估计会依据样本对总体参数进行估计并给出样本指标在一定范围内的概率。点估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度有多大。
区间估计:
几个重要的概念
置信区间(间距)是指,在某一置信度下,总体参数所在区域的长度。
置信度(置信水平)是也称为可靠度,或置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。是指正确的概率。(1-α 为置信度或置信水平其表明了区间估计的可靠性)
显著性水平是估计总体参数落在某一区间内,可能犯错误的概率为显著性水平,用α表示。
区间估计:通过抽样得到的抽样总体参数来估计实际总体参数所在的值域,并保证一定准确性。即根据样本指标和抽样平均误差推断总体指标的可能范围。
它包括两部分内容:
一是这一可能范围的大小;二是总体指标落在这个可能范围内的概率。区间估计既说清估计结果的准确程度,又同时表明这个估计结果的可靠程度,所以区间估计是比较科学的。
区间估计三要素:
估计值( 抽样得到的总体参数)、误差范围(抽样估计的总体参数有误差,与最后的置信区间密切相关)、和置信度
区间估计计算的要点是:样本与总体同分布,如果总体分布参数未知(如σ)就想办法把样本往已知的抽样分布上转变(如利用样本标准差,转换到t分布上)。区间估计说白了就围绕三个参数,两个总体的(u,σ),一个可靠度α.
区间估计的应用案例:
为估计考生的平均年龄,随机抽取一个样本容量为64的样本,其中平均年龄26.5岁,标准差为4,试求考生总体平均年龄的95.45%的置信区间
样本容量n>64,为大样本,方差未知,采用正太分布进行区间估计。
如下计算:总体平均年龄的95.45%的置信区间为[25.75,27.25]
大样本总体方差未知总体均值的区间估计
一个参数的区间估计分布选择:
区间估计统计量的选择
假设检验
不知道总体信息,假定总体的信息,检验假设进行推断。是先对总体参数提出一个假设,后用样本信息去验证这个假设是否正确。
假设检验的原理
逻辑上运用反证法,统计上依据小概率原理(先假设我们的假设是正确的,然后用事实证明假设是不是正确的),在原有假设的基础上,抽样结果中小概率事件发生的概率很小,如果发生了小概率事件,那么否定原假设。
原假设与备择假设
原假设:研究者想要收集证据予以反对的假设(想通过小概率事件否定的假设)(假设是作用在样本上的)
备择假设:研究者想收集证据予以支持的假设
假设检验的结论描述
假设检验的目的是在于试图找到拒绝原假设,而不在于证明什么是正确的(把想要拒绝的作为原假设,拒绝是绝对的,接受是相对的)
当不拒绝原假设的时候,不能说原假设是正确的,也不能说他不正确
假设检验的步骤
陈述原假设和备择假设
从所研究的总体中抽出一个随机样本
确定适当检验统计量
确定显著性水平,并计算出其临界值
进行比较
假设检验案例:
大样本方差未知总体均值的假设检验
假设检验的分布选择:
假设检验中统计量的选择
参数估计与假设检验的区别与应用
参数估计:通过抽样获得总体的参数,并给出参数的分布区间与概率大小(人口信息统计,社会经济运行信息统计等)
假设检验:根据历史经验,对总体参数提出某种假设,通过抽样进行验证(药物效果验证,流水线包装重量验证等)
-----一直在路上,从未停步