本
文
摘
要
假设检验一般步骤
step1
确定原假设和被择假设,和是相反的对立面例如小明本来是90斤,现在他想看看他这个月是胖了、瘦了还是没变;
此时H0就是=90,H1就是≠90,≠90就分为>90和<90,此时就是双侧检验
step2
在原假设H0成立的条件下,根据我们需要检验的量构造一个分布(标准正态分布、t分布,F、分布、x^2分布)例如:在H0 : W = 90的条件下,W~N(90,4),服从一个均值为90,方差为4的正态分布。W为小明的体重
此时虽然服从于正态分布,但不是比标准正态分布,此时进行标准化,
而对于称为统计量,统计量中只能包含我们要检验的这个变量,记为Z,并且Z服从于一个标准正态分布
step3
画出这个分布的概率密度图step4
给一个置信水平β(相信(接收)原假设H0成立的概率),一般取β=90%,95%,99%,其中95%用的最多在H0处理的条件下,我们构造的~N(0,1),且Z有95%的可能性的区间位于[-1.96,1.96]
概率密度函数
概率密度函数pdf(probality desinty function)
离散型随机变量
X
1
2
3
P
0.1
0.2
0.7
对于变量的每一个取值都有一个取值概率与其对应
连续型随机变量:X分布在[a,b]之间,,此时f(x)就是pdf
概率密度函数可以理解为X在某处发生的概率强度,且有如下的性质:
probability density function
举个例子:X在[-1,1]上均匀分布(每一个位置都是有可能发生的),也就是说f(x)是一条直线
那么我们可以计算出直线x=?
,所以k = 0.5,即函数x = 0.5
标准正态分布概率密度函数
标准正态分布
是个偶函数,
可以计算出,
也就是说95%的置信区间,双侧检验的临界值为-1.96和1.96
累计密度函数(cumulative distribution function)
X是服从于概率密度函数为f(x)的分布,记X~f(x)
则
显然,
F(-oo) = 0,F(+oo) = 1且F(x)递增F(x)是一个就是积分上限函数,F(x) = f(x)95%的置信水平下,那么通过求得的数字在[-1.96,1.96]之间为接受域,在这个区间之外为拒绝域
假设求得的,那就拒绝原假设,小概率事件发生,我们就拒绝原假设
假如我们将置信水平修改为99%,即在[-2.58,2.58]区间内接受原假设,时,我们无法再拒绝原假设。
双侧检验有两块拒绝域,而单侧检验只有一侧拒绝域,另一侧为接受域
单侧检验,双侧检验的话加上左边的对称区间
单侧检验:
P(x>2) = 1-0.9772 = 0.0228
P值就是单侧检验的时候,大于统计量的概率
P值 = P(x>2) = 0.0228 < 0.05 ,在95%置信水平下,拒绝H0
P值 = 0.028>0.01,在99%置信水平下,接收H0
双侧检验时,P值只需和α/2比较,>的话就接收,小于拒绝
或者P值改为单侧检验的两倍,也可以
比如在95%置信水平下,P(2) = 0.0228,2*0.0028 = 0.0046 < 0.05,拒绝原假设(推荐这种方法,和单侧检验同意)