本
文
摘
要
在科学试验中常常要探讨不同情况或者不同处理方式对试验结果是否造成影响,通常是比较不同试验下的样本均值的差异。这时,就需要进行方差分析,方差分析是检验多个样本均数间差异是否具有统计学差异的方法,例如:研究不同药物对治疗某种疾病的疗效、不同地区女性生育率等。都可以用方差分析去解决。本篇文章将方差分析步骤汇总,大体内容如上。
单因素方差分析
「SPSSAU|数据分析」:单因素方差分析步骤汇总
双因素方差分析
1.前期准备
(1)研究目的
双因素方差分析,用于分析定类数据(2个)与定量数据之间的关系情况.例如研究人员性别,学历对于网购满意度的差异性;以及男性或者女性时,不同学历是否有着网购满意度差异性;或者同一学历时,不同性别是否有着网购满意度差异性。
(2)数据格式
研究X对于Y的差异,1个X均占用1列,1个Y也占用1列,如果有协变量那么1个协变量占用1列。数据格式类似如下:
2.SPSSAU操作
(1)上传数据
登录账号后进入SPSSAU页面,点击右上角“上传数据”,将处理好的数据进行“点击上传文件”上传即可。
(2)拖拽分析项
在“进阶方法”模块中选择“双因素方差”方法,将Y定量变量放于上方分析框内,X定类变量放于中间分析框内,如果有协变量则放入下方分析框中,点击“开始分析”即可。
(3)选择参数
二阶效应:分析不同X之间是否存在交互作用;若勾选则为“有交互的双因素方差分析”;若不勾选则为“没有交互作用的双因素方差分析”具体分析请参考如下的SPSSAU分析。
事后多重比较:双因素方差分析提供了三种事后多重比较方法分别是LSD法、Bonferonni校正、Sidak法。三者区别如下:
简单效应:简单效应指X1在某个水平时,X2不同水平的比较;SPSSAU进行简单效应时默认使用Bonferroni法进行计算p 值。
3.SPSSAU分析
(1)有交互的双因素方差分析
①双因素方差分析结果
从上表可知,利用双因素方差分析去研究性别和学历对于Y的影响关系,从上表可以看出:性别呈现出显著性(F=14.103,p=0.000<0.05) ,说明主效应存在,性别会对Y产生差异关系。
具体差异可通过方差分析(单因素)进行具体分析。学历没有呈现出显著性(F=0.266,p=0.767>0.05) ,说明学历并不会对Y产生差异关系。性别和学历之间没有呈现出显著性(F=0.868,p=0.423>0.05) ,说明二者之间不存在二阶效应 (补充说明:若存在二阶效应SPSSAU会提供相应的交互图)。
②事后多重比较
主效应中性别呈现显著性,1.0代表性别男,2.0代表性别女,其中二者的均值差值为-1.433,标准误为0.381,进行多重比较后,p=0.000<0.05,说明男女性别在0.05水平上具有显著性差异。
(2)没有交互的双因素方差分析
①双因素方差分析结果
从上表可以看出:性别呈现出显著性(F=12.464,p=0.001<0.05) ,说明主效应存在,性别会对Y产生差异关系。具体差异可通过方差分析(单因素)进行具体分析。学历没有呈现出显著性(F=0.240,p=0.787>0.05) ,说明学历并不会对Y产生差异关系。
②事后多重比较
主效应中性别呈现显著性,1.0代表性别男,2.0代表性别女,其中二者的均值差值为-1.433,标准误为0.381,进行多重比较后,p=0.000<0.05,说明男女性别在0.05水平上具有显著性差异。
4.其他说明
(1)事后多重比较的类型选择说明?
通常建议使用Bonferroni校正法较优。如果各组别样本不同时可使用scheffe,如果各组别样本完全相同可使用tukey法等。
(2)事后多重比较与‘单独进行事后多重比较’结果不一致?
单独进行事后多重比较(进阶方法->事后多重比较法)时,模型实质上为单因素方差,仅考虑1个X的情况,标准误差的计算并不一致,因此结果会不一致,但通常情况下结论会保持一致;以及此处事后多重比较使用的是边际估计均值(偏最小二乘均值)与一般意义上的平均值有所区别。
三因素方差分析
当X为定类数据,Y为定量数据时,通常使用的是方差分析进行差异研究。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差。比如研究者测试某新药对于胆固醇水平是否有疗效;X共分为三个,分别是药物(旧药和新药)、性别,是否患高血压;Y为胆固醇水平。因而需要进行三因素方差分析即多因素方差分析。
多因素方差分析
当X为定类数据,Y为定量数据时,通常使用的是方差分析进行差异研究。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差,依次下去。当X超过1个时,统称为多因素方差。
协方差分析
1.前期准备
(1)研究目的
协方差分析是利用线性回归方法消除混杂因素的影响后进行的方差分析。例如,测试新药是否有帮助,因此使用方差分析对比两组被试在3月后胆固醇水平的差异性;如果有差异具体差异是什么,通过差异去研究新药是否有帮助;在这里出现一个干扰项即实验前的胆固醇水平(实验前胆固醇水平肯定会影响实验后的胆固醇水平),因此需要将实验前的胆固醇水平纳入模型中。
(2)数据格式
研究X对于Y的差异,1个X均占用1列,1个Y也占用1列,如果有协变量那么1个协变量占用1列。数据格式类似如下:
2.SPSSAU操作
(1)上传数据
登录账号后进入SPSSAU页面,点击右上角“上传数据”,将处理好的数据进行“点击上传文件”上传即可。
(2)拖拽分析项
在“进阶方法”模块中选择“协方差”方法,将Y定量变量放于上方分析框内,X定类变量放于中间分析框内(至少一个),如果有协变量则放入下方分析框中,点击“开始分析”即可。
(3)选择参数
平行性检验:自变量X与协变量对于因变量Y的影响时,自变量X与协变量之间保持独立性。协方差分析时可考虑首先进行平行性检验(如果交互项呈现出显著性则说明没有通过平行性检验;如果交互项没有呈现出显著性则说明通过平行性检验);
事后多重比较:双因素方差分析提供了三种事后多重比较方法分别是LSD、Bonferonni校正、Sidak法。三者区别如下:
3.SPSSAU分析
(1)平行性检验
首先进行平行性检验,平行性检验显示交互项“药物*胆固醇水平实验前”并未来呈现出显著性(F =0.003,p =0.954>0.05),说明数据通过平行性检验,因而满足协方差分析前提假设。
(补充说明:通过平行性检验后,可以不勾选“平行检验”按钮进行再次分析得出结论;如果协方差分析不满足“平行性”,交互项(即有*号项)的p 值< 0.05则说明不平行,不满足“平行性检验”,此时则应该将协变量项移出。)
(2)协方差结果分析
上表为协方差分析结果,上表中R 值为0.081,意味着药物解释胆固醇水平的8.1%变异。研究重点在于药物对于胆固醇水平的帮助,在这里药物呈现出0.05水平的显著性(F =6.045,p =0.016 <0.05),意味着普通药物和新药的两组群体在胆固醇水平上有着显著性差异。
(3)均值对比
两种药物的样本都是36个,新药使用B组群体整体胆固醇水平均值为4.99,小于旧药物组别的5.27,即说明新药对于胆固醇水平的帮助性明显更好。
4.其他说明
(1)协方差的步骤?
先进平行性检验(平行性检验”框打勾);通过平行性检验后,再进行协方差分析(平行性检验”框不能打勾)。如果是进行平行性检验,则此时只看交互项的显著性,其余指标不用理会,包括自变量的显著性情况。
(2) 选择了‘事后多重比较’但是没有输出表格?
当样本量超过2000时,SPSSAU不进行事后多重比较,因此并未输出。
总结
当X为定类数据,Y为定量数据时,通常使用的是方差分析进行差异研究。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差,依次下去。当X超过1个时,统称为多因素方差。
对于协方差分析,X是定类数据,Y是定量数据;协变量为定量数据;如果协变量是定类数据,可考虑将其纳入X即自变量中,也或者将协变量作虚拟变量处理;协变量为干扰项,但并非核心研究项;因此通常情况下只需要将其纳入模型中即可,并不需要过多的分析;
协方差分析有一个重要的假设即“平行性检验”,如果交互项(即有*号项)的p 值>0.05则说明平行,满足“平行性检验”,可进行分析。如果协方差分析不满足“平行性”,交互项(即有*号项)的p 值< 0.05则说明不平行,不满足“平行性检验”,此时则应该将协变量项移出。