本
文
摘
要
“最优”的回归方程,通常是指模型中包含所有对因变量 Y 影响显著的自变量,而不包含对因变量 Y 影响不显著的自变量。建立“最优”的回归方程主要有三种方法。一种是计算量很大的全子集法,以某一确定准则来确定最优回归子集;另一种是“最优”子集的变量筛选法,该方法基于偏回归平方和检验逐步引入变量或是逐步剔除变量或是两者结合,包括向前引入法、向后剔除法与逐步回归法(即逐步回归分析);第三种是计算量适中的选择法。
逐步回归的基本思想是将变量逐个引入模型,每引入一个解释变量后都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入变得不再显著时,则将其删除。以确保每次引入新的变量之前回归方程中只包含显著性变量。逐步回归法可以认为是向前引入法与向后剔除法的综合。逐步回归法克服了向前引入法与向后剔除法的缺点,吸收两种方法的优点。逐步回归法是以向前引入为主,变量可进可出的变量选取方法。它的基本思想是,当被选入的变量在新变量引入后变得不重要时,可以将其剔除,而被剔除的变量当它在新变量引入后变得重要时,又可以重新选入方程。逐步回归分析是多元回归分析中的一种方法。回归分析是用于研究多个变量之间相互依赖的关系,而逐步回归分析往往用于建立最优或合适的回归模型,从而更加深入地研究变量之间的依赖关系。在stata中,逐步回归法的基本命令是:stepwise。
数据描述:sum/describe线性回归:regress y x1 x2 x3 x4 x5相关系数矩阵:correlate y x1 x2 x3 x4 x5【**相关系数矩阵**一般认为相关系数>0.7,且P有显著性差异,存在共线性】检查是否存在多重共线性:estat vif 【VIF 大于10 存在严重的共线性,若自变量间存在的多重相关性这里将采取逐步回归法进行修正】前进法:sw reg y x1-x4, pr(0.05) 【pr是剔除变量的p值】后退法:sw reg y x1-x4, pe(0.05) 【pe是选入变量的p值】逐步法:同时选用pr和pe,为避免计算进入死循环,pr需略大于pe;Backward后退法善于发现联合作用比较强的自变量,而Forward前进法善于发现独立作用比较强的变量强制保留变量:sw pr pe lockterm1,y (x1 x2 x3) x4 x5 x6 x7stata命令参考链接:
应用Stata做logistic回归 - 百度文库
二分类Logistic回归-stata教程 - 专栏课程 - 医咖会
更多书愤课堂笔记(书愤 全篇)相关信息请关注本站,本文仅仅做为展示!