本
文
摘
要
初学计量时整理的一些stata命令(之二)
文/拔毛哥
本号曾发布过这么一篇推文
【集腋成裘】初学计量时整理的一些stata命令
当时的初衷是利用QQ空间日志,记录stata操作中遇到的困难及解决之道。一晃又过去很久,翻开QQ,发现《集腋成裘》又积了不少。今天权且再发布一篇“之二”吧。
39.分组统计
bys 农村:tab 变量
40.数据乱码处理
clear
unicode *** yze CLDS2016individual_(STATA)_171106.dta
unicode encoding set gb18030
unicode translate "CLDS2016individual_(STATA)_171106.dta", transutf8
unicode translate "CLDS2016individual_(STATA)_171106.dta"
unicode translate "CLDS2016individual_(STATA)_171106.dta", invalid(ignore)
41.改变变量名第一种方法:编辑器里改动第二种方法: rename 原名称 现名称42,提取字符(split命令)
日期:2017/1/12
split(日期), parse(/)
提取年月日
43,字符型转化为数值型destring 日, replace
对本身只有数值的原变量才有效
44,表格输出——asdoc
具体方法见:
https://zhuanlan.zhihu.com/p/47910987
45,office for mac崩溃丢失文件第一步:打开finder
第二步:按command+shift+g,打开文件夹路径输入框
第三步:输入路径:
~/Library/Containers/com.microsoft.Word/Data/Library/Preferences/AutoRecovery/前往word自动恢复文件夹。第四步:找到之前丢失的文档了,但是点击后发现打不开,提醒文件格式与文件扩展名不符。不要急,将后缀改成.doc。
第五步:打开文档,按照自己的心意继续编辑或者另存为.docx
46,stata命令界面找不见了window-review
47,excel数据首行美观显示ctrl+T(mac下为command)
48,单元格快速复制快捷键ctrl+D(mac下为command)
49,excel数据复制粘贴导入stata editor编辑器,经常会出现乱入的引号标点形成特殊乱码。解决方案是,在stata编辑器中赋值具体数据值或文字,然后粘贴入excel再重新导入。
50,首列标签冻结:excel表格的数据往往有几十行,往下翻页时,位于前几行的数据标签名称就会消失,
非常不方便读取。
解决方案:可以在“布局-窗口”中选择冻结首列窗口。
51,stata数据中,发现一个id对应两个时间的情况,如何快速锁定对应数据?
tab id year 或 tab year id 找“2”。
52,第51条,可以使用更简单的stata duplicates命令duplicates report year id——检查重复
duplicates examples year id——显示具体的重复虽然有强制处理命令——duplicates drop id year, force
但如果重复值很少可以先手动检查、修正
53,导入数据设定为面板——xtset id year
54,word for mac如何去除“回车键”?——“视图-段落标记”
54,字符型变量的转化stata——data——create or change data——other variable-transformation commands——encode value labels from string variables
encode 类别, generate(类别)
55,截尾与缩尾缩尾——winsor2 wage, replace cuts(1 99)
截尾——winsor2 wage, replace cuts(1 99) trim
56,分组xtile 性别比三组 = 性别比, nq(3)
57,中心化处理center
58,英文文献引注时只引姓。这是基本规范。59,更改字体后间距发生变化——取消自动右缩。
60,利用cmp命令估计IV-oprobit出现“convergence not achieved”问题如何解决?
使用“difficult”命令,指示ml在失败区域使用其他算法,具体命令——cmp (y=x1 x2 x3)(x1=z1 x2 x3) , ind($cmp_oprobit $cmp_cont) diff nolr
61,IV-oprobit回归结果中的atanhrho如何解读?辅助估计参数atanhrho显著异于零 (P值都为0) , 表明联立方程模型中两个方程之间存在显著的相关性, 采取条件混合过程进行联立估计比分别单独估计更为有效, 也说明解释变量为内生变量。《出口强度、产品价值链与企业信息化水平——学习效应还是规模经济效应?》《农户正规信贷需求的利率弹性及其异质性分析》
62.取消word回车符:“视图”——“段落标记”
63. ivoprobit模型遭遇“ equation appears ill-conditioned”问题如何解决?逗号后加入nrtolerance(#) 或 nonrtol 【nrtolerance(1e-5) 】
64. 边际效应导出estpost margins, dydx(身高) at(身高=(150(1)190))
outreg2 using myfile, replace ctitle(margins1) word dec(3)
65. 多分类变量与连续变量的交互作用简易——reg y x1##c.x2 X1为多分类变量
66. 被解释变量或中介变量为虚拟变量怎么办?binary_mediation, ldecomp命令
67. ologit模型,平行线假设 brant命令来自spost9包68. 计算vif值
reg y x
estat vif
69.excel数据显示不全自动换行
70. 快速选定大范围单元格command+A
71. excel快速选定指定列shift+command+下
72,excel数据导入stata,不能使用千位分隔符,否则数据类型为非数值型,string也无能为力,force损失信息73. stata计算中位数sum variable,d
return list
74. excel将单元格内某值替换为其他,如果直接使用“替换”功能会导致其他单元格内包含的值全部被替换,所以在替换中应注意点击“单元格匹配”。75. logout, save(5643678) word replace:tabstat 变量1 变量2, s(N mean p50)
76.stata不等于怎么表示?!=
等于号前面加上“!”77.参照组设定
ib#. use # as base, #=value of variable
ib(##). use the #th ordered value as base (**)
ib(first). use *** allest value as base (the default)
ib(last). use largest value as base
ib(freq). use most frequent value as base
ibn. no base level78.单侧缩尾winsor wage, gen(wage_wh) p(0.01) highonly
79. Mann-Whitney U 检验是与独立样本t检验相对应的方法,当正态分布、方差齐性等不能达到t检验的要求时,可以使用该检验。80. 零-均值规范化(z-score标准化) 零-均值规范化也称标准差标准化,经过处理的数据的均值为0,标准差为1
81.工具变量外生性不满足plausexog uci y c1 c2 (x=z), gmin(XXX) gmax(XXX) grid(2) level(.95) vce(robust)
82.计算同县周边社区解释变量均值充当工具变量egen 乡镇总=sum(X), by(乡镇)
gen 周边均值= 乡镇总 - 社区总
bys s43: gen NN=_N
gen 周边社区人数=NN-N
gen 周边社区信任均值= 周边社区信任 / 周边社区人数
83.PSM
p *** atch2 Y C,out( 总体 ) neighbor(1) caliper(.01) ate logit common ties
bootstrap r(att) r(atu) r(ate),reps(100): p *** atch2 Y C,out( 总体 ) neighbor(1) caliper(.01) ate logit common ties
84. plausexog检验图输出81后加 graph(变量) 注意:不用加逗号
85.比较两个分布是否存在显著差异——Kolmogorov-Smirnov检验(K-S检验)stata命令—— k *** irnov
86.从中间页插入行号布局-行号-行编号选项-应用于-插入点之后