STATA通用命令集－金锄头文库

资源描述

《STATA通用命令集》由会员分享，可在线阅读，更多相关《STATA通用命令集（15页珍藏版）》请在金锄头文库上搜索。

1、-/STATA常用命令集整变量格式：format x1 .3f将x1的列宽固定为10,小数点后取三位format x1 .3g将 x1 的列宽固定为 10，有效数字取三位format x1 .3e将 x1 的列宽固定为 10，采用科学计数法format x1 .3fc 将 x1 的列宽固定为 10，小数点后取三位，加入千分位分隔符format x1 .3gc 将 x1 的列宽固定为 10，有效数字取三位，加入千分位分隔符format x1 %-10.3gc将 x1 的列宽固定为 10，有效数字取三位，加入千分位分隔符，加入“ - ”表示左对齐合并数据：桌面 2006.dta, clear桌

2、面1999.dta将 1999和 2006的数据按照样本（ observation ）排列的自然顺序合并起来桌面 2006.dta, clear桌面 1999.dta ,unique sort将 1999和2006的数据按照唯一的（ unique ）变量 id 来合并，在合并时对 id 进行排序（ sort ）建议采用第一种方法。对样本进行随机筛选：sample 50在观测案例中随机选取sample 50,count在观测案例中随机选取查看与编辑数据：50%的样本，其余删除50 个样本，其余删除browse x1 x2 if x33 edit x1 x2 if x33（按所列变量与条件打开数

3、据查看器）（按所列变量与条件打开数据编辑器）数据合并（merge）与扩展（append）merge表示样本量不变，但增加了一些新变量；appe nd表示样本总量增加了，但变量数目不变。one-to-one merge ：数据源自 stata tutorial 中的 exampw1和 exampw2第一步：将exampw1按 v001v003这三个编码排序，并建立临时数据库 tempw1 clear use t:statatutexampw1.dtasusummarize 的简写sort v001 v002 v003save tempw1第二步：对exampw2做同样的处理clearuse

4、t:statatutexampw2.dta su sort v001 v002 v003save tempw2第三步：使用tempwl数据库，将其与tempw2合并：clearuse tempw1merge v001 v002 v003 using tempw2第四步：查看合并后的数据状况：ta _merge tabulate _merge 的简写su第五步：清理临时数据库，并删除_merge,以免日后合并新变量时出错erase tempw1.dtaerase tempw2.dtadrop _merge数据扩展 append：数据源自 stata tutorial 中的 fac19 和 new

5、facclearuse t:statatutfac19.dtata regionappend using t:statatutnewfacta region合并后样本量增加,但变量数不变茎叶图：stem x1,line(2) (做 x1 的茎叶图,每一个十分位的树茎都被拆分成两段来显示，前半段为04,后半段为59)stem x1,width(2) (做 x1 的茎叶图,每一个十分位的树茎都被拆分成五段来显示，每个小树茎的组距为 2)stem x1,round(100) (将 x1 除以 100 后再做 x1 的茎叶图)直方图采用 auto 数据库histogram mpg, discrete

6、 frequency normal xlabel(1(1)5)(discrete 表示变量不连续， frequency 表示显示频数， normal 加入正太分布曲线，xlabel设定x轴，1和5为极端值，(1)为单位)histogram price, fraction norm(fraction 表示 y 轴显示小数，除了 frequency 和 fraction 这两个选择之外，该命令可替换为“ percent ”百分比，和“ density ”密度；未加上 discrete 就表示将 price 当作连续变量来绘图)histogram price, percent by(forei

7、gn)(按照变量“ foreign ”的分类，将不同类样本的“ price ”绘制出来，两个图分左右排布)histogram mpg, discrete by(foreign, col(1)(按照变量“ foreign ”的分类，将不同类样本的“ mp绘制出来，两个图分上下排布)histogram mpg, discrete percent by(foreign, total) norm(按照变量“ foreign ”的分类，将不同类样本的“ mpg绘制出来，同时绘出样本整体的“总”直方图)二变量图：graph twoway lfit price weight | scatter p

8、rice weight(作出 price 和 weight 的回归线图“ lfit ”，然后与 price 和 weight 的散点图相叠加)twoway scatter price weight,mlabel(make)(做price和weight的散点图，并在每个点上标注“ make，即厂商的取值) twoway scatter price weight | lfit price weight,by(foreign)(按照变量 foreign 的分类，分别对不同类样本的 price 和 weight 做散点图和回归线图的叠加，两图呈左右分布)twoway scatter price w

9、eight | lfit price weight,by(foreign,col(1)(按照变量 foreign 的分类，分别对不同类样本的 price 和 weight 做散点图和回归线图的叠加，两图呈上下分布)twoway scatter price weight fweight= displacement,msymbol(oh)(画出price和weight的散点图，“msybol(oh) ”表示每个点均为中空的圆圈， fweight= displacement 表示每个点的大小与 displacement 的取值大小成比例)twoway connected y1 time,yaxi

11、 var3 var4(做三个线图的叠加)graph twoway connected var1 var4 | connected var2 var4 | connected var3 var4(叠加三个点线相连图)更多变量：graph matrix a b c y (画出一个散点图矩阵，显示各变量之间所有可能的两两相互散点图)graph matrix a b c d,half(生成散点图矩阵，只显示下半部分的三角形区域) 用 auto 数据集：graph matrix price mpg weight length,half by( foreign,total col(1) )(根据 fore

12、ign 变量的不同类型绘制 price 等四个变量的散点图矩阵，要求绘出总图，并上下排列】 =具) 其他图形：graph box y,over(x) yline(.22)(对应 x 的每一个取值构建 y 的箱型图，并在 y 轴的 0.22 处划一条水平线) graph bar (mean) y,over(x)对应x的每一个取值，显示y的平均数的条形图。括号中的“ meat”也可换成 median、sum sd、p25、p75 等graph bar a1 a2,over（b） stack（对应在b的每一个取值，显示al和a2的条形图，al和a2是叠放成一根条形柱。若不写入“ stack ”

13、，则 a1 和 a2 显示为两个并排的条形柱） graph dot （median）y,over（x）（画点图，沿着水平刻度，在 x 的每一个取值水平所对应的 y 的中位数上打点） qnorm x（画出一幅分位 -正态标绘图）rchart a1 a2 a2（画出质量控制R图，显示al到a3的取值范围）简单统计量的计算：ameans x（计算变量 x 的算术平均值、几何平均值和简单调和平均值，均显示样本量和置信区间）mean var1 pweight = var2（求取分组数据的平均值和标准误， var1 为各组的赋值， var2 为每组的频数） summarize y x1 x2,de

14、tail（可以获得各个变量的百分比数、最大最小值、样本量、平均数、标准差、方差、峰度、偏度）、，I 、+ :注意stata 中 summarize 所计算出来的峰度 skewness 和偏度 kurtosis 有问题，与 ECELL和SPSS有较大差异，建议不采用stata的结果。summarize var1 aweight = var2, detail（求取分组数据的统计量， var1 为各组的赋值， var2 为每组的频数）tabstat X1,stats（mean n q max min sd var cv）（计算变量 X1 的算术平均值、样本量、四分位线、最大最小值、标准差、方

15、差和变异系数）概率分布的计算：（ 1 ）贝努利概率分布测试：webuse quickbitest quick=0.3,detail（假设每次得到成功案例 1的概率等于 0.3 ，计算在变量 quick 所显示的二项分布情况下，各种累计概率和单个概率是多少）bitesti 10,3,0.5,detail（计算当每次成功的概率为 0.5 时，十次抽样中抽到三次成功案例的概率：低于或高于三次成功的累计概率和恰好三次成功概率）（ 2）泊松分布概率： display poisson(7,6).44971106（计算均值为 7，成功案例小于等于 6 个的泊松概率）display poissonp（7,6）.14900278计算均值为 7，成功案例恰好等于 6 个的泊松概率）display poissontail（7,6）.69929172（计算均值为 7，成功案例大于等于 6 个的泊松概率）（3）超几何分布概率：display hypergeometricp（1

展开阅读全文