Stata学习笔记--

上传人:左****笑 文档编号:145281121 上传时间:2020-09-18 格式:DOCX 页数:32 大小:1.04MB
返回 下载 相关 举报
Stata学习笔记--_第1页
第1页 / 共32页
Stata学习笔记--_第2页
第2页 / 共32页
Stata学习笔记--_第3页
第3页 / 共32页
Stata学习笔记--_第4页
第4页 / 共32页
Stata学习笔记--_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《Stata学习笔记--》由会员分享,可在线阅读,更多相关《Stata学习笔记--(32页珍藏版)》请在金锄头文库上搜索。

1、以下命令均采用小写字母Chapter 1 stata入门1.1打开数据use D:Stata9auto.dta, clear 用use命令打开数据sysuse auto,clear auto 为系统数据 sysuse为打开系统数据的命令1.2获取帮助Help summarize summarize为需要获取帮助对象 可以改为其他的需要帮助的对象Findit summarize,net 寻找网络帮助 summarize为需要获取帮助对象Search summarize ,net 寻找网络帮助 summarize为需要获取帮助对象显示结果Display 5+9 1.3描述统计(summarize

2、可简写成sum)Use atuo,clearSummarize price 描述price的观察值个数、平均值、标准差、最小值、最大值Sum weight summarize可简写成sumSum weight price 同时完成上面两步1.4绘图Scatter price weight scatter 为绘制散点图命令Line price weight ,sort line 为绘制折线图命令,sort为排序,绘制折线图前需要先排序1.5生成新的数据(generate 可简写成gen)ClearSet obs 1000 设置观测值的组数Gen x=_n _n 为观察值得序号Gen y=x+10

3、01.6控制结果输出显示List n 1.7设置屏幕滚动Set more off 先设置此项 则显示时,屏幕不停止Set more on 先设置此项 则显示时,会使显示停止1.8清除内存中原有内容clear1.9设置文件存取路径(cd)Cd d:stata d:stata为路径1.10如果想知道当前路径下有哪些文件,可以用dir 命令来列示.dir1.11假设你想在D 盘的根目录下创建一个新的文件夹mydata 来存放数据文件,命令为mkdir。mkdir d:mydata1.12错误提示List myvar上述命令试图显示变量myvar,但是结果窗口仅出现如下的显示variable myva

4、r not foundr(111);红色信息表明,没有找到一个叫myvar 的变量,的确,我们的数据中并没有这个变量。List 巧妇难为无米之炊。红色信息下面还有一个天兰色的 r(111),用鼠标点击,即可弹进一个帮助信息框,给出错误的更详尽解释。再比如,我们在求五数概略时,误把 sum 写成了sun. sununrecognized command: sunr(199);显示说不认识sun 这个命令。附录:常见命令Chapter2命令语句2.1 掌握命令语句的格式by varlist: command varlist =exp if exp in range weight , options

5、注: 表示可有可无的项,显然只有command 是必不可少的,下面结合例子分项来讲解命令的各个组成部分。2.2 命令commandby varlist: command varlist =exp if exp in range weight , options. cd d:/stata9. use auto, clear /打开美国汽车数据文件auto.dta,后面的clear 表示先清除内存中可能存在的数据集. summarize /*很多命令可单独使用,单独使用时,一般是对所有变量进行操作,等价于后面加上代表所有变量的_all。 */. summarize _all /注意到该命令输出结果

6、与上一个命令完全一样. sum /与前一命令等价,sum 为summarize 的略写. su su 是summarize 的最简化略写,不能再简化为s. s /简写前提是不引起混淆。执行这个命令将出现错误信息unrecognized command: s2.3 变量varlistby varlist: command varlist =exp if exp in range weight , optionsvarlist 表示一个变量,或者多个变量,多个变量之间用空格隔开。. cd d:/stata9. use auto, clear. sum price /求价格的观察值个数,平均值,方差

7、,最小值和最大值. su p /变量和命令均可略写,注意到两个结果完全一样. su t /分数据中有两个变量的开首字母为t(trunk 和turn),所以STATA 认为t 为模糊的省略。m ambiguous abbreviation /红色为错误信息. sum tr tu /求trunk 和turn 变量的五数概略统计变量名称除以下字符不能用作变量名外,任何字母、字母与数字(单独的数字也不允许)组合均可用做变量名:_all _b byte _coef _cons double float if in int long _n _N _pi _pred _rc _se _skip using

8、with基本要求如下:_ 第一个字元可以是英文字母或, 但不能是数字;_ 最多只能包括32 个英文字母、数字或下划线;_ 由于STATA 保留了很多以“_ “开头的内部变量,所以最好不要用为第一个字元来定义变量。2.4 分类操作by varlistby varlist: command varlist =exp if exp in range weight , options如果需要分别知道国产车和进口车的价格和重量,可以采用分类操作来求得,. cd d:/stata9. use auto, clear. by foreign: sum price weight /分别计算国产车和进口车的价格

9、和重量但如果执行下面两个命令,将出现错误*/. sort price /按价格从低到高重新排序. by foreign: sum price weight*not sorted/* 系统提示没有排序,这是因为by varlist 在执行时要求内存中的数据是按照by 后面的变量排序的。当我们用sort price 重新排序后,就打乱了原来按照foreign 的排序,所以出现了错误提示。更正的办法是:*/. sort foreign /按国产车和进口车排序. by foreign: sum price weight*更简略的方式是把两个命令用一个组合命令来写。. by foreign, sort:

10、 sum price weight如果不想从小到大排序,而是从大到小排序,其命令为 gsort。.gsort - price /按价格从高到低排序. gsort foreign price /*先把国产车都排在前,进口车排在后面,然后在国产车内再按价格从大小到排序,在进口车内部,也按从大到小排序*/2.5 赋值及运算=expby varlist: command varlist =exp if exp in range weight , options例:生成一个新的价格变量nprice,该变量的取值为原汽车价格变量price 的基础上涨10 元. cd d:/stata9. use auto

11、, clear. gen nprice=price+10 /生成新变量nprice,其值为price+10. list price nprice /比较一下两个变量的取值/*上面的命令generate(略写为gen) 生成一个新的变量,新变量的变量名为nprice,新的价格在原价格的基础上均增加了10 元。. replace nprice=nprice-10 /*命令replace 则直接改变原变量的赋值,nprice 调减后与price 变量取值相等*/. list price nprice /再比较一下两个变量,相等。2.6 条件表达式if expby varlist: command v

12、arlist =exp if exp in range weight , options例:若只想查看国产车的品牌和价格,则加入筛选条件if foreign=0 */. cd d:/stata9. use auto, clear. list make price if foreign=0*只查看价格超过1 万元的进口车(同时满足两个条件),则. list make price if foreign=1 & price10000*查看价格超过1 万元或者进口车(两个条件任满足一个). list make price if foreign=1 | price10000*分类型查看价格超过1 万元的

13、汽车的品牌和价格. by foreign, sort: list make price if price100002.7 范围筛选in rangeby varlist: command varlist =exp if exp in range weight , options如果要计算较低的前10 台车的平均价格,则要先按价格排序,然后仅对前10个车的价格求平均值. cd d:/stata9. use auto, clear. sort price. sum price in 1/5注意“1/5”中,斜杠不是除号,而是从1 到5 的意思,即1,2,3,4,5。如果要计算前10 台车中的国产车的平均价格,则可将范围和条件筛选联合使用。. sum price in 1/10 if foreign=02.8 加权weightby varlist: command varlist =exp if exp in range weight , options任务:下表是2005 年湖北省高考640 分及以上成绩一分一段的人数统计,第一列score 为高考分数,第二列num 为该分数段的人数。现在我们要求640 分及以上考生的平均分数。score num650 193649 26648 23647 16646 21645 26644 32643 23

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号