stata初级入门2数据篇

上传人:汽*** 文档编号:568632946 上传时间:2024-07-25 格式:PPT 页数:32 大小:909KB
返回 下载 相关 举报
stata初级入门2数据篇_第1页
第1页 / 共32页
stata初级入门2数据篇_第2页
第2页 / 共32页
stata初级入门2数据篇_第3页
第3页 / 共32页
stata初级入门2数据篇_第4页
第4页 / 共32页
stata初级入门2数据篇_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《stata初级入门2数据篇》由会员分享,可在线阅读,更多相关《stata初级入门2数据篇(32页珍藏版)》请在金锄头文库上搜索。

1、Stata 入门入门2数据篇数据篇25 七月 2024计量经济学软件应用课程讲义1一、数据录入一、数据录入l直接录入l打开dta数据文件l导入其它格式的数据文件l其它方式25 七月 2024计量经济学软件应用课程讲义21直接录入直接录入l(1)直接在stata中录入(适用于小样本少变量数据):打开程序,调用数据编辑窗口,直接录入数据,如excel中操作。l调用数据窗口方式:(a)在command窗口中输入edit命令;(b)点工具栏上的 l(2)在excel中录入后,直接复制到stata数据编辑窗口中。l(3)键盘直接输入:在command窗口,用input命令。划线部分输入. drop _a

2、ll. input x y x y 1. 1 2 2. 3 4 3. 5 6 4. 7 8 5. 9 10 6. end 25 七月 2024计量经济学软件应用课程讲义32.数据文件的读取数据文件的读取l(1)Stata数据文件,后缀.dtal直接双击l菜单操作:在工具栏上直接点击 或File Open:25 七月 2024计量经济学软件应用课程讲义4use 命令命令l语法格式:luse filename , clear nolabel,读取整个数据文件luse varlist if in using filename , clear nolabel,从数据文件中仅读取几个变量l范例:luse

3、 C:Program Files (x86)Stata12auto.dta, clearluse C:Program Files (x86)Stata12auto.dta, clear nolabelluse make price using C:Program Files (x86)Stata12auto.dta, clear (2)其它格式的数据文件)其它格式的数据文件lExcel数据:*.xls, *xlsx。这是stata12新增的功能。l用spreadsheet建立的ASCII(txt)数据:*.raw, *.txt, *.csv,用insheet命令。l固定列宽的ASCII(txt

4、)数据:*.dct,用infix命令l以dictionary格式建的ASCII(txt)数据:*.dct, *.raw,用infile命令。l无格式的ASCII(txt)数据: *.txt, *.raw,用infile命令。lSAS XPORT数据:*.xpt,用fdause命令。lODBC数据源:包括access数据源,*.mdb,dBase数据源,*.dbflxml数据:*.xmll菜单操作:fileimport25 七月 2024计量经济学软件应用课程讲义73.其它方式其它方式l(1)用StatTransfer 软件转换l可以用statTranser 9软件将各种格式的数据转换成dta格

5、式数据l前提是你安装了这个软件l(2)安装外挂命令程序包,如usespss.ado程序包就是一个用于读取spss生成的格式数据的程序包。l在search all中敲入搜索关键词:找到可能你需要的程序包,而后安装即可。l这个方法安装的外挂命令,不会在菜单中出现,需要你记住命令名。25 七月 2024计量经济学软件应用课程讲义8二、数据的保存或导出二、数据的保存或导出l1保存用save/save as l2导出l从file菜单中export选项下选择你想保存的格式;l用outfile,outsheet,fdasave,xmlsave命令25 七月 2024计量经济学软件应用课程讲义9三、数据操作三

6、、数据操作l变量名、标签等属性l变量属性显示和修改l变量的数据类型和长度l变量生成和变量值修改l缺失值的处理l变量的剔除和保留l数据的排序l字符变量和数值变量的相互转换25 七月 2024计量经济学软件应用课程讲义101.变量属性,如名称、标签、值标签变量属性,如名称、标签、值标签l变量名:由英文字符、数字、中文字符组成。l字母大小写表示的含义不同!l标签:对变量含义的解释l值标签:用于对分类变量值的含义进行解释l如foreign有domestic和foreign,在数据量化上,可用0代表domestic,1代表foreign。25 七月 2024计量经济学软件应用课程讲义112.变量属性的显

7、示变量属性的显示l菜单操作:菜单操作:DataDescribe Data in MemorylDescribe命令,语法格式:describe var1 var2 用于,可显示1个,或多个。l如describe foreign25 七月 2024计量经济学软件应用课程讲义123.变量属性的修改变量属性的修改l变量名更改变量名更改:rename命令,常用语法格式:rename old_var new_var,如rename income inc.l变量标签变量标签(label)的定义:label命令,语法:label var varname “#”,如label var foreign “car

8、 type”。除用于定义变量的标签外,其还可用于定义数据的标签,如label data “auto in American”l分类(或指示)变量的值标签定义分类(或指示)变量的值标签定义:亦label命令,要完成分类变量值的标签定义有两步,如把变量foreign取值为0,定义为domestic,取值为1,定义为foreign,并用origin表示该变量值标签定义结果:llabel define origin 0 “domestic” 1 “foreign”llabel values foreign origin25 七月 2024计量经济学软件应用课程讲义134.变量的数据类型和长度变量的数据

9、类型和长度l整数数值型整数数值型:l(1)byte,(2)int, (3)long。l小数数值型小数数值型:l(1)float,(2)double。l数值型数据一般定义为float型,除非你有特别定义。l字符串型字符串型:string25 七月 2024计量经济学软件应用课程讲义14数值型数据数值型数据字符型数据字符型数据数值变量和字符变量的转换数值变量和字符变量的转换lencode命令:将字符变量转换为数值变量。l格式:encode varname if in, generate(newvar) label (name) noextendl菜单: Data Create or change

10、data Other variable-transformation commands Convert variables from string to numericl范例:encode make, generate(make2)ldecode命令:将数值变量转换为字符变量l格式:decode varname if in, generate(newvar) maxlength(#)l菜单: Data Create or change data Other variable-transformation commands Convert variables from numeric to st

11、ringl范例:deocde price, genrate(price2)包括数值数据的字符转换包括数值数据的字符转换ldestring命令: 将字符变量转换为数值变量l语法:destring varlist, generate (newvarlist) | replace optionsloptions:ignore (“chars”) 删除字符变量中的非数值字符,force将非数值字符转换为缺失值ltostring命令: 将字符变量转换为数值变量l语法:tostring varlist, generate (newvarlist) | replace5.新变量生成新变量生成lgenerat

12、e/egen命令:lgen命令格式:generate type newvar=exp if inl范例:gen id=.legen命令格式:它是gen的更高级应用, egen type newvar=fcn(arguments) if in , optionsl范例:egen mmpg=mean(mpg)25 七月 2024计量经济学软件应用课程讲义18l菜单操作:lData Create or change data Create new variablelData Create or change data Create new variable (extended)6.变量值的修改变量值

13、的修改lreplace命令l格式:replace oldvar=exp if in , nopromotel范例:如replace id=17.缺失值的处理缺失值的处理l在现有的调查中,经常用88, 99,888,999,.等来表示不知道或不清楚。l在stata中如何一般用”.”来表示该变量的观测缺失值。l将变量缺失值转化为数值将变量缺失值转化为数值,用mvencode命令l格式:mvencode varlist if in, mv(#|mvc=# mvc=#. else=#) overridel 范例: mvencode rep78 if foreign = 0, mv(998)l将变量的某

14、些数值转化为缺失值将变量的某些数值转化为缺失值,用mvdecode命令l格式: mvdecode varlist if in, mv(numlist | numlist=mvc numlist=mvc.)l范例: mvdecode rep78, mv(998=. 999=.a)25 七月 2024计量经济学软件应用课程讲义21l菜单操作: lData Create or change data Other variable-transformation commands Change missing values to numeric或Change numeric values to miss

15、ing8.变量(观测值)的剔除变量(观测值)的剔除,保留保留,显示显示ldrop/keep命令:l格式:(1)变量:drop/keep varlist;(2)观测值:drop/keep if expl范例:drop pop*,drop if medage 32l菜单操作:(1)变量:Data Variables Manager;(2)观测值:Data Create or change data Keep or drop observationslClear命令llist命令:l格式:list varlist if in ,options9.数据的排序数据的排序lSort命令l语法:l升序sor

16、t varlist in ,stable。l选项stable指如果两个观测值相同,则保持其顺序不变。l降序gsort - varname - varname , generate (newvar) mfirst。l选项mfirst表示将缺失值放在前面。l菜单操作:l (1)只完成升序:Data Sort Ascending sortl(2)升、降序皆可:Data Sort Ascending and descending sortl范例:25 七月 2024计量经济学软件应用课程讲义25四、分类数据的处理四、分类数据的处理l变量:连续变量、分类变量l将连续变量转化为指示变量l如generate

17、 priceg=(price=6000)l将连续变量转化为分类变量l语法:generate newvar=recode(varname, num1,num2, num3, ., numk)l将分类变量转化为指示变量l语法:xi i.varname五、数据集的合并和附加五、数据集的合并和附加l1.数据集的合并:merge命令l语法:l(1)按指定的关键变量进行)按指定的关键变量进行1对对1匹配合并(匹配合并(One-to-one merge on specified key variables)lmerge 1:1 varlist using filename , optionsl(2)按指定的

18、关键变量进行多对一匹配合并)按指定的关键变量进行多对一匹配合并(Many-to-one merge on specified key variables)()(外部数据文件的关键变量值唯一值外部数据文件的关键变量值唯一值)lmerge m:1 varlist using filename , optionsl菜单操作:lData Combine datasets Merge two datasetsl范例:luse c:program files stata12auto1.dtalmerge 1:1 id using c:program files stata12auto2.dta25 七月

19、2024计量经济学软件应用课程讲义28l2.数据集的附加:append命令l语法: append using filename filename . , optionsl菜单操作:l Data Combine datasets Append datasetsl范例:luse c:program files stata12auto3.dtalappend using c:program files stata12auto4.dta25 七月 2024计量经济学软件应用课程讲义2925 七月 2024计量经济学软件应用课程讲义30六、虚拟变量的生成六、虚拟变量的生成lxi前缀+i.varnamel在stata中,你要想25 七月 2024计量经济学软件应用课程讲义31本讲练习本讲练习25 七月 2024计量经济学软件应用课程讲义32

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号