Stata 简介及基本操作ppt课件

上传人:资****亨 文档编号:132735607 上传时间:2020-05-19 格式:PPT 页数:33 大小:203.50KB
返回 下载 相关 举报
Stata 简介及基本操作ppt课件_第1页
第1页 / 共33页
Stata 简介及基本操作ppt课件_第2页
第2页 / 共33页
Stata 简介及基本操作ppt课件_第3页
第3页 / 共33页
Stata 简介及基本操作ppt课件_第4页
第4页 / 共33页
Stata 简介及基本操作ppt课件_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《Stata 简介及基本操作ppt课件》由会员分享,可在线阅读,更多相关《Stata 简介及基本操作ppt课件(33页珍藏版)》请在金锄头文库上搜索。

1、 Stata简介及基本操作 一 为什么使用Stata Stata是目前在欧美最为流行的计量软件 具有操作简单 功能强大的特点 由于使用Stata的用户很多 对于最新的计量方法 常常可以下载由用户写的Stata命令程序 十分方便 而官方的Stata版本也经常更新 以适应计量经济学迅猛发展的需要 Stata11已于2009年出版 但由于在中国普遍使用的仍是Stata10 我们主要介绍Stata10 1 面临的问题研究者经常地希望利用多种方法从不同角度对数据进行分析 但拥有绝对优势的软件是不存在的 不存在哪个软件能解决所有的问题 计量经济学发展迅速 新的方法层出不穷 而软件公司将这些新方法嵌入到软件

2、中是存在滞后的 2 解决方案Stata以其操作简单 运行快速而精确 全面的数据管理功能 精致的作图 强大的统计与计量分析功能 简练标准的程序与矩阵运算功能 丰富的网络资源 在统计学 经济学 金融学 心理学 计算机科学 物理 化学等多个学科领域得到广泛使用 请浏览 3 STATA简介 发展历史 1 Stata是一个用于数据管理和分析的统计软件 由Stata公司 StataCorp 研制开发 从1985开始 先后开发了1 1 1 2 等多个版本 目前Stata的最新版本为2009年7月份推出的Stata11 0 2 Stata11包括四种版本 Small 小型版 IC 标准版 SE 特别版 和MP

3、 多处理器版 其中属MP版本最为强大 MP版与SE版的功能完全相同 但MP版的运算速度比SE版的要快很多 用户可以在命令栏输入about查看所安装的Stata所属的版本 3 不同版本对样本容量 变量个数 矩阵阶数 宏的字符长度等有着不同的限制 以SE版为例 其最大变量个数为32767 最大字符长度为244字节 最大矩阵阶数为11000 即11000 11000 Stata默认值为 最大变量个数为5000 最大矩阵阶数为400 最大内存为50兆 在Stata10中为10m 如果用户需要更多的内存或者更多的变量 可以在命令栏输入如下命令进行扩展 setmaxvar setmaxvar5000 se

4、tmaxsize setmaxsize1000 setmemory m setmemory50m 4 STATA简介 主要特点与功能统计分析与计量分析的结合 1 单元统计 描述统计 假设检验 参数 非参数 ANOVA 质量控制 统计作图 2 多元统计 MANOVA 主成分 因子分析 典型相关 聚类 判别分析 对应分析 多维标度 3 线性回归 非线性回归 工具变量回归 广义线性回归 分位数回归 稳健回归 系统方程模型 SUR 联立方程 离散选择模型 二项选择 排序选择 多项选择 条件Logit 嵌套Logit模型 二元选择模型等 计数模型 泊松回归 负二项回归 截断与归并模型 海克曼选择模型 逐

5、步回归 stepwise 等 4 时间序列分析 时间序列的平滑 相关图 ARIMAX GARCH 单位根检验 Johansen协整检验 VAR VEC 滚动回归等 5 面板数据 线性模型 工具变量回归 动态面板 分层混合效应 广义估计方程 GMM 随机边界模型等 6 调查数据分析 7 生存分析 8 蒙特卡洛模拟 自举法 bootstrap 刀切法 jackknife 丰富的网络资源 http www stata http www stata 严谨 简练 灵活的程序语言 Stata提供了严谨 简练而灵活的程序语句 用户可以编写自己的命令和函数 也可以制作自己的对话框和窗口菜单 强大的矩阵运算功能

6、 MataMata是Stata的矩阵运算语言 实现各种运算 兼容性 在Stata中可以直接运行其它程序 其他语言编写的程序可以作为插件 Plugin 直接嵌入到Stata中 二 Stata的窗口安装好Stata后 点击电脑桌面上的Stata图标 即可打开Stata 此时可以看到 在最上方有一排菜单 即 FileEditDataGraphicsStatisticsUserWindowHelp 在此之下 有四个窗口 分别为 左上 Review 历史窗口 此窗口记录着自启动Stata以来执行过的命令 左下 Variables 变量窗口 此窗口记录着目前Stata内存中的所有变量 右上 Results

7、 结果窗口 此窗口显示执行Stata命令后的输出结果 右下 Command 命令窗口 在此窗口输入想要执行的Stata命令 为了使屏幕分割更美观实用 可以用鼠标将以上窗口拉到任意大小与位置 然后点击菜单Edit Preferences GeneralPreferences Windowing Locksplitter 就可以锁定当前画面 而在以后重启Stata时自动显示这个画面设置 Stata的主界面 三 Stata操作 1 将数据导入Stata打开Stata软件后 点击Data DataEditor图标 即可打开一个类似Excel的空白表格 然后 用Excel打开文件 实验数据 xls 复制

8、文件中的相关数据 并粘贴到DataEditor中 导入数据的另一方法是 点击菜单 File Import 然后导入各种格式的数据 但这种方法有时不如直接从Excel表中粘贴数据来得方便直观 关闭DataEditor后 即会看到左下方的 Variables 窗口出现了8个变量 分别为year gdp index index1978 gov pop deflator gcons 此时 可以点击Save图标 也可以点击菜单 File Save 将数据存为Stata格式的文件 扩展名为dta 比如wanger law dta 这样 以后就可以用Stata直接打开这个数据集了 不需要再从Excel表中粘

9、贴过来 打开的方式有两种 可以点击Open图标 也可以点击菜单 File Open 然后寻找要打开的dta文件的位置 另外一种方法是在命令窗口输入以下命令 假设文件在E盘的根目录 并回车 按Enter键 useE wagner law dta clear 其中 选择项 clear 表示可以替代内存中的已有数据 如果要关闭一个数据集 如果对数据集进行了改动 别忘了先存盘Save 以便使用另外一个数据集 可以在命令窗口输入 clear这样 内存中所有的当前数据都被清空 然后可以再打开另外一个数据集 2 变量的标签在变量窗口 每个变量的 名字 Name 旁边显示了其 标签 label 但目前的标签过

10、于简略 缺乏变量的解释信息 如果想将变量 gov 的标签改为 governmentexpenditures 可进行如下操作 以鼠标的右键点击变量名 gov 然后选择 Editvariablelabel 输入 governmentexpenditures 即可 此时 再去看变量 gov 的标签 就已经改为 governmentexpenditures 另外 在右上角的结果窗口出现了以下一行命令 labelvariabletc governmentexpenditures 这表明 直接在命令窗口输入上面这行命令 也能达到一样的效果 但不如直接在变量上点击右键操作方便 注意 Stata中字母的大小写

11、是严格区分的 因此Stata建议对于变量名一律使用小写字母 3 审视数据一个数据集可能很大 而我们常希望看到数据的概貌 想看数据集中的变量名单 标签等 可以在命令窗口输入 describe 如果想给整个数据集加上一个标签 以说明这个数据集来自 WagnerLaw1978 2009 可输入命令 labeldata WagnerLaw1978 2009 如果再次使用命令 describe 就会看到数据集的标签 WagnerLaw1978 2009 如果想看变量gov gcons与gdp的具体数据 可使用命令 listgovgconsgdp 注意 如果数据较长 可用Ctrl Break终止显示 有时

12、我们想对数据集的一部分执行命令 比如只想看变量gov与gdp的前5个数据 则可输入命令 listgovgdpin1 5 也可以通过逻辑关系来定义数据集的子集 如果要列出所有满足条件 year 1995 的变量gov与gdp的数据 则可以使用以下命令 listyeargovgdpifyear 1995 其中 表示 大于等于 其他表示关系的逻辑符号为 等于 大于 小于 小于等于 或 不等于 查看具体数据的一个直接方法是 点击DataEditor图标 如果想删除满足 year 2001 条件的观测值 则可使用命令 dropifyear 2001 反之 如果只想保留满足 year 2001 条件的观测

13、值 而删去所有其他观测值 keepifyear 2001 5 考察变量的统计特征如果想看变量gov gcons和gdp的统计特征 可输入命令 summarizegovgconsgdp VariableObsMeanStd Dev MinMaxgov3214454 1319217 21122 0976299 93gcons3211441 7612730 4148044396 9gdp3280670 9194125 313645 218340506 9 满足条件的统计 summarizegovgconsgdpifyear 2000 如果不指明变量 则将显示数据集中所有变量的统计指标 summari

14、ze 如果要显示内存中某些变量之间的相关系数 可输入命令 correlategovgconspopgdp 5 画图Stata具有很强的画图功能 如果想看变量q的直方图 假定组宽为1000 可输入以下命令 histogramq width 8000 frequency 由于直方图不连续 如果想看连续的经验分布图 可使用以下命令 kdensitygov 如果要画gov与gdp之间的散点图 则可输入以下命令 scattergovgdp 如果想在散点图上同时画出回归直线 可以使用如下命令 twoway scattergovgdp lfitgovgdp 其中 lfit 表示 linearfit 线性拟合

15、 6 生成新变量如果要估计以下方程 为了估计这个方程 需要在Stata中对原变量取对数 可使用命令 generate generatelngov log gov generatelngdp log gdp reglngovlngdp 如果要生成 虚拟变量 定义为 Stata命令为 generatedum ifyear 1995 删除变量 drop变量名如 dropdum修改变量值replace变量名 表达式条件如 replacedum 0ifyear 1990 在执行Stata命令时 有时需要调用许多变量 而某些变量名可能很长 此时 如果在命令窗口一一输入变量名 可能较费事 解决方法之一是 可

16、以直接在左下角的 变量窗口 单击需要的变量 则该变量名就会显现在命令窗口 解决方法之二是 如果有以下变量lnq1 lnq2 lnq30 而只想使用其中的前15个变量 则可以用lnq1 lnq15来简略地表示这15个变量 解决方法之三是 用 号来节省变量名的书写 假设想将内存中所有以 ln 开头的变量都去掉 则可输入命令 dropln 7 Stata的计算器功能Stata也可以作为计算器来使用 只要输入命令 displayexpression 即可 比如 displaylog 2 将计算ln2 8 线性回归分析使用OLS对方程进行估计 可输入命令 reglngovlngdp 上表中的 cons 表示常数项 R squared 显示R2 0 9676 AdjR squared 显示0 9665 检验整个方程显著性的F统计量之p值 Prob F 为0 0000 显示这个回归方程是高度显著的 残差平方和为1 77 方程标准差RootMSE为0 24 如果要显示估计系数的协方差矩阵 可输入命令 vce其中 vce 表示 variancecovariancematrixestimated 在进行回

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号