stata基本回归分析

上传人:ap****ve 文档编号:119688597 上传时间:2020-01-23 格式:PPT 页数:37 大小:710.50KB
返回 下载 相关 举报
stata基本回归分析_第1页
第1页 / 共37页
stata基本回归分析_第2页
第2页 / 共37页
stata基本回归分析_第3页
第3页 / 共37页
stata基本回归分析_第4页
第4页 / 共37页
stata基本回归分析_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《stata基本回归分析》由会员分享,可在线阅读,更多相关《stata基本回归分析(37页珍藏版)》请在金锄头文库上搜索。

1、第六章基本回归分析 主要内容 1 小样本的OLS估计与分析2 大样本的OLS估计与分析3 约束回归4 非线性最小二乘分析 实验6 1 小样本普通最小二乘分析 一 实验基本原理 二 实验内容和实验数据根据统计资料得到了美国汽车产业的横截面数据 1978年 变量主要包括 price 汽车的价格 mpg 每加仑油所行驶的英里数 weight 汽车的重量 foreign表示是否是进口车 如果foreign 0代表是国产车 如果foreign 1代表是进口车 完整的数据在本书附带光盘的data文件夹的 usaauto dta 工作文件中 利用usaauto数据 对汽车价格的影响因素进行计量分析 分析mp

2、g weight和foreign对价格的边际影响 包括进行OLS的估计 检验 预测和绘制图形等相关内容 三 实验操作指导1打开数据文件 观测数据特征 1 若要进行各种对原始数据的操作 首先必须正确地打开数据文件 在Stata中打开数据文件的方法有多种 其中较为常用的方法是通过命令直接打开或是使用菜单操作打开 我们在此使用命令方式 在命令窗口中输入如下命令 sysuseusaauto clear 2 在进行回归分析之前 可以先关注一下原始数据及其统计特征 在命令窗口中输入如下命令 edit如果想得到数据的统计特征 则需要在命令窗口中输入如下命令 describe 2利用最小二乘法进行模型的估计对

3、模型进行回归的仍然是采用命令方式进行操作 命令的基本格式如下 regressdepvar indepvar if in weight options 其中regress代表 回归 的基本命令语句 depvar代表被解释变量 或称因变量 的名称 indepvar代表解释变量 或称自变量 的名称 if代表条件语句 in代表范围语句 weight代表权重语句 options代表其他选项 表6 1的内容显示了options所代表的其他选项的具体内容 主要包括选项的命令语句及其所代表的含义 要想得到OLS的回归结果 只需本实验的模型在命令窗口中输入如下命令 regresspricempgweightfo

4、reign这个命令就表示以price作为因变量 mpg weight foreign作为自变量建立线性回归模型 运用OLS方法进行回归分析 3模型的检验基本回归分析之后 还要对模型的整体和系数进行检验 以求证其是否符合经济理论或现实情况的要求 用户可以发现刚才的回归结果中已经给出了最基本的F检验和t检验的结果 下面将介绍其他检验的相关命令 这些检验均为Wald检验 1 线性检验命令的基本格式如下 test spec spec test options 在这个命令中 test是线性检验的命令语句 而 spec 则表示线性检验的形式 主要包括以下五种 第一种检验所设定的系数都为0 命令形式如下 t

5、estcoeflist第二种检验所设定的系数表达式都为0 命令形式如下 testexp exp 第三种检验方程eqno中的变量varlist的系数都为0 命令形式如下 test eqno varlist 第四种检验不同方程中变量varlist的系数相同 命令形式如下 test eqno eqno varlist 第五种检验方程eqno中的变量varlist系数相同 命令形式如下 testparmvarlist equalequation eqno 2 如果检验为非线性检验 则需要将命令的基本格式调整如下即可 testnlexp exp exp options 这个命令中 testnl是非线性检

6、验的命令语句 而exp exp exp 表示系数之间的非线性关系式 在本实验中 如检验 weight foreign 的系数是否同时显著不为零 则需要输入如下命令 testweightforeign 也可以输入test weight 0 foreign 0 这个命令 效果相同 4模型的预测经济计量模型设定的最终目的是使其能够对社会经济生活有一定的预测功能 所以一个模型在估计和检验之后 就可以用其进行预测了 下面将着重介绍线性预测的主要内容 线性预测的基本命令格式如下 predict type newvar if in options 在这里 predict是预测的基本命令语句 newvar代表

7、将要进行预测的变量 if代表条件语句 in代表范围语句 options代表其他选项 在预测中起重要作用 表6 2显示了预测命令中options的命令语句和含义 利用本实验的数据 预测因变量和残差 price 和 e 值的具体操作步骤如下 若要得到 price 的预测值 需要输入如下命令 predictyhat xb这个命令就表示对因变量price进行线性预测 生成的变量名称为yhat 若要得到残差序列的预测值 则需要输入如下命令 predicte residual这个命令就表示对残差值进行预测 生成的变量名称为e 5基本回归图形的绘制在回归分析中 图形是十分重要的一种分析工具 其不仅具有直观的

8、视觉优势 且能包含巨大的信息量 鉴于图形的画法本书前面章节已经介绍 这里不再赘述 且多元线性回归大部分为超平面图形 所以不宜用散点图和回归线表示 所以这里仅仅介绍简单的残差图形的画法 残差对预测值标绘图提供了较为有用的诊断工具 在回归分析之后 我们就可以画出如图6 6所示的残差对预测值的标绘图了 这种图形的得到只需要在命令窗口中输入如下命令语句 rvfplot yline 0 在这个命令中 rvfplot表示自动生成残差e和因变量预测值yhat的散点图 并标识出纵轴值为零的直线 当然 图6 6也可以通过更为基本的graph命令得到 命令如下 graphtwowayscattereyhat yl

9、ine 0 这个命令的还以就是画一个两轴的散点图 一个轴是残差预测值e 一个轴是因变量预测值yhat 同时还要标出纵轴值为零的直线 实验6 2 大样本普通最小二乘分析 一 实验基本原理 二 实验内容和实验数据为了检验美国电力行业是否存在规模经济 Nerlove 1963 收集了1955年145家美国电力企业的总成本 tc 产量 q 工资率 pl 燃料价格 pf 及资本租赁价格 pk 的数据 变量名前面加ln表示取自然对数以后的数值 完整的数据在本书附带光盘的data文件夹的 nerlove dta 工作文件中 利用nerlove的数据 我们分别用大样本理论和小样本理论进行回归分析 以比较二者的

10、不同 从而使用户更加深刻地理解这两个理论 三 实验操作指导1模型的建立 2使用小样本理论进行回归首先 我们假设数据符合小样本理论严格的假设 所以可以直接运用小样本理论进行回归 使用use命令打开数据后 在命令窗口中输入回归命令如下 regresslntclnqlnpllnpklnpf这个命令的含义就是以lntc作为因变量 以lnq lnpl lnpk lnpf作为自变量建立线性回归模型 之后 我们就可以得到如图6 7所示的小样本理论下的回归结果了 3使用大样本理论进行回归大样本OLS经常采用稳健标准差估计 robust 稳健标准差是指其标准差对于模型中可能存在的异方差或自相关问题不敏感 基于稳

11、健标准差计算的稳健t统计量仍然渐进分布t分布 因此 在Stata中利用robust选项可以得到异方差稳健估计量 在本实验中 利用稳健标准差进行估计的命令如下 regresslntclnqlnpllnpklnpf robust这个命令表示是以lntc作为因变量 以lnq lnpl lnpk lnpf作为自变量建立线性回归模型 命令最后的robust命令代表使用大样本稳健标准差进行各种预测和检验 之后 我们就可以得到如图6 8所示的大样本理论下的回归结果了 4大 小样本理论结果对比从这两个结果可以看到 稳健标准差与普通标准差的估计的系数相同 但标准差和t值存在着较大的差别 尤其是lnq的标准差 在

12、现实社会的各种数据中 很少有数据能够满足小样本理论的严格假设 所以当样本数据足够大时 我们最好采用稳健标准差进行估计和检验 这样得到的结果将会更加准确 实验6 3 约束回归 一 实验基本原理 二 实验内容和实验数据本实验中 我们将利用与实验6 1相同的数据 即本书附带光盘data文件夹下的 usaauto dta 文件中的数据 来研究回归系数存在约束的情况下 价格 汽车重量等因素对每加仑汽油所行驶的路程的影响 我们将介绍如何定义约束 列出已定义的约束 取消已定义的约束 以及在定义好约束后如何进行约束回归 三 实验操作指导1约束的定义 列出和取消 1 要进行约束回归 首先应对约束进行定义 其语法

13、格式如下 constraint define n约束条件其中 constraintdefine代表 定义约束 的基本命令语句 define可以省略 n必须是位于 1 1999 的整数 用于表明这是第几个约束 2 要显示已定义的约束 可以使用如下的语句 constraintdir numlist all 或者constraintlist numlist all 其中 constraintdir或constraintlist代表 显示约束 的基本命令语句 numlist指明要显示的约束 all表示显示所有约束 当我们不指定要显示的约束为哪几个时 默认显示所有的约束条件 例如 我们想看到所有已定义的

14、约束 输入命令 constraintdir 3 要删掉某个或几个已定义的约束 则可使用以下语句 constraintdrop numlist all 2进行约束回归定义完约束之后 就可以进行约束回归了 约束回归的基本语法格式如下 cnsregdepvarindepvars if in weight constraints constraints options其中 cnsreg代表 约束回归 的基本命令语句 constraints可简写为c depvar代表被解释变量的名称 indepvar代表解释变量的名称 if代表条件语句 in代表范围语句 weight代表权重语句 options代表其他

15、选项 options中 我们可以使用异方差稳健标准差 r 或汇报其他水平的置信区间等 详见表6 3 下面 让我们通过例子来加深对命令的理解 拟合前面的约束回归 cnsregmpgpriceweightdisplgear ratioforeignlength c 1 5 命令中 cnreg代表进行约束回归 mpg是被解释变量的名称 priceweightdisplgear ratioforeignlength为各个解释变量的名称 选项c 1 5 表示在1到5个约束之下进行回归 实验6 4 非线性最小二乘 一 实验基本原理 二 实验内容和实验数据使用本书附带光盘的data文件夹的 profunc

16、dta 工作文件 我们研究劳动投入和资本投入对产量的影响 即进行一个生产函数的回归 变量包括产出的对数 lnoutput 劳动 labor 和资本 capital 三 实验操作指导1利用非线性最小二乘法进行模型的估计NLS回归的命令格式为 nl depvar if in weight options其中 depvar代表被解释变量的名称 sexp代表可替代表达式 substitutableexpression if代表条件语句 in代表范围语句 weight代表权重语句 options代表其他选项 其中 可替代表达式与普通的数学表达式基本一致 但要求将参数用大括号括起来 此外 在可替代表达式中 参数都可以被赋予初值 格式是 参数 初始值 当不赋予初值时 系统默认使用0作为初值 此外 需要注意的是 待回归模型表达式需要用小括号括起来 下面 我们来进行该CES生产函数的估计 并对其他选项进行讲解 这样 我们可以写出该nls回归的命令 该命令中的可替代表达式虽长 但实质就是把模型中所有的参数都加上大括号 并设定了几个初始值 2NLS的选项设定与结果分析 1 用选项initial 设定参数初始

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号