Stata软件之回归分析模板课件

上传人:cn****1 文档编号:587665434 上传时间:2024-09-06 格式:PPT 页数:39 大小:356KB
返回 下载 相关 举报
Stata软件之回归分析模板课件_第1页
第1页 / 共39页
Stata软件之回归分析模板课件_第2页
第2页 / 共39页
Stata软件之回归分析模板课件_第3页
第3页 / 共39页
Stata软件之回归分析模板课件_第4页
第4页 / 共39页
Stata软件之回归分析模板课件_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《Stata软件之回归分析模板课件》由会员分享,可在线阅读,更多相关《Stata软件之回归分析模板课件(39页珍藏版)》请在金锄头文库上搜索。

1、计量经济软件应用计量经济软件应用Stata软件实验之一元、软件实验之一元、多元回归分析多元回归分析内容概要内容概要一、实验目的一、实验目的二、简单回归分析的二、简单回归分析的Stata基本命令基本命令三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例四、多元回归分析的四、多元回归分析的Stata基本命令基本命令五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例一、实验目的:一、实验目的: 掌握运用掌握运用Stata软件进行简单回归分析以及软件进行简单回归分析以及多元回归分析的操作方法和步骤,并能看懂多元回归分析的操作方法和步骤,并能看懂Stata软件运行

2、结果。软件运行结果。 二、简单回归分析的二、简单回归分析的Stata基本命令基本命令u简单线性回归模型简单线性回归模型 ( simple linear regression model ) 指指只有一个解释变量的回归模型。如:只有一个解释变量的回归模型。如:其中,其中,y 为被解释变量,为被解释变量,x 为解释变量,为解释变量,u 为随机误差项,为随机误差项,表示除表示除 x 之外影响之外影响 y 的因素;的因素; 称为斜率参数或斜率系称为斜率参数或斜率系数,数, 称为截距参数或截距系数,也称为截距项或常数项。称为截距参数或截距系数,也称为截距项或常数项。简单线性回归模型的一种特殊情况:简单线

3、性回归模型的一种特殊情况:即假定截距系数即假定截距系数 时,该模型被称为过原点回归;过时,该模型被称为过原点回归;过原点回归在实际中有一定的应用,但除非有非常明确的理原点回归在实际中有一定的应用,但除非有非常明确的理论分析表明论分析表明 ,否则不宜轻易使用过原点回归模型。,否则不宜轻易使用过原点回归模型。二、简单回归分析的二、简单回归分析的Stata基本命令基本命令regress y x 以以 y 为被解释变量,为被解释变量,x 为解释变量进行普通最小二乘为解释变量进行普通最小二乘(OLS)回归。回归。regress命令可简写为横线上方的三个字命令可简写为横线上方的三个字母母reg。regre

4、ss y x, noconstanty 对对 x 的回归,不包含截距项的回归,不包含截距项 (constant),即过原点回归。,即过原点回归。predict z 根据最近的回归生成一个新变量根据最近的回归生成一个新变量 z,其值等于每一个观测,其值等于每一个观测的拟合值(即的拟合值(即 )。)。predict u, residual根据最近的回归生成一个根据最近的回归生成一个新变量新变量 u,其值等于每一个观测,其值等于每一个观测的残差(即的残差(即 )。)。三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例实验实验 1 简单回归分析:教育对工资的影响简单回归分析:教育对

5、工资的影响 劳动经济学中经常讨论的一个问题是劳动者工资的决定。不劳动经济学中经常讨论的一个问题是劳动者工资的决定。不难想象,决定工资的因素有很多,例如能力、性别、工作经验、难想象,决定工资的因素有很多,例如能力、性别、工作经验、教育水平、行业、职业等。在这里仅考虑其中一种因素:教育教育水平、行业、职业等。在这里仅考虑其中一种因素:教育水平,建立如下计量模型:水平,建立如下计量模型:其中,其中,wage 为被解释变量,表示小时工资,单位为元;为被解释变量,表示小时工资,单位为元;edu为解释变量,表示受教育年限,即个人接受教育的年数,单为解释变量,表示受教育年限,即个人接受教育的年数,单位为年;

6、位为年;u为随机误差项。假定模型为随机误差项。假定模型(3.1)满足简单回归模型的满足简单回归模型的全部全部5条基本假定,这样条基本假定,这样 的的OLS估计量估计量 将是最佳线性将是最佳线性无偏估计量。请根据无偏估计量。请根据表表S-2中给出的数据采用中给出的数据采用Stata软件完成上软件完成上述模型的估计等工作。述模型的估计等工作。三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例1、打开数据文件。、打开数据文件。直接双击直接双击“工资方程工资方程1.dta”文件;或者点文件;或者点击击Stata窗口工具栏最左侧的窗口工具栏最左侧的Open键,然后选择键,然后选择“工

7、资方程工资方程1.dta”即可;或者先复制即可;或者先复制Excel表表S-2中的数据,再点击中的数据,再点击Stata窗口工具栏右起第窗口工具栏右起第4个个Data Editor键,将数据粘贴到打开的键,将数据粘贴到打开的数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左起第二个起第二个Save键保存数据,保存时需要给数据文件命名。键保存数据,保存时需要给数据文件命名。2、给出数据的简要描述。、给出数据的简要描述。使用使用describe命令,简写为:命令,简写为:des 得到以下运行结果;得到以下运行结果;三、简单回归分析的三、简单回归

8、分析的Stata软件操作实例软件操作实例结果显示结果显示“工资方程工资方程1.dta”数据文件包含数据文件包含1225个样本和个样本和11个个变变量;量;11个变量的定义及说明见第个变量的定义及说明见第3列。列。三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例3、变量的描述性统计分析。、变量的描述性统计分析。对于定量变量,使用对于定量变量,使用summarize命令:命令:su age edu exp expsq wage lnwage,得到以下运行结得到以下运行结果,保存该运行结果;果,保存该运行结果;第第1列:变量名;列:变量名; 第第2列:观测数;列:观测数;第第3

9、列:均值;列:均值; 第第4列:标准差;列:标准差;第第5列:最小值;列:最小值; 第第6列:最大值。列:最大值。三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例4、wage对对edu的的OLS回归。回归。使用使用regress命令:命令:reg wage edu,得到以下运行结果,保存该运行结果;得到以下运行结果,保存该运行结果;(1) 表下方区域为基本的回归结果。第表下方区域为基本的回归结果。第1列依次为被解释变量列依次为被解释变量wage,解释,解释变量变量edu,截距项,截距项constant;第;第2列回归系数的列回归系数的OLS估计值;第估计值;第3列回归系列

10、回归系数的标准误;第数的标准误;第4列回归系数的列回归系数的 t 统计量值;统计量值;写出样本回归方程为:写出样本回归方程为:即如果受教育年限增加即如果受教育年限增加1年,平均来说小时工资会增加年,平均来说小时工资会增加0.39元。元。三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例(2) 表左上方区域为方差分析表。第表左上方区域为方差分析表。第2列从上到下依次为回归平方和列从上到下依次为回归平方和(SSE)、残差平方和残差平方和(SSR)和总离差平方和和总离差平方和(SST);第;第3列为自由度,分别为列为自由度,分别为k=1,n-k-1=1225-1-1=1223,n

11、-1=1225-1=1224;第第4列为均方和列为均方和(MSS),由各项,由各项平方和除以相应的自由度得到。平方和除以相应的自由度得到。(3) 表右上方区域给出了样本数表右上方区域给出了样本数(Number of obs)、判定系数、判定系数(R-squared)、调整的判定系数调整的判定系数(Adj R-squared)、F统计量的值、回归方程标准误或均方统计量的值、回归方程标准误或均方根误根误(Root MSE, 或或 S.E.) 以及其他一些统计量的信息。以及其他一些统计量的信息。u上述回归分析的菜单操作实现:上述回归分析的菜单操作实现:StatisticsLinear models

12、and relatedLinear regression弹出对话框,在弹出对话框,在Dependent Variable选项框中选择或键选项框中选择或键入入wage,在,在Independent Variables选项框中选择或键入选项框中选择或键入edu点击点击OK即可即可三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例5、生成新变量、生成新变量 z 为上一个回归的拟合值,生成新变量为上一个回归的拟合值,生成新变量 u 为为上一个回归的残差;上一个回归的残差;然后根据然后根据 u 对数据进行从小到大的排对数据进行从小到大的排序,并列出序,并列出 u 最小的最小的5个观测

13、。个观测。命令如下:命令如下:predict z (生成拟合值生成拟合值)predict u, residual ( 生成残差生成残差 )sort u (根据根据 u 对数据从小到大排序对数据从小到大排序)list wage z u in 1/5 (列出列出 u 最小的最小的5个观测值以及对应的实个观测值以及对应的实际样本观测值和拟合值际样本观测值和拟合值)即对于观测即对于观测 1,小时工资的实际观测值,小时工资的实际观测值(wage)为为2.46,拟合值,拟合值(z)为为9.10,残差,残差(u)为为-6.64。三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例6、画出以

14、、画出以wage为纵轴,以为纵轴,以edu为横轴的散点图,并加入样本为横轴的散点图,并加入样本回归线。回归线。命令如下:命令如下:graph twoway lfit wage edu | scatter wage edu得到以下运行结果,保存该运行结果;得到以下运行结果,保存该运行结果;三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例7、wage对对edu的的OLS回归,只使用年龄小于或等于回归,只使用年龄小于或等于30岁的样岁的样本。本。命令如下:命令如下:reg wage edu if age=30得到以下运行结果,保存该运行结果;得到以下运行结果,保存该运行结果;写

15、出样本回归方程为:写出样本回归方程为:对于年龄在对于年龄在30岁及以下的劳动者,增加岁及以下的劳动者,增加 1 年受教育年限使得工资会年受教育年限使得工资会增加增加0.41元,略高于针对全体样本的估计值。元,略高于针对全体样本的估计值。三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例8、 wage对对edu的的OLS回归,不包含截距项,即过原点回归。回归,不包含截距项,即过原点回归。命令如下:命令如下:reg wage edu, noconstant得到以下运行结果,保存该运行结果;得到以下运行结果,保存该运行结果;三、简单回归分析的三、简单回归分析的Stata软件操作实

16、例软件操作实例9、取半对数模型。、取半对数模型。模型模型 (3.1) 假定增加假定增加 1 年受教育年限带来年受教育年限带来相同数量的工资增长;但美国经济学家明瑟相同数量的工资增长;但美国经济学家明瑟(J. Mincer)等人等人的研究表明,的研究表明,更合理的情况是增加更合理的情况是增加 1 年受教育年限导致相同年受教育年限导致相同百分比的工资增长百分比的工资增长。这就需要使用。这就需要使用半对数模型半对数模型(对数对数-水平模水平模型型),即:,即:其中其中lnwage是小时工资的自然对数;是小时工资的自然对数;斜率系数的经济含义是:斜率系数的经济含义是:增加增加 1 年受教育年限导致收入

17、增长年受教育年限导致收入增长 ,该百分比值一,该百分比值一般称为般称为教育收益率或教育回报率教育收益率或教育回报率(the rate of return to education)u做做lnwage对对edu的回归,命令如下:的回归,命令如下:reg lnwage edu 得到以下运行结果,保存该运行结果得到以下运行结果,保存该运行结果(见下页见下页);三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例写出样本回归方程为:写出样本回归方程为:结果表明结果表明教育收益率教育收益率的估计值为的估计值为5.03%,即平均而言,增加,即平均而言,增加 1 年受教育年限使得工资增长年

18、受教育年限使得工资增长5.03% 。三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例10、最后可建立、最后可建立 do 文件把前面所执行过的命令保存下来。文件把前面所执行过的命令保存下来。在在do文件的编辑窗口中(点击文件的编辑窗口中(点击Stata窗口工具栏右起第窗口工具栏右起第5个个New Do-file Editor键即打开键即打开Stata的的do文件编辑窗口)键入如文件编辑窗口)键入如下命令和注释,并保存为下命令和注释,并保存为“工资方程工资方程1.do”文件。该文件的内文件。该文件的内容为:容为:use “D:讲课资料周蓓的上课资料数据【重要】【计量经济学软件

19、应用课件】10649289stata10工资方程1.dta“, clear/打开数据文件des/数据的简要描述su age edu exp expsq wage lnwage/定量变量的描述性统计reg wage edu/简单线性模型的OLS估计graph twoway lfit wage edu | scatter wage edu/作图reg wage edu if age=30/只使用年龄小于或等于30岁的样本进行OLS估计reg wage edu, noconstant/过原点回归reg lnwage edu/对数-水平模型三、简单回归分析的三、简单回归分析的Stata软件操作实例软件

20、操作实例实验实验 2 简单回归分析:学校投入对学生成绩的影响简单回归分析:学校投入对学生成绩的影响 表表S-3记录了一些学校某个年份高一学生的平均成绩及有记录了一些学校某个年份高一学生的平均成绩及有关学校的其他一些信息。本实验主要考察关学校的其他一些信息。本实验主要考察学校的生均支出学校的生均支出 (expend) 对对学生数学平均成绩学生数学平均成绩 (math) 的影响;的影响;生均支出代表生均支出代表了学校的经费投入水平了学校的经费投入水平,从理论上说,在其他条件不变的情,从理论上说,在其他条件不变的情况下,学生在生均支出越高的学校中能够获得更好的教学资况下,学生在生均支出越高的学校中能

21、够获得更好的教学资源源(包括更优秀的师资、更好的硬件设备等包括更优秀的师资、更好的硬件设备等),从而学习成绩,从而学习成绩也应该越高。请根据也应该越高。请根据表表S-3中给出的数据采用中给出的数据采用Stata软件完成软件完成相关模型的估计等工作。相关模型的估计等工作。1、打开数据文件。、打开数据文件。双击双击“学校投入与学生成绩学校投入与学生成绩.dta”文件,或文件,或点点击击Stata窗口工具栏窗口工具栏Open键选择键选择“学校投入与学生成绩学校投入与学生成绩.dta”即可;即可;或复制或复制Excel表表S-3中的数据后点击中的数据后点击Stata窗口工具栏窗口工具栏Data Edi

22、tor键,将数据粘贴到数据编辑窗口中,关闭该窗口,点击工具栏键,将数据粘贴到数据编辑窗口中,关闭该窗口,点击工具栏Save键保存数据,保存时要给数据文件命名。键保存数据,保存时要给数据文件命名。三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例2、假定生均支出、假定生均支出 (expend) 与影响学生数学成绩的其他因素与影响学生数学成绩的其他因素不相关,建立如下四个简单回归模型:不相关,建立如下四个简单回归模型:水平水平-水平模型:水平模型:水平水平-对数模型:对数模型:对数对数-水平模型:水平模型:对数对数-对数模型对数模型(常弹性模型常弹性模型):u水平水平-水平模型

23、的命令及运行结果如下:水平模型的命令及运行结果如下:reg math expend估计结果表明:学校生均支出增加估计结果表明:学校生均支出增加1千元,使得学生数学平均成绩千元,使得学生数学平均成绩将提高将提高2.46分;分;三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例u水平水平-对数模型的命令及运行结果如下:对数模型的命令及运行结果如下:reg math lnexpend估计结果:估计结果:即学校生均支出增加即学校生均支出增加1%,使得学生数学平均成绩将提高,使得学生数学平均成绩将提高0.11分;分;三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实

24、例u对数对数-水平模型的命令及运行结果如下:水平模型的命令及运行结果如下:reg lnmath expend估计结果:估计结果:即学校生均支出增加即学校生均支出增加1千元,使得学生数学平均成绩将提高千元,使得学生数学平均成绩将提高7%;三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例u对数对数-对数模型的命令及运行结果如下:对数模型的命令及运行结果如下:reg lnmath lnexpend估计结果:估计结果:即学校生均支出增加即学校生均支出增加1%,使得学生数学平均成绩将提高,使得学生数学平均成绩将提高0.32%;四、多元回归分析的四、多元回归分析的Stata基本命令基

25、本命令u对于多元线性回归模型:对于多元线性回归模型:regress y x1 x2xk 以以 y 为被解释变量,为被解释变量, x1, x2,xk 为解释变量进行普通最为解释变量进行普通最小二乘小二乘(OLS)回归。回归。regress命令可简写为命令可简写为reg;regress y x1 x2xk, noconstanty对对x1, x2,xk的回归,不包含截距项,即过原点回归;的回归,不包含截距项,即过原点回归;test x1 x2 x3根据最近的回归进行根据最近的回归进行 F 检验,原假设为:检验,原假设为: test 根据最近的回归进行根据最近的回归进行F检验,原假设为:检验,原假设

26、为:五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例实验实验 1 多元回归分析:工资方程多元回归分析:工资方程 利用数据文件利用数据文件“工资方程工资方程1.dta”建立工资方程考察影响小时建立工资方程考察影响小时工资工资(wage)的因素,重点关注受教育年限的因素,重点关注受教育年限(edu)的系数,即教的系数,即教育收益率育收益率(即对数即对数-水平模型的斜率系数水平模型的斜率系数)。1、打开数据文件。、打开数据文件。直接双击直接双击“工资方程工资方程1.dta”文件;或者点文件;或者点击击Stata窗口工具栏最左侧的窗口工具栏最左侧的Open键,然后选择键,然后选择

27、“工资方程工资方程1.dta”即可;即可;2、简单回归分析。、简单回归分析。首先建立简单回归模型首先建立简单回归模型(对数对数-水平模型水平模型):命令及运行结果如下:命令及运行结果如下:reg lnwage edu五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例回归结果表明:如果不考虑其他因素的影响,回归结果表明:如果不考虑其他因素的影响,教育收益率教育收益率的估计值为的估计值为5.03%,即平均而言,增加,即平均而言,增加 1年受教育年限使年受教育年限使得工资增长得工资增长5.03% 。五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例3、多元回归

28、分析。、多元回归分析。除了除了受教育年限受教育年限 (edu) 之外,之外,工作经验工作经验(exp) 也是影响也是影响小时工资小时工资 (wage) 的重要因素。从理论上分的重要因素。从理论上分析,其他条件不变,工作经验越长表明劳动者的工作经验越析,其他条件不变,工作经验越长表明劳动者的工作经验越丰富,劳动生产率也越高,从而工资水平较高。如果丰富,劳动生产率也越高,从而工资水平较高。如果工作经工作经验验(exp)与与受教育年限受教育年限(edu)不相关或相关程度很低,那么在工不相关或相关程度很低,那么在工资方程中是否加入工作经验资方程中是否加入工作经验(exp)对对教育收益率教育收益率的估计

29、几乎没的估计几乎没有影响;但如果有影响;但如果工作经验工作经验(exp)与与受教育年限受教育年限(edu)显著相关,显著相关,那么在工资方程中不加入工作经验那么在工资方程中不加入工作经验(exp)会使得会使得教育收益率教育收益率的的估计有偏误。为此,需要首先考察样本中估计有偏误。为此,需要首先考察样本中工作经验工作经验(exp)与与受受教育年限教育年限(edu)是否显著相关,方法是计算二者之间的样本相是否显著相关,方法是计算二者之间的样本相关系数并进行显著性检验,使用的命令如下:关系数并进行显著性检验,使用的命令如下:pwcorr edu exp, sig (pwcorr求样本相关系数命令,选

30、项求样本相关系数命令,选项sig表示列出原假设表示列出原假设H0为相关为相关系数等于系数等于0的假设检验的精确显著性水平,即统计量的相伴概率值的假设检验的精确显著性水平,即统计量的相伴概率值) 五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例得到以下运行结果:得到以下运行结果:可见,可见,edu与与exp的样本相关系数为的样本相关系数为-0.5005,显著性水平即假显著性水平即假设检验统计量的相伴概率值为设检验统计量的相伴概率值为0.0000,即拒绝相关系数等于,即拒绝相关系数等于0的原假设,的原假设,edu与与exp之间存在显著负相关之间存在显著负相关;因此,如果理;因

31、此,如果理论上论上exp对工资对工资(wage)的影响为正,那么在回归方程中遗漏了的影响为正,那么在回归方程中遗漏了exp 会使得会使得 edu 的系数估计产生负的偏误,即估计值偏低。的系数估计产生负的偏误,即估计值偏低。为此,考虑使用多元回归模型:为此,考虑使用多元回归模型:使用的命令及运行结果如下:使用的命令及运行结果如下:五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例reg lnwage edu exp(1) 表下方区域为回归分析的主要结果表下方区域为回归分析的主要结果。第。第1列分别为被解释变量列分别为被解释变量Lnwage,解释变量,解释变量edu,解释变量,

32、解释变量exp以及截距项;第以及截距项;第2列显示回列显示回归系数的归系数的OLS估计值;第估计值;第3列显示回归系数的标准误;第列显示回归系数的标准误;第4列显示列显示回归系数的回归系数的 t 统计量;第统计量;第5列显示列显示 t 检验的精确的显著性水平检验的精确的显著性水平(即即 t统计量的相伴概率统计量的相伴概率P值值);最后两列显示置信水平为;最后两列显示置信水平为95%的回归系的回归系数的置信区间。数的置信区间。五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例结果样本回归方程为:结果样本回归方程为:回归系数下方括号中所示数字从上到下依次为回归系数的标准误、回归

33、系数下方括号中所示数字从上到下依次为回归系数的标准误、t 统计量和统计量和P值;值;edu的系数和截距项在的系数和截距项在1%显著性水平上统计显显著性水平上统计显著,著,exp的系数在的系数在5%显著性水平上统计显著,显著性水平上统计显著,说明教育说明教育(edu)和工和工作经验作经验(exp)对小时工资对小时工资(wage)均有显著的正向影响均有显著的正向影响;这一结果也;这一结果也可以从回归系数的置信区间中可以看出,即两个系数的可以从回归系数的置信区间中可以看出,即两个系数的95%的置的置信区间均不包含信区间均不包含0,至少可以在,至少可以在5%显著性水平上分别拒绝这两个显著性水平上分别拒

34、绝这两个系数等于系数等于 0 的原假设。的原假设。u两个斜率系数的经济含义:如果保持工作经验两个斜率系数的经济含义:如果保持工作经验(exp)不变,受教不变,受教育年限育年限(edu)增加增加 1 年年,平均来说小时工资会增加,平均来说小时工资会增加5.67%,即即教育教育收益率为收益率为5.67%;另一方面,如果保持受教育年限;另一方面,如果保持受教育年限(edu)不变,不变,五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例工作经验工作经验(exp)增加增加1年,平均来说小时工资会增加年,平均来说小时工资会增加0.29%,即工龄的收益率为即工龄的收益率为0.29%。u前

35、面的分析指出:理论上前面的分析指出:理论上 exp 对对 lnwage 的影响为正,而的影响为正,而样本中样本中 edu 与与 exp 显著负相关,那么与上述多元回归模型相显著负相关,那么与上述多元回归模型相比,采用只包含比,采用只包含 edu 的简单回归模型就会使得的简单回归模型就会使得 edu 的系数估的系数估计值偏低。分析结果证明了这一点,简单回归模型中计值偏低。分析结果证明了这一点,简单回归模型中 edu 的的系数估计值为系数估计值为 0.0503 (5.03%),而多元回归模型中,而多元回归模型中 edu 的系的系数估计值为数估计值为0.0567 (5.67%), 后者大于前者。后者

36、大于前者。五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例(2) 表左上方区域为方差分析表。表左上方区域为方差分析表。第第2列从上到下依次为回归平方列从上到下依次为回归平方和和 (SSE)、残差平方和、残差平方和 (SSR)及总离差平方和及总离差平方和 (SST);第;第3列为自由列为自由度;第度;第4列为均方和列为均方和 (MSS),由各项平方和除以相应的自由度得到,由各项平方和除以相应的自由度得到(3) 表右上方区域。表右上方区域。样本数样本数 (Number of obs) 为为1225;回归模型总体;回归模型总体显著性检验显著性检验 F 检验的检验的 F 统计量等

37、于统计量等于45.75,其精确的显著性水平,其精确的显著性水平(即相伴概率值即相伴概率值)为为0.0000,可以拒绝所有的斜率系数都等于,可以拒绝所有的斜率系数都等于0的原的原假设,即模型总体显著成立;判定系数假设,即模型总体显著成立;判定系数(R-squared)为为0.0697,调整,调整的判定系数的判定系数(Adj R-squared)为为0.0681,略小于判定系数;均方根误,略小于判定系数;均方根误(Root MSE),也就是回归模型标准误,也就是回归模型标准误S.E.或或 为为0.51234 。五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例实验实验 2 多元

38、回归分析:学习努力程度对大学英语成绩的影响多元回归分析:学习努力程度对大学英语成绩的影响 数据文件数据文件“大学英语成绩大学英语成绩.dta”(或或表表S-4)为某高校大一学生为某高校大一学生英英语期末考试成绩及相关信息,本例关注语期末考试成绩及相关信息,本例关注学生的学习努力程度学生的学习努力程度对对期末成绩期末成绩的影响,并且用的影响,并且用学生的上课出勤率学生的上课出勤率和和完成作业的完成作业的情况情况衡量学习努力程度。建立如下模型并进行回归分析:衡量学习努力程度。建立如下模型并进行回归分析:其中其中 final 为英语期末考试成绩,为英语期末考试成绩,attend 为本学期英语课的出为

39、本学期英语课的出勤率勤率(百分数百分数),homework 为本学期英语课课后作业的完成率为本学期英语课课后作业的完成率(百分数百分数);1、打开数据文件。、打开数据文件。直接双击直接双击“大学英语成绩大学英语成绩.dta”文件;或点击文件;或点击Stata窗口工具栏最左侧的窗口工具栏最左侧的Open键,然后选择键,然后选择“大学英语成绩大学英语成绩.dta”即可;即可;2、上述模型的回归分析。、上述模型的回归分析。命令及运行结果如下:命令及运行结果如下:reg final attend homework五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例结果显示样本回归方程

40、为:结果显示样本回归方程为:attend 和和 homework的回归系数在的回归系数在10%的显著性水平上显著。在保的显著性水平上显著。在保持作业完成率持作业完成率(homework)不变的条件下,上课出勤率不变的条件下,上课出勤率(attend) 提高提高10个百分点将令其期末成绩提高个百分点将令其期末成绩提高0.80分;在保持上课出勤率分;在保持上课出勤率(attend)不变的条件下,作业完成率不变的条件下,作业完成率(homework)提高提高10个百分点将令其期末个百分点将令其期末成绩提高成绩提高0.65分;可以认为学习努力程度的确影响期末成绩。判定分;可以认为学习努力程度的确影响期

41、末成绩。判定系数系数 和调整的判定系数和调整的判定系数 仅为仅为0.02,表示表示attend 和和 homework两两个变量联合起来仅能解释个变量联合起来仅能解释 final 总变异的总变异的2%多,表明模型的总体多,表明模型的总体五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例拟合程度不高。拟合程度不高。u显然,除了学习努力程度显然,除了学习努力程度(attend和和homework)之外,学生先前的之外,学生先前的英语水平也会对期末成绩英语水平也会对期末成绩(final)起到决定性作用;而且如果先前的起到决定性作用;而且如果先前的英语水平与学习努力程度英语水平与学

42、习努力程度(attend和和homework)相关,那么遗漏了先相关,那么遗漏了先前的英语水平作为解释变量就会使得学习努力程度前的英语水平作为解释变量就会使得学习努力程度 (attend和和homework)的系数估计值产生偏误。为此,考虑使用入学考试成绩的系数估计值产生偏误。为此,考虑使用入学考试成绩(entry)衡量先前的英语水平。衡量先前的英语水平。u首先估算首先估算entry和和attend以及以及entry和和homework的样本相关系数;的样本相关系数;命令为:命令为:pwcorr entry attend homework, sig 五、多元回归分析的五、多元回归分析的Stat

43、a软件操作实例软件操作实例可以看出,可以看出,entry和和attend 以及以及 entry和和homework 都是显著负相关都是显著负相关的,因此如果理论上的,因此如果理论上 entry 对对 final的影响为正,那么遗漏了的影响为正,那么遗漏了entry的的上述二元回归模型就会使得上述二元回归模型就会使得 attend 和和 homework 的的OLS估计值偏估计值偏低;低;u因此,在上述二元回归模型的基础上加入因此,在上述二元回归模型的基础上加入 entry 作为解释变量:作为解释变量:回归分析的命令及运行结果如下:回归分析的命令及运行结果如下:reg final attend

44、homework entry五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例样本回归方程为:样本回归方程为:结果表明,加入结果表明,加入entry作为解释变量后作为解释变量后 attend 和和 homework的系数估的系数估计值变大了,而且在统计上更为显著;计值变大了,而且在统计上更为显著;entry的系数也显著为正。的系数也显著为正。模型分析结果表明,对于先前英语水平模型分析结果表明,对于先前英语水平(entry)相同的学生,相同的学生,学习学习努力程度能够对期末成绩产生显著的正向影响努力程度能够对期末成绩产生显著的正向影响。具体数值是,在。具体数值是,在其他条件相

45、同的情况下,上课出勤率其他条件相同的情况下,上课出勤率(attend)提高提高10个百分点将令个百分点将令期末成绩提高期末成绩提高1.23分,作业完成率分,作业完成率(homework)提高提高10个百分点将令个百分点将令期末成绩提高期末成绩提高0.67分。分。 另外,模型的判定系数另外,模型的判定系数 和和 为为0.17,相比原二元模型大大提,相比原二元模型大大提高,说明从拟合优度角度看,现三元模型要比原二元模型好很多。高,说明从拟合优度角度看,现三元模型要比原二元模型好很多。u对三元模型的系数进行对三元模型的系数进行F 检验。检验。三元回归显示三元回归显示 的估计值为的估计值为0.5278

46、,想进行假设检验,想进行假设检验 ; (即考察入学成绩的变即考察入学成绩的变化是否能够带来期末成绩的相同变化化是否能够带来期末成绩的相同变化),可使用如下,可使用如下 test 命令:命令:test entry=1结果显示结果显示 F 统计量为统计量为96.66,其相伴概率值为,其相伴概率值为0.0000,即可以拒绝,即可以拒绝 的原假设;的原假设;类似地,对于假设检验类似地,对于假设检验 ; ,命令及结果如下:,命令及结果如下:test entry=0.5结果结果 F 统计量的相伴概率值为统计量的相伴概率值为0.5633,不能拒绝,不能拒绝 的原假设;的原假设;test命令用于命令用于F 检验的联合检验。比如考察检验的联合检验。比如考察 是否同时为是否同时为0,即,即 ; 中至少有一个不为中至少有一个不为0;命令及结果如下:;命令及结果如下: test attend homework 结果结果 F 统计量的相伴概率值为统计量的相伴概率值为0,即拒绝,即拒绝 同时为同时为0的原假设,也的原假设,也就是说不能认为学习努力程度对期末成绩没有影响。就是说不能认为学习努力程度对期末成绩没有影响。 End

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号