《精编》多元线性回归模型检验

上传人:tang****xu2 文档编号:133207806 上传时间:2020-05-25 格式:PPT 页数:50 大小:497.50KB
返回 下载 相关 举报
《精编》多元线性回归模型检验_第1页
第1页 / 共50页
《精编》多元线性回归模型检验_第2页
第2页 / 共50页
《精编》多元线性回归模型检验_第3页
第3页 / 共50页
《精编》多元线性回归模型检验_第4页
第4页 / 共50页
《精编》多元线性回归模型检验_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《《精编》多元线性回归模型检验》由会员分享,可在线阅读,更多相关《《精编》多元线性回归模型检验(50页珍藏版)》请在金锄头文库上搜索。

1、第四章多元线性回归模型检验 拟合优度检验方程的显著性检验 总参数的F检验 变量的显著性检验 单参数的t检验 构造置信区间 3 2拟合优度检验 可决系数与调整的可决系数 由于 0 所以有 有意思的是 条件 模型必须有截距项 2 可决系数 3 调整的可决系数 在样本容量一定的情况下 增加解释变量必定使得自由度减少 所以调整的思路是 将残差平方和与总离差平方和分别除以各自的自由度 以剔除变量个数对拟合优度的影响 其中 n k为残差平方和的自由度 n 1为总体平方和的自由度 一 方程的显著性检验 F检验 方程的显著性检验 旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断 3

2、3统计推断 F检验的思想来自于总离差平方和的分解式 TSS ESS RSS 如果这个比值较大 则X的联合体对Y的解释程度高 可认为总体存在线性关系 反之总体上可能不存在线性关系 因此 可通过该比值的大小对总体线性关系进行推断 根据数理统计学中的知识 在原假设H0成立的条件下 统计量 2 检验统计量 p值检验法 为了方便起见 将F统计量的值记为F0计算p P F F0 称为p值 p value 如果p 则p 2 2 F0落入不能拒绝域 不能拒绝H0 如果p 落入拒绝域 应拒绝H0 准则 当P值小于显著性水平时 方程在给定显著性水平下是显著的当P值大于显著性水平时 方程在给定显著性水平下是不显著的

3、 3 关于拟合优度检验与方程显著性检验的关系 二 变量的显著性检验 t检验 2 检验统计量 2 t检验统计量 P值检验法 p valuetest p值的概念 为了方便 将t统计量的值记为计算p P t t0 称为p值 p value 通常的计量经济学软件都可自动计算出p值 如果p 则p 2 2 t0落入拒绝域 应拒绝H0 当P值小于等于给定显著性水平时 所研究的解释变量对被解释变量的影响在该显著性水平下是显著的 当P值大于给定显著性水平时 所研究的解释变量对被解释变量的影响在该显著性水平下是显著的 4 两类错误 H0真H0伪不拒H0对取伪 拒H0拒真 对 拒真 把不应该引入的变量引入模型 导致

4、多列无关变量 造成虽然参数估计值是无偏 但标准差会大 若不想犯第一类错误 则显著水平需要定得小点 取伪 把不该引入的变量引入模型遗漏变量造成参数估计量有偏 三 参数的置信区间 2 的置信区间 对称区间 中心是bk 半径是 如何才能缩小置信区间 增大样本容量n 因为在同样的样本容量下 n越大 t分布表中的临界值越小 同时 增大样本容量 还可使样本参数估计量的标准差减小 提高模型的拟合优度 因为样本参数估计量的标准差与残差平方和呈正比 模型优度越高 残差平方和应越小 提高样本观测值的分散度 一般情况下 样本观测值越分散 的分母的的值越大 致使区间缩小 F值 R2 P值 调整的R2 T值 p值 置信

5、区间 系数 回归平方和 残差平方和 总平方和 标准差 Stata操作 命令行格式 最常用的方法use d data auto dta clear 打开数据库 regressyx1x2x3菜单格式 Stata8以后开始有菜单选择菜单进行操作后 在命令栏里可以看到命令行格式是如何写的 Stata操作 Stata的主要功能 数据管理 datamanagement统计功能 statistics作图功能 graphics矩阵运算 matrix程序设计 programming 数据管理 作图功能 统计功能 数据管理 数据读取编辑数据产生或改变变量 gen egen 保存数据库数据集的重新组织 reshap

6、e合并和添加数据 merge append Logusinge panelLogclose Tabulatet gen tdummy xi regcyi t 常见数据格式 Stata格式 dta文本格式 txtExcel格式 xls其它格式 sas spss gauss等 读取数据 用use命令调入数据 dta格式数据use d stata data auto dta clearExcel格式数据的读取直接拷贝 粘贴到stata中使用Stattransfer把其它格式的数据转成stata格式的数据读入ASCII格式数据文件 比较麻烦 产生或改变变量 genreplaceegen 对gen的扩展

7、 与一些函数结合使用 如mean count min max等 产生虚拟变量tabulatevid gen vdumy Xi regyx1x2i vid变量的命名 性别 gender1 female 0 male不好female1 female 0 male 产生变量 bysorthhid genorder nbysorthhid gennumber N n 是产生排序的数列 N 产生总数 给数据或变量加注释 Labeldata Investment cfliu2006 labelvariablev1 county labeldefine与labelvalues是一起使用的 而labelvar

8、iable是单独使用的 另外 比如有个变量gender的值为0和1 1表示male0表示female 你如果用tablegenderx1 会发现是按照01来显示分类的 你如果用了 labeldefinegendervalue0female1male labelvaluesgendergendervalue在执行tablegenderx1 则是按照female和male来分类的 但gender还是原来的变量类型 如原来是数值型 现在还是 虽然listsex显示为femalemale 但仍然可以按照0或1来操作 数据集的重新组织 reshapecollapse collapse mean c by

9、 t Thelong longform Thewide yearlong sexform Thewide wideform Thelong yearwide sexform Reshape命令详细解释 包括矩阵转置等 Reshape命令 Fromlong longformtolong wideformreshapewide inc i hidyear j sex string Fromlong wideformtolong longformreshapelong inc i hidyear j sex string Fromlong longformtowide longformreshape

10、wideinc i hidsex j year Fromwide longformtolong longformreshapelonginc i hidsex j year Fromlong wideformtowide wideformreshapewidemincfinc i hid j year Fromwide wideformtolong wideformreshapelongmincfinc i hid j year Fromwide longformtowide wideformreshapewide inc90 inc91 i hid j sex string Fromwide

11、 wideformtowide longformreshapelong inc90 inc92 i hid j sex string 如果变量为字符型 如sex的值为f和m 要把inc变量生成finc和minc 则需要用 outregusingtable1 coefastrpbdec 2 3asterreplace outregusingtable1 sebdec 2 3asterreplace Collapse命令 产生新的数据集collapse 统计量 变量 by 变量 collapse mean price by foreign collapse mean mprice price su

12、m sprice price by foreign tableforeign c meanpricesumprice replace 统计功能 描述统计交叉表格估计 描述统计 Sumx 如不指定x 会把库里所有变量都统计出来 Histogramx normal 作图 twoway histogramc title 消费分析 xlabel 1000 500 6000 bfcolor gs5 scattercytwoway scattercy qfitcy twoway scattercy lfitcy 表格 Table可以作四维表格tableforeign c npricemeanpricesd

13、pricemaxpriceminprice rowtableyearregiongender c meanpricesdpricemaxpriceminprice by agegroup rowTabulatetabulatevid gen vidumy tabulatevidgender tableyearif vcode vcode n 1 vcode vcode n 1 vcow 0 c nvcode do文件的编写 编写do文件的作用记录你的操作过程减少命令的输入do文件的编写Stata中的dofile编辑器其它的软件 Textpad 作图 twoway histogramc titl

14、e 消费分析 xlabel 1000 500 6000 bfcolor gs5 scattercytwoway scattercy qfitcy twoway scattercy lfitcy 其它一些常用命令 cleardropkeepsumdeslistIf条件bysort变量outregreturnlistereturnlist Outreg生成像杂志那样的表格 Outregusing文件名 coefastrpbdec 2 3asterreplaceOutregusing文件名 coefastrse3asterappendbdec 2 留两位数Coefastr 给系数加星号P 系数下面标

15、P值Se 系数下面标标准误差3aster 加3个星号 1 5 10 ereturn used stata data auto dta clearregmpgpriceforeignereturnlist 产生滞后变量 genxlag x n 1 bysortcode genxlag x n 1 滞后1期 滞后2期 genxlag2 x n 2 bysortcode genxlag2 x n 2 发现重复的ID号和变量 sortidlistifid id n 1 bysortidscorex1x2y1y2 genn NListifn 1Duplicatesreport variablename Duplicateslist variablename Countifid id n 1 检查缺失值 nmissing变量ifnpresent变量ifnpresentx1x2ify 调用数据库程序讲解 E panel

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号