统计及优化实验报告

上传人:第*** 文档编号:61735002 上传时间:2018-12-11 格式:DOC 页数:18 大小:821KB
返回 下载 相关 举报
统计及优化实验报告_第1页
第1页 / 共18页
统计及优化实验报告_第2页
第2页 / 共18页
统计及优化实验报告_第3页
第3页 / 共18页
统计及优化实验报告_第4页
第4页 / 共18页
统计及优化实验报告_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《统计及优化实验报告》由会员分享,可在线阅读,更多相关《统计及优化实验报告(18页珍藏版)》请在金锄头文库上搜索。

1、南昌大学统计与优化实验报告学院:管理学院专业:管理科学121班姓名:黄恬恬 学号:5504112028统计优化实验(一)1、 数据选择与分析为了研究税收(T)发展状况,选择国内生产总值(GDP)、财政支出(GE)为影响因素,建立计量经济模型分析因素之间的经济关系。选取下表的有关统计数据,模型如下: 税收收入等有关统计数据 单位:亿元 年份税收收入T国内生产总值GDP财政支出GE1978519.283645.21122.091979537.824062.61281.791980571.74545.61228.831981629.894891.61138.411982700.025323.4122

2、9.981983775.595962.71409.521984947.357208.11701.0219852040.7990162004.2519862090.7310275.22204.9119872140.3612058.62262.1819882390.4715042.82491.2119892727.416992.32823.7819902821.8618667.83083.5919912990.1721781.53386.6219923296.9126923.53742.219934255.335333.94642.319945126.8848197.95792.621995603

3、8.0460793.76823.7219966909.8271176.67937.5519978234.04789739233.5619989262.884402.310798.18199910682.5889677.113187.67200012581.5199214.615886.5200115301.38109655.218902.58200217636.45120332.722053.15200320017.31135822.824649.95200424165.68159878.328486.89200528778.54184937.433930.28200634804.352163

4、14.440422.73200745621.97265810.349781.35200854223.79314045.462592.66通过绘制T,GDP,GE之间的散点图,可以猜测三者之间存在线性关系,因此采用OLS方法建立线性回归模型。2、 用OLS建立多元线性回归模型 输出结果如下:回归模型为:结果可以看出,反映拟合优度的可决系数接近于1,F统计量很大,但常数C与GDP均未能通过回归系数t检验,说明原模型是有问题的模型。模型中参数表明国内生产总值(GDP)每增加1000亿元,税收收入将增加1亿元;财政支出每增加1000亿元,税收收入将增加867亿元。从财政支出对于税收收入的影响看,参数值

5、偏大,可能与模型的设定及其它违背假设的问题有关,问题所在将之后讨论。三、模型预测预测包括点预测和区间预测,点预测就是在回归模型的基础上,根据解释变量的预期水平推测被解释变量的预期值,简单说就是将解释变量的预期水平代入回归模型,计算出被解释变量的预期值。年份税收收入T国内生产总值GDP财政支出GE200959521.59340506.976299.93在工作文件(Workfile)窗口中双击被解释变量预测值的序列名,弹出预测值的对话框,在其对应位置可确定被解释变量的预期值。TF=66201.42,T=59522,可以看出在一定水平上,模型是可信的。四、多重共线性检验1、对多重共线性的理解(1)多

6、重共线性是一个程度问题而不是一个存在与否的问题(2)除了对于存在一个较大的,并因此导致较大的,进而导致变大以外;一个很小的也可能导致一个较大的,因此小的样本容量也能导致大的抽样方差。(3)即使存在一个较大的和,检验也不一定不显著,毕竟,因此对多重共线性的判断要格外小心。(4)多重共线性是否一定要消除值得考虑。2、 根据经验,多重共线性产生的经济背景和原因有以下几个方面: 1经济变量之间往往存在同方向的变化趋势 2经济变量之间往往存在着密切的关联度 3在模型中引入滞后变量也容易产生多重共线性 4在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性3、多重共线性检验如图从检验及其伴随概率来

7、看,只有变量GE较为显著,GDP解释变量不显著;但方程拟和优度为0.997、同时方程整体的检验很显著。因此可以怀疑在变量GDP和GE之间存在多重共线性。因此查看GDP与GE的简单相关系数,通过eviews可得:从图可以看出,解释变量GE,GDP之间的简单相关系数很大,因此解释变量之间相关程度较高。4、解决方案(1)从模型中删除不必要的自变量 删除变量要谨慎,否则可能导致模型产生偏误。(参见计量经济学导论现代观点:J.M.伍德里奇,中国人民大学出版社,2003,95页) (2)用变量比例替代原变量(3)改变模型形式(4)增大样本容量(5)获取新数据我认为本题造成该多重共线性的原因在于:财政支出与

8、税收收入之间并没有一次线性相关性。因此解决这一多重共线性的方法在于将解释变量GE删除,再对T、GDP进行线性回归,输出结果如图所示。通过对输出结果的考察,发现多重共线性已经消除。模型变化为:五、异方差性检验1、 异方差问题是指随着解释变量的变化,被解释变量的方差存在明显的变化趋势。这也是经济与管理领域中经常出现的问题。他违反了高斯-马尔科夫定理的条件,从而使OLS估计值不再具有最优的性质。2、 异方差问题出现时的后果回归参数的估计值仍然是无偏的,但是不再具有最小方差,所以不再有效,由于不满足关于OLS的高斯-马尔科夫定理,所以结论也不成立。3、 异方差判断(1) X-Y散点图判断从图中不能观察

9、出是否有明显的散点扩大,缩小或复杂型趋势。(2) White检验输出结果图为:图的上半部分报告的为White检验的F检验值及其相伴概率和LM统计量 LM统计量(Lagrange Multiplier statistic):拉格朗日乘数统计量,又称得分统计量(score statistic),此处值为观测值个数乘以残差项对自变量回归后的值,其服从自由度为自变量个数的分布,因此有时也被称为n-R-平方统计量,该统计量类似于F检验统计量,也是检验排除性约束的。及其相伴概率,通过这两个统计量值及其相伴概率p0.05,可以不能拒绝不存在异方差的原假设。而图的下半部分提供了White检验的辅助回归的回归结

10、果,该结果的F检验统计量值与上半部分报告的一样p0.05。因此残差不具有异方差性。6、 自相关检验自相关问题是指伴随不同期的样品值之间,存在相关关系这也是经济与管理领域中经常出现的问题。他违反了高斯-马尔科夫定理的条件,从而使OLS估计值不再具有最优的性质。1、引起自相关的原因(1) 变量本来就前后期相关(2) 漏掉变量,被包含在随机扰动项中,由此引起了序列相关(3) 系统观察误差(4) 灾害的影响是多年的2、 检验异方差软件输出:接下来点击方程窗口左上角【View】【Actual,Fitted,Residual】【Actual,Fitted,Residual Graph】。屏幕显示结果如图所

11、示。残差散点图DW统计值为0.137,靠近0结合上图的分析,初步得出存在正自相关的结论。3、Durbin两步法对自相关的修正(1)在命令窗口中输入:s t c t(-1) gdp gdp(-1)(2)以,做广义差分变换,通过输入命令:ls t-0.9315*t(-1) c gdp-0.9315*gdp(-1)输出结果,如图所示。(3)再使用genr e=resid命令定义残差项,做et对et-1的回归,输出结果如图所示。自相关消除。七、正态白噪声检验(1) 正态检验EVIEWS中利用JB统计量对序列的正态性假设进行检验,如下图最后两行数据显示。其概率是原假设为正态时,原假设成立的概率。这里JB

12、=1.4599.488。所以必定肯定原假设,原假设成立,满足正态分布。(2) 白噪声检验白噪声检验是在正态性检验的基础上,利用相关图和Q统计量来进行的。该检验是对正态序列进行自相关和偏自相关函数计算,并就各滞后阶计算Q检验统计量,以确定“无此阶自相关”假设成立的概率。1、 对残差的独立性检验假设选择滞后性为162. 、对残差平方的独立性检验八、统计学检验参数的T检验(略)方程的F检验回归系数的F检验CoefficientsaModelUnstandardized CoefficientsStandardized CoefficientstSig.BStd. ErrorBeta1(Constan

13、t)-1347.213468.557-2.875.007GDP.165.004.99038.398.000a. Dependent Variable: T表中常数项和自变量“GDP”的T检验均小于0.05,即相应系数显著异于0。通过F检验。统计与优化实验(二)1、 判别对象若干专家依据测量的数据,对一组运动员的体形,生理,心里评分,依据这些分值对运动员分类,并判定。2、 采用层次聚类法对样本进行分类对个体进行聚类(cases),依据不同类之间的距离的平均值,进行类别合并(组间连接法)。1、给出了个体总数13,以及被处理的情况,所选距离和方法Case Processing Summarya,bCasesValidMissingTotalNPercentNPercentNPercent13100.00.013100.0a. Squared Euclidean Distance used b. Average Linkage (Between Groups)2、聚类过程Agglomeration ScheduleStageCluster CombinedCoefficientsStage Cluster First AppearsNext StageCluster 1Cluster 2Cluster 1Cluster 21271.000

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号