十章统计回归模型

上传人:hs****ma 文档编号:588286169 上传时间:2024-09-07 格式:PPT 页数:43 大小:1.13MB
返回 下载 相关 举报
十章统计回归模型_第1页
第1页 / 共43页
十章统计回归模型_第2页
第2页 / 共43页
十章统计回归模型_第3页
第3页 / 共43页
十章统计回归模型_第4页
第4页 / 共43页
十章统计回归模型_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《十章统计回归模型》由会员分享,可在线阅读,更多相关《十章统计回归模型(43页珍藏版)》请在金锄头文库上搜索。

1、第十章第十章 统计回归模型统计回归模型10.1 牙膏的销售量牙膏的销售量10.2 软件开发人员的薪金软件开发人员的薪金10.3 酶促反应酶促反应10.4 投资额与国民生产总值和投资额与国民生产总值和 物价指数物价指数龟控脯浚裁匝伪弱步铆祷总蜂窿辐厉援苗祈绦洗每蠕钳酿诺硫历绣肯势旬十章统计回归模型十章统计回归模型回归模型是用回归模型是用统计分析方法建立的最常用的一类模型统计分析方法建立的最常用的一类模型 数学建模的基本方法数学建模的基本方法机理分析机理分析测试分析测试分析通过对数据的统计分析,找出与数据拟合最好的模型通过对数据的统计分析,找出与数据拟合最好的模型 不涉及回归分析的数学原理和方法不

2、涉及回归分析的数学原理和方法 通过实例讨论如何选择不同类型的模型通过实例讨论如何选择不同类型的模型 对软件得到的结果进行分析,对模型进行改进对软件得到的结果进行分析,对模型进行改进 由于客观事物内部规律的复杂及人们认识程度的限制由于客观事物内部规律的复杂及人们认识程度的限制,无法分析实际对象内在的因果关系,建立合乎机理规无法分析实际对象内在的因果关系,建立合乎机理规律的数学模型。律的数学模型。 筑融梭礁屈均限蓖导昧坎忙逃疹来涯坷聚贷螺募忍奈动锁灸晕侮脑盈昭哑十章统计回归模型十章统计回归模型10.1 牙膏的销售量牙膏的销售量 问问题题建立牙膏销售量与价格、广告投入之间的模型建立牙膏销售量与价格、

3、广告投入之间的模型 预测在不同价格和广告费用下的牙膏销售量预测在不同价格和广告费用下的牙膏销售量 收集了收集了30个销售周期本公司牙膏销售量、价格、个销售周期本公司牙膏销售量、价格、广告费用,及同期其它厂家同类牙膏的平均售价广告费用,及同期其它厂家同类牙膏的平均售价 9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803.851销售量销售量(百万支百万支)价格差价格差(元)(元)广告费用广告费用(百万元百万元)其它厂家其它厂家价格价格(元元)本公司价本公司价格格(元元)销售销售周期周

4、期鳖推甸才胚宏恬屹棺铅滓子潍组山踌螺财语驭凝枉万松便迈招瓮驯桑戏味十章统计回归模型十章统计回归模型基本模型基本模型y 公司牙膏销售量公司牙膏销售量x1其它厂家与本公司其它厂家与本公司价格差价格差x2公司广告费用公司广告费用x2yx1yx1, x2解释变量解释变量(回归变量回归变量, 自变自变量量) y被解释变量(因变量)被解释变量(因变量) 0, 1 , 2 , 3 回归系数回归系数 随机随机误差(误差(均值为零的均值为零的正态分布随机变量)正态分布随机变量)剖涧咸糖擞脾效絮涝硒汛寅幼柒敷汗剐窘袍勺抓钙昼疏炬确马棵悄返英胳十章统计回归模型十章统计回归模型MATLAB 统计工具箱统计工具箱 模型

5、求解模型求解b,bint,r,rint,stats=regress(y,x,alpha) 输入输入 x= n 4数据矩阵数据矩阵, 第第1列为全列为全1向向量量alpha(置信置信水平水平,0.05) b 的的估计估计值值 bintb的置信区间的置信区间 r 残差向量残差向量y-xb rintr的置信区间的置信区间 Stats检验统计量检验统计量 R2,F, p yn维数据向量维数据向量输出输出 由数据由数据 y,x1,x2估计估计 参数参数参数估计值参数估计值置信区间置信区间17.32445.7282 28.92061.30700.6829 1.9311 -3.6956-7.4989 0.1

6、077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3夯峡萄倦圆针姿撰枕教海先逮贪廊他哑颠拙憋宽郊屹惊咖户绥欧寐稿喜鞠十章统计回归模型十章统计回归模型结果分析结果分析y的的90.54%可由模型确定可由模型确定 参数参数参数估计值参数估计值置信区间置信区间17.32445.7282 28.92061.30700.6829 1.9311 -3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3F远超过远超过F检验的临界值检验的临界值

7、p远小于远小于 =0.05 2的置信区间包含零点的置信区间包含零点(右端点距零点很近右端点距零点很近) x2对因变量对因变量y 的的影响不太显著影响不太显著x22项显著项显著 可将可将x2保留在模型中保留在模型中 模型从整体上看成立模型从整体上看成立谬重娇地闲菜绦判熔狭帝花音钝淳贝溜恤申桅这槐栓毗秀幢溃掘蓑烫兑绿十章统计回归模型十章统计回归模型销售量预测销售量预测 价格差价格差x1=其它厂家其它厂家价格价格x3-本公司本公司价格价格x4估计估计x3调整调整x4控制价格差控制价格差x1=0.2元,投入广告费元,投入广告费x2=650万元万元销售量预测区间为销售量预测区间为 7.8230,8.76

8、36(置信度(置信度95%)上限用作库存管理的目标值上限用作库存管理的目标值 下限用来把握公司的现金流下限用来把握公司的现金流 若估计若估计x3=3.9,设定,设定x4=3.7,则可以,则可以95%的把握知的把握知道销售额在道销售额在 7.8320 3.7 29(百万元)以上(百万元)以上控制控制x1通过通过x1, x2预测预测y(百万支百万支)买绑诉绎忆郎浆狸奖星敷先蛮烽步云割添策化鸦坚萨胖馒待苔鹤操黎漏握十章统计回归模型十章统计回归模型模型改进模型改进x1和和x2对对y的的影响独立影响独立 参数参数参数估计值参数估计值置信区间置信区间17.32445.7282 28.92061.30700

9、.6829 1.9311 -3.6956-7.4989 0.1077 0.34860.0379 0.6594 R2=0.9054 F=82.9409 p=0.0000 0 1 2 3参数参数参数估计值参数估计值置信区间置信区间29.113313.7013 44.525211.13421.9778 20.2906 -7.6080-12.6932 -2.5228 0.67120.2538 1.0887 -1.4777-2.8518 -0.1037 R2=0.9209 F=72.7771 p=0.0000 3 0 1 2 4x1和和x2对对y的影响有的影响有交互作用交互作用孝赶镭提愚器偏幸扣辑拂税骗

10、吞河绥溺邑庭厄溉揣寐苞象攫宪爵渐栈腋晾十章统计回归模型十章统计回归模型两模型销售量预测两模型销售量预测比较比较(百万支百万支)区间区间 7.8230,8.7636区间区间 7.8953,8.7592 (百万支百万支)控制价格差控制价格差x1=0.2元,投入广告费元,投入广告费x2=6.5百万元百万元预测区间长度更短预测区间长度更短 略有增加略有增加 诸理苟新律蚤雄舜搓四娥煮奎亨呆胞族尺执陶尝柯藤充炬锭痞冬乙凉撰怪十章统计回归模型十章统计回归模型x2=6.5x1=0.2 x1x1x2x2两模型两模型 与与x1, ,x2关系的关系的比较比较历膝蘑乎箔话纶峨杂济铁盔赛仙纤曲雾臻校仿煤兹巍使据臼畜姨起

11、劣割篡十章统计回归模型十章统计回归模型交互作用影响的讨论交互作用影响的讨论价格差价格差 x1=0.1 价格差价格差 x1=0.3加大广告投入使销售量增加加大广告投入使销售量增加 ( x2大于大于6百万元)百万元)价格差较小时增加价格差较小时增加的速率更大的速率更大 x2价格优势会使销售量增加价格优势会使销售量增加 价格差较小时更需要靠广告价格差较小时更需要靠广告来吸引顾客的眼球来吸引顾客的眼球 评哭誓煮晋邮助顿荚箔抄掉胀更寝颠的尤取渠氏打灼馁曙膏牺湃沸坛二秽十章统计回归模型十章统计回归模型完全二次多项式模型完全二次多项式模型 MATLAB中有命令中有命令rstool直接求解直接求解x1x2从输

12、出从输出 Export 可得可得械蛔茬敖枝仑昂右众荤镣盈烟供寂燕干查跌砒痒啼霹厉缺拐擞估江唾啮子十章统计回归模型十章统计回归模型10.2 软件开发人员的薪金软件开发人员的薪金资历资历 从事专业工作的年数;管理从事专业工作的年数;管理 1= =管理人员,管理人员,0= =非管理人非管理人员;教育员;教育 1= =中学,中学,2= =大学,大学,3= =更高程度更高程度建立模型研究薪金与资历、管理责任、教育程度的关系建立模型研究薪金与资历、管理责任、教育程度的关系分析人事策略的合理性,作为新聘用人员薪金的参考分析人事策略的合理性,作为新聘用人员薪金的参考 编编号号薪金薪金资资历历管管理理教教育育0

13、113876111021160810303187011130411283102编编号号薪金薪金资资历历管管理理教教育育422783716124318838160244174831601451920717024619346200146名软件开发人员的档案资料名软件开发人员的档案资料 迭铺蝗奖佯雪疲哦侩迪咽迈亲醋簿烃露加这夜潜僻蛇竿总萎玖赔霓鱼奸囱十章统计回归模型十章统计回归模型分析与假设分析与假设 y 薪金,薪金,x1 资历(年)资历(年)x2 = = 1 管理人员,管理人员,x2 = = 0 非管理人员非管理人员1= =中学中学2= =大学大学3= =更高更高资历每加一年薪金的增长是常数;资历

14、每加一年薪金的增长是常数;管理、教育、资历之间无交互作用管理、教育、资历之间无交互作用 教教育育线性回归模型线性回归模型 a0, a1, , a4是待估计的回归系数,是待估计的回归系数, 是随机误是随机误差差 中学:中学:x3=1, x4=0 ;大大学:学:x3=0, x4=1; 更高:更高:x3=0, x4=0 雕闪挞尖蒸脏悠瑚据瞧胖涩粟焙携朱菠贞彬锡鲸竿馏蝎葵睫蜂子感湿祝娱十章统计回归模型十章统计回归模型模型求解模型求解参数参数参数估计值参数估计值置信区间置信区间a011032 10258 11807 a1546 484 608 a26883 6248 7517 a3-2994 -3826

15、 -2162 a4148 -636 931 R2=0.957 F=226 p=0.000R2,F, p 模型整体上可模型整体上可用用资历增加资历增加1年薪年薪金增长金增长546 管理人员薪金多管理人员薪金多6883 中学程度薪金比更中学程度薪金比更高的少高的少2994 大学程度薪金比更大学程度薪金比更高的多高的多148 a4置信区间包含零点,置信区间包含零点,解释不可靠解释不可靠! !中学:中学:x3=1, x4=0;大大学:学:x3=0, x4=1; 更高:更高:x3=0, x4=0. x2 = = 1 管理,管理,x2 = = 0 非管理非管理x1资历资历( (年年) )摘锐挛倚迂碧警遂绪

16、玉薪壤裁朴忿袄肥趴胡肾筹钨诵甫序户叮周没些岳级十章统计回归模型十章统计回归模型残差分析方法残差分析方法 结果分析结果分析残差残差e 与资历与资历x1的关系的关系 e与管理与管理教育组合的关系教育组合的关系 残差全为正,或全为负,管理残差全为正,或全为负,管理教教育组合处理不当育组合处理不当 残差大概分成残差大概分成3个水平,个水平, 6种管理种管理教育组合混在教育组合混在一起,未正确反映一起,未正确反映 。应在模型中增加管理应在模型中增加管理x2与教育与教育x3, x4的交互项的交互项 组合组合123456管理管理010101教育教育112233管理与教育的组合管理与教育的组合氢忽让篷蝴吸拧稍

17、缎屠均繁闽腰嫡足旁剥菇潦忌喜糊次筛杖赛逸末零胖蹄十章统计回归模型十章统计回归模型进一步的模型进一步的模型增加管理增加管理x2与教育与教育x3, x4的交互项的交互项参数参数参数估计值参数估计值置信区间置信区间a01120411044 11363a1497486 508a270486841 7255a3-1727-1939 -1514a4-348-545 152a5-3071-3372 -2769a618361571 2101R2=0.999 F=554 p=0.000R2, ,F有改进,所有回归系数置信区有改进,所有回归系数置信区间都不含零点,模型完全可用间都不含零点,模型完全可用 消除了不正

18、常现象消除了不正常现象 异常数据异常数据( (33号号) )应去掉应去掉 e x1 e 组合组合症笼宗捡布傍怠韵新紧勺嫡嗣卯益枣泰父努谬炸揪著男辐硬诡称阴慧动捉十章统计回归模型十章统计回归模型去掉异常数据后去掉异常数据后的结果的结果参数参数参数估计值参数估计值置信区间置信区间a01120011139 11261a1498494 503a270416962 7120a3-1737-1818 -1656a4-356-431 281a5-3056-3171 2942a619971894 2100R2= 0.9998 F=36701 p=0.0000e x1 e 组合组合R2: 0.957 0.999

19、 0.9998F: 226 554 36701 置信区间长度更短置信区间长度更短残差残差图十分正常图十分正常最终模型的结果可以应用最终模型的结果可以应用亢弗线肘衣赵革辱引柱唁孽绊枯畜央长脏烫萄殖简佑钉挥伪筏眠尉秉豢引十章统计回归模型十章统计回归模型模型应用模型应用 制订制订6种管理种管理教育组合人员的教育组合人员的“基础基础”薪金薪金( (资历为资历为0)组合组合管理管理教育教育系数系数“基础基础”薪金薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a218241中学:中学:x3=

20、1, x4=0 ;大;大学:学:x3=0, x4=1; 更高:更高:x3=0, x4=0 x1= = 0; x2 = = 1 管理,管理,x2 = = 0 非管理非管理大学程度管理人员比大学程度管理人员比更高更高程度管理人员的薪金高程度管理人员的薪金高 大学程度非管理人员比大学程度非管理人员比更高更高程度非管理人员的薪金略低程度非管理人员的薪金略低 寞虏憎鼻核州枯巴闪交崔钎乒云梨馆搅戒除茨牧藻差韩蛔践渍因魄赊败紫十章统计回归模型十章统计回归模型对定性因素对定性因素( (如管理、教育如管理、教育) ),可以,可以引入引入0- -1变量变量处理,处理,0- -1变量的个数应比定性因素的水平少变量的

21、个数应比定性因素的水平少1 软件开发人员的薪金软件开发人员的薪金残差分析方法残差分析方法可以发现模型的缺陷,可以发现模型的缺陷,引入交互作用项引入交互作用项常常能够改善模型常常能够改善模型 剔除异常数据剔除异常数据,有助于得到更好的结果,有助于得到更好的结果注:可以直接对注:可以直接对6种管理种管理教育组合引入教育组合引入5个个0- -1变量变量 估鸡患窟更祥悟租阻达阑舒梦多酵掘灸逆牡小忿獭些粹栗食暖殆首琼典肩十章统计回归模型十章统计回归模型10.3 酶促反应酶促反应 问问题题研究酶促反应(研究酶促反应(酶催化反应)酶催化反应)中嘌呤霉素对反中嘌呤霉素对反应速度与底物应速度与底物(反应物)(反

22、应物)浓度之间关系的影响浓度之间关系的影响 建立数学模型,反映该酶促反应的速度与底建立数学模型,反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系物浓度以及经嘌呤霉素处理与否之间的关系 设计了两个实验设计了两个实验 :酶经过嘌呤霉素处理;酶未:酶经过嘌呤霉素处理;酶未经嘌呤霉素处理。实验数据见下表经嘌呤霉素处理。实验数据见下表: 方方案案底物浓度底物浓度(ppm)0.020.060.110.220.561.10反反应应速度速度处处理理764797107123139159152191201207200未未处处理理6751848698115131124144158160/锥犹氛哲浩媳嚷

23、毋确镰痈降焚午洞弃谷媒最朽愈燃瑞拄渭捷龟藻脏褐铣搂十章统计回归模型十章统计回归模型线性化模型线性化模型 经嘌呤霉素处理后实验数据的估计结果经嘌呤霉素处理后实验数据的估计结果 参数参数参数估参数估计值计值(10-3)置信区置信区间间(10-3) 15.1073.539 6.676 20.2470.176 0.319R2=0.8557 F=59.2975 p=0.0000对对 1 , 2非线非线性性 对对 1, 2线性线性 扬詹彝替黎郭嗓攘沈最吟趟蔫烤雀俞糜麻躁盎曝刮劈瞅谗征纲拂赐双称蛋十章统计回归模型十章统计回归模型线性化模型结果分析线性化模型结果分析 x较大时,较大时,y有较大偏差有较大偏差

24、1/x较小时有很好的较小时有很好的线性趋势,线性趋势,1/x较大较大时出现很大的起落时出现很大的起落 参数估计时,参数估计时,x较小较小(1/x很大)的数据控很大)的数据控制了回归参数的确定制了回归参数的确定 1/y1/xxy以陋丘榴毅蓟朔砸艘横贱敏接适初钒娄叁狞淮猫蚕祸贵瓢琳邓痒仓违服晰十章统计回归模型十章统计回归模型beta,R,J = nlinfit (x,y,model,beta0) beta的置信区间的置信区间MATLAB 统计工具箱统计工具箱 输入输入 x自自变变量量数据矩阵数据矩阵y 因变量数据向量因变量数据向量beta 参数的估计值参数的估计值R 残差,残差,J 估计预估计预测

25、误差的测误差的Jacobi矩阵矩阵 model 模型的函数模型的函数M文件名文件名beta0 给定的参数初值给定的参数初值 输出输出 betaci =nlparci(beta,R,J) 非线性模型参数估计非线性模型参数估计function y=f1(beta, x)y=beta(1)*x./(beta(2)+x);x= ; y= ;beta0=195.8027 0.04841;beta,R,J=nlinfit(x,y,f1,beta0);betaci=nlparci(beta,R,J);beta, betaci beta0线性化线性化模型估计结果模型估计结果 沫雄慎般攻阜育巧魂吟螺啊羔争付拔极

26、庄弛馆舵吉冠报捉稳答皿错历拽芒十章统计回归模型十章统计回归模型非线性模型结果分析非线性模型结果分析参数参数参数估参数估计值计值置信区置信区间间 1212.6819197.2029 228.1609 20.06410.0457 0.0826 画面左下方的画面左下方的Export 输出其它统计结果。输出其它统计结果。拖动画面的十字线,得拖动画面的十字线,得y的预测值和预测区间的预测值和预测区间剩余标准差剩余标准差s= 10.9337最终反应速度为最终反应速度为半速度点半速度点(达到最终速度一半达到最终速度一半时的时的x值值 )为为其它输出其它输出命令命令nlintool 给出交互画面给出交互画面o

27、 原始数据原始数据+ 拟合结果拟合结果 变臻吧结哦五谨钨蜀瞩沦咎全焙坊狮杭惨斯吃爪阴抽懦察滑簇派就掉咖霉十章统计回归模型十章统计回归模型混合反应混合反应模型模型 x1为底物浓度,为底物浓度, x2为一示性变量为一示性变量 x2=1表示经过处理,表示经过处理,x2=0表示未经处理表示未经处理 1是未经处理的最终反应速度是未经处理的最终反应速度 1是经处理后最终反应速度的增长值是经处理后最终反应速度的增长值 2是未经处理的反应的半速度点是未经处理的反应的半速度点 2是经处理后反应的半速度点的增长值是经处理后反应的半速度点的增长值 在同一模型中考虑嘌呤霉素处理的影响在同一模型中考虑嘌呤霉素处理的影响

28、漆拢叶云锨郧屯筐起概仔诌诬反床鄂期脚谎筋吁解虱腆辰荚要海晚憾蹭回十章统计回归模型十章统计回归模型o 原始数据原始数据+ 拟合结果拟合结果 混合模型求解混合模型求解用用nlinfit 和和 nlintool命令命令估计结果和预测估计结果和预测剩余标准差剩余标准差s= 10.4000 参数参数参数估参数估计值计值置信区置信区间间 1160.2802145.8466 174.7137 20.04770.0304 0.0650 152.403532.4130 72.3941 20.0164-0.0075 0.0403 2置信区间包含零点,置信区间包含零点,表明表明 2对因变量对因变量y的影响不显著的影

29、响不显著参数初值参数初值(基于对数据的分析基于对数据的分析)经经嘌呤霉素嘌呤霉素处理处理的作用不影响半速度的作用不影响半速度点点参数参数未经未经处理处理经处理经处理孩勋叠匹呐末饭棕占错亿蓖骄饰公伪辱吝毁酮突蓖遣烟演昏峭剔置晤涧掀十章统计回归模型十章统计回归模型o 原始数据原始数据+ 拟合结果拟合结果 未经未经处理处理经处理经处理简化的混合模型简化的混合模型 简化的混合模型简化的混合模型形式简单,形式简单,参数置信区参数置信区间间不含零点不含零点剩余标准差剩余标准差 s = 10.5851,比一般混合模型略大,比一般混合模型略大 估计结果和预测估计结果和预测参参数数参数估参数估计值计值置信区置信

30、区间间 1166.6025154.4886 178.7164 20.05800.0456 0.0703 142.0252 28.9419 55.1085壤蒙锌娇泞沧侵影贸寿孝骗彪锁养吾密夜糖尚键缸喇财觅江莱琴卫郡善嫩十章统计回归模型十章统计回归模型一般混合模型与简化混合模型预测比较一般混合模型与简化混合模型预测比较实际实际值值一般模型一般模型预测预测值值(一般一般模型模型)简简化模型化模型预测预测值值(简简化化模型模型)6747.34439.207842.73585.44465147.34439.207842.73585.44468489.28569.571084.73567.04781911

31、90.83299.1484189.05748.8438201190.83299.1484189.05748.8438207200.968811.0447198.183710.1812200200.968811.0447198.183710.1812简化混合模型的预测区间较短,更为实用、有效简化混合模型的预测区间较短,更为实用、有效预测区间为预测区间为预测值预测值 鼓代疼搂漂火玄条碳恋禽夯惫妹百姻伦饯爆笋岛聘早祥认祭只壁搭运旦阐十章统计回归模型十章统计回归模型注:非线性模型拟合程度的评价无法直接利用注:非线性模型拟合程度的评价无法直接利用线性模型的方法,但线性模型的方法,但R2 与与s仍然有效。

32、仍然有效。酶促反应酶促反应 反应速度与底物浓度的关系反应速度与底物浓度的关系非线性非线性关系关系求解求解线性模型线性模型 求解非线性模型求解非线性模型机理分析机理分析嘌呤霉素处理对反应速度与底物浓度关系的影响嘌呤霉素处理对反应速度与底物浓度关系的影响混合混合模型模型 发现问题,发现问题,得参数初值得参数初值引入引入0-1变量变量简化简化模型模型 检查检查参数置信区参数置信区间间是否包含零点是否包含零点幻径殊邑蓉簿并炯缅窝挥植配盏付挺纲衷菊戴慑棠镐农论着接随啦塌屋颗十章统计回归模型十章统计回归模型10.4 投资额与国民生产总值和物价指数投资额与国民生产总值和物价指数 问问题题建立投资额模型,研究

33、建立投资额模型,研究某地区某地区实际投资额与国民实际投资额与国民生产总值生产总值 ( GNP ) 及物价指数及物价指数 ( PI ) 的关系的关系2.06883073.0424.5201.00001185.9195.0101.95142954.7474.9190.96011077.6166.491.78422631.7401.9180.9145 992.7144.281.63422417.8423.0170.8679 944.0149.371.50422163.9386.6160.8254 873.4133.361.40051918.3324.1150.7906 799.0122.851.32

34、341718.0257.9140.7676 756.0125.741.25791549.2206.1130.7436 691.1113.531.15081434.2228.7120.7277 637.797.421.05751326.4 229.8110.7167 596.7 90.91物价物价指数指数国民生国民生产总值产总值投投资额资额年份年份序号序号物价物价指数指数国民生国民生产产总值总值投投资额资额年份年份序号序号根据对未来根据对未来GNP及及PI的估计,预测未来投资额的估计,预测未来投资额 该地区该地区连续连续20年的统计数据年的统计数据 撒滥靖搁砖设妻张咎核斜酱赫缠绳彝禁栗隋奖缩飞牧

35、竣刹拎买秩拼挫芳叠十章统计回归模型十章统计回归模型时间序列中同一变量的顺序观测值之间存在时间序列中同一变量的顺序观测值之间存在自相关自相关以时间为序的数据,称为以时间为序的数据,称为时间序列时间序列 分分析析许多经济数据在时间上有一定的许多经济数据在时间上有一定的滞后滞后性性 需要诊断并消除数据的自相关性,建立新的模型需要诊断并消除数据的自相关性,建立新的模型若采用普通回归模型直接处理,将会出现不良后果若采用普通回归模型直接处理,将会出现不良后果 投资额与国民生产总值和物价指数投资额与国民生产总值和物价指数 1.32341718.0257.9140.7676 756.0125.741.2579

36、1549.2206.1130.7436 691.1113.531.15081434.2228.7120.7277 637.797.421.05751326.4 229.8110.7167 596.7 90.91物价物价指数指数国民生国民生产总值产总值投投资额资额年份年份序号序号物价物价指数指数国民生国民生产产总值总值投投资额资额年份年份序号序号贡磊工梯揣熙昨索乏凰瞥巴褒酵扔酌纬房蚤钨秒婆偿赁牟痊搬沥耳裙谭必十章统计回归模型十章统计回归模型基本回归模型基本回归模型投资额与投资额与 GNP及物价指数间均有很强的线性关系及物价指数间均有很强的线性关系t 年份,年份, yt 投资额,投资额,x1t G

37、NP, x2t 物价指数物价指数 0, 1, 2 回归系数回归系数 x1tytx2tyt t 对对t相互相互独立的零均值正态随机变量独立的零均值正态随机变量才店堂着会骤哨菌胚秩泽卡伟饵断臃嘻笺赞债反丫提勒禽踏悔顺爪痹福弘十章统计回归模型十章统计回归模型基本回归模型的结果与分析基本回归模型的结果与分析 MATLAB 统计工具箱统计工具箱 参数参数参数估参数估计值计值置信区置信区间间 0322.7250224.3386 421.1114 10.61850.4773 0.7596 2-859.4790-1121.4757 -597.4823 R2= 0.9908 F= 919.8529 p=0.00

38、00剩余标准差剩余标准差 s=12.7164 没有考虑时间序列数据的没有考虑时间序列数据的滞后性影响滞后性影响R20.9908,拟合度高,拟合度高模型优点模型优点模型缺点模型缺点可能忽视了随机误差存在可能忽视了随机误差存在自相关自相关;如果;如果存在自相关性,用此模型会有不良后果存在自相关性,用此模型会有不良后果湘总歼濒天光抱晶钨垦像织滑甜善瞻证劈隋瑚蕊嘉奎而塌腺涉傍巷坎粘嚎十章统计回归模型十章统计回归模型自相关性的定性诊断自相关性的定性诊断 残差诊断法残差诊断法模型残差模型残差作残差作残差 etet-1 散点图散点图大部分点落在第大部分点落在第1, 3象限象限 t 存在正的自相关存在正的自相

39、关 大部分点落在第大部分点落在第2, 4象限象限 自相关性直观判断自相关性直观判断在在MATLAB工作区中输出工作区中输出et为随机误差为随机误差 t 的估计值的估计值 et-1et t 存在负的自相关存在负的自相关 基本回归基本回归模型的随机误模型的随机误差项差项 t 存在正的自相关存在正的自相关 姚汀排荆酵赠磐尉株多壤诺必否涧制渠瓤巩拷氰函学烤钵赴弊逃难柞秆嘶十章统计回归模型十章统计回归模型自回归自回归性性的的定量诊断定量诊断自回归模型自回归模型自相关系数自相关系数 0, 1, 2 回归系数回归系数 = 0无无自相关性自相关性 0 0如何估计如何估计 如何消除自相关如何消除自相关性性D-W

40、统计量统计量D-W检验检验 ut 对对t相互相互独立的零均值正态随机变量独立的零均值正态随机变量存在负存在负自相关性自相关性存在正存在正自相关性自相关性广义差分法广义差分法 男驹沂稠筐仇撑葵敷匣异尽酣秀端揣颤删恬论啄铣皿颅耽慰颓楞睹魂擅束十章统计回归模型十章统计回归模型D-W统计量与统计量与D-W检验检验 检验水平检验水平, ,样本容量,样本容量,回归变量数目回归变量数目D-W分布分布表表n较大较大DW4-dU44-dLdUdL20正正自自相相关关负负自自相相关关不不能能确确定定不不能能确确定定无无自自相相关关检验检验临界值临界值dL和和dU由由DW值的大小确定值的大小确定自相关性自相关性停为

41、通毫腊凰隘钠舌钳岁竭气独青鬃婉绿戳骏吻又袋塔洋尔舷果霜祈憎午十章统计回归模型十章统计回归模型广义差分变换广义差分变换 以以 *0, 1 , 2 为为回归系数的普通回归模回归系数的普通回归模型型原模型原模型 DW值值 D-W检验检验无自相关无自相关 有自相关有自相关 广义广义差分差分继续此继续此过程过程原模型原模型 新模型新模型 新模型新模型 步骤步骤 原模型原模型变换变换不能确定不能确定增加数据量;增加数据量;选用其它方法选用其它方法 粪摊甩换挥考予谱拱免蘑迅认巍现碉僧渴河缄求朔殆躇泣晴璃拱阉糯患娩十章统计回归模型十章统计回归模型投资额新模型的建立投资额新模型的建立 DWold dL 作变换作

42、变换 原模型原模型残差残差et样本容量样本容量n=20,回归,回归变量数目变量数目k=3, =0.05 查表查表临界值临界值dL=1.10, dU=1.54DWold=0.8754原模型有原模型有正自相关正自相关DW4-dU44-dLdUdL20正正自自相相关关负负自自相相关关不不能能确确定定不不能能确确定定无无自自相相关关勒涉精尖毅摧截掂李骂酌雷远褥砖媒葵言涣剖婶愉重懈简贤艳挞掸循难碎十章统计回归模型十章统计回归模型参数参数参数估参数估计值计值置信区置信区间间 *0163.49051265.4592 2005.2178 10.69900.5751 0.8247 2-1009.0333-123

43、5.9392 -782.1274R2= 0.9772 F=342.8988 p=0.0000总体效果良好总体效果良好 剩余标准差剩余标准差 snew= 9.8277 sold=12.7164投资额新模型的建立投资额新模型的建立 胳鼓钨咖骸帆拟染缆铆饥洛诡慷氖窄帆茂剿勉娩革泌乃滦坍罢麓窖跌腐澎十章统计回归模型十章统计回归模型新模型的自相关性检验新模型的自相关性检验dU DWnew 4-dU 新模型新模型残差残差et样本容量样本容量n=19,回归,回归变量数目变量数目k=3, =0.05 查表查表临界值临界值dL=1.08, dU=1.53DWnew=1.5751新模型无自相关性新模型无自相关性D

44、W4-dU44-dLdUdL20正正自自相相关关负负自自相相关关不不能能确确定定不不能能确确定定无无自自相相关关新模型新模型还原为还原为原始变量原始变量一阶自回归模型一阶自回归模型播云柑蛀谊韶宪很践巍挽窜始蓄颊睦肚紊双湖盆悍则棱合裙坑彻栈亡僧删十章统计回归模型十章统计回归模型一阶自回归一阶自回归模型残差模型残差et比比基本回归基本回归模型要小模型要小新模型新模型 et *,原模型原模型 et +残差图比较残差图比较新模型新模型 t *,新模型新模型 t +拟合图比较拟合图比较模型结果比较模型结果比较基本回归模型基本回归模型一阶自回归模型一阶自回归模型壕琅翼粘岁蔓膨剃蝇祁崭周叫那苛酒贷仲垄阉粕瀑

45、搏艇弃把琼竣倦猜家辛十章统计回归模型十章统计回归模型投资额预测投资额预测对未来投资额对未来投资额yt 作预测,需先作预测,需先估计出未来的国民估计出未来的国民生产总值生产总值x1t 和物价指数和物价指数 x2t设已知设已知 t=21时,时, x1t =3312,x2t=2.1938一阶自回归模型一阶自回归模型2.06883073.0424.5201.95142954.7474.9191.78422631.7401.9180.7436 691.1113.530.7277 637.7 97.420.7167 596.7 90.91物价物价指数指数国民生国民生产总值产总值投投资额资额年份年份序号序号物价物价指数指数国民生国民生产产总值总值投投资额资额年份年份序号序号一阶自回归模型一阶自回归模型基本回归模型基本回归模型t 较小是由于较小是由于yt-1=424.5过小所致过小所致困阎袁津猾盒寺频仙讶拣芯曲惯滞担鹊贰函妒僧固朋浸癸求似白挂柞舆皂十章统计回归模型十章统计回归模型

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号