3定量预测技术

上传人:M****1 文档编号:564622814 上传时间:2022-10-21 格式:DOC 页数:16 大小:451.02KB
返回 下载 相关 举报
3定量预测技术_第1页
第1页 / 共16页
3定量预测技术_第2页
第2页 / 共16页
3定量预测技术_第3页
第3页 / 共16页
3定量预测技术_第4页
第4页 / 共16页
3定量预测技术_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《3定量预测技术》由会员分享,可在线阅读,更多相关《3定量预测技术(16页珍藏版)》请在金锄头文库上搜索。

1、3、定量预测技术回归预测模型的一般形式Y=f(X)3.1一元线性回归模型: Y=a+bx根据占有的若干组数据,计算出系数和,就得出该事物发展变化的规律性,这就是要确定的预测模型。下面以某公司1988年-2001年产品产量的数据,说明建立一元线性预测模型的方法。某公司1988-2001年产品产量数据(单位:万t)年份1988198919901991199219931994t0123456产量(Y)10.5917.6717.0717.2118.2418.8417.62年份1995199619971998199920002001t78910111213产量(Y)19.2118.4420.8525.2

2、219.2432.9935.113.1.1一元线性回归的简易求法: 预测方程: (1) 方法: (1)将n组数据平均得分为两组(份组数决定于需确定的参数个数),并分别代入式(1);(2)把各组方程相加,得到一个以和为变量的线性方程;(3)解此线性方程组可求出和的值,代入式(1),即使所求预测方程。 前7个相加得114.24=7+21,后7个相加得181.06=7+70,联立解得预测方程为:3.1.2最小二乘法:对于回归方程,将占有的数据代入后得: 令 ,则它表示占有数据与预测值 的误差。为防止误差正负抵消,采用误差平房和最小作为确定参数和的准则,这种确定参数的和的方法叫做最小二乘法。 (2)使

3、Q最小,由得 (3)解得 (4) (5)式中若则 (6)3.1.3线性回归预测模型检验过程及预测精度: 1相关系数 评价X、Y两个变量之间线性关系密切程度的数量指标叫相关系数,并以r表示 , (7)式中 (8)叫的离差平方和,它是反映自变量波动的一个指标,越大,的波动越大,反之越小;叫做、的离差乘积和。 (9)或 (10) 由(9)(10)可见: (1)r=0时,b=0,则回归直线是一条与X轴平等的直线,说明X的变化与Y无关。 (2)当时, 这时考察误差平方和Q,将 代入得 时,Q=0,由此可知,当r=1时,即Q=0,所有点均在回归直线上,称完全正相关;当r=-1时,称完全负相关。XYXY 当

4、-1r,说明原假设不成立,相关显著,回归方程有实用价值。 t的计算公式为:,式中S为Y的均方差 (2)F检验。F检验的意义与t检验相同,只不过是查表确定F的临界值。 F的计算公式为 当F时,否定原假设,变量相关显著。(3)r检验。为了使用方便,由公式反求出r的临界值, 即可通过r的大小直接判断显著性。 当时,两变量相关显著。3、方差分析为了估计预测精度需对预测模型作方差分析。应用预测模型,当X=时,求出的预测值只是实际的期望值,且该估计是无偏估计。 其方差为 因为是的无偏估计, 所以可用代替, 且Y落在内的概率为1-,即P=1-或 由上可知,取决于数据组数(样本数)n和X的大小。当n大时,值小

5、,预测精度高,反之则低;在数据组数一定且在时,最小;若X离越远,则预测误差越大。Y=X+(X)Y=X-(X)XY预测精度示意图小结:线性回归的方法和步骤:(1)整理占有的数据(2)运用和求出和得到预测方程(3)进行检验:求出相关系数r;选择t检验、F检验或r检验法对预测模型的显著性进行检验(4)利用模型进行预测,并用或 确定置信区间。3.2一元非线性回归模型-化一元非线性函数为线性函数确定曲线类型的方法一般为: (1)根据理论分析以及过去所积累的经验,确定X、Y之间的函数类型;(2)在数据量不大的情况下,作出散点图,观察散点的分布,确定函数类型;(3)采用过多种曲线模型进行回归分析后,进行相对

6、比较分析,小噢内各种选择一个较好形式的模型作为预测模型。将特殊曲线化为直线的代换方法: (1)双曲函数 将代入,即得,将作为预测模型。 (2)指数函数,取对数后,令得(3)指数函数 取对数后,令得(4)对数函数 令,得(5)幂函数 取对数后,令,得 (6)S曲线 取倒数后,令,得3.3多元线性回归模型3.3.1二元线性回归分析 某公司木器厂准备根据音响生产成本的两个重要因素劳动量和木材消耗量,建立成本预测模型。某公司木器厂有关资料月总成本Y/千元劳动量X1/kh木材耗用量X2/Km313.13.92.422.63.62.132.93.82.342.73.91.952.83.71.963.03.

7、92.173.23.82.4现考虑的自变量有两个:一个是劳动量,以表示,另一个是木材消耗量,以表示。现研究当、改变时,Y的变化规律。我们采用线性回归模型 作为预测模型。 、称为回归系数。仍用最小二乘法,以误差平方和最小作为回归分析的准则,即求 ,当时,Q有极小值,得方程组(正规方程组): (3.3.1) 解得 其中,代入后整理得: 矩阵形式为(正规方程)或 (3.3.2)其中,即为(4.3.2)式的解。以上例说明建立预测模型的方法和步骤:(1)、求正规方程组的系数(即建立L和L0矩阵) 故正规方程为 (2)、求解正规方程和结果为(3)、建立模型 如果时,总成本预测值为(千元)3.3.2多元线性

8、回归分析一般形式 3.3.3多元线性回归模型的检验基本思想:首先对整个多元回归模型进行显著性检验。因多元线性回归分析中自变量的数量多,因此,在总的显著性分析的基础上,还需分析哪些因素对因变量的影响大,哪些因素影响小,哪些可以忽略不计,最后再确定它的区间估计值。1、全相关系数平方和分解 (回归平方和与剩余平方和)其中,;推导得:剩余标准差: 全相关系数: 2、回归显著性检验(用F检验)若回归无意义,即,则 否则 。还需判断每个自变量与因变量的显著性。其检验方法采用t检验法: 其中,为正规方程系数矩阵L的逆矩阵L-1中对角线上的元素。如果 则认为对Y有作用,否则无作用,应予以剔除。不需重新配合方程

9、的计算公式和算法: 设剔除因素之前的回归模型为 剔除因素之后,新回归模型为则 式中 为中相应的元素。 剔除某因素后,回归平方和所发生的变化叫偏回平方和。原回归平方和,剔除第i个因素后的回归平方和,则剔除因素的骗汇平方和为,若大,则对Y的影响大。剔除因素得到新模型后,再经过检验,直到所有剩下的因素都通过t检验为止,即可确定回归系数的区间估计。其计算公式为 区间为根据可预测Y值,一般采用剩余标准差的2倍来估计Y的误差,即可保证的置信度。举例说明多元线性回归预测的方法和步骤。某建筑公司认为平均造价与工程结构有关,现对13个建筑公司高层建筑造价进行调查的下表,现该公司准备根据该资料建立快速报价估算模型

10、。影响造价因素调查表工程编号机械化施工所占的比重/%主体结构工程量所占的比重/%基础工程量所占的比重/%装饰工程量所占的比重/%平均造价/万元11068812109.421166912113.332147426115.94140233483.85131224472.56371176102.77254182293.1872666078.59129155274.3101156820104.311113184787.61275263395.9131155922109.2平均值7.46248.154117.6930.00085.423设每千平方米的平均造价为Y,影响平均造价的因素为:机械化施工所占的比重、主体结构工程量所占的比重、基础工程量所占的比重、装饰工程量所占的比重。该公司平均造价预测模型为 其过程为:(1)求L矩阵,建立正规方程组。根据和得:(2)求解正规方程组和求。求解结果为 (3)建立预测模型。全相关系数,采用F检验,求临界值和F故回归显著。(5)各回归系数检验。剩余平方和Q和剩余标准差为 L-1矩阵对角线上元素为计算t值 ,查表,当时,只有显著不为零(6)剔除因素。因|t3|最小,故剔除。 故新回归方程为 偏回归平方和为新预测模型的回归平方和为可见的影响很小。如此一直进行到所有因素均显著为止。但需注意的是美提出一个因素之后,都要重新进行回归系数的检验。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号