直线回归分析及其不确定度评定讲解

上传人:我** 文档编号:113630891 上传时间:2019-11-09 格式:DOC 页数:14 大小:517.50KB
返回 下载 相关 举报
直线回归分析及其不确定度评定讲解_第1页
第1页 / 共14页
直线回归分析及其不确定度评定讲解_第2页
第2页 / 共14页
直线回归分析及其不确定度评定讲解_第3页
第3页 / 共14页
直线回归分析及其不确定度评定讲解_第4页
第4页 / 共14页
直线回归分析及其不确定度评定讲解_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《直线回归分析及其不确定度评定讲解》由会员分享,可在线阅读,更多相关《直线回归分析及其不确定度评定讲解(14页珍藏版)》请在金锄头文库上搜索。

1、直线回归分析及其测量不确定度评定 第 14 页 共 14 页直线回归分析及其测量不确定度评定第一节 一元线性回归分析当输入量Xi的估计值xi是由实验数据用最小二乘法拟合的曲线上得到时,曲线上任何一点和表征曲线拟合参数的标准不确定度,可以用有关的统计程序评定。例如有两个估计值x,y有线性关系y=a+bx,对其独立测得若干对数据(x1,y1),(x2,y2),(xn,yn),n2,欲求取参数a,b及其标准不确定度,以及预期估计值及其标准不确定度,则需要应用最小二乘法。最小二乘法是以“残差平方和最小”为条件求得最佳值并拟合成最佳直线、最佳曲线。图13.1给出了直线拟合的最小二乘法示意图。图中,xi,

2、yi是观测数据,vi是残差,a是拟合直线的截距,b是拟合直线的斜率。yiyixixvia拟合直线测量数据图13.1 最小二乘法示意图呈直线的标准曲线用下式表示: (13.1)式中b是直线的斜率(回归系数),a是截距。各实验数据点可表示为(xi,yi)i=1,2,n。 误差方程可用残差vi表示为: 需要使残差平方和最小 因此须同时对a和b求偏导数并使其为零,得到联立方程 式中, 首先用联立方程求解b 式中,以上各式中,是x值的平均值,是y值的平均值。利用试验数据应用上式求解b会增加比较大的工作量,通常将上式变换为更易于数据处理的形式。注意到,上式的分子可变换成 类似地可将上式的分母可变换成 最后

3、将lxx和lxy代入可以求解出b 用已经求得的b和,求得截距a。 同样可以计算相关系数r。现归纳整理得到如下的斜率b、截距a和相关系数r计算公式1.1 斜率 (13.2)1.2 截距 (13.3)1.3 相关系数 (13.4)1.4 y对x的回归直线用计算得到的斜率b和截距a绘制的直线就是拟合得到的最佳直线,称为y对x的回归直线。显然,实验中测得的各实验点(xi,yi)并不完全落在该回归直线上,除非相关系数r1。y对x的回归直线方程可表示为 (13.5)式中,表示是从回归直线上取得的与xi对应的yi计算值。【例13.1】 现以中国合格评定国家认可委员会CNAS-GL06:2006化学分析中不确

4、定度的评估指南例A5中,测定镉浓度为例,求回归直线方程和相关系数r。实验室采用浓度为(5000.5)mgL-1镉标准溶液,配置浓度分别为0.1)mgL-1,0.3 mgL-1,0.5 mgL-1,0.7 mgL-1和0.9 mgL-1的5种校准标准溶液。用原子吸收光谱仪对5种校准溶液的每一个分别进行3次平行测量,被测物品浓度和吸收值如表13.1中第2栏和第3栏所示。求回归直线方程和相关系数r。【解】 为便于计算,将有关中间计算结果列于表13.1中。用式(13.2)和表13.1的数据计算斜率b (13.6) 用式(13.3)和表13.1的数据计算截距a (13.7) 用式(13.6)、式(13.

5、7)和表13.1的数据就可给出校准曲线(回归直线)方程 (13.8)用式(13.4)和表13.1的数据计算相关系数r (13.9)相关系数r是一个纯数,在理化试验中,其绝对值通常大于0.99而很少小于0.90。相关系数r接近于1和1时,一般应给出三位以上的有效数字。r绝对值越接近1,相关性越好,直线的拟合程度越好,数据离直线越近。当x增加y也增加时,我们称x和y(之间)为正相关,r为正值。当x增加y反而减小时,x和y(之间)为负相关,r为负值。表13.1 原子吸收法测定镉浓度的实验数据和回归直线中间计算结果xy(10-6)10.10.028-0.40.16-0.10120.010241440.

6、0404823.0420.10.029-0.40.16-0.10020.010040040.0400814.4430.10.029-0.40.16-0.1.0020.010040040.0400814.4440.30.084-0.20.04-0.0.4050.002043040.00904950.30.083-0.20.04-0.04620.002134440.00924460.30.081-0.20.04-0.04820.002323240.00964070.50.135000.00580.00003346033.4680.50.131000.00180.0000034203.2490.50

7、.133000.00380.00001444014.44100.70.1800.20.040.05080.002580640.010166.76110.70.1810.20.040.05180.002683240.0103612.96120.70.1830.20.040.05380.002894440.0107631.36130.90.2150.40.160.08580.007361640.03432112.36140.90.2300.40.160.10080.010160640.0403219.36150.90.2160.40.160.08680.007534240.0347292.16S7

8、.51.93801.200.070088400.2892391.2【注】设计确定回归直线的中间计算结果表,在使用Excel电子表格时将节省大量运算时间,并减少计算差错。第二节 回归直线的方差分析及显著性检验 因为对任意两个变量x和y的一组观测数据(xi,yi)(i=1,2,n),都可以用最小二乘法拟合出一条直线。所以,回归直线方程式(13.5)是否实用,首先需要确定该直线是否基本符合x和y之间的实际关系。也就是说需要对式(13.5)进行显著性检验。其次,由于变量x和y之间是相关关系,那么是否可以应用回归直线方程式(13.5),依据自变量x的值来预报因变量y的值?也就是说,回归直线的预报是否准确

9、?因此需要分析评定回归直线的方差或不确定度。一、 回归直线的方差分析分析可知,观测值y1,y2,yn之间的差异(或变差),是由两方面的原因引起的。一是自变量x的取值不同,二是测量误差等其他因素的影响。为了对观测数据(xi,yi)线性回归的效果进行检验必须将上述两个因素造成的结果分离出来。图13.2 回归直线方差分析平均数回归直线0yx 如图13.2所示,将变量y的观测值yi(i=1,2,n)与其平均值的偏差,分解为由变量x的不同取值引起的回归偏差,以及由于测量误差等其他因素引起的残余误差。并进一步用n个取值的偏离平方和来描述它们,分别记为S,U和Q。总偏差平方和S为 (13.10) 参看图13

10、.2,有 (13.11)可以证明上式中的交叉项为零,即 (13.12)因此总偏差平方和S可以分解为两部分: (13.13)上式第一项 (13.14)称作回归平方和。U反应了在y的总偏差中因为x和y的线性关系而引起的y的变化的大小。式(13.13)中的第二项 (13.15)称作残余平方和。Q反应了在y的总偏差中除了x对y的线性影响之外的其他因素而引起的y的变化的大小。这些因素包括测量误差,x和y不能用直线关系描述的因素,以及其他未加控制的因素等。正如本章第一节所述,回归分析要求“残差平方和最小”,即Q越小,回归效果越好。 为了利用本章第一节回归分析中的一些结果,U和Q并不是按照它们的定义式(13

11、.13)和式(13.14)进行计算,而是按照呈直线的标准曲线方程进行计算 (13.16) (13.17) 对每一个平方和都有一个称作为自由度的数值与之相联系,自由度是指独立观测值的个数。因S中的n个观测值受平均值的约束,从而有一个观测值不是独立的,即失去一个自由度,故总偏差平方和S的自由度为nS=n-1。U中只有b是独立变化的,故回归平方和U的的自由度为nU=1。如果一个平方和是由几个相互独立的平方和组成,则总的自由度等于各平方和的自由度之和。所以,残余平方和Q的自由度nQ为 (13.18)二、 残余方差及残余标准差 残余平方和Q除以它的自由度nQ所得商称作残余方差 (13.19)它的意义可以看作是在排除了x对y的线性影响后(或当x值固

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号