高等数学 上 教学课件 ppt 作者 张圣勤 黄勇林 姜玉娟第十三章 13-5

上传人:E**** 文档编号:89373024 上传时间:2019-05-24 格式:PPT 页数:34 大小:455.50KB
返回 下载 相关 举报
高等数学 上 教学课件 ppt 作者 张圣勤 黄勇林 姜玉娟第十三章 13-5_第1页
第1页 / 共34页
高等数学 上 教学课件 ppt 作者 张圣勤 黄勇林 姜玉娟第十三章 13-5_第2页
第2页 / 共34页
高等数学 上 教学课件 ppt 作者 张圣勤 黄勇林 姜玉娟第十三章 13-5_第3页
第3页 / 共34页
高等数学 上 教学课件 ppt 作者 张圣勤 黄勇林 姜玉娟第十三章 13-5_第4页
第4页 / 共34页
高等数学 上 教学课件 ppt 作者 张圣勤 黄勇林 姜玉娟第十三章 13-5_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《高等数学 上 教学课件 ppt 作者 张圣勤 黄勇林 姜玉娟第十三章 13-5》由会员分享,可在线阅读,更多相关《高等数学 上 教学课件 ppt 作者 张圣勤 黄勇林 姜玉娟第十三章 13-5(34页珍藏版)》请在金锄头文库上搜索。

1、第十三章 数理统计初步,第五节 一元线性回归,第五节 一元线性回归,一 最小二乘法估计,二 线性回归的显著性检验,三 用线性回归方程作预报,两个变量之间的关系,确定性关系(或函数关系),常用函数关系来表达;如正方形的面积与其边长的关系,球的体积与其直径的关系.,非确定性关系(相关关系),没有完全确定的函数关系式, 但两个变量之间存在着一定的统计规律性;如人的体重与身高之间的关系,身高与年龄之间的关系等,,如1885年,英国科学家高尔顿和卡-皮尔逊等人通过大量的统计试验研究得出子代身高y与父代身高x之间有相关关系,且可大致地用数学式y=0.516x+33.73(英寸)来描述,并称之为“回归定理”

2、。,所以我们把寻找具有相关关系的变量之间的近似的数学关系并进行统计推论的方法叫做回归分析。而相应的近似数学关系式也称为回归方程,并把只有一个自变量和一个随机变量所对应的回归问题称为一元回归问题。若一元回归方程是线性的,则称为一元线性回归方程。,例1 去年有人对某单位家庭拥有机动车情况作了统计,发现该单位机动车家庭普及率如下:,显然,y随着x增大而增大,y与x之间存在着相关关系,这相关关系到底是怎样的呢?我们不妨在直角坐标系内把这7对数据(Xi,Yi)(i=1,2,3,-7)作为点的坐标作出对应的7个点来,如图所示。(此图叫做散点图)。,从散点图上看,这7个点虽是散乱的,但大致还是散布在一条直线

3、的周围,即y与x之间的关系大致是线性的。 如果作这样的直线 =a+bx,则这样的直线有许多条,哪条最合适呢?,设这些点(Xi,Yi)与直线 =a+bx沿纵轴方向的偏差为i=yi-i ,即 i=Yi-(a+bXi)。 我们自然希望所有i都最小为佳,即使直线 =a+bx 从总体上看与这7个点都要尽量地接近。,要使偏差平方和 Q=,最小为佳,这样求出的a,b而得到的直线 =a+bx才最合适。,一 最小二乘法估计,设自变量x与随机变量y之间的相关关系是线性的,即:y=a+bx+ 并经过n次独立试验,所获得的数据为(x1,y1),(x2,y2),-(xn,yn)把它们分别代入上式得: yi=a+bxi+

4、i (i=1,2,-,n). 令 =a+bx,则i是 yi 与i 之间的偏差即i=yi-i ,(i=1,2,-,n),要用 =a+bx来表达 y与x 之间的线性相关关系。因此要求对所有的数据来说要找到合适的a,b,使偏差的平方和,要为最小。,利用微分学中求函数极值的方法,我们将 对a,b 求偏导得:,所以,为了方便计算,记,则显然有:,从而可求得 x与y 之间的一元线性回归方程 =a+bx。这种方法叫做最小二乘法估计。其实,我们也可以直接利用计算器的统计功能求得Lxx,Lyy,从而求得a, b。,如上例1:因为,由计算器统计功能可直接求得,所以,而,故b=Lxy/Lxx=2.113, a=50

5、.24-2.1134=41.79 所以,该单位机动车家庭拥有率 y与月份x 之间的回归直线方程为: =a+bx =41.79+2.113x。,因此,对任一组观察值(xi,yi)(i =1,2,-n)不论y与x是否存在线性相关关系都可利用最小二乘法求出回归直线 =a+bx ,显然当y与x之间并不存在线性相关关系时,所求的回归直线方程就毫无意义。因此,我们还必须要检验y与x之间是否存在显著的线性相关关系。,二 线性回归的显著性检验,定理:,简记为Lyy=Q+U 也叫做总偏差平方和Lyy的分解公式,1平方和分解公式,已知两个变量x与y之间存在线性相关关系和回归方程为 =a+bx,其中,则我们有如下定

6、理,它是由于实际观察数据没有落在回归直线上所引起的 ,它反映了观察数据偏离回归直线的程度。,引起的。它反映了回归值i 的离散程度。,即U是由回归直线的斜率b与xi的取值所决定的,这清楚地说明U是x对y的线性影响引起的变差。,所以,叫回归平方和,它是由回归直线所,由于,所以,证明:因为,而,所以:,显然:U 越大,Q就越小,即y 与x的线性关系就越显著;反之,U越小,Q就越大,即y与x 的线性关系就越不明显。从前面的讨论中可以看出,如果在总偏离差平方和Lyy中,回归平方和U 很大而偏离平方和Q很小,就可以认为变量y与x之间线性相关关系显著。反之,则认为y与x之间线性关系不显著,即当U/Lyy接近

7、1时,y与x 的线性关系显著。,2相关系数,与 b=Lxy/Lxx 相比较,可知r与b同号。 并由r2=U/Lyy=Lyy-Q/Lyy 得:Q =Lyy(1-r2),由于,这表明|r|1,且Lyy固定时,|r|越接近于1, Q就越小,从而y与x线性关系就越明显。,特别当|r|=1时,Q=0,U=Lyy,即y的变化完全由y与x的线性关系引起。因此统计量r刻划了y与x之间线性关系的密切程度。故可作为假设H0:y与x 之间线性关系不存在,即 b=0的检验统计量。,对变量y与x之间线性相关关系的显著性检验可用相关系数r 检验法,其具体步骤为: 1、提出假设H0:b=0 即y与x之间不存在线性相关关系。

8、,3 线性回归的显著性检验,2、作统计量,根据数据计算 Lxx,Lyy 和Lxy 得到r的观察值。,3、对于给定的显著性水平,确定自由度为n-2 ,查相关系数临界值表(见附表 ),得临界值=r(n-2) 4、作出判断:当|r|,则拒绝H0,即y与x之间线性关系显著。当|r|,则接受H0,即y与x之间线性关系不显著。,例2 某公司一年中某种产品每月的总收益R(万元)与每月销售量x(万件)的统计数据如下:,试求(1)每月的总收益R与每月销售量 x之间的线性回归方程。,(2)设显著性水平为=0.01,试检验R与x之间线性关系是否显著。,解 (1)因为,而,故:每月的总收益R与每月销售量x 之间的线性

9、回归方程为:R=0.99+1.21x,所以,(2)假设H0:R与x 之间不存在线性相关关系。,作统计量,对于给定的显著性水平=0.01,自由度为n-2=12-2=10 查相关系数表得临界值=r(10)=0.708 由于r=0.9940.708 所以拒绝假设H0 。即每月的总收益R与每月销售量x之间线性关系显著。,关于r检验法的说明,(1)虽然0|r|1,但当r=0时,Lxy=0即b=0此时回归直线平行于x 轴, 说明y 的取值与x 无关。即y与x 之间无线性相关关系,但不能排除它们之间存在其它的非线性关系。,(2)当|r|=1 时,Q=0即yi=i 说明 n个散点均在回归直线上,此时y与x之间

10、构成线性函数关系。,(3)当00时称为y与x正相关,r0称为y与x负相关,三 用线性回归方程作预报,一元线性回归方程一经求出,并经过相关性检验,如果线性相关显著,便可用来进行预报。 1、点预报。 所谓点预报,就是利用所求得的一元线性回归方程 =a+bx对预定的x=x0 值,由线性回归方程算出0 =a+bx0作为y0的预报值。 2、区间预报。 区间预报就是对预定的x =x0 值,利用区间估计的方法来由线性回归方程 =a+bx 求出精确值y0的置信区间。,对于给定的 x=x0,由线性回归方程 =a+bx可求出 y0的预报值 0 =a+bx0 ,可以证明,随机变量,服从自由度为n-2的t分布。其中,

11、所以,对于给定的置信水平1-(或置信度),查自由度为n-2的t分布,可得临界值= t(n-2),使P(|T|)=,从而得到y0的置信水平为1-的置信区间为,Q=Lyy-bLxy=(1-r2 )Lxx。,其中=t/2(n-2),而此时t(n-2)分布也接近标准正态分布,所以 也可查标准正态分布表来得到。故此时y0的1-置信区间为:,其中 =U/2,例3 炼钢是一个氧化脱碳过程,冶炼时间的长短直接影响到钢液含碳量的多少。下表是某平炉34炉的溶毕碳xi (即全部炉料熔化完毕时钢液的含碳量)与精炼时间yi 的生产记录,试求:(1)精炼时间 y 对熔毕碳x 的回归直线方程。(2)对于显著性水平=0.05

12、。试检验y与x的线性相关关系是否显著。(3)预报当溶毕碳x0 =144(即1.44%)时,精炼时间 y0 在什么范围内。( =0.05),解:(1)为了简化计算,令X=x-150,Y=(y-160)/5,这样Xi ,Yi的数值就要比原始数据xi,yi小得多,即,因为,LXY=6465.06,所以,Lxx=LXX=25462.7 Lyy=52LYY =50094,Lxy=5LXY =32325.3 故 b=Lxy/Lxx=32325.3/25462.7=1.27,即所求精炼时间y 对溶毕碳x 的回归直线方程为 y=-32.38+1.27x,(2)提出假设H0: y与x线性关系不显著。,而对于=0

13、.05,n -2=34-2=32查相关系数表得临界值 = r0.05(32) 0.349=r0.05(30),其中 =U/2=U0.025=1.96,(3)当 x0=144(即1.44%),由回归方程可算出: y0=-32.38+1.271.44=150.50(分),故:r =0.905 ,即拒绝H0 所以,y 与x之间线性关系显著。,由于n =34较大,可用近似的预测区间,Q=Lyy(1-r2)=9065.76,故: y0的预测区间为117.51,183.49 即当溶毕碳x0=144(即1.44%)时,我们可以95%的把握预测其相应的精炼时间y0落在(117.51分,183.49分)内。,小结,1 最小二乘法估计,2 线性回归的显著性检验-r检验法,3 用线性回归方程作预报-点预报,区间预报,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号