回归直线方程—最小二乘法分析课件

上传人:新** 文档编号:570336183 上传时间:2024-08-03 格式:PPT 页数:19 大小:778.50KB
返回 下载 相关 举报
回归直线方程—最小二乘法分析课件_第1页
第1页 / 共19页
回归直线方程—最小二乘法分析课件_第2页
第2页 / 共19页
回归直线方程—最小二乘法分析课件_第3页
第3页 / 共19页
回归直线方程—最小二乘法分析课件_第4页
第4页 / 共19页
回归直线方程—最小二乘法分析课件_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《回归直线方程—最小二乘法分析课件》由会员分享,可在线阅读,更多相关《回归直线方程—最小二乘法分析课件(19页珍藏版)》请在金锄头文库上搜索。

1、问题问题:在一次对人体脂肪含量与年龄关系的研究中,在一次对人体脂肪含量与年龄关系的研究中, 研究人员获得了一组样本数据:研究人员获得了一组样本数据:年年龄龄2327394145495053545657586061脂脂肪肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6散散点点图图回回归归直直线线回归直线概念:散点图中心的分布从整体上看回归直线概念:散点图中心的分布从整体上看大致是一条直线附近,该直线称为回归直线大致是一条直线附近,该直线称为回归直线 求出回归直线的方程求出回归直线的方程我们就可以比较清楚地了解年龄与体我们就可以比较清

2、楚地了解年龄与体内脂肪含量之间的相关性内脂肪含量之间的相关性由此可以预测相应年龄段的脂肪含量由此可以预测相应年龄段的脂肪含量那我们又该如何具体求这个回归方程呢?那我们又该如何具体求这个回归方程呢?方法汇总方法汇总?1.画一条直线画一条直线2.测量出各点测量出各点与它的距离与它的距离3.移动直线,移动直线,到达某一位置到达某一位置使距离的和最使距离的和最小,测量出此小,测量出此时直线的斜率时直线的斜率与截距,得到与截距,得到回归方程。回归方程。1.选取两点作选取两点作直线直线ps:使直线两:使直线两侧侧 的点的个的点的个数基本相同。数基本相同。1.在散点图中在散点图中多取几组点,多取几组点,确定

3、出几条直确定出几条直线的方程线的方程2.分别求出各分别求出各条直线的斜率、条直线的斜率、截距的平均数截距的平均数3.将这两个平将这两个平均数当成回归均数当成回归方程的斜率与方程的斜率与截距。截距。法一法一法四法四法二法二法三法三? 上面三种方法都有一定的道理,但总让人感到上面三种方法都有一定的道理,但总让人感到可靠性不强可靠性不强. . 回归直线与散点图中各点的位置用数学的方法回归直线与散点图中各点的位置用数学的方法来刻画应具有怎样的关系?来刻画应具有怎样的关系? 方法汇总方法汇总1.画一条直线画一条直线2.测量出各点测量出各点与它的距离与它的距离3.移动直线,移动直线,到达某一位置到达某一位

4、置使距离的和最使距离的和最小,测量出此小,测量出此时直线的斜率时直线的斜率与截距,得到与截距,得到回归方程。回归方程。1.选取两点作选取两点作直线直线ps:使直线两:使直线两侧侧 的点的个的点的个数基本相同。数基本相同。1.在散点图中在散点图中多取几组点,多取几组点,确定出几条直确定出几条直线的方程线的方程2.分别求出各分别求出各条直线的斜率、条直线的斜率、截距的平均数截距的平均数3.将这两个平将这两个平均数当成回归均数当成回归方程的斜率与方程的斜率与截距。截距。最最小小二二乘乘法法法一法一法四法四法二法二法三法三求回归方程的关键求回归方程的关键如何使用如何使用数学方法数学方法来刻画来刻画“从

5、整体上看,从整体上看,各点到此直线的距离最小各点到此直线的距离最小”。假设两个具有线性相关关系的变量的一组数假设两个具有线性相关关系的变量的一组数据据:(x1, y1),(x2, y2),. (xn, yn)下面讨论如何表达这些点与一条直线下面讨论如何表达这些点与一条直线y=bx+a之间的距离。之间的距离。最小二乘法的公式的探索过程如下:最小二乘法的公式的探索过程如下:1.设已经得到具有线性相关关系的变量的一组数据:设已经得到具有线性相关关系的变量的一组数据: (x1,y1),(),(x2,y2),),(,(xn,yn)2.设所求的回归直线方程为设所求的回归直线方程为Y=bx+a,其中其中a,

6、b是待是待定的系数。当变量定的系数。当变量x取取x1,x2,xn时,可以得到时,可以得到 Yi=bxi+a(i=1,2,n)3.它与实际收集得到的它与实际收集得到的yi之间偏差是之间偏差是 yi-Yi=yi-(bxi+a)(i=1,2,n)(x1,y1)(x2,y2)(xi ,yi )yi-Yiy x这样,用这这样,用这n个偏差的和来刻画个偏差的和来刻画“各点与此直线的整体偏差各点与此直线的整体偏差”是比较合适的。是比较合适的。因此用因此用 表示各点到直线表示各点到直线y=bx+a的的“整体距离整体距离” (x1 ,y1)(x2 ,y2)(xi ,yi)yi-(bxi+a)(x(x1 1,y,

7、y1 1) )(x(x2 2,y y2 2) )(x(xi i,y yi i) )(x(xn n,y yn n) ) 由于绝对值使得计算不方便,在实际应用由于绝对值使得计算不方便,在实际应用中人们更喜欢用中人们更喜欢用(x(x1 1,y,y1 1) )(x(x2 2,y y2 2) )(x(xi i,y yi i) )(x(xn n,y yn n) )这样,问题就归结为:当这样,问题就归结为:当a a,b b取什么值时取什么值时Q Q最小?即最小?即点到直线点到直线 的的“整体距离整体距离”最小最小. .这样通过求此式的最小值而得到回这样通过求此式的最小值而得到回归直线的方法,即使得样本数据的

8、归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小点到回归直线的距离的平方和最小的方法叫做的方法叫做最小二乘法最小二乘法. .根据有关数学原理推导,根据有关数学原理推导,a a,b b的值由下列公式给出的值由下列公式给出(yi-Yi)的最小值的最小值ni=1|yi-Yi|的最小值的最小值ni=1(yi-Yi)2的最小值的最小值ni=1Q=(y1-bx1-a) 2+(y2-bx2-a) 2+(yn-bxn-a) 2当当a,b取什么值时,取什么值时,Q的值最小,即总体偏差最小的值最小,即总体偏差最小13求线性回归方程的步骤:求线性回归方程的步骤:(1)求平均数求平均数 ;(2)计算计算

9、与与 yi 的乘积的乘积,再求再求 ;(3)计算计算 ;(4)将上述有关结果代入公式,写出回归将上述有关结果代入公式,写出回归 直线方程直线方程.xi年年龄龄2327394145495053545657586061脂脂肪肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6根据最小二乘法公式,根据最小二乘法公式,利用计算机可以求出利用计算机可以求出其回归直线方程其回归直线方程散散点点图图回回归归直直线线思考:将表中的年龄作为思考:将表中的年龄作为x代入回归方程,看看得代入回归方程,看看得出的数值与真实数值之间的关系,从中你体会到出的数值

10、与真实数值之间的关系,从中你体会到了什么?了什么? x=27时,时,y=15.099%x=37时,时,y=20.901%可利用回归方程可利用回归方程预测不同年龄段预测不同年龄段的体内脂肪含量的体内脂肪含量的百分比。的百分比。存在样本存在样本点不在直线上点不在直线上年年龄龄2327394145495053545657586061脂脂肪肪9.517.821.225.927.526.328.229.630.231.430.833.535.234.6(2012山东临沂二模,山东临沂二模,20,12)假设关于某设备的)假设关于某设备的使用年限使用年限x和所有支出的维修费用和所有支出的维修费用y(万元),

11、有如(万元),有如下表的统计资料:下表的统计资料:使用年使用年限限x23456维修费维修费用用y2.23.85.56.57.0若由资料可知若由资料可知y对对x呈线性相关关系,试求:呈线性相关关系,试求:(1)线性回归直线方程)线性回归直线方程(2)估计使用年限为)估计使用年限为10年时,维修费用是多少?年时,维修费用是多少?y=1.23x+0.08 ;y=12.38 回归直线回归直线方程特点方程特点存在样本点存在样本点不在直线上不在直线上的样本点的样本点只能表示线只能表示线性相关关系性相关关系回归直线方程的特点回归直线方程的特点过定点过定点(样本中心)(样本中心)练习练习解析:销售量销售量y(件件)与销售价格与销售价格x(元元/件件)负相关负相关x的系数为负的系数为负又又y不能为负值,不能为负值,常数项必须是正值故选常数项必须是正值故选A.答案:答案:A20y=2x

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号