回归分析北师大版

上传人:小** 文档编号:89498887 上传时间:2019-05-25 格式:PPT 页数:59 大小:2.92MB
返回 下载 相关 举报
回归分析北师大版_第1页
第1页 / 共59页
回归分析北师大版_第2页
第2页 / 共59页
回归分析北师大版_第3页
第3页 / 共59页
回归分析北师大版_第4页
第4页 / 共59页
回归分析北师大版_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《回归分析北师大版》由会员分享,可在线阅读,更多相关《回归分析北师大版(59页珍藏版)》请在金锄头文库上搜索。

1、3.1.1 回归分析,回归分析的基本思想及其初步应用,1、两个变量的关系,不相关,相关关系,函数关系,线性相关,非线性相关,问题1:现实生活中两个变量间的关系有哪些呢?,相关关系:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。,回顾复习,思考:相关关系与函数关系有怎样的不同?,函数关系中的两个变量间是一种确定性关系 相关关系是一种非确定性关系,函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般 的情况,问题2:对于线性相关的两个变量用什么方法来刻划之间的关系呢?,2、最小二乘估计,最小二乘估计下的线性回归方程:,ybx a,其中,,,ybx

2、 a,最小二乘估计下的线性回归方程:,回归直线必过样本点的中心,3、解线性相关问题的基本步骤:,画散点图,求线性相关方程,预报、决策,例某医院用光电比色计检验尿汞时,得尿汞含量(毫克/ 升)与消光系数如下表:,(1)作散点图; (2)如果y与x之间具有线性相关关系,求线性回归方程,解:(1)散点图如图,1(2011辽宁高考)调查了某地若干户家庭的年收入x(单位: 万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:y0.254x0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元 解析:以x1代x

3、,得y0.254(x1)0.321,与y0.254x0.321相减可得,年饮食支出平均增加0.254万元 答案:0.254,2(2011江西高考)为了解儿子身高与其父亲身高的关系, 随机抽取5对父子的身高数据如下:,答案:C,1.2 相关系数,复习回顾, 用线性回归方程进行回归分析:,(1)画散点图;,(2)求回归系数 :,(3)写回归直线方程 ,并用方程进 行预测说明.,任何数据,不管它们的线性相关关系如何,都可以用最小二乘法求出线性回归方程,为使建立的线性回归方程有意义,在利用最小二乘法求线性回归方程之前,先要对变量间的线性相关关系作个判断,通常可以作散点图。但在某些情况下,从散点图中不容

4、易判断变量间的线性关系,另外,如果数据量较大时,画散点图比较麻烦,此时我们有没有其他方法来刻画变量之间的线性相关关系呢?,新课探究,为解决这个问题,我们可通过计算线性相关系数 r,来判断变量间相关程度的大小,计算公式为:,新课探究,的最小值为:,据前面的分析,回归系数 使得误差,由 知 ,即 ,则,新课探究,值越大,误差 越小,则变量的线性相关程度 就越高; 值越接近于0, 越大,线性相关程度就 越低。,当 时, ,两变量的值总体上呈现同 时增加的趋势,则称两变量正相关; 当 时, ,一变量增加,另一变量有 减小的趋势,则称两变量负相关; 当 时,则称两变量线性不相关。,相关系数r的性质,新课

5、探究,相关系数,1.计算公式 2相关系数的性质 (1)|r|1; (2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小 问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?,负相关,正相关,思考交流,对于课本P73给出的例题,变量的线性相关系数r 如何求?,我们知道,相关系数的计算公式为:,要求r,只需求出相关的量:,由数据表,经过计算,可知(P77):,这能说明什么?,这说明肱骨 和股骨 有较强的线性相关程度。,计算下表变量的线性相关系数r。,并观察,通过计算可以发现什么?,由表可知:,你发现什么了?,r=0,则变量间并不存在线性相关关系。即此时 建立线性回归方程是没

6、有意义的。,实际上,从散点图上我们也可以验证这一点:,易看出,几个样本点都落在同一个半圆上,而不 是条状分布,此时建立线性回归方程无任何意义,这 与相关系数r的计算结果相一致。,样本点的分布如何?,许多先进国家对驾驶员的培训,大多采用室内模拟教学和 训练,而后再进行实地训练并考试,这种方法可以大大节 约训练的费用。问题是这种方法有效吗?下表是12名学员 的模拟驾驶成绩x与实际考试成绩y的记录(单位:分):,试问:两者的相关性如何?请画出散点图,并求出y与x 间的线性相关系数.,动手做一做,解答:可求出r=0.9871,说明实际考试成绩y与模拟驾驶成绩x有较强的线性相关程度.,拓展思考,相关系数

7、r越大,变量间的线性关系就越 强,那么r的值究竟大到什么程度就认为线性 关系较强?,相关系数,正相关;负相关通常, r-1,-0.75负相关很强; r0.75,1正相关很强; r-0.75,-0.3负相关一般; r0.3, 0.75正相关一般; r-0.25, 0.25相关性较弱;,相关关系的测度 (相关系数取值及其意义),r,小结, 线性相关系数r:,,其中 。,4对四对变量y和x进行线性相关检验,已知n是观测值组 数,r是相关系数,且已知: n7,r0.953 3;n15,r0.301 2; n17,r0.499 1;n3,r0.995 0. 则变量y和x线性相关程度最高的两组是 ( )

8、A和 B和 C和 D和 解析:相关系数r的绝对值越大,变量x,y的线性相关程度越高,故选B. 答案:B,5某厂的生产原料耗费x(单位:百万元)与销售额y(单位: 百万元)之间有如下的对应关系: ( ),判断x与y之间是否存在线性相关关系,解:画出(x,y)的散点图,如图所示,由图可知x,y呈现线性相关关系,可线性化的回归分析,复习回顾, 线性相关系数r及性质:,,其中 。,1、下表是随机抽取的8对母女的身高数据,试根据这些数据探讨y与x之间的关系,母亲身高,女儿身高,练习,解:,,,,,,,,,所以:,所以可以认为,与,之间具有较强的线性相关,的,关系线性回归模型y=a+bx中,线性回归方程为

9、,新课讲解,下表按年份给出了19812001年我国出口贸易 量(亿美元)的数据,根据此表你能预测2008年我 国的出口贸易量么?,从散点图中观察,数据与直线的拟合性不好, 若用直线来预测,误差将会很大。,而图像近似指数函数,呈现出非线性相关性。,分析:,考虑函数 来拟合数据的变化关系,将其转 化成线性函数,两边取对数:,即线性回归方程,记1981年为x=1,1982年为 x=2,变换后的数据如下表:,设 ,则上式变为 ,,对上表数据求线性回归方程得: 即:,由此可得: ,曲线如图:,这样一来,预测2008年的出口贸易量就容易多了。,将下列常见的非线性回归模型转化为线性回归模型。,作变换,得线形

10、函数 。,1.幂函数:,2. 指数曲线:,作变换,得线形函数 。,作怎样的变换,得到线形函数的方程如何?,思考交流,3. 倒指数曲线:,4. 对数曲线:,作怎样的变换,得到线形函数的方程如何?,小结, 非线性回归方程:,对某些特殊的非线性关系,可以通过变换,将非 线性回归转化为线性回归,然后用线性回归的方法进 行研究,最后再转换为非线性回归方程。, 常见非线性回归模型:,1.幂函数:,2. 指数曲线:,3. 倒指数曲线:,4. 对数曲线:,例3 (12分)为了研究某种细菌随时间x变化繁殖个数y的变化,收集数据如下:,(1)作出这些数据的散点图; (2)求y与x之间的回归方程 思路点拨 作出数据

11、的散点图,选择合适的函数模型转化为线性模型,精解详析 (1)散点图如图所示:,(4分),(2)由散点图看出样本点分布在一条指数函数yc1ec2x图像的周围,于是令zln y,则 (6分),由计算器算得z0.69x1.112, 则有ye0.69x1.112. (12分),一点通 非线性回归问题一般不给出经验公式,这时,应先画出已知数据的散点图,把它与所学过的各种函数图像作比较,挑选一种跟这些散点图拟合得最好的函数,采用适当的变量置换,把问题化为线性回归分析问题,使问题得以解决,6下列数据x,y符合哪一种函数模型 ( ),解析:选项A中当x8,9,10时,函数值与所给数值偏差较大,不合题意;选项B

12、中当x10时,y2e10,远远大于4.3,不合题意;选项C中的函数在(0,)上为减函数,不合题意故选D. 答案:D,7在一次抽样调查中测得样本的5个样本点,数值如下表:,试建立y与x之间的回归方程,解:由数值表可作散点图如下,根据散点图可知y与x近似地呈反比例函数关系,,由置换后的数值表作散点图如下:,由散点图可以看出y与t呈近似的线性相关关系列表如下,1判断变量之间的线性相关关系,一般用散点图,但在作图中,由于存在误差,有时很难判断这些点是否分布在一条直线的附近,从而就很难判断两个变量之间是否具有线性相关关系,此时就必须利用线性相关系数来判断 2相关系数r可以定量地反映出变量间的相关程度,明确的给出有无必要建立两变量间的线性回归方程,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号