《13可线性化的回归分析》由会员分享,可在线阅读,更多相关《13可线性化的回归分析(33页珍藏版)》请在金锄头文库上搜索。
1、会将非线性回归模型经过变换转化为线性回归模型,进而进行回归分析学习本节后还应初步会将简单的非线性回归问题转化为线性回归问题(重点、难点)1.3可线性化的回归分析【课标要求】【核心扫描】 对不具有线性相关关系的两个变量做统计分析,通过变量代换,转化为线性回归模型1非线性回归分析 2非线性回归方程曲线方程曲线图形变换公式变换后的线性函数yaxbcln avln xuln y. . ucbv曲线方程曲线图形变换公式变换后的线性函数yaebxcln auln y . .ucbx续表ucbv uabv 想一想:作两个变量的散点图的主要目的是_ _提示直观了解两个变量之间的关系当两变量y与x不具有线性相关
2、关系时,要借助于散点图,与已学过的函数(如指数函数、对数函数、幂函数等)的图象相比较,找到合适的函数模型,利用变量代换转化为线性函数关系,从而使问题得以解决(1)确定变量:确定解释变量为x,预报变量为y;(2)画散点图:通过观察散点图并与学过的函数(幂、指数、对数函数、二次函数)作比较,选取拟合效果好的函数模型;名师点睛1可线性化的回归分析2解决非线性回归问题的方法及步骤(3)变量置换:通过变量置换把非线性问题转化为线性回归问题;(4)分析拟合效果:通过计算相关指数或相关系数等来判断拟合效果;(5)写出非线性回归方程在大量的实际问题中,研究的两个变量不一定都呈现线性相关关系,它们之间可能呈现指
3、数关系或对数关系等非线性关系等在某些情况下可以借助于线性回归模型研究呈现非线性关系的两个变量之间的关系我们往往将两个非线性的变量关系转化成线性的变量关系例如,将幂函数曲线yaxb转化为ucbv.其中uln y,vln x,cln a;将指数曲线yaebx转化为ucbx.其中uln y,cln a.3非线性变量关系转化为线性变量关系(1)画出散点图,观察它们之间的关系(如是否存在线性关系等)(2)由经验确定回归方程的类型(如观察到数据呈线性关系,则选用线性回归方程yabx)(3)按一定规则估计回归方程中的参数(如最小二乘法)(4)得出结果后分析是否有异常,若存在异常,则检查数据是否有误,或模型是
4、否合适等4建立回归模型的基本步骤 有一位同学家里开了一个小卖部,他为了研究气温对热茶销售杯数的影响,经过统计,得到一个卖出热茶杯数与当天气温的对比表:题型一线性回归分析【例1】 气温x/504712151923273136热茶销售杯数y/杯156150 132 12813011610489937654(1)求热茶销售杯数y与气温x的线性回归方程;(2)预测气温为10 时热茶的销售杯数思路探索 根据样本点数据画出散点图利用散点图直观分析热茶销售杯数y与气温x具有线性相关关系,利用线性回归方程中参数的计算公式可得线性回归方程解(1)所给数据的散点图如下图所示由图可看出,这些点在一条直线附近,可以用
5、线性回归方程来刻画y与x之间的关系因为,由公式计算得b2.352,ab147.767,所以y对x的线性回归方程为y147.7672.352x.(2)对于气温10,由回归方程可以预报热茶的销售杯数为y147.7672.352(10)171.287171(杯)规律方法进行线性回归分析的关键是画出样本点的散点图,确定出变量具有线性相关关系,再求出回归直线方程如果x,y的线性相关关系具有统计意义,就可以用线性回归方程来作预测和控制预测是指对于x的取值范围内任一个x0,y取相应值y0的估计;控制是指通过控制x的值把y的值控制在指定范围内 为了研究3月下旬的平均气温(x)与4月20日前棉花害虫化蛹高峰日(
6、y)的关系,某地区观察了2006年至2011年的情况,得到了下面的数据:【训练1】 年份200620072008200920102011x/24.429.632.928.730.328.9y/日19611018(1)对变量x,y进行相关性检验;(2)据气象预测,该地区在2012年3月下旬平均气温为27 ,试估计2012年4月化蛹高峰日为哪天解制表.题型二可线性化的回归分析【例2】 (12分)在一化学反应过程中,化学物质的反应速度y(g/min)与一种催化剂的量x(g)有关,现收集了8组观测数据列于表中:催化剂的量x/g1518212427303336化学物质的反应速度y/(gmin1)6830
7、277020565350审题指导 解答本题可先画出散点图,再选择适宜的回归方程求解【解题流程】 规范解答 根据收集的数据,作散点图(如图),根据已有的函数知识,可以发现样本点分布在某一条指数函数曲数yc1ec2x的周围,其中c1和c2是待定的参数令zln y,则zln yln c1c2x,即变换后的样本点应该分布在直线zabx(aln c1,bc2)的周围(2分)(4分)由y与x的数据表可得到变换后的z与x的数据表: x1518212427303336z 1.792 2.079 3.401 3.296 4.248 5.323 4.174 5.858(6分) 作出z与x的散点图(如图)(8分)由
8、散点图可观察到,变换后的样本点分布在一条直线的附近,所以可用线性回归方程来拟合由z与x的数据表,可得线性回归方程:z0.8480.81x,所以y与x之间的非线性回归方程为:ye0.8480.81x. (12分)【题后反思】 可线性化的回归分析问题,画出已知数据的散点图,选择跟散点拟合得最好的函数模型进行变量代换,作出变换后样本点的散点图,用线性回归模型拟合 电容器充电后,电压达到100 V,然后开始放电,由经验知道,此后电压U随时间t变化的规律用公式UAebt(b0)表示,现测得时间t(s)时的电压U(V)如下表: 【训练2】 t/s0123456789 10U/V 1007555403020
9、151010 55试求:电压U对时间t的回归方程(提示:对公式两边取自然对数,把问题转化为线性回归分析问题) 对UAebt两边取对数得ln Uln Abt,令yln U,aln A,xt,则yabx,得y与x的数据如下表:根据表中数据作出散点图,如下图所示,从图中可以看出,y与x具有较强的线性相关关系,由表中数据求得5,3.045,进而可以求得b0.313,ab 4.61,所以y对x的线性回归方程为y4.610.313x.x012345678910y 4.64.34.03.73.43.02.72.32.31.61.6解由yln U,得Uey,Ue4.610.313 xe4.16e0.313 x
10、,因此电压U对时间t的回归方程为Ue4.61e0.313 x. 在一次抽样调查中测得样本的5个样本点,数值如下表:试建立y与x之间的回归方程误区警示没有判断两变量的相关性而致错【示例】 x 0.250.5 1 2 4y16125 2 1错解 由已知条件制下表: 序号xiyixiyixy10.251640.062 525620.51260.25144315512542244454141617.75362321.312 5430t421 0.50.25y 1612 521由散点图也可以看出y与t呈近似的线性相关关系列表如下:序号tiyitiyity141664162562212244144315512540.5210.25450.2510.250.062 517.753694.2521.312 5430 求回归方程,应注意首先对样本点是否线性相关进行检验,因为对于任何一组样本点,都可以根据最小二乘法求得一个线性回归方程,但这条线性回归方程是否较好地反映了样本点的分布呢,显然不一定,特别是对于不呈线性相关的回归模型可以通过散点图或求相关系数r首先作出是否线性相关的检验,然后再选择恰当的回归模型进行模拟