11回归分析的基本思想及其初步应用习题课

上传人:M****1 文档编号:587178848 上传时间:2024-09-05 格式:PPT 页数:33 大小:723KB
返回 下载 相关 举报
11回归分析的基本思想及其初步应用习题课_第1页
第1页 / 共33页
11回归分析的基本思想及其初步应用习题课_第2页
第2页 / 共33页
11回归分析的基本思想及其初步应用习题课_第3页
第3页 / 共33页
11回归分析的基本思想及其初步应用习题课_第4页
第4页 / 共33页
11回归分析的基本思想及其初步应用习题课_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《11回归分析的基本思想及其初步应用习题课》由会员分享,可在线阅读,更多相关《11回归分析的基本思想及其初步应用习题课(33页珍藏版)》请在金锄头文库上搜索。

1、我们的梦向往的地方 北京师范大学用自己的聪明和勤奋,打造一个最优秀的自己 北京师范大学是教育部直属重点大学,北京师范大学是教育部直属重点大学,是一所以教师教育、教育科学和文理基础是一所以教师教育、教育科学和文理基础学科为主要特色的著名学府。学校的前身学科为主要特色的著名学府。学校的前身是是1902年创立的京师大学堂师范馆,年创立的京师大学堂师范馆,1908年改称京师优级师范学堂,独立设校。年改称京师优级师范学堂,独立设校。1912年改名为北京高等师范学校。年改名为北京高等师范学校。1923年年更名为北京师范大学,成为中国历史上第更名为北京师范大学,成为中国历史上第一所师范大学。一所师范大学。1

2、931年、年、1952年北平女子年北平女子师范大学、辅仁大学先后并入北京师范大师范大学、辅仁大学先后并入北京师范大学。学。 复习回顾:复习回顾:1.回归直线的方程回归直线的方程:我们又引入相关指数我们又引入相关指数R2来刻画回归的效果:来刻画回归的效果:残差平方和残差平方和总体偏差平方和总体偏差平方和当当R2越接近于越接近于1,说明解释变量和预报变量说明解释变量和预报变量之间的相关性越强之间的相关性越强,如果同一个问题如果同一个问题,采用采用不同的回归方法分析不同的回归方法分析,我们可以通过我们可以通过选择选择R2大的来作为回归模型大的来作为回归模型相关系数相关系数 相关系数的性质相关系数的性

3、质: : (1)|r|1 (1)|r|1 (2)|r|(2)|r|越接近于越接近于1 1,相关程度越强;,相关程度越强;|r|r|越接近于越接近于0 0, 相关程度越弱相关程度越弱如何描述两个变量之间线性相关关系的强弱?如何描述两个变量之间线性相关关系的强弱?问题:问题:达到怎样程度,达到怎样程度,x、y线性相关呢?线性相关呢?它们的相关程度怎样呢?它们的相关程度怎样呢?基本步骤基本步骤抽取样本抽取样本, ,采集数据采集数据作出散点图作出散点图确定类型确定类型, ,求回归方程求回归方程残差分析残差分析相关指数相关指数判定拟合程度判定拟合程度案例案例2 一只红铃虫的产卵数一只红铃虫的产卵数y和温

4、度和温度x有关。现有关。现收集了收集了7组观测数据列于表中:组观测数据列于表中:(1 1)试试建建立立产产卵卵数数y y与与温温度度x x之之间间的的回回归归方方程程;并并预测温度为预测温度为2828o oC C时产卵数目。时产卵数目。(2 2)你所建立的模型中温度在多大程度上解释了)你所建立的模型中温度在多大程度上解释了产卵数的变化?产卵数的变化? 温度温度xoC21232527293235产卵数产卵数y/个个711212466115325非线性回归问题非线性回归问题假设线性回归方程为假设线性回归方程为 :=bx+a选选 模模 型型由计算器得:线性回归方程为由计算器得:线性回归方程为y=y=

5、19.8719.87x x-463.73-463.73 相关指数相关指数R R2 2= =r r2 20.8640.8642 2=0.7464=0.7464估计参数估计参数 解:选取气温为解释变量解:选取气温为解释变量x x,产卵数产卵数 为预报变量为预报变量y y。选变量选变量所以,二次函数模型中温度解释了所以,二次函数模型中温度解释了74.64%的产卵数变化。的产卵数变化。探索新知探索新知画散点图画散点图050100150200250300350036912151821242730333639方案1分析和预测分析和预测当当x=28时,时,y =19.8728-463.73 93一元线性模型

6、一元线性模型奇奇怪怪?9366 ?模型不好?模型不好? y=bx2+a 变换变换 y=bt+a非线性关系非线性关系 线性关系线性关系方案2问题问题选用选用y=bx2+a ,还是还是y=bx2+cx+a ?问题问题3 产卵数产卵数气气温温问题问题2如何求如何求a、b ?合作探究合作探究 t=x2二二次函数模型次函数模型方案2解答平方变换平方变换:令令t=xt=x2 2,产卵数产卵数y y和温度和温度x x之间二次函数模型之间二次函数模型y=bxy=bx2 2+a+a就转化为产卵数就转化为产卵数y y和温度的平方和温度的平方t t之间线性回归模型之间线性回归模型y=y=bt+abt+a温度温度21

7、232527293235温度的平方温度的平方t44152962572984110241225产卵数产卵数y/个个711212466115325作作散散点点图图,并并由由计计算算器器得得:y y和和t t之之间间的的线线性性回回归归方方程程为为y=y=0.3670.367t t-202.543-202.543,相关指数相关指数R R2 2=0.802=0.802将将t=xt=x2 2代入线性回归方程得:代入线性回归方程得: y=y=0.3670.367x x2 2 -202.543 -202.543当当x x=28=28时时,y y=0.367=0.36728282 2- -202.548520

8、2.5485,且,且R R2 2=0.802=0.802,所以,二次函数模型中温度解所以,二次函数模型中温度解释了释了80.2%80.2%的产卵数变化。的产卵数变化。t问题问题 变换变换 y=bx+a非线性关系非线性关系 线性关系线性关系问题问题如何选取指数函数的底如何选取指数函数的底?产卵数产卵数气气温温指数函数模型指数函数模型方案3合作探究合作探究对数对数方案3解答温度温度xoC21232527293235z=lny1.9462.3983.0453.1784.1904.7455.784产卵数产卵数y/个个711212466115325xz当当x=28x=28o oC C 时,时,y 44

9、y 44 ,指数回归指数回归模型中温度解释了模型中温度解释了98.5%98.5%的产卵数的的产卵数的变化变化由计算器得:由计算器得:z z关于关于x x的线性回归方程的线性回归方程为为 对数变换:在对数变换:在 中两边取常用对数得中两边取常用对数得令令 ,则,则 就转换为就转换为z=z=bx+abx+a. .相关指数相关指数R R2 2=0.98=0.98最好的模型是哪个最好的模型是哪个? 产卵数产卵数气气温温产卵数产卵数气气温温线性模型线性模型二次函数模型二次函数模型指数函数模型指数函数模型比比一一比比函数模型函数模型相关指数相关指数R2线性回归模型线性回归模型0.7464二次函数模型二次函

10、数模型0.80指数函数模型指数函数模型0.98最好的模型是哪个最好的模型是哪个?回归分析(二)回归分析(二)则回归方程的残差计算公式分别为:则回归方程的残差计算公式分别为:由计算可得:由计算可得:x21232527293235y7112124661153250.557-0.1011.875-8.9509.230-13.38134.67547.69619.400-5.832-41.000-40.104-58.26577.968因此模型(因此模型(1)的拟合效果远远优于模型()的拟合效果远远优于模型(2)。)。练练习习:为为了了研研究究某某种种细细菌菌随随时时间间x x变变化化,繁繁殖殖的的个个数

11、数,收集数据如下:收集数据如下:天天 数数 x/x/天天 1 1 2 2 3 34 4 5 56 6繁繁殖殖个个数数y/y/个个 6 6 1212 2525 4949 9595190190 (1 1)用天数作解释变量,繁殖个数作预报变量,作出这些)用天数作解释变量,繁殖个数作预报变量,作出这些 数据的散点图;数据的散点图; (2) 描述解释变量与预报变量描述解释变量与预报变量 之间的关系;之间的关系; (3 3) 计算残差、相关指数计算残差、相关指数R R2 2. .天数天数繁殖个数繁殖个数解:解:(1)散点图如右所示散点图如右所示 (2 2)由散点图看出样本点分布在一条指数函数)由散点图看出

12、样本点分布在一条指数函数y= y= 的周的周围,于是令围,于是令Z=Z=lnylny, ,则则x x1 12 23 34 45 56 6Z Z1.791.792.482.483.223.223.893.894.554.555.255.25由计数器算得由计数器算得 则有则有6.066.0612.0912.0924.0924.0948.0448.0495.7795.77190.9190.9y y6 61212252549499595190190(3)即(解释变量)天数即(解释变量)天数解释了解释了99.99%(预报变量)繁殖细菌得预报变量)繁殖细菌得个数个数理论迁移理论迁移 例例 19931993

13、年到年到20022002年中国的国内生产总年中国的国内生产总值(值(GDPGDP)的数据(单位:亿元)如下:)的数据(单位:亿元)如下:104790.6104790.62002200274462.674462.61997199797314.897314.82001200167884.667884.61996199689468.189468.12000200058478.158478.11995199582067.582067.51999199946759.446759.41994199478345.278345.21998199834634.434634.419931993GDPGDP年份年份

14、GDPGDP年份年份(1 1)作)作GDPGDP和年份的散点图,根据该图和年份的散点图,根据该图猜想它们之间的关系应是什么?猜想它们之间的关系应是什么?(2 2)建立年份为解释变量)建立年份为解释变量GDPGDP为预报变为预报变量的回归模型,并计算残差量的回归模型,并计算残差. .(3 3)根据你得到的模型,预报)根据你得到的模型,预报20032003年的年的GDPGDP,看看你的预报与实际的,看看你的预报与实际的GDPGDP(117251.9117251.9亿元)的误差是多少?亿元)的误差是多少?(4 4)你认为这个模型能较好地刻画)你认为这个模型能较好地刻画GDPGDP和年份的关系吗?请说

15、明理由和年份的关系吗?请说明理由. .0200004000060000800001000001200001992199419961998200020022004 GDPGDP与年份近似地呈线性关系与年份近似地呈线性关系. .993.791993.791200220024638.0554638.055199719971277.6221277.622200120015252.0245252.024199619961932.3531932.353200020003037.4933037.493199519952140.9842140.984199919991489.2381489.238199419

16、941328.6851328.685199819986422.2696422.26919931993残差残差年份年份残差残差年份年份20032003年年GDPGDP预报值为预报值为112976.4112976.4,预报与实际相,预报与实际相差差4275.54275.5相关指数相关指数R R2 20.9740.974,说明年份能够解释,说明年份能够解释97.4%97.4%的的GDPGDP值变化,所建模型能很好地刻画值变化,所建模型能很好地刻画GDPGDP和年份的关系和年份的关系. .练习某运动员训练次数与运动成绩之间的数据关系如下:编号次数 成绩 试预测运动员训练次以及次的成绩编号次数 成绩 第

17、一步:做散点图编号次数 成绩 第二步:求回归方程编号编号次数次数 成绩成绩 残差残差第三步:残差图-1.24-0.370.550.461.380.170.09-1.08残差图残差图编号编号次数次数 成绩成绩 残差残差-1.24-0.370.550.461.380.170.09-1.08第四步:计算相关指数第四步:计算相关指数编号编号次数次数 成绩成绩 残差残差-1.24 -0.370.550.461.380.170.09-1.08说明了该运动员的成绩的差异有是由训练次数引起的,说明了两个变量的相关关系非常强第五步:作出预报由上述分析可知,我们可以用回归方程一般地,建立回归模型的基本步骤为:1.

18、确定研究对象2.画散点图3.由经验确定回归方程的类型4.按一定规则估计回归方程中的参数5. 分析残差图. 下结论. 分析残差图小结:作业:作业: 假设关于某设备的使用年限假设关于某设备的使用年限x和所支出的维修费用和所支出的维修费用 y(万元),有如下的统计资料。万元),有如下的统计资料。使用年限使用年限x 23456维修费用维修费用y 2.23.85.56.57.0若由资料知若由资料知,y对对x呈线性相关关系。试求:呈线性相关关系。试求:(1)线性回归方程)线性回归方程 的回归系数的回归系数 ;(2)求残差平方和;)求残差平方和;(3)求相关系数)求相关系数 ;(4)估计使用年限为)估计使用年限为10年时,维修费用是多少?年时,维修费用是多少?解:解: (1)由已知数据制成表格。)由已知数据制成表格。12345合计合计23456202.23.85.56.57.0254.411.422.032.542.0112.34916253690所以有所以有

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号