第62讲 统计案例与线性回归分析

上传人:cl****1 文档编号:499133778 上传时间:2022-08-23 格式:DOCX 页数:21 大小:161.88KB
返回 下载 相关 举报
第62讲 统计案例与线性回归分析_第1页
第1页 / 共21页
第62讲 统计案例与线性回归分析_第2页
第2页 / 共21页
第62讲 统计案例与线性回归分析_第3页
第3页 / 共21页
第62讲 统计案例与线性回归分析_第4页
第4页 / 共21页
第62讲 统计案例与线性回归分析_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《第62讲 统计案例与线性回归分析》由会员分享,可在线阅读,更多相关《第62讲 统计案例与线性回归分析(21页珍藏版)》请在金锄头文库上搜索。

1、第62讲:统计案例与线性回归分析一、课程标准1、会作两个有关联变量的数据的散点图,并利用散点图认识变量间的相关关系2、了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3、了解独立性检验的基本思想、方法及其简单应用,能通过计算判断两个变量的相关程度二、基础知识回顾1. 变量间的相关关系(1) 常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关 系是一种非确定性关系.瞳|体现的不一定是因果关系.(2) 从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关;点散 布在左上角到右下角的区域内,两个变量的这种相关关系为

2、负相关.2. 两个变量的线性相关(1) 从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之 间具有线性相关关系,这条直线叫做回归直线.(2) 回归方程为yA=bAx+aA_,其中其中aA,b是待定参数,错误!(乂一bxa)2的最小值而得到回归直 线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫做最小二乘法.(4)相关系数:当r0时,表明两个变量正相关;当r0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几 乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强

3、的线性相关性.3. 独立性检验(1) 2X2列联表设X,Y为两个变量,它们的取值分别为&,x2和如,y2,其样本频数列联表(2X2列联表)如下:yi总计x1aba+bX2cdc+d总计a+cb+da+b+c+d(2)独立性检验n (ad一bc ) 2利用随机变量K2(也可表示为又2)的观测值k=(a+b)(c+d)(a+Z)(b+dT(其中n=a+b+c+d为样本容量)来判断“两个变量有关系”的方法称为独立性检验.常用结论(1)求解回归方程的关键是确定回归系数a-,b-,应充分利用回归直线过样本中心点(x-,y).(2)根据K2的值可以判断两个分类变量有关的可信程度,若K2越大,则两分类变量有

4、关的把握越大.(3)根据回归方程计算的b-值,仅是一个预报值,不是真实发生的值.三、自主热身、归纳总结1、根据如下样本数据C. a0D. a0,b 3.841)牝0.05 , P(K2 6.635)牝0.01)A. 99%B. 95%C. 1%D. 5%变式1、某研究性学习小组调查研究学生使用智能手机对学习的影响,部分统计数据如表(参考公式:K 2 =n(ad 一 bc)2(a+b)(c + d )(a+c)(b+d)其中 n = a+b+c+d .)夜用曷能手汗不使用智&手如-合计|- 学习瞬优秀482学习成缱不优秀2 fa.aa afcaKBJ* -It r ITJT HT I- 合计L_

5、生珀I附表:P(K2 k0)0.150.100.050.0250.0100.0050.001k 02.0722.7063.8415.0246.6357.87910.828则下列选项正确的是()A. 有99.5%的把握认为使用智能手机对学习有影响B. 有99.5%的把握认为使用智能手机对学习无影响C. 有99.9%的把握认为使用智能手机对学习有影响D. 有99.9%的把握认为使用智能手机对学习无影响变式2、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A. 若&的观测值为;=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有 99人患有肺病;B. 从独

6、立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患 有肺病;C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推判出现错误;D. 以上三种说法都不正确.变式3、为考察某种疫苗预防疾病的效果,进行动物试验,得到统计数据如下:未发病发病总计未注射疫苗20xA注射疫苗30yB总计5050100.8号.6,5.43.2.10000-00-00现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为2.求2X2列联表中的数据x,y,A,B的值.(2)绘制发病率的条形统计图,并判断疫苗是否影响到了发病率?(3) 能否在犯错误的概率不超

7、过0.001的前提下认为疫苗有效?附:,n=a+b+c+d.n (adbe) 2(a+b)(c+d)(a+c)(b+d)临界值表:P(K2Nk0)0.050.010.0050.001ko3.8416.6357.87910.828方法总结:(1)根据题意完善2X2列联表,再计算观测值K2,对照临界值表即可得出结论;(2)理解K2的运算过程以及在实际问题中的统计学意义.考点三、统计案例与线性回归分析的综合例3、某大学餐饮中心为了了解新生的饮食习惯,在某学院大一年级100名学生中进行了抽样调查,发现喜 欢甜品的占70%.这100名学生中南方学生共80人。南方学生中有20人不喜欢甜品.(1)完成下列2

8、X2列 联表:喜欢甜品不喜欢甜品合计南方学生北方学生合计(2)根据表中数据,问是否有95%的把握认为南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(3)已知在被调查的南方学生中有6名数学系的学生,其中2名不喜欢甜品;有5名物理系的学生,其中1 名不喜欢甜品.现从这两个系的学生中,各随机抽取2人,记抽出的4人中不喜欢甜品的人数为X,求X的 分布列和数学期望.n (ad - bc附:欠2 (a + b)(c + d)(a + c)(b + d)P (K 2 k 0)0.150.1000.0500.0250.010k 02.0722.7063.8415.0246.635变式1、【吉林省梅河口市

9、第五中学2017-2018学年高二下学期期末】某中学一名数学老师对全班50名学生 某次考试成绩分男女生进行统计,其中120分(含120分)以上为优秀,绘制了如图所示的两个频率分布 直方图:(1)根据以上两个直方图完成下面的2 2列联表:性别成绩优秀不优秀总计男生女生总计(2)根据(1)中表格的数据计算,你有多大把握认为学生的数学成绩与性别之间有关系?k2.0722.7063.8415.0246.6357.87910.828P (K 2 k 0)0.150.100.050.0250.0100.0050.001n ad - bc )2附:K2 - TrR V; ,(a + b )(c + d )(a + c )(b + d )变式2、(2020届山东省德州市高三上期末)某公司为了了解年研发资金投人量工(单位:亿元)对年销售额 (单位:亿元)的影响.对公司近12年的年研发资金投入量工和年销售额.的数据,进行了对比分析, II建立了两个函数模型:J =a + px2,y = eM+,,其中a、p、人、t均为常数,e为自然对数的底数.并得到一些统计量的值.令七=x2,v, = In y. (i =1,2,,12),经计算得如下数据:xy月(x - X )i=1方(y - y) iuv206677246

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号