&amp#167;12.4 独立性检验与回归分析初步

上传人:飞****9 文档编号:132099064 上传时间:2020-05-12 格式:DOC 页数:6 大小:162KB
返回 下载 相关 举报
&amp#167;12.4 独立性检验与回归分析初步_第1页
第1页 / 共6页
&amp#167;12.4 独立性检验与回归分析初步_第2页
第2页 / 共6页
&amp#167;12.4 独立性检验与回归分析初步_第3页
第3页 / 共6页
&amp#167;12.4 独立性检验与回归分析初步_第4页
第4页 / 共6页
&amp#167;12.4 独立性检验与回归分析初步_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《&amp#167;12.4 独立性检验与回归分析初步》由会员分享,可在线阅读,更多相关《&amp#167;12.4 独立性检验与回归分析初步(6页珍藏版)》请在金锄头文库上搜索。

1、124独立性检验与回归分析初步(教案)知识点:了解独立性检验(只要求22到联表)的基本思想、方法及其初步应用,了解回归分析的基本思想、方法及其初步应用。学习目标:通过对典型案例的探究,进一步了解回归的基本思想、方法及初步应用。(一) 课标解读及教学要求:通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。(1)通过对典型案例(如肺癌与吸烟有关吗等)的探究,了解独立性检验(只要求2x2列联表)的基本思想、方法及其初步应用。(2)通过对典型案例(如质量控制,新药是否有效等)的探究,了解聚类分析的基本思想、方法及其初步应用。(3)通过对典型案例(如人的体重与身高的关系等)

2、的探究,进一步了解回归与分析的基本思想、方法及其初步应用。(二)知识点1统计量与临界值显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值 它必须在每一次统计检验之前确定 显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为,其中是数据的个数 在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值r0 05或r0 01;例如时,0.050.754,0.010.874 求得的相关系数和临界值0.05比较,若0.05,上面与是线性相关的,当r0 05或r

3、0 01,认为线性关系不显著讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直线;通过两个变量是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研究;我们研究的对象是两个变量的线性相关关系,还可以研究多个变量的相关问题,这在今后的学习中会进一步学到 解决方法:(直观方法1假设检验原理)思路:反证法思想(1)假设:患病与吸烟无关 即 P(A)P(B)= P(AB)(2)在成立的条件下进行推理。(3)如果实际观测值与由(2)推出的值相差不大,则可以认为这些差异是由随机误差造成的,假设不能被否定;否则,假设不能被接受.如何描述实际观测值与理论估计值的差异?(差异

4、不大的情况)解决方法2:检验法(2*2列联表中4个数都要大于5)未感冒感冒合计aba+bcdc+d合计a+cb+da+b+c+d 作为检验在多大程度上可以认为“两个变量有关系”的标准 。(理论上可以证明,当观测总数n很大时,c2近似地是一个称为c2分布的随机变量的观测值也就是说,在成立的情况下,对统计量c2进行多次观测,观测值超过6.635的频率约为0.01现在的c2=11.8634,大于6.635,由此可知,出现这样的观测值c2的概率不超过0.01因此,我们有99%的把握认为不成立,即有99%的把握认为“患呼吸道疾病与吸烟有关系”)即:如果c2较大,就拒绝,即事件A与事件B无关。注意:3个临

5、界值:10.828,3.841和6.635,当c210.828,有99.9%的把握说事件A与B有关;当c26.635,有99%的把握说事件A与B有关;当c22.706,认为事件A与B无关。独立性检验的一般步骤:(1)根据样本数据制成2*2列联表(2)根据公式计算c2的值;(3)比较c2与临界值的大小关系作统计推断2随机误差、线形回归模型(1)将称为线形回归模型,其中a+bx是确定性函数,称为随机误差。随机误差产生的主要原因有以下几种:所用的确定性函数不恰当引起的误差;忽略了某些因素的影响;存在观测误差。(2)回归直线方程为的计算公式:(3)如何精确刻画线性相关关系?相关系数r。相关系数:相关系

6、数是因果统计学家皮尔逊提出的,对于变量y与x的一组观测值,把= 叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度. 相关系数的性质: 1,且越接近1,相关程度越大;且越接近0,相关程度越小.掌握对相关系数r的显著性检验:一、基础训练:1相关子数r具有如下性质:(1)|r| 1;(2)|r|越接近1,两个变量间的线性相关程度越 ;(3)|r|越接近0,两个变量间的线性相关程度越 。2有下列关系:人的年龄与他(她)拥有的财富之间的关系;曲线上的点与该点的坐标之间的关系;苹果的产量与降雨量之间的关系;森林中的同一种树木,其断面直径与高度之间的关系;学生与他(她)的

7、学号之间的关系其中有相关关系的是_。3在第2题题中的5组数据中,去掉某组数据后,使剩下的4组数据的线性相关系数最大,则去掉的数组是 。4工人月工资(元)依劳动生产率(千元)变化的回归方程为=50+80x,下列判断正确的是_.(1)劳动生活率为1000元时,工资为130元;(2)劳动生产率提高1000元时,工资提高80元;(3)劳动生产率提高1000元时,工资提高130元;(4)当月工资为210元时,劳动生产率为2000元.二、例题:例1:有300人按性别和是否色弱分类如下表:男女正常142155色弱135由此表可求得的值为 4.046 ,根据,可以有95%的把握认为色弱与性别有关。【命题意图】

8、考查的计算与临界值比较的方法。【分析】利用表中的数据通过统计量,可以用它的取值大小来判断独立是否成立。例2:对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别。【命题意图】考查使用的统计量做2x2列联表的独立性检验的方法。使学生明白检验是解决此类问题的最常用的方法。【分析】可先画出2x2列联表(已经给出)。解:例3:一个车间为了规定工时定额,需要

9、确定加工零件所花费的时间,为此进行了10 次试验,测得如下数据:零件数x(个)102030405060708090100加工时间y(分)626875818995102108115122(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求回归直线方程;(3)据此估计加工200个零件所用时间为多少?【命题意图】考查线性关系的判断和线性回归方程的求法。【分析】先计算线性相关系数,再查表判断,最后求线性回归方程。例4:某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到如下数据:x123410203050100200y10.155.524.082.852.111.621.4

10、21.301.211.15 检验每册书的成本费y 与印刷数的倒数1/x之间是否具有线性相关关系(可靠性不低于99%)?如有,求出y对x的回归方程。【分析】考查回归方程的求法和系数b的实际意义。【命题意图】先由公式求出回归系数,得回归方程说明b的实际意义。作业: 班级 姓名 学号 1下列结论:函数关系是一种确定关系;相关关系是一种非确定性关系;回归分析是对具有函数关系的两个变量进行分析的一种方法;回归分析是对具有相关关系的两个变量进行统计分析的一种常方法。其中正确的是 。2对于回归分析,下列说法正确的是 。(1)在回归分析中,变量间的关系若是非确定性关系,则因变量不能由自变量惟一确定(2)线性相

11、关系数可以是正的或负的(3)回归分析中,如果r2=1或r=1,说明x与y之间完全线性相关(4)样本相关系数r(-, +)3已知x与y之间的一组数据,则y与x的线性回归方程=bx+a必过点(1.5, )。4在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。(1)根据以上数据建立一个22的列联表;(2)试判断性别与休闲方式是否有关系(可靠性不低于95%)。5给10只中年大鼠注射内毒素(30mg/kg)后,测得每只大鼠的红细胞含量x(104/mm3)与血红蛋白含量y(g/L)分别如下:鼠号12345678910x654786667605761642652706602539y130168143130158129151153149109 试对x, y两变量进行线性相关和回归分析(x为自变量,y为因变量,可靠性不低于95%)。6

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号