《独立性检验》

上传人:新** 文档编号:567709942 上传时间:2024-07-22 格式:PPT 页数:35 大小:1.03MB
返回 下载 相关 举报
《独立性检验》_第1页
第1页 / 共35页
《独立性检验》_第2页
第2页 / 共35页
《独立性检验》_第3页
第3页 / 共35页
《独立性检验》_第4页
第4页 / 共35页
《独立性检验》_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《《独立性检验》》由会员分享,可在线阅读,更多相关《《独立性检验》(35页珍藏版)》请在金锄头文库上搜索。

1、独立性检验独立性检验本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心在日常生活中,我们常常关心分类变量的之间是否有关系分类变量的之间是否有关系独立性检验独立性检验独立性检验独立性检验日常生活中我们关心这样一些问题:日常生活中我们关心这样一些问题:1.吸烟与患呼吸道疾病有无关系?吸烟与患呼吸道疾病有无关系?2.饮食与心脏病之间有无关系?饮食与心脏病之间有无关系?3.性别与喜欢数学课之间有无关系?性别与喜欢数学课之间有无关系?以上问题用什么知识来解决呢?以上问题用什么知识来解决呢?统计学中检验两个变量统计学中检验两个变量是否有关系是否有关系的一的一种统计方法种统计方法独立性检验

2、独立性检验学习目标学习目标 1.会列会列22列联表,会画等高条形图列联表,会画等高条形图2.会从会从22列联表,等高条形图中直观列联表,等高条形图中直观的判断出两个分类变量之间是否有关?的判断出两个分类变量之间是否有关?3.了解独立性检验的基本思想和步骤了解独立性检验的基本思想和步骤 某医疗机构为了了解患呼吸道疾病患呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220220人,不吸烟者295295 人,调查结果是:吸烟的220220 人中3737人患呼吸道疾病呼吸道疾病, 183183人未患呼吸道呼吸道疾病疾病;不吸烟的295295人中2121人患病, 274

3、274人未患病病。 根据这些数据能否断定:患呼吸道疾病呼吸道疾病与吸烟有关? 吸烟与患呼吸道疾病列联表吸烟与患呼吸道疾病列联表患病患病不患病不患病总计总计吸烟吸烟3737183183220220不吸烟不吸烟2121274274295295总计总计5858457457515515为了调查吸烟是否对呼吸道有影响,某医疗研究所随为了调查吸烟是否对呼吸道有影响,某医疗研究所随机地调查了机地调查了515515人,得到如下结果(单位:人)人,得到如下结果(单位:人)列联表列联表在不吸烟者中患病的比重是在不吸烟者中患病的比重是 在吸烟者中患病的比重是在吸烟者中患病的比重是 7.12%7.12%16.82%1

4、6.82%不患病患病1)通过图形直观判断通过图形直观判断三维柱三维柱状图状图不患病患病2) 通过图形直观判断通过图形直观判断二维条二维条形图形图不患病患病3)通过图形直观判断通过图形直观判断患病患病比例比例不患病不患病比例比例问题1:吸烟与不吸烟,患病的可能性的大小是否有差异? 吸烟者和不吸烟者患呼吸道疾病的可能性存在差吸烟者和不吸烟者患呼吸道疾病的可能性存在差异,吸烟者患呼吸道疾病的可能性大异,吸烟者患呼吸道疾病的可能性大问题2:差异大到什么程度才能作出“吸烟与患病有关”的判断?问题3:能否用数量刻画出“有关”的程度?初步结论:初步结论:思考交流:反证法原理: 在一个已知假设下,如果推出一个

5、矛盾,就证明了这个假设不成立。假设检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。数据整理;数据整理;(列(列2 2联表)联表)做出相反的假设;(做出相反的假设;(“患病与吸烟没有关系患病与吸烟没有关系”)计算计算 ;查临界值表;查临界值表;下结论。下结论。统计学对此类问题提供了这样的方法:统计学对此类问题提供了这样的方法:数据整理;数据整理;(列(列2 2联表)联表)做出相反的假设;(做出相反的假设;(“患病与吸烟没有关系患病与吸烟没有关系”)计算计算 ;查临界值表;查临界值表;下结论。下结论。统计学对此类问题提供了这样的方法:统计学对此类问题提供了这

6、样的方法: 吸烟与患呼吸道疾病关系列联表吸烟与患呼吸道疾病关系列联表患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d1、列、列2 2联表联表H H0 0: 吸烟吸烟 和和患呼吸道疾病患呼吸道疾病没有关系没有关系 通过数据和图表分析,得到结论是:通过数据和图表分析,得到结论是: 吸烟与患呼吸道病有关吸烟与患呼吸道病有关结论的可靠结论的可靠程度如何?程度如何? 2、做出相反的假设、做出相反的假设3、计算、计算吸烟的人中患病的比例:吸烟的人中患病的比例:不吸烟的人中患病的比例:不吸烟的人中患病

7、的比例: 吸烟与患呼吸道疾病关系列联表吸烟与患呼吸道疾病关系列联表患病患病不患病不患病总计总计吸烟吸烟a ab ba+ba+b不吸烟不吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d若若H H0 0成立成立作为检验在多大程度上可以认为作为检验在多大程度上可以认为“两个变量两个变量有关系有关系”的标准的标准 。统计学家为了消除样本量对上式的影响,引入统计学家为了消除样本量对上式的影响,引入了了卡方统计量卡方统计量通过公式计算通过公式计算 吸烟与患呼吸道疾病列联表吸烟与患呼吸道疾病列联表患病患病不患病不患病总计总计吸烟吸烟3737183183220220不吸

8、烟不吸烟2121274274295295总计总计58584574575155154、查表、查表1)1)如果如果P(P( 10.828)= 0.00110.828)= 0.001表示有表示有99.9%99.9%的把握认为的把握认为”X X与与Y Y”有关有关系系; ;2)2)如果如果P( 7.879)= 0.005P( 7.879)= 0.005表示有表示有99.5%99.5%的把握认为的把握认为”X X与与Y Y”有关有关系系; ;3)3)如果如果P( 6.635)= 0.01P( 6.635)= 0.01表示有表示有99%99%的把握认为的把握认为”X X与与Y Y”有关系有关系; ;4)4

9、)如果如果P( 5.024)= 0.025P( 5.024)= 0.025表示有表示有97.5%97.5%的把握认为的把握认为”X X与与Y Y”有关有关系系; ;5)5)如果如果P( 3.841)= 0.05P( 3.841)= 0.05表示有表示有95%95%的把握认为的把握认为”X X与与Y Y”有关系有关系; ;6)6)如果如果P( 2.706)= 0.10P( 2.706)= 0.10表示有表示有90%90%的把握认为的把握认为”X X与与Y Y”有关系有关系; ;7)7)如果如果P( P( 2.706),2.706),就认为没有充分的证据显示就认为没有充分的证据显示”X X与与Y

10、Y”有关系有关系; ;已知在已知在 成立的情况下,成立的情况下,故有故有99.9%99.9%的把握认为的把握认为H H0 0不成立,即有不成立,即有99.9%99.9%的把握认为的把握认为“患呼吸道疾病与吸烟有关系患呼吸道疾病与吸烟有关系”。5、下结论、下结论网络链接网络链接检验结果检验结果 DNADNA是从几滴血是从几滴血, ,腮细胞或培养的组织纤内提取而腮细胞或培养的组织纤内提取而来来. .用畴素将用畴素将DNADNA样本切成小段样本切成小段, ,放进喱胶内放进喱胶内, ,用电泳槽推动用电泳槽推动DNADNA小块使之分离小块使之分离-最细的在最远最细的在最远, ,最大的最近最大的最近. .

11、 之後之後, , 分分离开的基因放在尼龙薄膜上离开的基因放在尼龙薄膜上, ,使用特别的使用特别的DNADNA探针去寻找基探针去寻找基因因, , 相同的基因会凝聚于一相同的基因会凝聚于一, ,然後然後, ,利用特别的染料利用特别的染料, ,在在X X光光的环境下的环境下, ,便显示由便显示由DNADNA探针凝聚于一的黑色条码探针凝聚于一的黑色条码. .小孩这小孩这种肉眼可见的条码很特别种肉眼可见的条码很特别 -一半与母亲的吻合一半与母亲的吻合, ,一半与一半与父亲的吻合父亲的吻合. .这过程重覆几次这过程重覆几次, ,每一种探针用于寻找每一种探针用于寻找DNADNA的的不同部位并影成独特的条码不

12、同部位并影成独特的条码, ,用几组不同的探针用几组不同的探针, ,可得到超可得到超过过99,9%99,9%的父系或然率或分辨率的父系或然率或分辨率. . DNA亲子鉴定的原理和程序亲子鉴定的原理和程序DNA亲子鉴定的结果亲子鉴定的结果 孩子会有一条纹与亲生母亲相同而另一条码与孩子会有一条纹与亲生母亲相同而另一条码与待证实父亲待证实父亲1号号(AF1)相同相同,此人是生父此人是生父; 被排除的男被排除的男子子(AF2),则与小孩并无相同的条码则与小孩并无相同的条码. 肯定父系关系肯定父系关系 = 99.99%或更大的生父或然率或更大的生父或然率 (法律上证明是生父法律上证明是生父) 否定父系关系

13、否定父系关系 = 0% 生父或然率生父或然率(100%排除为生父排除为生父)例例1.1.在在500500人人身身上上试试验验某某种种血血清清预预防防感感冒冒作作用用,把把他他们们一一年年中中的的感感冒冒记记录录与与另另外外500500名名未未用用血血清清的的人人的的感感冒冒记记录录作作比比较较,结结果果如如表表所所示示。问问:该该种种血血清清能能否否起起到到预预防防感冒的作用?感冒的作用?未感冒未感冒感冒感冒合计合计使用血清使用血清258242500未使用血清未使用血清216284500合计合计4745261000解:设解:设H0:感冒与是否使用该血清没有关系。:感冒与是否使用该血清没有关系。

14、因当因当H0成立时,成立时,26.635的概率约为的概率约为0.01,故有,故有99%的把握认的把握认为该血清能起到预防感冒的作用。为该血清能起到预防感冒的作用。P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.8

15、79 10.828有效有效无效无效合计合计口服口服585840409898注射注射646431319595合计合计1221227171193193解:设解:设H0:药的效果与给药方式没有关系。:药的效果与给药方式没有关系。因当因当H0成立时,成立时,21.3896的概率大于的概率大于15%,故不能否定假设,故不能否定假设H0,即不能作出药的效果与给药方式有关的结论。,即不能作出药的效果与给药方式有关的结论。2.072例例2 2:为研究不同的给药方式(口服与注射)和药的效:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,果(有效与无效)是否有关,进行了相

16、应的抽样调查,调查的结果列在表中,根据所选择的调查的结果列在表中,根据所选择的193193个病人的数个病人的数据,能否作出药的效果和给药方式有关的结论?据,能否作出药的效果和给药方式有关的结论?P(x0)0.500.400.250.150.100.050.025 0.010 0.005 0.001x00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828例例3:气管炎是一种常见的呼吸道疾病,医药研究人:气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,员对两种中草药治疗慢性气管炎的疗效进行对比,

17、所得数据如表所示,问:它们的疗效有无差异?所得数据如表所示,问:它们的疗效有无差异?有效有效无效无效合计合计复方江剪刀草复方江剪刀草18461245胆黄片胆黄片919100合计合计27570345解:设解:设H0:两种中草药的治疗效果没有差异。:两种中草药的治疗效果没有差异。因当因当H0成立时,成立时,210.828的概率为的概率为0.001,故有,故有99.9%的把握认的把握认为,两种药物的疗效有差异。为,两种药物的疗效有差异。小结:小结:1、独立性检验的基本思想、独立性检验的基本思想2、独立性检验是用、独立性检验是用 统计量研究一统计量研究一类问题的方法。类问题的方法。3、用、用 统计量研

18、究问题的步骤统计量研究问题的步骤 由于抽样的随机性,由样本得到的推断由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用有可能正确,也有可能错误。利用 进行进行独立性检验,可以对推断的正确性的概率作独立性检验,可以对推断的正确性的概率作出估计,样本量出估计,样本量n n越大,估计越准确。越大,估计越准确。例例1:随着:随着新还珠格格新还珠格格的热播,又掀起了一的热播,又掀起了一场场“还珠热还珠热”。为了了解喜爱看。为了了解喜爱看新还珠格格新还珠格格是是否与性别有关,小欣随机抽查了否与性别有关,小欣随机抽查了140名男性和名男性和160名女性,调查发现,男性和女性中分别有名女性,调查

19、发现,男性和女性中分别有80人和人和120人喜爱看,其余人不喜爱看。人喜爱看,其余人不喜爱看。(2)利用图形判断性别与是否喜爱看)利用图形判断性别与是否喜爱看新新 还珠格格还珠格格有关?有关?(1)根据以上数据建立一个)根据以上数据建立一个22的列联表;的列联表; 为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下联表:喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程总计总计男男3785122女女35143178总计总计72228300解:在假设“性别与是否喜欢数学课程之间没有关系”的前提下K2应该很小,并且例3.性别与喜欢数学课 由表中数

20、据计算K2的观测值k 4.513。在多大程度上可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么?而我们所得到的K2的观测值k 4.513超过3.841,这就意味着“性别与是否喜欢数学课程之间有关系”这一结论错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”。例例1.在某医院在某医院,因为患心脏病而住院的因为患心脏病而住院的665名男性病人名男性病人中中,有有214人秃顶人秃顶;而另外而另外772名不是因为患心脏病而住名不是因为患心脏病而住院的男性病人中有院的男性病人中有175秃顶秃顶.分别利用图形和独立性检分别利用图形和独立性检验方法判断秃顶与患心脏病是

21、否有关系验方法判断秃顶与患心脏病是否有关系?你所得的结论你所得的结论在什么范围内有效在什么范围内有效?秃顶与患心脏病列联表秃顶与患心脏病列联表患心脏病患心脏病患其他病患其他病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437有有99%的把握认为的把握认为“秃顶与患心脏病有关秃顶与患心脏病有关”例例2. 为考察高中生的性别与是否喜欢数学课程之间的关为考察高中生的性别与是否喜欢数学课程之间的关系。在某城市的某校高中生随机抽取系。在某城市的某校高中生随机抽取300名学生。得到名学生。得到如下列联表:如下列联表:性别与喜欢数学课程列联表性别与喜欢数学课程列联

22、表喜欢喜欢不喜欢不喜欢总计总计男男3785122女女35143178总计总计72228300 由表中数据计算得到由表中数据计算得到 的观测值的观测值 4.514。能够。能够以以95的把握认为高中生的性别与是否喜欢数学课程的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?为什么?之间有关系吗?为什么? 解:在假设解:在假设 “性别与是否喜欢数学课程之间没有关系性别与是否喜欢数学课程之间没有关系”的前提下,的前提下, 应该很小,并且应该很小,并且而我们所得到的而我们所得到的 的观测值的观测值 超过超过3.8413.841,这就,这就意味着意味着“性别与是否喜欢数学课程之间有关系性别与是否喜欢数

23、学课程之间有关系”这一结论这一结论是错误的可能性约为是错误的可能性约为0.050.05,即有,即有95%95%的把握认为的把握认为“性别与性别与是否喜欢数学课程之间有关系是否喜欢数学课程之间有关系”。练习练习:甲乙两个班级进行一门考试甲乙两个班级进行一门考试,按照学生考试成绩优秀和按照学生考试成绩优秀和不优秀统计后不优秀统计后,得到如下列联表得到如下列联表:优秀优秀不优秀不优秀总计总计甲班甲班103545乙班乙班73845总计总计177390画出列联表的条形图出列联表的条形图,并通过图形判断成绩与班级是否并通过图形判断成绩与班级是否有关有关.利用列联表的独立性检验估计利用列联表的独立性检验估计,认为认为“成绩与班级成绩与班级有关系有关系”犯错误的概率是多少。犯错误的概率是多少。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号