文档详情

第一篇统计案例独立性检验课件

壹****1
实名认证
店铺
PPT
173.01KB
约18页
文档ID:606410549
第一篇统计案例独立性检验课件_第1页
1/18

单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,第一章 统计案例,选修1-2,“测量,重复测量,再重复测量,就能找出误差,以及误差的误差.”,伽利略,第一章 统计案例选修1-2 “测量,重复测量,再,1.1 独 立 性 检 验,医生对患者提出忠告:“你这气管炎是长期吸烟的结果,为了减缓症状,请快戒烟吧!”,呼吸道疾病真的与吸烟有关吗?,花粉的形状决定了花的颜色吗?,一种新药,用药方式会影响用药效果吗?,两个随机事件之间是否相互独立?,1.1 独 立 性 检 验医生对患者提出忠告:“你这气管,某医疗机构为了了解,呼吸道疾病,与吸烟是否有关,进行了一次抽样调查,共调查了,515,个成年人,其中吸烟者,220,人,不吸烟者,295,人,调查结果是:吸烟的,220,人中,37,人患,呼吸道疾病,,,183,人不患,呼吸道疾病,;不吸烟的,295,人中,21,人患,呼吸道疾病,,,274,人不患,呼吸道疾病,。

问题:,根据这些数据能否断定:患,呼吸道疾病,与,吸烟有关?,某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次,吸烟与呼吸道疾病列联表,患病,不患病,总计,吸烟,37,183,220,不吸烟,21,274,295,总计,58,457,515,问题:,为了调查吸烟是否患呼吸道疾病有影响,某医疗研究所随机地调查了515人,得到如下结果(单位:人),列联表,在不吸烟者中患呼吸道疾病的比重是,在吸烟者中患呼吸道疾病的比重是,7.12%,16.82%,吸烟与呼吸道疾病列联表患病不患病总计吸烟37183220,问题1:判断的标准是什么?,吸烟与不吸烟,患病的可能性的大小是否有差异?,说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大,问题2:差异大到什么程度才能作出“吸烟与患病有关”的判断?,问题3:能否用数量刻画出“有关”的程度?,问题1:判断的标准是什么?吸烟与不吸烟,患病的可能性的大小是,独立性检验,H,0,:,吸烟,和,患呼吸道疾病,之间没有关系,通过数据和图表分析,得到结论是:,吸烟与患呼吸道疾病有关,结论的可靠程度如何?,吸烟与呼吸道疾病列联表,患呼吸道疾病,不患呼吸道疾病,总计,吸烟,a,b,a+b,不吸烟,c,d,c+d,总计,a+c,b+d,a+b+c+d,独立性检验H0:吸烟和患呼吸道疾病之间没有关系通过数据和,吸烟的人中患肺癌的比例:,不吸烟的人中患肺癌的比例:,若H,0,成立,吸烟的人中患肺癌的比例:不吸烟的人中患肺癌的比例:若H0成立,独立性检验,引入一个随机变量:,卡方统计量,作为检验在多大程度上可以认为“两个变量有关系”的标准。

独立性检验引入一个随机变量:卡方统计量作为检验在多大程度上,独立性检验,通过公式计算,吸烟与呼吸道疾病列联表,患病,不患病,总计,吸烟,37,183,220,不吸烟,21,274,295,总计,58,457,515,独立性检验通过公式计算 吸烟与呼吸道疾病列联表患病不患病,独立性检验,已知在 成立的情况下,,故有99%的把握认为,H,0,不成立,即有99%的把握认为“患呼吸道疾病与吸烟有关系”即在 成立的情况下,大于6.635概率非常小,近似为0.01,现在的 =11.8634的观测值远大于6.635,出现这样的观测值的概率不超过0.01独立性检验已知在 成立的情况下,故有99%的把握认为,1)如果P(,m,10.828)=0.001表示有99.9%的把握认为”X与Y”有关系;,2)如果P(m7.879)=0.005表示有99.5%的把握认为”X与Y”有关系;,3)如果P(m6.635)=0.01表示有99%的把握认为”X与Y”有关系;,4)如果P(m5.024)=0.025表示有97.5%的把握认为”X与Y”有关系;,5)如果P(m3.841)=0.05表示有95%的把握认为”X与Y”有关系;,6)如果P(m2.706)=0.10表示有90%的把握认为”X与Y”有关系;,7)如果P(m,2.706),就认为没有充分的证据显示”X与Y”有关系;,y,1,y,2,总计,x,1,a,b,a+b,x,2,c,d,c+d,总计,a+c,b+d,a+b+c+d,22列联表,适用观测数据a,、,b,、,c,、,d不小于5,1)如果P(m10.828)=0.001表示有99.9%,一般地,对于两个研究对象和,有两类,取值,即类A和B(如吸烟与不吸烟);也有两类,取值,即类1和2(如患病与不患病)。

于是得到,下列联表所示的抽样数据:,类1,类2,总计,类A,a,b,a+b,类B,c,d,c+d,总计,a+c,b+d,a+b+c+d,用 统计量研究这类问题的方法称为,独立性检验,一般地,对于两个研究对象和,有两类类1类2总计类Aa,要推断“和有关系”,可按下面的步骤进行:,(1)提出假设,H,0,:和没有关系;,(3)查对临界值,作出判断2)根据2,2列表与公式计算 的值;,由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误利用 进行独立性检验,可以对推断的正确性的概率作出估计,样本量n越大,估计越准确,要推断“和有关系”,可按下面的步骤进行:(1)提出假设H,反证法原理与假设检验原理,反证法原理:,在一个已知假设下,如果,推出一个矛盾,,就,证明,了这个假设不成立假设检验原理:,在一个已知假设下,如果,一个与该假设矛盾的小概率事件发生,,,就,推断,这个假设不成立反证法原理与假设检验原理反证法原理:在一个已知假设下,如果,例1.,在500人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示问:该种血清能否起到预防感冒的作用?,未感冒,感冒,合计,使用血清,258,242,500,未使用血清,216,284,500,合计,474,526,1000,例1.在500人身上试验某种血清预防感冒作用,把他们一年中的,例2:为研究不同的给药方式(口服与注射),和药的效果(有效与无效)是否有关,进行,了相应的抽样调查,调查的结果列在表中,,根据所选择的193个病人的数据,能否作出,药的效果和给药方式有关的结论?,有效,无效,合计,口服,58,40,98,注射,64,31,95,合计,122,71,193,例2:为研究不同的给药方式(口服与注射)有效无效合计口服58,例3:气管炎是一种常见的呼吸道疾病,医药研,究人员对两种中草药治疗慢性气管炎的疗效进,行对比,所得数据如图所示,问:它们的疗效,有无差异,有效,无效,合计,复方江剪刀草,184,61,245,胆黄片,91,9,100,合计,275,70,345,例3:气管炎是一种常见的呼吸道疾病,医药研有效无效合计复方江,作业:P9-10 T1-3,P11 T1-3,作业:P9-10 T1-3,。

下载提示
相似文档
正为您匹配相似的精品文档