独立性检验的基本思想PPT课件

上传人:大米 文档编号:580616203 上传时间:2024-08-29 格式:PPT 页数:20 大小:450.03KB
返回 下载 相关 举报
独立性检验的基本思想PPT课件_第1页
第1页 / 共20页
独立性检验的基本思想PPT课件_第2页
第2页 / 共20页
独立性检验的基本思想PPT课件_第3页
第3页 / 共20页
独立性检验的基本思想PPT课件_第4页
第4页 / 共20页
独立性检验的基本思想PPT课件_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《独立性检验的基本思想PPT课件》由会员分享,可在线阅读,更多相关《独立性检验的基本思想PPT课件(20页珍藏版)》请在金锄头文库上搜索。

1、1.2 1.2 独立性检验的基本思想及其初步应用独立性检验的基本思想及其初步应用 在统计学中,独立性检验就是检验两个分类变量是在统计学中,独立性检验就是检验两个分类变量是否有关系的一种统计方法。否有关系的一种统计方法。 所谓所谓“分类变量分类变量”,就是指个体所属的类别不同,就是指个体所属的类别不同,也也称为称为属性变量属性变量或或定型变量定型变量。例如性别,是否吸烟,宗教。例如性别,是否吸烟,宗教信仰,国籍,等等信仰,国籍,等等 在日常生活中,我们常常关心两个分类变量之间是在日常生活中,我们常常关心两个分类变量之间是否有关系,例如吸烟是否与患肺癌有关系?性别是否对否有关系,例如吸烟是否与患肺

2、癌有关系?性别是否对于喜欢数学课程有影响等等。于喜欢数学课程有影响等等。 吸烟与患肺癌列联表吸烟与患肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了地调查了99659965人,得到如下结果(单位:人)人,得到如下结果(单位:人)列联表列联表2 22 21.1.在不吸烟者中患肺癌的比重是在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是在吸烟者中患肺癌

3、的比重是 0.54%0.54%2.28%2.28%2. 2. 通过图形直观判断通过图形直观判断二维二维条形图条形图3.3.通过图形直观判断通过图形直观判断患肺癌患肺癌比例比例不患肺癌不患肺癌比例比例等高等高条形图条形图 独立性检验 通过数据和图表分析,得到结通过数据和图表分析,得到结论是:论是:吸烟与患肺癌有关吸烟与患肺癌有关结论的可靠结论的可靠程度如何?程度如何? 吸烟与患肺癌列联表吸烟与患肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟a ab ba+ba+b吸烟吸烟c cd dc+dc+d总计总计a+ca+cb+db+da+b+c+da+b+c+d引入一个随机变量引入一个随机变

4、量:卡方统计量卡方统计量作为检验在多大程度上可以认为作为检验在多大程度上可以认为“两个变量两个变量有关系有关系”的标准的标准 。 吸烟与患肺癌列联表吸烟与患肺癌列联表不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965由由2 22 2列联表,得列联表,得故有故有99.9%99.9%的把握认为的把握认为“患肺癌与吸烟有关患肺癌与吸烟有关系系”。解:解:a+b+c+da+b+c+db+db+da+ca+c总计总计c+dc+dd dc ca+ba+bb ba a总计总计

5、一般地,对于两个分类变量一般地,对于两个分类变量X X和和Y Y。X X有两类取值:有两类取值:即类即类 和和 (如吸烟与不吸烟);(如吸烟与不吸烟);Y Y也有两类取值:也有两类取值:即类即类 和和 (如患病与不患病)。于是得到下列样(如患病与不患病)。于是得到下列样本频数的本频数的2 22 2列联表为:列联表为: 用卡方统计量来确定在多大程度上可以认为用卡方统计量来确定在多大程度上可以认为“两个分类变量有关系两个分类变量有关系”的方法称为这两个分类变的方法称为这两个分类变量的独立性检验。量的独立性检验。要推断要推断“X X和和Y Y有关系有关系”,可按下面的步骤进行:,可按下面的步骤进行:

6、(3 3)查对临界值表,作出判断。)查对临界值表,作出判断。(2 2)根据)根据2 22 2列联表与公式计算列联表与公式计算 的值;的值;0.050.0250.0100.0050.0013.8415.0246.6357.87910.828P( ) 0.500.400.250.150.100.4550.7081.3232.0722.706(1 1)根据题意,列)根据题意,列2222列联表;列联表;例例. .在某医院在某医院, ,因为患心脏病而因为患心脏病而住院的住院的665665名男性病人中名男性病人中, ,有有214214人秃顶人秃顶; ;而另外而另外772772名不是名不是因为患心脏病而住院

7、的男性病因为患心脏病而住院的男性病人中有人中有175175秃顶秃顶. .用独立性检验用独立性检验方法判断秃顶与患心脏病是否方法判断秃顶与患心脏病是否有关系有关系? ?解:秃顶与患心脏病列联表解:秃顶与患心脏病列联表患心脏病患心脏病患其他病患其他病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437所以我们有所以我们有99.9%99.9%的把握认为的把握认为“秃顶与患秃顶与患心脏病有关心脏病有关”根据根据2222列联表得列联表得练练1 1 为考察高中生的性别与是否喜欢数学课程之间的关为考察高中生的性别与是否喜欢数学课程之间的关系。在某城市的某校高中生随机

8、抽取系。在某城市的某校高中生随机抽取300300名学生。得到名学生。得到如下列联表:如下列联表:性别与喜欢数学课程列联表性别与喜欢数学课程列联表喜欢喜欢不喜欢不喜欢总计总计男男37378585122122女女3535143143178178总计总计7272228228300300 由表中数据计算得到由表中数据计算得到K K2 2的观测值的观测值k4.514k4.514。能够能够以以9595的把握认为高中生的性别与是否喜欢数学课程的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?为什么?之间有关系吗?为什么? 解:解: 我们所得到的我们所得到的 的观测值的观测值 超超过过3.8413.841

9、,这就意味着,这就意味着“性别与是否喜欢性别与是否喜欢数学课程之间有关系数学课程之间有关系”这一结论是错误的这一结论是错误的可能性约为可能性约为0.050.05,即有,即有95%95%的把握认为的把握认为“性别与是否喜欢数学课程之间有关系性别与是否喜欢数学课程之间有关系”。练练2: ( P15)甲乙两个班级进行一门考试甲乙两个班级进行一门考试, ,按照学生考试成绩优秀和按照学生考试成绩优秀和不优秀统计后不优秀统计后, ,得到如下列联表得到如下列联表: :优秀优秀不优秀不优秀总计总计甲班甲班103545乙班乙班73845总计总计177390画出列联表的条形图画出列联表的条形图, ,并通过图形判断

10、成绩与班级是否并通过图形判断成绩与班级是否有关有关. .根据列联表的独立性检验根据列联表的独立性检验, ,判断成绩与班级是否判断成绩与班级是否有关系。有关系。100%90%80%70%60%50%40%30%20%10% 0%优秀优秀不优秀不优秀列联表的条形图:列联表的条形图: 由图及表直观判断,好像由图及表直观判断,好像“成成 绩优秀与班级有关系绩优秀与班级有关系”,由表,由表中数据计算,得中数据计算,得 的观察值为的观察值为 。则没有充分的证据显示。则没有充分的证据显示“成成绩优秀与班级有关系绩优秀与班级有关系”作业:作业:P16 P16 习题习题1.2 1.2 第第1 1题题 第第2 2题题

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号