《独立性检验 (2)》由会员分享,可在线阅读,更多相关《独立性检验 (2)(14页珍藏版)》请在金锄头文库上搜索。
1、兰州二中兰州二中 王雯倩王雯倩国籍、宗教信仰、性别国籍、宗教信仰、性别观察与思考观察与思考我们在日常生活中如何对这些变量进行取我们在日常生活中如何对这些变量进行取值值?成绩、身高、年龄、某班学生的百米成绩成绩、身高、年龄、某班学生的百米成绩定量变量定量变量定性变量定性变量分类变量分类变量数学与生活数学与生活 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了调查了99659965人,得到如下结果(单位:人):人,得到如下结果(单位:人):案例分析案例分析调查结果调查结果:吸烟的:吸烟的2 2148148人中有人中有4949人患人患肺癌肺癌,
2、20992099 人未患人未患肺癌肺癌;不吸烟的;不吸烟的78177817人中有人中有4242人患病,人患病,77757775人未患病。人未患病。数据整理数据整理列联表列联表 列出两个分类列出两个分类变量的频数表变量的频数表不患肺癌不患肺癌患肺癌患肺癌不吸烟不吸烟吸烟吸烟777577754242781778172099209949492148214898749874919199659965总计总计总计总计0.54%2.28%等高条形图等高条形图 根据这些数据能否断定根据这些数据能否断定“吸烟对患肺癌有影响吸烟对患肺癌有影响”?你是如何判断的?你是如何判断的?不吸烟不吸烟吸烟吸烟患肺癌比例不患肺
3、癌比例吸烟的患病率吸烟的患病率不吸烟的患病率不吸烟的患病率49/214849/2148 2.28%2.28%42/781742/7817 0.54%0.54% 根据统计分析的思想,用频率估计概率可根据统计分析的思想,用频率估计概率可知,吸烟者与不吸烟者患病的可能性存在差异。知,吸烟者与不吸烟者患病的可能性存在差异。你能有多大把握认为你能有多大把握认为“患病与吸烟有关患病与吸烟有关”呢?呢?直观方法解决问题直观方法解决问题统计方法解决问题统计方法解决问题不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟aba+b吸烟吸烟cdc+d总计总计a+cb+da+b+c+d 把数字用字母代替,得到如下用字母
4、表示的列联表:把数字用字母代替,得到如下用字母表示的列联表:K K2 2如何判断吸烟如何判断吸烟与患肺癌之间的与患肺癌之间的关系呢?关系呢?0.50.40.250.150.10.460.7081.3232.0722.7060.050.0250.010.0050.0013.845.0246.6357.87910.83不患肺癌不患肺癌患肺癌患肺癌总计总计不吸烟不吸烟77757775424278177817吸烟吸烟20992099494921482148总计总计98749874919199659965K2=卡卡方方临临界界值值表表K K2 2的观的观测值测值首先,假设结论不成立,即首先,假设结论不成
5、立,即 H0 :两个分类变量没有关系:两个分类变量没有关系 (在这种假设下(在这种假设下k应该很小)应该很小)其次,由观测数据计算其次,由观测数据计算K2的观测值的观测值k, (如果(如果k很大,则在一定可信程度上说明很大,则在一定可信程度上说明H0不成立不成立,即两即两个分类变量之间有关系)个分类变量之间有关系)最后,根据最后,根据k的值判断假设是否成立的值判断假设是否成立独立性检验独立性检验 利用随机变量利用随机变量K K2 2来判断来判断“两个分类变量两个分类变量有关系有关系”的方法称为的方法称为独立性检验独立性检验例例 为为考考察察高高中中生生的的性性别别与与是是否否喜喜欢欢数数学学课
6、课程程之之间间的的关关系系,在在某某城城市市的的某某校校高高中中生生中中随随机机抽抽取取300名名学学生生,得得到到如如下下联表:联表:喜欢数学喜欢数学课程课程不喜欢数学不喜欢数学课程课程总计总计男男3785122女女35143178总计总计72228300 由由表表中中数数据据计计算算K2的的观观测测值值k4.513。在在多多大大程程度度上上可可以以认认为为高高中中生生的的性性别别与与是是否否喜喜欢欢数数学学课课程程之之间有关系?为什么?间有关系?为什么?应用与巩固应用与巩固0.50.40.250.150.10.460.7081.3232.0722.7060.050.0250.010.005
7、0.0013.845.0246.6357.87910.83 而而我我们们所所得得到到的的K2的的观观测测值值k4.513超超过过3.841,这这就就意意味味着着“性性别别与与是是否否喜喜欢欢数数学学课课程程之之间间的的关关系系”这这一一结结论论错错误误的的可可能能性性约为0.05(或小于0.05) ,即有95%(或大于 95%)的把握认为“性别与是否喜欢数学课程之间有关系”。解解:在在假假设设“性性别别与与是是否否喜喜欢欢数数学学课课程程之之间间的的关关系系”的前提下的前提下K2应该很小,并且应该很小,并且归纳与小结归纳与小结 在日常生活中还有哪些变量之间的相在日常生活中还有哪些变量之间的相关问题可以借助独立性检验来解决呢?关问题可以借助独立性检验来解决呢?作业与练习作业与练习 结合本节所学的知识对你所关心的结合本节所学的知识对你所关心的两个分类变量之间的相关关系进行独立两个分类变量之间的相关关系进行独立性检验性检验