《独立性检验课件》由会员分享,可在线阅读,更多相关《独立性检验课件(9页珍藏版)》请在金锄头文库上搜索。
1、独立性检验独立性检验学习目标学习目标 1.会列会列22列联表,会画等高条形图列联表,会画等高条形图2.会从会从22列联表,等高条形图中直观列联表,等高条形图中直观的判断出两个分类变量之间是否有关?的判断出两个分类变量之间是否有关?3.了解独立性检验的基本思想和步骤了解独立性检验的基本思想和步骤例:为了了解喜爱看青春偶像剧是否与性例:为了了解喜爱看青春偶像剧是否与性别有关,小欣在班里随机抽查了别有关,小欣在班里随机抽查了16名男同名男同学和学和16名女同学,调查发现,男生和女生名女同学,调查发现,男生和女生中分别有中分别有8人和人和12人喜爱看,其余人不喜人喜爱看,其余人不喜爱看。爱看。(2)利
2、用等高条形判断性别与是否喜)利用等高条形判断性别与是否喜爱看青春偶像剧有关?爱看青春偶像剧有关?(1)根据以上数据建立一个)根据以上数据建立一个22的列联表;的列联表;(3)我们有多大的把握可以认为性别)我们有多大的把握可以认为性别与是否喜爱看青春偶像剧有关?与是否喜爱看青春偶像剧有关?3.“有关”的可信程度是多少?即有“多少把握认为有关”呢?两个分类变量的独立性检验患病不患病总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d 利用随机变量K2来确定是否能以一定的把握认为“两个变量有关系”的方法,称为两个分类变量的独立性检验。 利利用用独独立立性性检检验验来来考考察察两两个个分分
3、类类变变量量是是否否有有关关系系,能较精确地给出这种判断的可靠程度能较精确地给出这种判断的可靠程度. .具体作法是:具体作法是:(1 1)根据实际问题需要的可信程度确定临界值)根据实际问题需要的可信程度确定临界值k k0 0;(2)由观测数据计算得到随机变量)由观测数据计算得到随机变量K2的观测值的观测值k;(3)如果)如果k6.635,就以,就以 1-P(K26.635)100%的把的把握认为握认为“X与与Y有关系有关系”;否则就说样本观测数据没有;否则就说样本观测数据没有提供提供“X与与Y有关系有关系”的充分证据的充分证据.10.8287.8796.6355.0243.8412.7062.
4、0721.3230.7080.445 k0.0010.0050.0100.0250.050.100.150.50.400.50(1 1)如果)如果k10.828k10.828,就有,就有99.9%99.9%的把握认为的把握认为“X X与与Y Y有关系有关系”;(2 2)如果)如果k7.879k7.879,就有,就有99.5%99.5%的把握认为的把握认为“X X与与Y Y有关系有关系”;(3 3)如果)如果k6.635k6.635,就有,就有99%99%的把握认为的把握认为“X X与与Y Y有关系有关系”;(4 4)如果)如果k5.024k5.024,就有,就有97.5%97.5%的把握认为的
5、把握认为“X X与与Y Y有关系有关系”;(5 5)如果)如果k3.841k3.841,就有,就有95%95%的把握认为的把握认为“X X与与Y Y有关系有关系”;(6 6)如果)如果k2.706k2.706,就有,就有90%90%的把握认为的把握认为“X X与与Y Y有关系有关系”;(7 7)如果)如果k=2.706k=2.706,就认为没有充分的证据显示,就认为没有充分的证据显示 “X X与与Y Y有关系有关系”. .临界值临界值例例2 在在某某医医院院,因因为为患患心心脏脏病病而而住住院院的的665名名男男性性病病人人中中,有有214人人秃秃顶顶;而而另另外外772名名不不是是因因为为患
6、患心心脏脏病病而而住住院院的的男男性性病病人人中中有有175人人秃秃顶顶。利利用用独独立立性性检检验验方方法法判判断断秃秃顶顶与与患患心心脏脏病病是是否否有有关关系?你所得的结论在什么范围内有效?系?你所得的结论在什么范围内有效?解:根据题目所给数据得到如下列联表:解:根据题目所给数据得到如下列联表:患心脏病患心脏病不患心脏病不患心脏病总计总计秃顶秃顶214175389不秃顶不秃顶4515971048总计总计6657721437 根据列联表的数据,得到根据列联表的数据,得到所以有所以有99%的把握认为的把握认为“秃顶与患心脏病有关秃顶与患心脏病有关”。 为考察高中生的性别与是否喜欢数学课程之间
7、的关系,在某城市的某校高中生中随机抽取300名学生,得到如下联表:喜欢数学课程喜欢数学课程不喜欢数学课程不喜欢数学课程总计总计男男3785122女女35143178总计总计72228300解:在假设“性别与是否喜欢数学课程之间没有关系”的前提下K2应该很小,并且例3.性别与喜欢数学课 由表中数据计算K2的观测值k 4.513。在多大程度上可以认为高中生的性别与是否喜欢数学课程之间有关系?为什么?而我们所得到的K2的观测值k 4.513超过3.841,这就意味着“性别与是否喜欢数学课程之间有关系”这一结论错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢数学课程之间有关系”。(1)列出出2 222列联表列联表(2)计算K2的观测值k(3)查表得结论(表111) 课堂小结课堂小结:独立性检验的步骤独立性检验的步骤