《西格玛教材40-23Unit-4分析48卡方检验》由会员分享,可在线阅读,更多相关《西格玛教材40-23Unit-4分析48卡方检验(25页珍藏版)》请在金锄头文库上搜索。
1、分析分析(Analyze)阶段阶段卡方检验卡方检验( Chi-square-Test )DefineDefineMeasureMeasureAnalyzeAnalyzeImproveImproveControlControlStep 8- Data 分析分析Step 9- Vital Few X的选定的选定q Multi Variq Central limitq Hypothesis testingq Confidence intervalq ANOVA, T-testq Chi-squareq Correlation,regressionStep 7- Data 收集收集路径位置路径位置目目
2、 标标l介绍介绍无关性无关性2 -检验检验的基本概念的基本概念l把把无关性无关性2 -检验检验和和 MAIC 路径联系起来路径联系起来记住这个例题?人事部想调查人的年龄(年老和年轻)和被雇佣与否之间是否有关联人事部想调查人的年龄(年老和年轻)和被雇佣与否之间是否有关联什么是 Y ? _ 数据类型 ? _什么是 X ? _ 数据类型 ? _你将采用什么类型的工具 ? _被雇佣被雇佣分立分立分立分立年龄年龄2被雇佣被雇佣未被雇佣未被雇佣年老年老3045150230数据数据年轻年轻合计合计合计合计75380455275180在此你如何做出判断在此你如何做出判断? ?Ho:数据是无关的数据是无关的 (
3、没有关联没有关联)Ha:数据是相关的数据是相关的 (有关联有关联)假设假设根据无关性根据无关性2 2- -检验检验, , 统计学家假设在现实生活中绝统计学家假设在现实生活中绝大部分变量之间是无关的,因此大部分变量之间是无关的,因此: :如果如果 P P 值值 0.05 , 0.05 , 就推翻就推翻 HoHo理论理论让我们查看一下我们的例子让我们查看一下我们的例子.假设我们要决定假设我们要决定 年龄年龄 和和 雇佣实际雇佣实际 相关或不相关相关或不相关, ,因而我们的假设描述如下因而我们的假设描述如下.Ho: Ho: 年龄年龄 和和雇佣实际雇佣实际 不相关不相关Ha: Ha: 年龄年龄 和和
4、雇佣实际雇佣实际 相关相关我们必须建立一个我们必须建立一个观察频率表观察频率表,把我们的两个变量分把我们的两个变量分成两个等级。成两个等级。年龄年龄: : 年老年老 & & 年轻年轻雇佣实际雇佣实际: : 雇佣雇佣 & &不雇佣不雇佣然后我们收集数据来进行分析然后我们收集数据来进行分析. . 被雇佣被雇佣未被雇佣未被雇佣年老年老3045150230年轻年轻步骤步骤#1#1计算列计算列和和行的合计行的合计被雇佣被雇佣未被雇佣未被雇佣年老年老3045150230年轻年轻步骤步骤#2#2合计合计合计合计75380455275180被雇佣被雇佣未被雇佣未被雇佣年老年老年轻年轻步骤步骤#3#3建立一个建
5、立一个 观察频率表观察频率表. .也就是说也就是说, , 如果这如果这2 2个因素真的不相关,个因素真的不相关,这个表会显示出什么这个表会显示出什么? ?我们应该怎么做我们应该怎么做? ?步骤步骤 #3 #3 (继续)(继续)建立一个建立一个 期望频率表期望频率表. 也就是说也就是说, 如果这如果这2个因素真的不相关,个因素真的不相关,这个表会显示出什么这个表会显示出什么?被雇佣被雇佣未被雇佣未被雇佣年老年老_年轻年轻合计合计合计合计75380455275180单元的期待频率是单元的期待频率是:(列合计)列合计) (行合计行合计)总计总计75 x 180455步骤步骤 #3 #3 (继续)(继
6、续)被雇佣被雇佣未被雇佣未被雇佣年老年老_年轻年轻合计合计合计合计75380455275180如果这两个因素真的不相关,如果这两个因素真的不相关,29.6 正是我们所期望的正是我们所期望的 你做完了这个表格你做完了这个表格!步骤步骤 #4 #4 被雇佣被雇佣未被雇佣未被雇佣年老年老_年轻年轻合计合计合计合计75380455275180从观察值中减去期望值从观察值中减去期望值(O-E)你做完了这个表格你做完了这个表格!30-29.6=.4步骤步骤 #5 #5被雇佣被雇佣未被雇佣未被雇佣年老年老_年轻年轻合计合计合计合计75380455275180将差值平方将差值平方(O-E)2你做完了这个表格你
7、做完了这个表格!(.4)*(.4)=.16.09.09.09.09.09.09步骤步骤#6#6被雇佣被雇佣未被雇佣未被雇佣年老年老_年轻年轻合计合计合计合计75380455275180计算相对的差值的平方计算相对的差值的平方(O-E)2 / E你做完了这个表格你做完了这个表格!.16 / 29.6 = .005 .0006.0006.002.002.0004.0004所以怎么样所以怎么样? ?相对的方差的和是一个相对的方差的和是一个2分布!分布!012345如果不相关,我们期望这个差值接近于如果不相关,我们期望这个差值接近于0。随着我们做得越来越深入,。随着我们做得越来越深入,这两个变量看起来
8、就越像相关了。为了帮助我们作出这个判断,我们这两个变量看起来就越像相关了。为了帮助我们作出这个判断,我们将依靠将依靠P值。值。2 无关性检验无关性检验分析路径分析路径收集数据收集数据运行运行 Minitab表格表格 卡方检验卡方检验 命令命令评价评价 P 值值检查偶然性检查偶然性表格表格作出结论作出结论用用 Minitab Minitab 分析数据分析数据 卡方卡方检验: Hired, Not 在在观测计数下方下方给出的是期望出的是期望计数在期望在期望计数下方下方给出的是卡方出的是卡方贡献 Hired Not 合合计 1 30 150 180 2 45 230 275合合计 75 380 45
9、5卡方卡方 = 0.007, DF = 1, P 值 用用 Minitab Minitab 分析数据分析数据 注意注意: 观测值和期望值与刚才的计算结果观测值和期望值与刚才的计算结果是相同的是相同的你将做出什么样的判断你将做出什么样的判断?一个一个一个一个 P-P-值值值值 ! !另外一个例子另外一个例子 . . . . . .你将作出什么判断你将作出什么判断?被雇佣被雇佣未被雇佣未被雇佣年老年老4545135230年轻年轻2 2 注释注释2 2 是我们本星期所学的最不容易识别,通常也是比较是我们本星期所学的最不容易识别,通常也是比较“难分析难分析”的的工具。但当我们处理记数性数据时会发生同样
10、的事情。工具。但当我们处理记数性数据时会发生同样的事情。为了进行为了进行2 2- -检验你必须有至少检验你必须有至少 5 5个期望频率值,个期望频率值,或使用或使用 MinitabMinitab。你收集的数据必须确保是随机性的你收集的数据必须确保是随机性的. . 小心其他的隐藏因素小心其他的隐藏因素 ( (X).X).回顾回顾l介绍介绍无关性无关性2 2- -检验的基本概念检验的基本概念l将将无关性无关性2 2- -检验检验与与MAICMAIC路径相联系路径相联系选择练习选择练习 - 1 - 1测量系统评价测量系统评价以下关联是不良数的监控过程以下关联是不良数的监控过程# # 合格合格# #不合格不合格AlAl 232 232 434 434EricEric 590 590 1199 1199DebbieDebbie 45 45 83 83作业者与产品等级之间是否有联系呢?作业者与产品等级之间是否有联系呢?如果有联系,是什么造成了差异如果有联系,是什么造成了差异? ?下一步你该做什么下一步你该做什么? ?选择练习选择练习 - 2 - 2 ZipZip和和JazJaz之间是否有联系之间是否有联系? ? 他们是否有相似的问题他们是否有相似的问题? ?Zip JazDoor JamsDamaged MediaSoftware3232421358098你下一步要做什么你下一步要做什么?