双样本置信区间设检验

上传人:乐*** 文档编号:113981875 上传时间:2019-11-10 格式:PPT 页数:52 大小:461.50KB
返回 下载 相关 举报
双样本置信区间设检验_第1页
第1页 / 共52页
双样本置信区间设检验_第2页
第2页 / 共52页
双样本置信区间设检验_第3页
第3页 / 共52页
双样本置信区间设检验_第4页
第4页 / 共52页
双样本置信区间设检验_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《双样本置信区间设检验》由会员分享,可在线阅读,更多相关《双样本置信区间设检验(52页珍藏版)》请在金锄头文库上搜索。

1、第4部分: 双样本 置信区间 和 假设检验,第4部分: 双样本置信区间和假设检验,目的:,目标:,比较方差,采用 F-检验法、Bartlett检验法和Levene检验法。 比较平均值,采用双样本置信区间和假设检验。 理解统计重要性和实际重要性之间的区别。,本章的目的是使用假设检验来检查两个总体的平均值和方差之间的差异是否存在统计显著性。,位于洗衣机上的传动装置的总高度将影响制动性能。我们所关心的CTQ是总高度,目标值=5.394英寸。有8个不同的固定架用于固定该部件以便加工。 您想了解一些什么? 固定架是否为重要的X变量? 分析步骤: 1. 将数据制成图表,并观察差异。 2. 使用假设检验和置

2、信区间来确定此差异是否确实存在。 3. 得出结论。 打开Minitab中的文件“ lth” L:6SigmaMinitabTrainingMinitabSession 2lth.mtw,举例.,总高度 - 数据列表,第一步 - 制图,数据显示 行 设备 1 设备 2 设备 3 设备 4 设备 5 设备 6 设备 7 设备 8 1 5.390 5.387 5.394 5.388 5.386 5.388 5.388 5.388 2 5.389 5.387 5.394 5.389 5.384 5.388 5.389 5.389 3 5.390 5.387 5.393 5.388 5.385 5.38

3、8 5.388 5.388 4 5.389 5.387 5.394 5.390 5.385 5.388 5.388 5.388 5 5.388 5.388 5.394 5.389 5.384 5.388 5.388 5.388 6 5.391 5.388 5.395 5.392 5.387 5.391 5.391 5.390 7 5.391 5.389 5.396 5.391 5.388 5.391 5.392 5.391 8 5.391 5.389 5.397 5.391 5.387 5.391 5.391 5.390 9 5.391 5.388 5.395 5.391 5.387 5.39

4、0 5.389 5.389 10 5.389 5.387 5.395 5.390 5.387 5.390 5.389 5.390,变量 N 平均值 中值 Tr平均值 标准方差 SE平均值 设备1 10 5.3899 5.3900 5.3900 0.0011 0.0003 设备2 10 5.3877 5.3875 5.3876 0.0008 0.0003 设备3 10 5.3947 5.3945 5.3946 0.0012 0.0004 设备4 10 5.3899 5.3900 5.3899 0.0014 0.0004 设备5 10 5.3860 5.3865 5.3860 0.0014 0.0

5、004 设备6 10 5.3893 5.3890 5.3892 0.0014 0.0004 设备7 10 5.3893 5.3890 5.3891 0.0015 0.0005 设备8 10 5.3891 5.3890 5.3890 0.0011 0.0003,方框图可以提供设备间的差异图,设备3和5的 平均值明显不同,设备2的标准差 是否不同?,从图形中可得出答案。假设检验给出了答案的统计置信度,GraphBoxplot,目标值 =5.394,观察数据的另一种方式,抖动的分布图,采用假设检验法来分析差异 是实实在在的还是偶然发生的,您想知道什么?,1. 方差: 统计问题 -不同固定架方差之间看

6、上去明显的差异是实际存在还是偶然发生的? 实际问题 - 我们是否应该努力制造象2号那样的固定架,以减少方差? 2. 平均值: 统计问题 -不同固定架均值之间看上去明显的差异是实际存在还是偶然发生的? 实际问题 - 我们是否应该努力制造象3号那样的固定架,以使它们接近目标值?,根据您希望比较的内容选择假设检验法,采用什么工具确定差异是确实存在,还是偶然发生?,比较方差 F检验法 (2个方差) Bartlett检验法 (用于正态数据) Levene检验法 (用于非正态数据) 比较平均值 双样本 t 成对t,1.,2.,为什么使用假设检验和 置信区间?,在六个西格玛项目中,我们使用图形和假设检验来筛

7、选少数关键Xs。,假设检验有助于确定差异是确实存在,还是偶然发生。 置信区间给出总体值(参数)最可能的取值范围。,所有 潜在 “X”s,关键少数 “ X”s,为什么使用假设检验和 置信区间?,由于所有数据均存在偏差,因此,即使总体是一样的,样本数据也会存在细微差异。让我们来看一看在生成一些随机数据(无规律的数据)时会发生什么情况。 1. 产生8组随机数据 打开新的工作表: File New . . . Minitab Worksheet OK 生成10行数据。保存在c1-c8栏中。 Calc Random data Normal,为什么使用假设检验和 置信区间?,2.在一栏中进行叠加。 Man

8、ip Stack/Unstack Stack 叠加c1-c8。 将叠加的数据保存在c9。 在10中存储下标。,为什么使用假设检验和 置信区间?,3. 将数据制图,并寻找差异。 Graph Boxplot 制作c9 (Y)和c10 (X, 固定架)的对比图。,为什么使用假设检验和 置信区间?,4. 请注意,样本平均值和方差存在着差异,即使所有8组数据都取自同一总体也不例外。,有些统计程序的前提条件是方差相同,而大多数程序对这一假并不敏感,因此,它通常不是我们所关心的问题。 如果您利用Minitab进行双样本t检验,它将问您是否假设方差相同。您可以使用方差检验来作出判断。,比较方差,何时应该比较方

9、差?,如果您对改变了工序,并想确定输出结 果中的方差是否改变,您可以将工序改变 前后的方差进行比较。,手工计算的F-检验 (比较2个方差),计算F = s12/s22, 其中 s12 = 两个样本方差中较大的方差,和 s22 = 两个样本方差中较小的方差 如果计算的F值比表格中的F值更大,则否定零假设并接受存在差异,举例: 比较固定架1和固定架2的方差 s1 = .00110 固定架1的标准方差 s2 = .000823 固定架2的标准方差 每个样本的容量为10 -各自的自由度为9。 计算的F = .001102 / .0008232 = 1.79 分子的自由度为9、分母的自由度为9的F分布临

10、界值为3.18 ,由F表格中得出。 计算的F值比表格的F值小,因此,无法拒绝方差相等这个零假设。,结论:没有足够的证据来以95%的置信度 说明方差已经改变。,F表格,分子自由度,分子自由度,分母自由度,课堂练习: 手工计算F - 检验,F = s12/s22 其中 s12 = 一个分布的方差 (两个样本方差中的较大方差) s22 =另一分布的方差 (两个样本方差中的较小方差),比较固定架7和固定架8的方差 s7 = .00149 固定架7的标准方差 s8 = .00110 固定架8的标准方差 每个样本的容量为10。 分子的自由度是多少? 分母的自由度是多少? F表格的临界值是多少? 哪个方差值

11、更大,而应置于分子? 计算的F是多少? 计算的F值是否比表格的F值大? 您的结论是什么?您有证据能够以95%的置信度来说明固定架7和固定架8之间的方差不同吗?,方差齐性 StatANOVAHomogeneity of Variance Bartlett检验法 - 正态数据 Levene检验法 -非正态数据,采用Minitab比较方差,Ho : 12 = 22 = . . . = k2 p 时无法拒绝 Ho Ha : i2 = j2 (至少一对) p 时接受Ha 一般为 .05。,假设,比较所有8个固定架的方差,假设是什么? Ho: Ha:,StatANOVAHomogeneity of Var

12、iance,0.0005,0.0015,0.0025,0.0035,西格玛的95%置信区间,Bartlett检验法,检验统计值: 4.298,P-值 : 0.745,Levene检验法,检验统计值: 0.818,P-值 : 0.576,因素级别,1,2,3,4,5,6,7,8,总高度的方差齐性,统计结论:我们无法得出8个固定架之间的方差 存在差异的结论。我们在图形中观察到的差异可 能是由于偶然因素而发生的。 实际结论:不应该将所有固定架都制造成象设备2 那样来减少方差。,方差齐性检验,我们现在转向平均值,您希望知道什么?,统计问题 - 固定架之间方差的明显差异是实际存在还是偶然出现的? 实际问

13、题 - 是否应该努力制造3号那样的固定架,以使其均值接近目标值?,目标值 5.394,现在转向双样本t,单样本比较 将一组数据与标准值比较,双样本比较 两组数据互相比较,Bill Mark,Bill par,为什么计算置信区间和假设检验?,单样本比较 将一组数据与标准值比较。 双样本比较 互相比较两组数据 Ho: m1 = m2 或者: Ho: m1 - m2 = 0,如果1- 2 的置信区间不包括0,则说明m1 和 m2 之间 的差异是显著的。,单击 “ Graphs”,点击两次“ OK”运行,采用Minitab进行“ 双样本t”, 以比较两个固定架,假设是什么? Ho: Ha:,选择Ha

14、单侧或 双侧,StatBasic Statistic2-Sample t,如果F检验未拒绝 Ho ,单击 “ Assume Equal Variance”,比较固定架1与固定架3:,单击“ Boxplots of data”,P值 .05; 拒绝Ho,Minitab给出了置信区间 和假设检验,Ho 和 Ha的假设,m1-m2的置信区间 (不包括0.0),置信区间的说明,平均值差异的最可能估计值为: 5.3899 - 5.3947 = -0.0048. 实际差异 (如果我们包括总体的所有数据)可能大于该值,也可能小于该值。 我们有95%的置信度说明实际值在 -0.00586和-0.00374之间

15、。 这是总体差异的近似值范围 (与数据一致的数值)。 以这种方式组成的区间中有95%的区间包含实际总体值(您出错的机率是5%。) 0.0不在该区间内,因此,我们可以有力的证明固定架之间的差异确实存在,而不是偶然出现。这意味着我们可以否定2个平均值是相等这一零假设 (Ho: m1 = m2 or m1 - m2 = 0)。,P值 .05; 否定 Ho,Minitab给出了置信区间 和假设检验,固定架1和3的平均值之间确实存在统计差异。 固定架是关键X!,Ho 和 Ha 的假设,置信区间 (不包括 0.0),假设检验的说明 p值小于 .05,因此,我们拒绝 Ho,得出结论:2个固定架间差异确实存在

16、,而非偶然发生。 其实,我们有超过99.9%的置信度 相信差异确实存在。 计算t的绝对值(|-9.50|=9.50)比表格中自由度为18的值(2.101)大,说明该差异具有统计显著性。,拒绝范围,无法拒绝HO,表格值 (临界值),表格值 (临界值),表格值 (临界值),表格值 (临界值),拒绝范围,无法拒绝HO,拒绝范围,拒绝范围,/ 2,/ 2,无法拒绝HO,双侧检验,单侧右检验,单侧左检验,注意:备择假设(Ha)决定拒绝范围),单侧和双侧检验,Ha: = (不等于),Ha: (大于),Ha: (小于),假设检验,双样本t, 手工方式. . .,为了确定统计显著性,将计算的tcalc 与t表格中的t(n1+n2-2,/2)值进

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号