统计培训教材22抽样及样本容量

上传人:cn****1 文档编号:568732531 上传时间:2024-07-26 格式:PPT 页数:66 大小:1.39MB
返回 下载 相关 举报
统计培训教材22抽样及样本容量_第1页
第1页 / 共66页
统计培训教材22抽样及样本容量_第2页
第2页 / 共66页
统计培训教材22抽样及样本容量_第3页
第3页 / 共66页
统计培训教材22抽样及样本容量_第4页
第4页 / 共66页
统计培训教材22抽样及样本容量_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《统计培训教材22抽样及样本容量》由会员分享,可在线阅读,更多相关《统计培训教材22抽样及样本容量(66页珍藏版)》请在金锄头文库上搜索。

1、样本容量-1抽样及样本容量抽样及样本容量(Sampling & Sample Size)样本容量-2什么是抽样及为何要进行抽样?什么是抽样及为何要进行抽样?抽样是抽样是收集收集所有所有数据的一部分。数据的一部分。使用该部分数据得出结论(进行推论)。使用该部分数据得出结论(进行推论)。为什么要进行抽样?因为查看为什么要进行抽样?因为查看所有所有数据可能数据可能成本太高。成本太高。费时太长。费时太长。造成破坏(例如、品尝测试)。造成破坏(例如、品尝测试)。一般可从比较少量的数据得出可靠的结论。一般可从比较少量的数据得出可靠的结论。样本容量-3总体总体情况:在操作上您可以定义现存的总体的边界、以便可

2、以认出情况:在操作上您可以定义现存的总体的边界、以便可以认出 总体的每个个体、在理论上还可以进行编号。总体的每个个体、在理论上还可以进行编号。抽样目的:抽样目的: 描述该总体的特征。描述该总体的特征。 示例:抽样调查(示例:抽样调查(8 月月 31 日以前毕业的)大学校友、以确定日以前毕业的)大学校友、以确定 在今后两年中他们至少将一个小孩送进大学的百分比。在今后两年中他们至少将一个小孩送进大学的百分比。总体和过程总体和过程样本使用样本对总体进行推论:例如。平均值 = X、比例 = p样本容量-4过程过程情况:过程是动态的且不断变化的;过程中的个体并不是全可以鉴定的、情况:过程是动态的且不断变

3、化的;过程中的个体并不是全可以鉴定的、 因为某些个体尚不存在(如明天制造的那些个体)。因为某些个体尚不存在(如明天制造的那些个体)。 目的:了解过程、以便采取行动改进或预测过程未来的行为。目的:了解过程、以便采取行动改进或预测过程未来的行为。示例:我们估计下月发票中有示例:我们估计下月发票中有 5% 至至 20% 有错误(除非更改该过程)。有错误(除非更改该过程)。总体和过程(续)总体和过程(续)使用样本对过程未来的行为进行推论昨天保存时间顺序!今天明天?20%5%10%15%抽样数据的时间曲线图抽样数据的时间曲线图?以时间顺序排列的过程输出以时间顺序排列的过程输出样本容量-5抽样和改进项目抽

4、样和改进项目v 确定过程周期和缺陷比率的基准性能;确定过程周期和缺陷比率的基准性能; (例如:(例如:在控制图上绘出样本数据在控制图上绘出样本数据)v估计过程能力;估计过程能力; (例如:(例如:计算一件样本中的缺陷计算一件样本中的缺陷)v确定造成性能低下或数据变动的因素确定造成性能低下或数据变动的因素 (X); (利用样本数据绘制图表、进行假设测试或回归分析利用样本数据绘制图表、进行假设测试或回归分析)v验证建议的改进工作;验证建议的改进工作; (比较从过程中抽取的新数据与从该过程抽取的旧数据比较从过程中抽取的新数据与从该过程抽取的旧数据)v监视过程性能、必要时采取补救措施、并预测未来的性能

5、;监视过程性能、必要时采取补救措施、并预测未来的性能; (在控制图上绘出新过程的样本数据在控制图上绘出新过程的样本数据)改进项目一般是对过程情况进行抽样:改进项目一般是对过程情况进行抽样:样本容量-6为什么要区别总体抽样和过程抽样?为什么要区别总体抽样和过程抽样?样本容量公式是为定义明确的静态(而且常常是理论上的)样本容量公式是为定义明确的静态(而且常常是理论上的) 总体情况设计的。总体情况设计的。但是大多数抽样应用是针对动态的、尚未知的过程情况。但是大多数抽样应用是针对动态的、尚未知的过程情况。将样本容量公式应用于过程抽样情况可能得出错误的结论、将样本容量公式应用于过程抽样情况可能得出错误的

6、结论、 除非满足一定的条件。除非满足一定的条件。要使推论有效、样本必须真实地代表总体或过程。要使推论有效、样本必须真实地代表总体或过程。总体所需的抽样策略不同于过程所需的抽样策略、总体所需的抽样策略不同于过程所需的抽样策略、 以确保样本具有代表性(在下一节中讨论)。以确保样本具有代表性(在下一节中讨论)。样本容量-7从稳定的过程中抽样从稳定的过程中抽样如果如果过程是稳定的、样本容量公式可应用于过程情况。过程是稳定的、样本容量公式可应用于过程情况。可获得具有特定精度的可靠估计值。可获得具有特定精度的可靠估计值。当进行比较时、如果存在的差异具有一定功效、便可找出它们。当进行比较时、如果存在的差异具

7、有一定功效、便可找出它们。(稳定的、可预测的过程)4045505560651357911131517192123252729313335373941样本容量-8从不稳定的过程中抽样从不稳定的过程中抽样然而许多过程是不稳定的。然而许多过程是不稳定的。无论如何总要收集数据、并绘制控制图或时间曲线图。无论如何总要收集数据、并绘制控制图或时间曲线图。识别特殊原因并清除之。识别特殊原因并清除之。使用样本容量公式求出的值是您应认为最小的数字;使用样本容量公式求出的值是您应认为最小的数字; 可能的话,需要收集更多的数据。可能的话,需要收集更多的数据。存在特殊原因时,需要更大的样本容量,因为长期变动大于短期变

8、异。存在特殊原因时,需要更大的样本容量,因为长期变动大于短期变异。使用公式时,您必须估计使用公式时,您必须估计s(或或 p););您必须判断特殊原因如何您必须判断特殊原因如何 影响该估计值,并根据您认为过程将会是什么情况来调整它影响该估计值,并根据您认为过程将会是什么情况来调整它。样本容量-9从不稳定的过程中抽样(续)从不稳定的过程中抽样(续)当进行组之间的比较时:当进行组之间的比较时:尽量在相同时间内获取每组的样本。尽量在相同时间内获取每组的样本。当作结论或报告结论时、会存在这样一个风险、即这些结论可能当作结论或报告结论时、会存在这样一个风险、即这些结论可能 不适用于将来。不适用于将来。如果

9、过程是不稳定的,可能的话,将一段如果过程是不稳定的,可能的话,将一段很长的时间里得到的数据的时间里得到的数据 绘制于一张控制图上,并圈出或特别标示您的样本所代表的数据点绘制于一张控制图上,并圈出或特别标示您的样本所代表的数据点 或时间区间。或时间区间。允许您和他人可直接从曲线观察过程的行为。允许您和他人可直接从曲线观察过程的行为。帮助您判断这些结论在未来的可靠性。帮助您判断这些结论在未来的可靠性。样本容量-10从过程中抽样从过程中抽样对于过程情况,我们希望确保能够理解过程的行为。因此我们:对于过程情况,我们希望确保能够理解过程的行为。因此我们:在一段时间内进行系统或整群(非随机)抽样。在一段时

10、间内进行系统或整群(非随机)抽样。即使随机抽样能适用于稳定过程,我们仍采用系统或整群抽样,并保持时间顺序即使随机抽样能适用于稳定过程,我们仍采用系统或整群抽样,并保持时间顺序 以便能更好地表示过程行为。以便能更好地表示过程行为。尽量从足够长的时间段中进行抽样,以便真实地表示过程中的变化源。尽量从足够长的时间段中进行抽样,以便真实地表示过程中的变化源。运用您自己的判断和有关变化源的过程知识来确定多长时间进行一次抽样运用您自己的判断和有关变化源的过程知识来确定多长时间进行一次抽样 (每隔(每隔 10 个个体、每隔个个体、每隔 7 个个体、每天、每月等)。个个体、每天、每月等)。一般情况下、更加频繁

11、地收集小样本、可确保随着时间的过去能真实地表示过程行为。一般情况下、更加频繁地收集小样本、可确保随着时间的过去能真实地表示过程行为。绘制控制图或时间曲线图,以确定该过程是稳定的还是不稳定的(寻找非正常值、偏移、绘制控制图或时间曲线图,以确定该过程是稳定的还是不稳定的(寻找非正常值、偏移、趋势或其它模式)。趋势或其它模式)。样本容量-11抽样方法抽样方法样本容量-12代表性样本代表性样本要使结论有效,样本必须具有代表性。要使结论有效,样本必须具有代表性。数据应真实地表示总体或过程数据应真实地表示总体或过程收集的数据与未收集的数据之间不应存在有系统性的差异。收集的数据与未收集的数据之间不应存在有系

12、统性的差异。样本容量-13每个单元具有相同被选中的机会每个单元具有相同被选中的机会从每个组随机抽样一个成比例的数字从每个组随机抽样一个成比例的数字随机随机 抽样抽样分层分层随机随机抽样抽样样本样本总体总体样本样本总体总体AABBBBCDDDAAAABB BBBBBCCD D DD D DB概率抽样概率抽样样本容量-14每隔每隔 n 个抽样(如每隔三个抽样)个抽样(如每隔三个抽样)每经过时间每经过时间 t 抽样抽样 n 个单元(例如,个单元(例如,每小时抽样三个单元)每小时抽样三个单元);然后计算每然后计算每个小组的平均值个小组的平均值 (比例)(比例)系统系统 抽样抽样整群整群 抽样抽样样本总

13、体或过程保持时间顺序样本过程9:009:3010:3010:00保持时间顺序样本容量-15 统计调查的误差(抽样误差):是指调查所得结果与总体真实数值之间的差异。 可分 1、登记性误差:指在调查和汇总过程中,由于观察、测量、登记、计算等 方面的差错或被调查者提供虚假资料而造成的误差。 (不是抽样调查独有的)尽量避免 2、代表性误差:指用样本指标推断总体指标时,由于样本结构与总体结构 不一致、样本不能完全代表总体而产生的误差。它又分 -2-1、系统误差:指由于非随机因素引起的样本代表性不足而产生的误差, 表现为样本估计量的值系统性偏高或偏低,故也称偏差,尽量避免 如抽样框与目标总体不一致、有意多

14、选较好或较差的单位等; -2-2、随机误差:又称偶然性误差,指遵循随机抽样原则,由于随机因素 (偶然性因素)引起的代表性误差。不可避免,但需加以计算与控制 抽样估计中所谓的抽样误差,就是指这种随机误差, 即由于抽样的随机性而产生的样本估计量与总体参数之间的代表性误差。抽样误差抽样误差样本容量-16抽样误差的抽样误差的3个概念个概念 1 1、实际抽样误差:、实际抽样误差:-实际上总体参数实际上总体参数是未知数,不可计算是未知数,不可计算 2 2、抽样平均误差:、抽样平均误差:3 3、抽样极限误差:是指在一定的概率下抽样误差的可能范围,、抽样极限误差:是指在一定的概率下抽样误差的可能范围, 也称为

15、允许误差。用也称为允许误差。用表示抽样极限误差,即在一定概率下,表示抽样极限误差,即在一定概率下, 抽样误差率抽样误差率= =(抽样极限误差(抽样极限误差/ /估计量)估计量)* *100%100% 抽样估计精度抽样估计精度=100%-=100%-抽样误差率抽样误差率如如|xxbar-X| xbar样本容量-17抽样总结抽样总结本单元包括:本单元包括:抽样是查看所有数据的一种有效率和效果的方法。抽样是查看所有数据的一种有效率和效果的方法。总体抽样与过程抽样有不同的目的和方法。总体抽样与过程抽样有不同的目的和方法。代表性是抽样最重要的一方面。代表性是抽样最重要的一方面。正确抽样使您对结论有信心。

16、正确抽样使您对结论有信心。总体抽样的样本容量公式可适用于稳定过程。总体抽样的样本容量公式可适用于稳定过程。样本容量-18样本容量样本容量(Sample Size)样本容量-19样本容量介绍样本容量介绍人们常问的第一个问题是人们常问的第一个问题是“我需要多少个样本?我需要多少个样本?”该问题的答案由下列四个因素确定:该问题的答案由下列四个因素确定:1. 数据类型数据类型离散数据和连续数据离散数据和连续数据2. 您想做什么您想做什么描述整组的某个特征(平均值或比例)描述整组的某个特征(平均值或比例)在特定的精度内(在特定的精度内( _ 单位)单位)比较组的特征(找出组平均值或比例之间的差异)比较组

17、的特征(找出组平均值或比例之间的差异)以什么功效:希望检测到特定差异的概率以什么功效:希望检测到特定差异的概率3. 您估计的标准偏差(或比例)为多大您估计的标准偏差(或比例)为多大4. 您希望的置信度为多高(通常为您希望的置信度为多高(通常为 95%)样本容量-20假设检验中样本容量的重要性假设检验中样本容量的重要性假设检验中样本容量的重要性假设检验中样本容量的重要性当样本容量太小当样本容量太小 不能检验出差异不能检验出差异n = 1n = 5 过程过程A过程过程A过程过程 B过程过程 B样本容量-21假设检验中样本容量的重要性假设检验中样本容量的重要性假设检验中样本容量的重要性假设检验中样本

18、容量的重要性当样本容量太大当样本容量太大对平均值的漂移过于敏感对平均值的漂移过于敏感 资源浪费资源浪费样本容量-22样本容量的选取过程样本容量的选取过程样本容量的选取过程样本容量的选取过程第一步第一步: 明确研究过程中的响应变量明确研究过程中的响应变量第二步第二步: 选择合适的统计检验选择合适的统计检验第三步第三步: 决定可接受的风险决定可接受的风险 和和 第四步第四步: 定出漂移敏感度定出漂移敏感度 第五步第五步: 建立或估计当前过程中的参数建立或估计当前过程中的参数 第六步第六步: 决定合适的样本容量决定合适的样本容量样本容量-23抽样风险抽样风险抽样风险抽样风险 是是 H0 成立成立,

19、但结果却否定它的风险但结果却否定它的风险. 1- 是是 H0 的置信系数的置信系数. 观察值 1样本容量-24抽样风险抽样风险抽样风险抽样风险 是是H0不成立不成立, 但结果却肯定它的风险但结果却肯定它的风险. (1- ) 称为检验的称为检验的功效功效, 它表示它表示H0 不成立不成立, 而结果也否定它的概率而结果也否定它的概率, 即当即当H0不成立不成立时时,作出正确结论的概率作出正确结论的概率.观 察 值 1 2漂移 样本容量-25抽样风险抽样风险抽样风险抽样风险样本容量-26抽样风险抽样风险抽样风险抽样风险 H0 : 无差异无差异 H1 : 有明显差异有明显差异零假设零假设成立不成立决策

20、决策接受 H0拒绝 H0正确正确1 正确正确1 第一类错误第一类错误第一类错误第一类错误 第二类错误第二类错误第二类错误第二类错误 样本容量-27漂移敏感性漂移敏感性漂移敏感性漂移敏感性 实验之前需要预先指定反映明显差异的量实验之前需要预先指定反映明显差异的量 . 与标准差与标准差 之比之比 / 称为漂移敏感度称为漂移敏感度(drift sensitivity ). 样本容量-28关于均值的比较的检验关于均值的比较的检验关于均值的比较的检验关于均值的比较的检验单样本检验单样本检验(1-Sample Tests)Stat Power and Sample Size 1-Sample ZStat

21、Power and Sample Size 1-Sample t双样本检验双样本检验(2-Sample Tests)Stat Power and Sample Size 2-Sample t样本容量-29样本容量公式取决于您的目的样本容量公式取决于您的目的抽样目的抽样目的公式公式*Minitab 命令命令估计平均值估计平均值(例如、确定基准周期)(其中 d = 精度: _ 单位)估计比例估计比例(例如、确定缺陷基准百分比)(其中 d = 精度: _ 单位)样本容量-30精度精度 (d)精度是允许某个特征的估计值波动的范围。精度是允许某个特征的估计值波动的范围。估计上下不超过两天的周期。估计上下

22、不超过两天的周期。估计上下不超过估计上下不超过 3% 的缺陷百分比。的缺陷百分比。使用符号使用符号 d 表示精度。表示精度。传统的统计学称它为传统的统计学称它为 “delta”、因此以因此以d 表示表示。精度等于置信区间精度等于置信区间 (CI) 的一半。的一半。周期(单位为天)为周期(单位为天)为 95% 时时 CI = (48、 52) 意味着我们有意味着我们有 95% 的的确信平均周期在确信平均周期在 48 天至天至 52 天之间。天之间。CI 的宽度的宽度 = 4 天。天。精度精度 = d = 2 天天(= 估计值上下不超过估计值上下不超过 2 天)。天)。样本容量-31精度精度 (d

23、)(续)续)决定您需要多大的精度。决定您需要多大的精度。精度与样本容量的平方根成反比。精度与样本容量的平方根成反比。样本容量-32精度和样本容量精度和样本容量要提高精度、必须增加样本容量(但会增加成本)。要提高精度、必须增加样本容量(但会增加成本)。对于需要多大的精度没有明确的答案;对于需要多大的精度没有明确的答案; 该答案取决于使用该估计值对业务产生多大的影响。该答案取决于使用该估计值对业务产生多大的影响。每种情况都是独特的;不要效仿别人的决定。每种情况都是独特的;不要效仿别人的决定。样本容量-33估计平均值所需的样本容量估计平均值所需的样本容量95% 的置信度*意味着因子为 2 标准偏差的

24、估计您希望的精度不重复抽样不重复抽样重复抽样重复抽样样本容量-34目的:练习使用样本容量公式估计平均值。目的:练习使用样本容量公式估计平均值。时间:时间:3 分钟。分钟。要求:要求: 使用样本容量公式计算平均值,使用样本容量公式计算平均值, 以便回答下列问题。以便回答下列问题。 1. 假设您想估计假设您想估计 呼入电话的平均通话时间呼入电话的平均通话时间 1 分钟。您需要多少样本?分钟。您需要多少样本? (历史数据显示典型的标准偏差历史数据显示典型的标准偏差 = 3 分钟。)分钟。) 2. 您需要对多少次呼入抽样、以获得您需要对多少次呼入抽样、以获得 1/8 分钟的精度?分钟的精度?练习练习:

25、估计平均值所需的样本容量:估计平均值所需的样本容量样本容量-35练习:答案练习:答案问题 1.问题 2.样本容量-36如何估计标准偏差如何估计标准偏差困难的选择:困难的选择:要估计样本容量,您需要知道标准偏差。要估计样本容量,您需要知道标准偏差。您需对数据的变化量有一定了解,因为数据可变性加大,您需对数据的变化量有一定了解,因为数据可变性加大, 需要的样本容量也要相应增加。需要的样本容量也要相应增加。但是,如果您还没有进行抽样,如何知道偏差呢?但是,如果您还没有进行抽样,如何知道偏差呢?样本容量-37如何估计标准偏差(续)如何估计标准偏差(续)估计标准偏差的选择估计标准偏差的选择查找现存的数据

26、并计算查找现存的数据并计算 s。使用类似过程的控制图(针对个体的)。使用类似过程的控制图(针对个体的)。采集一个小的样本并计算采集一个小的样本并计算 s。根据您对过程的认识和记得的类似数据猜一猜根据您对过程的认识和记得的类似数据猜一猜(大多数人不擅长这样做)。大多数人不擅长这样做)。样本容量-38估计比例所需的样本容量估计比例所需的样本容量95% 的置信度意味着因子为 2猜 p 的值(样本大小随 P 变动较大、从 P=0.1 到 0.5,变化甚剧)您希望的精度样本容量-39使用精度调整样本容量使用精度调整样本容量您可使用确定样本容量的公式,来确定是否需要花更多的资金收集更多的您可使用确定样本容

27、量的公式,来确定是否需要花更多的资金收集更多的样本来得到更高的精度。在收集数据之前这样做可以帮助您决定多少样本可样本来得到更高的精度。在收集数据之前这样做可以帮助您决定多少样本可以符合您的项目和预算。以符合您的项目和预算。1.确定您可以提供多少个样本确定您可以提供多少个样本 (n)。2.然后问:然后问: 该样本提供多高的精度?该样本提供多高的精度? 即、精度的平均值在即、精度的平均值在 d 单位之内单位之内还是精度的比例在还是精度的比例在 d% 之内之内样本容量-40使用精度调整样本容量(续)使用精度调整样本容量(续)3.该精度足够精确吗?该精度足够精确吗?4.如果不够精确:如果不够精确:为各

28、种样本容量绘制一个精度和成本表,以确定在样本上每为各种样本容量绘制一个精度和成本表,以确定在样本上每花一美元在精度上提高了多少。花一美元在精度上提高了多少。然后选择一个样本容量,再根据所提高的精度或您需要的精然后选择一个样本容量,再根据所提高的精度或您需要的精度来证明这是正确的选择。度来证明这是正确的选择。样本容量-41从有限的总体中进行抽样从有限的总体中进行抽样样本容量公式假设样本容量样本容量公式假设样本容量 (n) 小于总体小于总体 (N)。如果如果 .05 您抽取的样本占总体的您抽取的样本占总体的 5% 以上以上您可以使用您可以使用“有限总体有限总体”公式调整样本容量:公式调整样本容量:

29、样本容量-42使用样本容量公式使用样本容量公式使用样本容量公式:使用样本容量公式:在置信度为在置信度为 95% 的情况下,根据给定的期望精度以及的情况下,根据给定的期望精度以及 S 或或 P 的的估计值,估计值, 确定估计整组的某个特征(平均值或比例)所需的样本容量。确定估计整组的某个特征(平均值或比例)所需的样本容量。在收集数据在收集数据之前之前,确定各种样本容量其估计值的精度。确定各种样本容量其估计值的精度。确定确定估计值的精度估计值的精度与与增加样本容量的成本增加样本容量的成本之间的得失。之间的得失。在收集数据在收集数据之后之后,确定估计值的精度。确定估计值的精度。样本容量-43状态:样

30、本容量命令和公式状态:样本容量命令和公式抽样目的抽样目的公式公式*/ Minitab 命令命令估计平均值估计平均值(例如、确定基准周期)(其中 d = 精度: _ 单位)估计比例估计比例(例如、确定缺陷基准百分比)(其中 d = 精度: _ 单位)比较两组平均值、找出差异比较两组平均值、找出差异(2 个样本的 t 测试)统计 功效和样本容量 2 个样本的 t比较两个以上的组的平均值、比较两个以上的组的平均值、找出差异找出差异(ANOVA)统计 功效和样本容量 单向 ANOVA比较两个(或更多)组的比比较两个(或更多)组的比例、找出差异例、找出差异(卡方测试)统计 功效和样本容量 2 个比例样本

31、容量-44样本容量大经验法则样本容量大经验法则统计值统计值 或图表或图表建议应采用的最建议应采用的最小样本容量小样本容量 (n) 平均值比例频率分布图(直方图) Pareto 排列图散布图控制图50502424样本容量-455 5个变量个变量、和和 N N之间的关系可写出下面是公式:之间的关系可写出下面是公式: 注意如果我们知道了注意如果我们知道了5 5个变量中的任意个变量中的任意4 4个变量,就可以通过上式个变量,就可以通过上式计算出第计算出第5 5个变量个变量 利用利用Minitab, Minitab, 我们现在将说明如何计算样本容量和检验功效:我们现在将说明如何计算样本容量和检验功效:

32、v样本容量样本容量 = = N Nv检验功效检验功效 = 1- = 1-计算样本容量计算样本容量样本容量-46u一种新型的焊接机已经研制出来,出于对经济价值的考虑,新型一种新型的焊接机已经研制出来,出于对经济价值的考虑,新型焊接机的焊接机的合格率合格率必必须要须要比现有类型的焊接机大比现有类型的焊接机大5 5个百分点,现有个百分点,现有设备的设备的合格率合格率约为约为80% 80% u为了比较这两种设备,要使用日常的数据,现有设备的历史日合为了比较这两种设备,要使用日常的数据,现有设备的历史日合格率的标准差为格率的标准差为3%3%,要求新的焊接机有相同的日合格率散布。,要求新的焊接机有相同的日

33、合格率散布。 u我们可接受的我们可接受的风险是风险是0.010.01(指两台设备有差异而实际上并没有指两台设备有差异而实际上并没有差异的机会)差异的机会) u我们可接受的我们可接受的风险是风险是0.200.20(说两台设备合格率相同而实际上并说两台设备合格率相同而实际上并不同的机会不同的机会) 例题例题1 1 : : 1-1-样本样本 t- t-检验时检验时的的样本容量的计算样本容量的计算样本容量-47零假设零假设 (Ho): 新设备的合格率新设备的合格率并不比并不比现有的设备现有的设备好好 备择假设备择假设 (Ha): 新设备的日合格率新设备的日合格率比比现有的设备现有的设备高高 焊接机焊接

34、机: 假设假设样本容量-48v 在在这两个假设之间需要选择多大的样本容量呢?这两个假设之间需要选择多大的样本容量呢? v 从所给的信息,我们得到从所给的信息,我们得到 显著水平显著水平, = 0.01 检验功效检验功效 = 1- - = 0.80. 平均值间的差异平均值间的差异, = 85 - - 80 = 5.标准差标准差, = 3备择假设备择假设 (Ha)为新设备的日合格率比现有的设备高为新设备的日合格率比现有的设备高 焊接机焊接机: 需要的样本容量需要的样本容量 样本容量-49选择选择 Stat Power and Sample Size 1-Sample t. 5. 输入 alpha,

35、 a 2. 输入检验功效, 1-b 1. 输入delta, 4. 选择备择假设 3. 输入 sigma, s填选项1- 3;然后点“Options” 再填选项4 和 5;最后, 在所有打开的窗口中点 OK 焊接机焊接机: 利用利用Minitab样本容量-50Minitab 告诉我们,至少要抽取7个样本,才能保证在我们的检验功效为0.80的情况下,把新焊接机是否比现有的设备高5个百分点准确检测出来 (注:N=7时,实际的检验功效为 0.8512)焊接机焊接机: Minitab 输出输出Power and Sample Size 1-Sample t TestTesting mean = null

36、 (versus null)Calculating power for mean = null + differenceAlpha = 0.01 Assumed standard deviation = 3 Sample TargetDifference Size Power Actual Power 5 7 0.8 0.851212样本容量-51F某工程师想通过实施一个全阶乘某工程师想通过实施一个全阶乘DOE (3DOE (3因子,因子,8 8运行运行) ),来研究恒,来研究恒温箱对温度、流体密度和液罐变化的动作灵敏度;温箱对温度、流体密度和液罐变化的动作灵敏度; F0.0010.001英寸

37、的动作就影响功能表现。设计队想探测这样或更高幅英寸的动作就影响功能表现。设计队想探测这样或更高幅度的影响;度的影响; F必须考虑恒温箱动作中的工程散布,必须考虑恒温箱动作中的工程散布,SPCSPC数据显示标准偏差约为数据显示标准偏差约为0.0010.001英寸;英寸; F可以接受的可以接受的风险(说一个因子的两个水平不同,而实际上相同风险(说一个因子的两个水平不同,而实际上相同的风险)是的风险)是0.030.03; F由于时间的限制,只能作两次再现(共由于时间的限制,只能作两次再现(共1616次运行),次运行), 有关该有关该DOEDOE计划的报告必须上报给工程主管。计划的报告必须上报给工程主

38、管。 例题例题2-检验功效计算:恒温箱检验功效计算:恒温箱 DOE样本容量-52零假设零假设 (Ho): 实验因子对恒温箱动作实验因子对恒温箱动作没有影响没有影响 备择假设备择假设 (Ha):实验因子对恒温箱动作实验因子对恒温箱动作有影响有影响 恒温箱恒温箱 DOE: 假设假设样本容量-53观察到观察到0.001英寸尺度影响(当此影响存在时)的概率是多少?英寸尺度影响(当此影响存在时)的概率是多少?(即此计划完的(即此计划完的DOE 的检验功效是多少?)的检验功效是多少?) 从所给的信息,我们知道从所给的信息,我们知道 显著水平显著水平, = 0.03再现数再现数 = 2.影响差异影响差异,

39、= 0.001 英寸英寸标准偏差标准偏差, = 0.001 英寸英寸备择假设备择假设 (Ha) 是,因子对恒温箱的动作有影响是,因子对恒温箱的动作有影响 恒温箱恒温箱 DOE: 检验功效检验功效 样本容量-54选择选择 Stat Power and Sample Size 2 Level Factorial Design6. 输入alpha, a 2. 输入循环数 填写选项1-5。然后点 “Options” 并填选项6。最后,在所有打开的窗口中点 OK 1. 输入因子数4. 输入影响尺度, 5. 输入 sigma, s 3. 输入再现数恒温箱恒温箱 DOE: 利用利用 Minitab样本容量-

40、55Minitab 告诉我们,两次再现时的检验功效只有 0.3234,这意味着我们很可能不能看到0.001英寸尺度的影响,显然需要更多的再现数. 恒温箱恒温箱 DOE: Minitab 输出输出Power and Sample Size 2-Level Factorial DesignAlpha = 0.03 Assumed standard deviation = 0.001Factors: 3 Base Design: 3, 8Blocks: noneCenter TotalPoints Effect Reps Runs Power 0 0.001 2 16 0.323375样本容量-56

41、i某公司正在考虑决定是否变更供应商;某公司正在考虑决定是否变更供应商; i供应商供应商X X是当前的供应商,其不良率约为是当前的供应商,其不良率约为10%10%;而;而供应商供应商Y Y是一个是一个新供应商,其许诺提供部品的不良率将小于新供应商,其许诺提供部品的不良率将小于10%10%; i顾客认为如果供应商顾客认为如果供应商Y Y比供应商比供应商X X的不良率小的不良率小1 1个百分点,则更换个百分点,则更换供应商就有经济利益;供应商就有经济利益; i用来决定是否值得采用供应商用来决定是否值得采用供应商Y Y的样本容量是多少?的样本容量是多少? i为了比较,分别计算获得检验功效为为了比较,分

42、别计算获得检验功效为0.60.6、0.70.7、0.80.8和和0.90.9 所需所需要的样本容量;要的样本容量;i假设假设a = 0.05 = 0.05 例题例题3-样本容量计算样本容量计算 : 拒绝部品比例拒绝部品比例 样本容量-57零假设零假设 (Ho): 供应商之间部品的不供应商之间部品的不良率没有差异良率没有差异 备择假设备择假设 (Ha):供应商供应商X的部品不的部品不良率要大于供应商良率要大于供应商Y的的拒绝部件的比例:假设拒绝部件的比例:假设 样本容量-58在检验功效分别为在检验功效分别为0.6、0.7、0.8和和0.9时,能计算并比较两个观察时,能计算并比较两个观察 的不良率

43、所需样本容量是多少?的不良率所需样本容量是多少? 从所给的信息,我们知道从所给的信息,我们知道 显著水平显著水平, = 0.05如果供应商如果供应商Y的部品不良率要比供应商的部品不良率要比供应商X低一个百分点,低一个百分点, 顾客将选择供应商顾客将选择供应商Y 比例的差异比例的差异 , d = 0.01备择假设备择假设 (Ha) 是供应商是供应商X的不良率大于供应商的不良率大于供应商Y的不良率的不良率 拒绝部品比例拒绝部品比例: 样本容量样本容量样本容量-59选择选择 Stat Power and Sample Size 2 Proportions5. 输入 alpha, a4. 指定供应商

44、X大于供应商 Y先填选项 1-3;然后点“Options” 并填选项 4和5;最后,在所有打开的窗口中点 OK 2. 输入检验功效3.输入供应商 Y 的比例 拒绝部品比例拒绝部品比例: 利用利用 Minitab1. 输入供应商 X 的不良率样本容量-60Power and Sample Size Test for Two ProportionsTesting proportion 1 = proportion 2 (versus )Calculating power for proportion 2 = 0.09Alpha = 0.05 Sample TargetProportion 1 Si

45、ze Power Actual Power 0.1 6196 0.6 0.600035 0.1 8091 0.7 0.700008 0.1 10630 0.8 0.800005 0.1 14724 0.9 0.900006需要很大的样本容量!为了提供90%的检验功效来探测百分之一的差异(如果存在),则需要每个供应商提供147240件部品! 拒绝部品比例拒绝部品比例: Minitab 输出输出样本容量-61 练习练习1 1 (1-Sample Tests) (1-Sample Tests) 每箱每箱64打的冰其凌打的冰其凌, 允许的误差不能超过允许的误差不能超过3打打. 机器包装时的标准差是机器

46、包装时的标准差是1打打. 对于检验功效分别为对于检验功效分别为0.7, 0.8 和和 0.9 的情形的情形, 为了得到每箱冰其凌为了得到每箱冰其凌的平均容量的置信度为的平均容量的置信度为99%的区间估计的区间估计, 样本容量应取多大样本容量应取多大?样本容量-62 练习练习 2 2 双样本检验双样本检验 (2- (2-Sample Tests)Sample Tests) 一个工程师计划比较一台新机器的有效性一个工程师计划比较一台新机器的有效性. 该机器的感兴趣的响应变量为均值为该机器的感兴趣的响应变量为均值为5, 标准差为标准差为1. 如果新机器的平均响应高出现有机器至少如果新机器的平均响应高

47、出现有机器至少3个单位个单位, 则他会建议购则他会建议购买买. 由于投资很大由于投资很大, 他希望把投资失误的风险控制在他希望把投资失误的风险控制在0.5%以内以内. 为使检验的功效为为使检验的功效为0.7, 0.8 和和 0.9, 样本容量需要多大样本容量需要多大? 样本容量-63 练习练习3 3 (1 Proportion Test) (1 Proportion Test) 一个管理人员想了解本部门的一个管理人员想了解本部门的 Six Sigma 意识水平究竟如何意识水平究竟如何. 他他想知道他的员工中是否有超过想知道他的员工中是否有超过50%的人熟识的人熟识 Six Sigma 哲学哲学

48、. 如如果比例低于果比例低于45%, 那么就要举办一个培训课程那么就要举办一个培训课程. 对对 =0.05 和和 =0.15, 样本容量需要多大样本容量需要多大?样本容量-64 练习练习4 4 (2 Proportions Test) (2 Proportions Test) 管理层想评估关于管理层想评估关于 Six Sigma 的新的培训课程的效果的新的培训课程的效果. 培训前估计培训前估计Six Sigma 的意识水平估计为的意识水平估计为40%. 如果至少能提高如果至少能提高30%, 则此次培训课程可被认为是成功的则此次培训课程可被认为是成功的. 对对 =0.05 和和 =0.15, 试

49、决定所需的样本容量试决定所需的样本容量.样本容量-65常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数? 将每一列的将每一列的“?”,画上,画上向或下向的箭头向或下向的箭头 例如例如, 在第一种情况下,如果在第一种情况下,如果 和和 不变,如果你需要较小的不变,如果你需要较小的 , 你的样本容量是大些你的样本容量是大些 (上向箭头上向箭头) 还是小些还是小些 (下向箭头)下向箭头)? 用用 Minitab 来验证这些来验证这些数字规律数字规律 课堂综合练习课堂综合练习样本容量-66常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数常数答案答案答案答案

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号