基础统计PPT课件

上传人:cl****1 文档编号:567940073 上传时间:2024-07-22 格式:PPT 页数:81 大小:3.18MB
返回 下载 相关 举报
基础统计PPT课件_第1页
第1页 / 共81页
基础统计PPT课件_第2页
第2页 / 共81页
基础统计PPT课件_第3页
第3页 / 共81页
基础统计PPT课件_第4页
第4页 / 共81页
基础统计PPT课件_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《基础统计PPT课件》由会员分享,可在线阅读,更多相关《基础统计PPT课件(81页珍藏版)》请在金锄头文库上搜索。

1、基础统计基础统计基础统计基础统计置信区间置信区间置信区间置信区间正态分布与中心极限定理正态分布与中心极限定理正态分布与中心极限定理正态分布与中心极限定理统计量统计量统计量统计量连续数据和离散数据连续数据和离散数据连续数据和离散数据连续数据和离散数据变异的概念变异的概念功效与样本大小功效与样本大小功效与样本大小功效与样本大小1 1产品的品质特性一定会有波动!所以我们预期的观测值就会有产品的品质特性一定会有波动!所以我们预期的观测值就会有产品的品质特性一定会有波动!所以我们预期的观测值就会有产品的品质特性一定会有波动!所以我们预期的观测值就会有差异:差异:差异:差异: 如果我们研究面板的尺寸如果我

2、们研究面板的尺寸如果我们研究面板的尺寸如果我们研究面板的尺寸,每个面板的尺寸是不是一样的;每个面板的尺寸是不是一样的;每个面板的尺寸是不是一样的;每个面板的尺寸是不是一样的; 如果我们测量如果我们测量如果我们测量如果我们测量10101010台冰箱的能耗,得到的结果也是不一样的;台冰箱的能耗,得到的结果也是不一样的;台冰箱的能耗,得到的结果也是不一样的;台冰箱的能耗,得到的结果也是不一样的; 世界上没有两片一模一样的树叶!世界上没有两片一模一样的树叶!世界上没有两片一模一样的树叶!世界上没有两片一模一样的树叶!这种差异使我们的工作更具挑战性!这种差异使我们的工作更具挑战性!这种差异使我们的工作更

3、具挑战性!这种差异使我们的工作更具挑战性!一般来说,我们不能相信来自一个数据点的结果,通常收集多一般来说,我们不能相信来自一个数据点的结果,通常收集多一般来说,我们不能相信来自一个数据点的结果,通常收集多一般来说,我们不能相信来自一个数据点的结果,通常收集多个数据点、并且非常注意如何选取这些样本,以减少偏差。个数据点、并且非常注意如何选取这些样本,以减少偏差。个数据点、并且非常注意如何选取这些样本,以减少偏差。个数据点、并且非常注意如何选取这些样本,以减少偏差。变异(变异)的产生是必然的、意料之中变异(变异)的产生是必然的、意料之中的,是统计学的基础。的,是统计学的基础。变异变异2 2变异来源

4、变异来源造成这种变异的原因在于产品或服务实现过程中的造成这种变异的原因在于产品或服务实现过程中的造成这种变异的原因在于产品或服务实现过程中的造成这种变异的原因在于产品或服务实现过程中的因因因因素变异素变异素变异素变异,普遍来源有:,普遍来源有:,普遍来源有:,普遍来源有:测量测量Measurement流程变异流程变异的原因的原因人员人员人员人员ManpowerManpower环境环境Environment设备设备Machine方法方法方法方法MethodsMethods材料材料材料材料MaterialMaterial关键是要分关键是要分析哪种变异析哪种变异对响应变量对响应变量的贡献最大的贡献最

5、大-分析技术分析技术3 3变异分类变异分类 我们把变异分成两类:我们把变异分成两类:我们把变异分成两类:我们把变异分成两类: 系统变异(原因变异、特殊变异)系统变异(原因变异、特殊变异)系统变异(原因变异、特殊变异)系统变异(原因变异、特殊变异) 预期的(和可预测的)测量结果之间的差异;预期的(和可预测的)测量结果之间的差异;预期的(和可预测的)测量结果之间的差异;预期的(和可预测的)测量结果之间的差异; 随机变异(偶然变异)随机变异(偶然变异)随机变异(偶然变异)随机变异(偶然变异) 不可预测的测量结果之间的差异;不可预测的测量结果之间的差异;不可预测的测量结果之间的差异;不可预测的测量结果

6、之间的差异;举例:举例:举例:举例:金型正常的磨损金型正常的磨损金型正常的磨损金型正常的磨损 造成造成造成造成ICICICIC冲切异常冲切异常冲切异常冲切异常普通原因普通原因普通原因普通原因 金型非正常的磨损金型非正常的磨损金型非正常的磨损金型非正常的磨损 造成造成造成造成ICICICIC冲切异常冲切异常冲切异常冲切异常 特殊原因特殊原因特殊原因特殊原因 4 4统计学作用统计学作用统计学应用以下方法统计学应用以下方法统计学应用以下方法统计学应用以下方法分析分析分析分析&处理处理处理处理 变异:变异:变异:变异:统计描述统计描述统计描述统计描述用用用用图形、总结性数据(统计量)来描述一组图形、总

7、结性数据(统计量)来描述一组图形、总结性数据(统计量)来描述一组图形、总结性数据(统计量)来描述一组数据;数据;数据;数据;基础统计量、图形分析基础统计量、图形分析基础统计量、图形分析基础统计量、图形分析设计试验、收集并分析数据,了解过程中变设计试验、收集并分析数据,了解过程中变设计试验、收集并分析数据,了解过程中变设计试验、收集并分析数据,了解过程中变异因素所造成的影响;异因素所造成的影响;异因素所造成的影响;异因素所造成的影响;试验计划试验计划试验计划试验计划确定测量结果之间的差异是由于系统变异还确定测量结果之间的差异是由于系统变异还确定测量结果之间的差异是由于系统变异还确定测量结果之间的

8、差异是由于系统变异还是随机变异所造成的;是随机变异所造成的;是随机变异所造成的;是随机变异所造成的;假设检验、方差分析、多变量分析、回归假设检验、方差分析、多变量分析、回归假设检验、方差分析、多变量分析、回归假设检验、方差分析、多变量分析、回归统计推断统计推断统计推断统计推断试验设计试验设计试验设计试验设计5 5为为为为了解原料、制程、产品的品质特性,了解原料、制程、产品的品质特性,了解原料、制程、产品的品质特性,了解原料、制程、产品的品质特性,经调查或实验而得到的数字或数量。经调查或实验而得到的数字或数量。经调查或实验而得到的数字或数量。经调查或实验而得到的数字或数量。数数 据据统计学的应用

9、,根本要有统计学的应用,根本要有“数据数据”6 6数据分类数据分类依依依依数据来源数据来源数据来源数据来源 分分分分o o 原材料或产品数据原材料或产品数据o o 制程数据制程数据o o 检验数据检验数据依依依依数据时间数据时间数据时间数据时间 先后先后先后先后o o 过去数据过去数据o o 日常数据日常数据o o 新数据新数据依依依依数据特性数据特性数据特性数据特性 区分区分区分区分o o 计数值:计数值:计数值:计数值:以点数而得的数据,如不良品数、缺点数;以点数而得的数据,如不良品数、缺点数;o o 计量值:计量值:计量值:计量值:用测量而得的数据,如厚度、高度、温度等;用测量而得的数据

10、,如厚度、高度、温度等;7 7连续数据(计量):连续数据(计量):连续数据(计量):连续数据(计量):可使用一种可使用一种度量单位度量单位度量单位度量单位 来描述的数来描述的数据,如温度、长度据,如温度、长度离散数据(属性):离散数据(属性):离散数据(属性):离散数据(属性):以以类别类别类别类别 作描述的数据,如作描述的数据,如“合格合格”与与“不合格不合格”、等级、等级数据分类数据分类8 8数据分类数据分类9 9数据分类数据分类(Exercise)请说出以下的数据属性:请说出以下的数据属性:#ACFACF拉力需大于拉力需大于 400400gfgf/cm/cm #组立制程预警界限为不良率组

11、立制程预警界限为不良率2.0% 2.0% #1717EA07 IDDEA07 IDD电流需小于电流需小于 900 900 mAmA #1 1线的线的Tact timeTact time为为23.5 23.5 s s #11/5 11/5 OQCOQC批退率批退率 2000 2000 ppmppm1010群体与样本群体与样本群体群体群体群体大小大小大小大小-N N平均数平均数平均数平均数- 标准差标准差标准差标准差- 样本样本样本样本大小大小大小大小-n n平均数平均数平均数平均数-XbarXbar标准差标准差标准差标准差-S S x x x x x x x x x x x x x x x x

12、x x x x x x x x xx x x x x x x x xx x x x x x x x x x x x x x x x x x x x x x x x x x x x x xxxxxxxxxx计计算算样样本本统统计计量量并并进行检定进行检定决策决策应用于群体应用于群体分分 析析 结结 论论作作 决决 策策 依依据据试验试验统计学统计学统计学统计学描述性统计描述性统计描述性统计描述性统计推论统计学推论统计学推论统计学推论统计学1111抽样原则抽样原则我们通过研究样本来估计群体我们通过研究样本来估计群体我们通过研究样本来估计群体我们通过研究样本来估计群体 XbarXbar; SS;并使

13、;并使;并使;并使估计变异尽量小。估计变异尽量小。估计变异尽量小。估计变异尽量小。群体层别群体层别群体层别群体层别取样方法:取样方法:取样方法:取样方法: 随机抽样法随机抽样法随机抽样法随机抽样法 系统抽样法系统抽样法系统抽样法系统抽样法 分层随机抽样法分层随机抽样法分层随机抽样法分层随机抽样法 集体抽样法集体抽样法集体抽样法集体抽样法XXXXXXXXXXXX#X$X$#X#X$X$#XX X X XX XX XX X X XX XXXX XX X X XX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX1212数据收集数据收集 收集数据的收集数据的收集

14、数据的收集数据的目的目的目的目的为何?为何?为何?为何? 收集的数据收集的数据收集的数据收集的数据可靠性可靠性可靠性可靠性如何?如何?如何?如何? 是否有是否有是否有是否有遗漏或重复遗漏或重复遗漏或重复遗漏或重复?数据整理:分类与列表数据整理:分类与列表数据整理:分类与列表数据整理:分类与列表1 1 1 1、分类项目确定;、分类项目确定;、分类项目确定;、分类项目确定;2 2 2 2、归类整理;、归类整理;、归类整理;、归类整理;3 3 3 3、列表;、列表;、列表;、列表;OKOK1313图表分析图表分析频率分析工具频率分析工具频率分析工具频率分析工具 频率表频率表频率表频率表 直方图直方图

15、直方图直方图了解数据在每类(范围、区间)内出现的频率。了解数据在每类(范围、区间)内出现的频率。了解数据在每类(范围、区间)内出现的频率。了解数据在每类(范围、区间)内出现的频率。查检收数据查检收数据查检收数据查检收数据直方显分布直方显分布直方显分布直方显分布 柏拉抓重点柏拉抓重点柏拉抓重点柏拉抓重点 散布找相关散布找相关散布找相关散布找相关 层别找差异层别找差异层别找差异层别找差异 特性找要因特性找要因特性找要因特性找要因 管制防变异管制防变异管制防变异管制防变异 1414QC手法回顾手法回顾查检收数据查检收数据柏拉抓重点柏拉抓重点散布找相关散布找相关特性找要因特性找要因1515直方显分布直

16、方显分布管制防变异管制防变异QC手法回顾手法回顾1616QC手法回顾手法回顾1717数据给你什么信息数据给你什么信息数据给你什么信息数据给你什么信息?图表分析图表分析1818频率表频率表为为为为了解数据分布,我们构造频率表:了解数据分布,我们构造频率表:了解数据分布,我们构造频率表:了解数据分布,我们构造频率表:1.1.全距全距全距全距: : : : 最大值最大值最大值最大值- - - -最小值最小值最小值最小值 = 23-17.4 =5.6= 23-17.4 =5.6= 23-17.4 =5.6= 23-17.4 =5.6公里公里公里公里2.2.组数组数组数组数: : : : K=1+3.3

17、2lg n = 1+3.32lg100 = 7.64 (8K=1+3.32lg n = 1+3.32lg100 = 7.64 (8K=1+3.32lg n = 1+3.32lg100 = 7.64 (8K=1+3.32lg n = 1+3.32lg100 = 7.64 (8组组组组) ) ) )3.3.组距组距组距组距: : : : R/K = 5.6/8 = 0.7R/K = 5.6/8 = 0.7R/K = 5.6/8 = 0.7R/K = 5.6/8 = 0.7公里公里公里公里4.4.列出各组次数列出各组次数列出各组次数列出各组次数( ( ( (频率频率频率频率) ) ) )5.5.计算

18、各组比率计算各组比率计算各组比率计算各组比率: : : : 该组频率该组频率该组频率该组频率/ / / /样本总数样本总数样本总数样本总数* * * *100%100%100%100%图表分析图表分析1919组界组界组界组界次数次数次数次数( (频率频率频率频率) )比率比率比率比率累积比率累积比率累积比率累积比率17.4-18.166%6%18.1-18.81616%22%18.8-19.52020%42%19.5-20.21111%53%20.2-20.92222%75%20.9-21.61313%88%21.6-22.31010%98%22.3-23.022%100%频率表给你什么信息频

19、率表给你什么信息频率表给你什么信息频率表给你什么信息?图表分析图表分析2020直方图直方图直方图是对频率表的图形显示直方图是对频率表的图形显示直方图是对频率表的图形显示直方图是对频率表的图形显示图图图图形形形形给给给给您您您您什什什什么么么么信信信信息息息息?LSLLSLUSLUSL图表分析图表分析2121 测知制程能力测知制程能力测知制程能力测知制程能力 计算产品的不良率计算产品的不良率计算产品的不良率计算产品的不良率 检查样本是否混入两个以上不同群体检查样本是否混入两个以上不同群体检查样本是否混入两个以上不同群体检查样本是否混入两个以上不同群体 测知有无假数据测知有无假数据测知有无假数据测

20、知有无假数据( ( ( (选别选别选别选别) ) ) ) 探测异常值探测异常值探测异常值探测异常值 与规格或标准值比较与规格或标准值比较与规格或标准值比较与规格或标准值比较直方图的主要应用直方图的主要应用图表分析图表分析22221.1.测知制程能力测知制程能力测知制程能力测知制程能力图表分析图表分析MinitabMinitab:Basic StatisticsQuality Basic StatisticsQuality ToolsCapability AnalysisToolsCapability Analysis23232. 2.计算产品的不良率计算产品的不良率计算产品的不良率计算产品的不

21、良率图表分析图表分析24243.3.检查样本是否混入两个以上不同群体检查样本是否混入两个以上不同群体检查样本是否混入两个以上不同群体检查样本是否混入两个以上不同群体-40-30-20-10010203040LSLUSLProcess Capability Analysis for DATA直方图成双峰直方图成双峰直方图成双峰直方图成双峰 多峰形态多峰形态多峰形态多峰形态: : : :数据可能为混合两个或多个不数据可能为混合两个或多个不数据可能为混合两个或多个不数据可能为混合两个或多个不同群体同群体同群体同群体.(.(.(.(来自于不同设备、材料、班别等来自于不同设备、材料、班别等来自于不同设备

22、、材料、班别等来自于不同设备、材料、班别等) ) ) )图表分析图表分析25254.4.测知有无假数据测知有无假数据测知有无假数据测知有无假数据( (选别选别选别选别) )LSLLSLUSLUSL直方图成削壁形态直方图成削壁形态直方图成削壁形态直方图成削壁形态: : : : 往往是因制程能力不够,但为求产往往是因制程能力不够,但为求产往往是因制程能力不够,但为求产往往是因制程能力不够,但为求产品符合规格,而进行全数选别。品符合规格,而进行全数选别。品符合规格,而进行全数选别。品符合规格,而进行全数选别。图表分析图表分析26265.5.探测异常值探测异常值探测异常值探测异常值异常值:会严重影响统

23、计量(平均数、变异数)的计算;异常值:会严重影响统计量(平均数、变异数)的计算;异常值:会严重影响统计量(平均数、变异数)的计算;异常值:会严重影响统计量(平均数、变异数)的计算; 往往是改进的机会;往往是改进的机会;往往是改进的机会;往往是改进的机会; 图表分析图表分析27276. 6.与规格或标准值比较与规格或标准值比较与规格或标准值比较与规格或标准值比较制程能力合宜制程能力合宜制程能力合宜制程能力合宜制程能力过剩制程能力过剩制程能力过剩制程能力过剩图表分析图表分析2828基本统计量基本统计量= = =抽样抽样抽样+ + +数据数据数据+ + +计算计算计算有益资讯有益资讯有益资讯合理推断

24、合理推断合理推断改善资讯改善资讯改善资讯统计统计统计数据统计量的数据统计量的数据统计量的描述方式描述方式描述方式平均数平均数 MeanMean中位数中位数 MedianMedian众数众数 ModeMode全距全距 RangeRange四分位距四分位距 InterquartileInterquartile Range Range 变异数变异数 VarianceVariance标准差标准差 Standard DeviationStandard Deviation置信区间置信区间集中趋势集中趋势离散趋势离散趋势机率机率分布分布概率分布概率分布2929数据数据数据数据集中趋势集中趋势集中趋势集中趋势

25、 的统计量的统计量的统计量的统计量中位数中位数Median将数据从小至大或大至小依次排列,位居正中的数或中将数据从小至大或大至小依次排列,位居正中的数或中间两个数的平均值,称为中位数。间两个数的平均值,称为中位数。例1:18,20,21,24,26Me21例2:2,3,4,5,6,84+5位居中间的两个数据为4和5,Me=(4+5)/24.5基本统计量基本统计量平均数平均数Mean(样本均值;样本均值;样本均值;样本均值;群体均值;群体均值;群体均值;群体均值;) ))代表一群数据的平均数值。代表一群数据的平均数值。代表一群数据的平均数值。代表一群数据的平均数值。=(X1+X2+X3+Xn)/

26、n3030全距(全距(Range)一群数值中最大值与最小值之差,称为全距一群数值中最大值与最小值之差,称为全距。全距(全距(R)最大值最小值最大值最小值数据数据数据数据离散程度离散程度离散程度离散程度 的统计量的统计量的统计量的统计量变异数(变异数(Variance)各测定值与平均值之差之平方总和各测定值与平均值之差之平方总和,称为偏差平方和称为偏差平方和(变异数)(变异数)SS(X1X)2(X2X)2(XnX)2(XiX)2ni=1基本统计量基本统计量3131标准差(标准差(StandardDeviance)(s样本标样本标样本标样本标准差;准差;准差;准差;群体标准差;群体标准差;群体标准

27、差;群体标准差;)方差之开方,即为标准方差之开方,即为标准偏偏差(差(简称标准差)。简称标准差)。( ( =R/d2=R/d2近似计算近似计算近似计算近似计算) )数据数据数据数据离散程度离散程度离散程度离散程度 的统计量的统计量的统计量的统计量基本统计量基本统计量3232 水平水平良率良率DPMODPMO1 68.273173002 95.45455003 99.7327004 99.9937635 99.9999430.576 99.99999980.002 +1+1 +2+2 +3+3 + +4 4 + +5 5 + +6 6 - -1 1 - -2 2 - -3 3 - -4 4 -

28、-5 5 - -6 6 1 +1+1 +2+2 +3+3 + +4 4 + +5 5 + +6 6 - -1 1 - -2 2 - -3 3 - -4 4 - -5 5 - -6 6 1.51.5 1.51.5 水平水平良率良率DPMODPMO1 30.236977002 69.133087003 93.32668104 99.379062105 99.976702336 99.9996603.4基本统计量基本统计量3333置信区间置信区间为何我们要计算置信区间为何我们要计算置信区间? ?3434置信区间置信区间3535置信区间置信区间置信区间置信区间置信区间置信区间3636通常,置信区间具有

29、附加的不确定性:通常,置信区间具有附加的不确定性:通常,置信区间具有附加的不确定性:通常,置信区间具有附加的不确定性:估计值估计值估计值估计值 变异幅度变异幅度变异幅度变异幅度群体统计量群体统计量群体统计量群体统计量 =样本统计量样本统计量样本统计量样本统计量 【XX 】例如:例如:例如:例如:, 例如:例如:例如:例如:x x,s s置信因素置信因素置信因素置信因素统计变异统计变异统计变异统计变异置信区间置信区间置信区间置信区间置信区间置信区间3737置信区间置信区间:区间估计又称为置信区间区间估计又称为置信区间区间估计又称为置信区间区间估计又称为置信区间:是用来估计参数的取:是用来估计参数

30、的取:是用来估计参数的取:是用来估计参数的取值范围的值范围的值范围的值范围的, , , ,给结论留一些余地。给结论留一些余地。给结论留一些余地。给结论留一些余地。:置信区间置信区间置信区间置信区间(1-1-)与显著性水平与显著性水平与显著性水平与显著性水平( ()0.950.950.950.95置信区间(置信区间(置信区间(置信区间(1-1-1-1-)0.050.050.050.05显著性水平显著性水平显著性水平显著性水平( ( ( ()的置信区间的置信区间的置信区间的置信区间=0.01=0.01=0.01=0.01表示反复抽样表示反复抽样表示反复抽样表示反复抽样100010001000100

31、0次,则得到的次,则得到的次,则得到的次,则得到的1000100010001000个区间中不包含真值的仅为个区间中不包含真值的仅为个区间中不包含真值的仅为个区间中不包含真值的仅为10101010个左右。个左右。个左右。个左右。:区间估计的原理:样本分布理论区间估计的原理:样本分布理论区间估计的原理:样本分布理论区间估计的原理:样本分布理论置信区间统计量标准误到统计量标准误置信区间统计量标准误到统计量标准误置信区间统计量标准误到统计量标准误置信区间统计量标准误到统计量标准误3838置信区间置信区间真值( )各不相同的10個信赖區間例如:所谓例如:所谓例如:所谓例如:所谓 90% 90% 90%

32、90% 信赖区间,信赖区间,信赖区间,信赖区间,就是反复信赖区间得的就是反复信赖区间得的就是反复信赖区间得的就是反复信赖区间得的10101010个信赖区间中,个信赖区间中,个信赖区间中,个信赖区间中,9 9 9 9个包含母个包含母个包含母个包含母体平均的意思。体平均的意思。体平均的意思。体平均的意思。3939- 1.96(3.0)+ 1.96(3.0)观察样本平均数观察样本平均数, X平均值平均值置信区间置信区间置信区间置信区间置信区间置信区间4040如前所述如前所述如前所述如前所述汽车汽油效率案例中:汽车汽油效率案例中:汽车汽油效率案例中:汽车汽油效率案例中: X=20.033X=20.03

33、3S=1.254S=1.254n=100n=100 t.025,99 = 1.98所以母体平均值的置信区间是所以母体平均值的置信区间是:20.033-1.98*1.254/1020.033-1.98*1.254/10 20.033+1.98*1.254/1020.033+1.98*1.254/10即即即即: :群体平均值置信区间群体平均值置信区间群体平均值置信区间群体平均值置信区间=19.785=19.78520.28120.281置信区间置信区间置信区间置信区间置信区间置信区间4141现在用现在用Minitab 来计算信心区间!来计算信心区间!所所所所研究研究研究研究的数据的数据的数据的数据

34、信心水信心水信心水信心水准准准准95%95%置信区间置信区间置信区间置信区间置信区间置信区间4242样本平均值样本平均值样本平均值样本平均值样本标准差样本标准差样本标准差样本标准差样本最小值样本最小值样本最小值样本最小值样本最大值样本最大值样本最大值样本最大值样本中位数样本中位数样本中位数样本中位数群体平均值置信区间群体平均值置信区间群体平均值置信区间群体平均值置信区间群体标准差置信区间群体标准差置信区间群体标准差置信区间群体标准差置信区间置信区间置信区间4343概率分布概率分布概率分布三种应用概率分布三种应用概率分布三种应用概率分布三种应用已知已知已知已知X X X Xf(X) =f(X)

35、=f(X) =f(X) = ? ? ? ?已知已知已知已知Z or SPECZ or SPECZ or SPECZ or SPECp =p =p =p = ? ? ? ?已知已知已知已知DPMODPMODPMODPMOZ=Z=Z=Z= ? ? ? ?4444本本案例中案例中,群体中汽车每升汽油群体中汽车每升汽油23公里的概率有多少公里的概率有多少?属于哪种类型属于哪种类型属于哪种类型属于哪种类型?概率分布概率分布4545已知规格已知规格已知规格已知规格超出概率超出概率超出概率超出概率概率密度概率密度概率密度概率密度样本均值样本均值样本均值样本均值样本标准差样本标准差样本标准差样本标准差预测界限

36、预测界限预测界限预测界限Normal with mean = 20.033 and Normal with mean = 20.033 and standard deviation = 1.254standard deviation = 1.254 x f( x ) x f( x )23 0.0193643 23 0.0193643 群体中群体中群体中群体中2323的概率的概率的概率的概率1.94%1.94%概率分布概率分布4646重要几率分配重要几率分配重要几率分配重要几率分配离散(计数值)几率分配:离散(计数值)几率分配:离散(计数值)几率分配:离散(计数值)几率分配: 二项分布二项分布二

37、项分布二项分布 超几何分布超几何分布超几何分布超几何分布 泊淞分布泊淞分布泊淞分布泊淞分布连续(计量值)几率分配:连续(计量值)几率分配:连续(计量值)几率分配:连续(计量值)几率分配: 正态分布正态分布正态分布正态分布 指数分布指数分布指数分布指数分布 对数分布对数分布对数分布对数分布 平均分布平均分布平均分布平均分布来自常态群体的抽样分布:来自常态群体的抽样分布:来自常态群体的抽样分布:来自常态群体的抽样分布: T T T T分布分布分布分布 F F F F分布分布分布分布中央极限定理中央极限定理中央极限定理中央极限定理概率分布概率分布4747二项分布二项分布二项分布二项分布二项分布用于描

38、述结果可记为二项分布用于描述结果可记为二项分布用于描述结果可记为二项分布用于描述结果可记为Yes & NoYes & NoYes & NoYes & No的情况。的情况。的情况。的情况。几率分配形式几率分配形式几率分配形式几率分配形式 n-n-n-n-样本大小样本大小样本大小样本大小 p-p-p-p-群体不良率群体不良率群体不良率群体不良率 x-x-x-x-不良品数不良品数不良品数不良品数 b(x;n,p) =( )b(x;n,p) =( )b(x;n,p) =( )b(x;n,p) =( )p p p px x x x (1-p)(1-p)(1-p)(1-p)n-xn-xn-xn-xn n

39、n nx x x x概率分布概率分布4848P(x2)=b(xP(x2)=b(xP(x2)=b(xP(x2)=b(x;30, 0.006)30, 0.006)30, 0.006)30, 0.006)x=0x=02 2= =0.99920.9992解答:解答:解答:解答:ExampleExample某材料的不良率为某材料的不良率为60006000ppmppm,现抽检现抽检3030PCSPCS,问不良问不良品小于品小于2 2PCSPCS的的几率。几率。概率分布概率分布4949我们用我们用我们用我们用MINITABMINITABMINITABMINITAB来计算!来计算!来计算!来计算!正态分布正态

40、分布正态分布正态分布F F分布分布分布分布t t分布分布分布分布二项分布二项分布二项分布二项分布超几何分布超几何分布超几何分布超几何分布泊淞分布泊淞分布泊淞分布泊淞分布韦伯分布韦伯分布韦伯分布韦伯分布MINITABMINITAB:CalcCalcProbability DistributionsProbability Distributions?概率分布概率分布5050样本数样本数样本数样本数不良率或成功几率不良率或成功几率不良率或成功几率不良率或成功几率预期数量预期数量预期数量预期数量Cumulative Distribution Function Cumulative Distributi

41、on Function Binomial with n = 30 and p = 0.006Binomial with n = 30 and p = 0.006x P( X = x )x P( X = x )2 0.9992232 0.999223NOTENOTE:成功几率成功几率成功几率成功几率=1-=1-不良率不良率不良率不良率概率分布概率分布5151超几何分布超几何分布超几何分布超几何分布二项分布用于描述结果可记为二项分布用于描述结果可记为二项分布用于描述结果可记为二项分布用于描述结果可记为Yes&NoYes&No、群体为群体为群体为群体为有限个数,取出样本不归还。有限个数,取出样本不归

42、还。有限个数,取出样本不归还。有限个数,取出样本不归还。几率分配形式几率分配形式几率分配形式几率分配形式 N-N-群体大小群体大小群体大小群体大小 n-n-样本大小样本大小样本大小样本大小 P-P-群体不良率群体不良率群体不良率群体不良率 x-x-不良品数不良品数不良品数不良品数h(x;N,n,p)=h(x;N,n,p)=NpNpx xN(1-p)N(1-p)n-xn-x()() ()()N Nn n()()概率分布概率分布5252ExampleExample在一批总量在一批总量NN为为5050的产品中,随机抽取的产品中,随机抽取1010件作检验。该件作检验。该产品不良率为产品不良率为0.06

43、0.06,买卖双方约定不良数买卖双方约定不良数1 1允允2 2退,问:退,问:该批产品允收概率多少?该批产品允收概率多少?群体数量群体数量群体数量群体数量群体中不良数或成功数群体中不良数或成功数群体中不良数或成功数群体中不良数或成功数样本数量样本数量样本数量样本数量预期数量预期数量预期数量预期数量NOTENOTE:M=N*PM=N*P概率分布概率分布5353CumulativeDistributionFunctionCumulativeDistributionFunctionCumulativeDistributionFunctionCumulativeDistributionFunction

44、 HypergeometricHypergeometricwithN=50,M=3,andwithN=50,M=3,andn=10n=10xP(X=x)xP(X16n16、N10nN10n、P0.1P0.1)几率分配形式几率分配形式p(x;p(x; )=)=( ( - - * * x x) )x!x! =2.71828=2.71828=npnp概率分布概率分布5555ExampleExample在一批总量在一批总量NN为为12001200的产品中,随机抽取的产品中,随机抽取100100件作检验。件作检验。该产品不良率为该产品不良率为0.5%0.5%,买卖双方约定不良数买卖双方约定不良数1 1允

45、允2 2退,问:退,问:该批产品允收概率多少?该批产品允收概率多少?Mean=Mean=n*p=100*0.5%=0.5n*p=100*0.5%=0.5预期数量预期数量预期数量预期数量CumulativeDistributionCumulativeDistributionCumulativeDistributionCumulativeDistributionFunctionFunctionFunctionFunctionPoissonwithmean=0.5Poissonwithmean=0.5xP(X=x)xP(X=x)10.90979610.909796概率分布概率分布5656Exampl

46、eExample:我们统计了我们统计了9090为女士的身高,请制作成直方图为女士的身高,请制作成直方图概率分布概率分布(课堂练习)课堂练习)5757正态分布正态分布5858正态分布特征图正态分布特征图正态分布特征图正态分布特征图正态分布正态分布5959正态分布正态分布正态分布正态分布正态分布正态分布6060减少变异减少变异Z Z值与值与值与值与DPMODPMO1s3s平均规格界限3 3 水准的水准的稳定工程稳定工程1s6s6 6 水准的水准的稳定工程稳定工程规格界限正态分布正态分布6161ExampleExample零件规格:零件规格:零件规格:零件规格:1.0300.0301.0300.03

47、0,假设我们测量了假设我们测量了假设我们测量了假设我们测量了3030个部件,个部件,个部件,个部件,Xbar=1.050Xbar=1.050,S=0.015S=0.015请计算不符合规格的比率和该过程请计算不符合规格的比率和该过程请计算不符合规格的比率和该过程请计算不符合规格的比率和该过程SigmaSigma水平水平水平水平USLUSLZ ZUSLUSL=USL-XUSL-XS S=1.0601.0501.0601.0500.0150.015Z ZUSLUSL=0.67=0.67查正态分布表或计算可得查正态分布表或计算可得查正态分布表或计算可得查正态分布表或计算可得25.14%25.14%25

48、.14%25.14%的零件超出的零件超出的零件超出的零件超出USLUSLUSLUSL。LSLLSLZ ZLSLLSL=X-LSLX-LSLS S=1.0501.0001.0501.0000.0150.015Z ZLSLLSL=3.33=3.33查正态分布表或计算可得查正态分布表或计算可得查正态分布表或计算可得查正态分布表或计算可得0.04%0.04%0.04%0.04%的零件低于的零件低于的零件低于的零件低于LSLLSLLSLLSL。正态分布正态分布6262Z Z BenchBench的定义的定义的定义的定义 PUSL是相对是相对USLUSL的的缺陷率缺陷率 PLSL是相对是相对LSLLSL的

49、缺陷率的缺陷率 PTOT是总缺陷率是总缺陷率 PTOT = PUSL + PLSLZ Z Z Z BenchBenchBenchBench是是是是总缺陷率对应的总缺陷率对应的总缺陷率对应的总缺陷率对应的Z Z Z Z值,值,值,值,可查正态分布表或计算获得。可查正态分布表或计算获得。可查正态分布表或计算获得。可查正态分布表或计算获得。正态分布正态分布6363Z Z值与值与值与值与DPMODPMO计算计算计算计算MINITABMINITAB:CalcCalcProbability DistributionsProbability DistributionsNormalNormal已知已知已知已知

50、Z Z,求,求,求,求Pr(Pr(DPMODPMO) )CumulativeDistributionFunctionCumulativeDistributionFunctionCumulativeDistributionFunctionCumulativeDistributionFunctionNormalwithmean=0andstandardNormalwithmean=0andstandarddeviation=1deviation=1xxP(X=x)P(X=x)3.333.330.9995660.999566已知已知已知已知Pr(Pr(DPMODPMO) ),求,求,求,求Z ZIn

51、verseCumulativeDistributionInverseCumulativeDistributionInverseCumulativeDistributionInverseCumulativeDistributionFunctionFunctionFunctionFunctionNormalwithmean=0andstandardNormalwithmean=0andstandarddeviation=1deviation=1P(X=x)xP(X,不能拒绝原假设不能拒绝原假设H0,当,当p,拒绝原假设拒绝原假设H0。7575PowerandSampleSize1-SampletP

52、owerandSampleSize1-Samplet计量型数据计量型数据计量型数据计量型数据Supposeyouaretheproductionmanageratadairyplant.InordertoSupposeyouaretheproductionmanageratadairyplant.Inordertomeetstaterequirements,youmustmaintainstrictcontroloverthemeetstaterequirements,youmustmaintainstrictcontroloverthepackagingoficecream.Thevolum

53、ecannotvarymorethan3ozforapackagingoficecream.Thevolumecannotvarymorethan3ozforahalf-gallon(64-oz)container.Thepackagingmachinetolerancesarehalf-gallon(64-oz)container.Thepackagingmachinetolerancesaresetsotheprocesssetsotheprocess is1.is1.HowmanysamplesmustbetakentoestimateHowmanysamplesmustbetakent

54、oestimatethemeanpackagevolumeataconfidencelevelof99%(themeanpackagevolumeataconfidencelevelof99%(a a a a=.01)for=.01)forpowervaluesof0.7,0.8,and0.9?powervaluesof0.7,0.8,and0.9?(需要样本量大小?)需要样本量大小?)需要样本量大小?)需要样本量大小?)MinitabMinitab操作:操作:操作:操作:1ChooseStatPowerandSampleSize1-Samplet.1ChooseStatPowerandSam

55、pleSize1-Samplet.2In2InDifferencesDifferences,enter,enter3 3.In.InPowervaluesPowervalues,enter,enter0.70.80.90.70.80.9. .3In3InStandarddeviationStandarddeviation,enter,enter1 1. .4Click4ClickOptionsOptions.In.InSignificancelevelSignificancelevel,enter,enter0.010.01.Click.ClickOKOKineachineachdialogb

56、oxdialogbox7676InterpretingtheresultsInterpretingtheresults结果分析结果分析结果分析结果分析分析结果分析结果分析结果分析结果:PowerandSampleSizePowerandSampleSize1-SampletTest1-SampletTestTestingmean=null(versusnot=null)Testingmean=null(versusnot=null)Calculatingpowerformean=null+differenceCalculatingpowerformean=null+differenceAlph

57、a=0.01Assumedstandarddeviation=1Alpha=0.01Assumedstandarddeviation=1SampleTargetSampleTargetDifferenceSizePowerActualPowerDifferenceSizePowerActualPower350.70.894714350.70.894714350.80.894714350.80.894714360.90.982651360.90.982651InterpretingtheresultsInterpretingtheresults(结果说明):结果说明):结果说明):结果说明):M

58、initabdisplaysthesamplesizerequiredtoobtaintherequestedpowerMinitabdisplaysthesamplesizerequiredtoobtaintherequestedpowervalues.Becausethetargetpowervalueswouldresultinnon-integersamplevalues.Becausethetargetpowervalueswouldresultinnon-integersamplesizes,Minitabdisplaysthepower(ActualPower)thatyouwo

59、uldhavetosizes,Minitabdisplaysthepower(ActualPower)thatyouwouldhavetodetectdifferencesinvolumegreaterthanthreeouncesusingthenearestdetectdifferencesinvolumegreaterthanthreeouncesusingthenearestintegervalueforsamplesize.integervalueforsamplesize.Ifyoutakeasampleoffivecartons,powerforIfyoutakeasampleo

60、ffivecartons,powerforyourtestis0.895;forasampleofsixcartons,poweris0.983yourtestis0.895;forasampleofsixcartons,poweris0.983. .7777PowerandSampleSize2ProportionsPowerandSampleSize2Proportions计数型计数型计数型计数型Asapoliticaladvisor,youwanttodeterminewhetherthereisaAsapoliticaladvisor,youwanttodeterminewhether

61、thereisadifferencebetweentheproportionsofmenandwomenwhodifferencebetweentheproportionsofmenandwomenwhosupportataxreformbill.Resultsofaprevioussurveysuggestsupportataxreformbill.Resultsofaprevioussurveysuggestthat30%(p=0.30)ofthevotersingeneralsupportthebill.Ifthat30%(p=0.30)ofthevotersingeneralsuppo

62、rtthebill.Ifyoumail1000surveystovotersofeachgender,youmail1000surveystovotersofeachgender,whatisthewhatisthepowertodetectthedifferenceifmenandwomeninthepowertodetectthedifferenceifmenandwomeninthegeneralpopulationdifferinsupportforthebillby5%(0.05)orgeneralpopulationdifferinsupportforthebillby5%(0.0

63、5)ormore?more?MinitabMinitab操作:操作:操作:操作:1ChooseStatPowerandSampleSize2Proportions.1ChooseStatPowerandSampleSize2Proportions.2In2InSamplesizesSamplesizes,enter1000.,enter1000.3In3InProportion1valuesProportion1values,enter0.250.35.,enter0.250.35.4In4InProportion2Proportion2,enter0.30.Click,enter0.30.C

64、lickOKOK. .7878结果分析结果分析结果:结果:结果:结果:SessionwindowoutputSessionwindowoutputTestforTwoProportionsTestforTwoProportions Testingproportion1=proportion2(versusnot=)Testingproportion1=proportion2(versusnot=)Calculatingpowerforproportion2=0.3Calculatingpowerforproportion2=0.3Alpha=0.05Alpha=0.05SampleSample

65、Proportion1SizePowerProportion1SizePower0.2510000.251000 0.7070600.7070600.3510000.6655700.3510000.665570Thesamplesizeisforeachgroup.Thesamplesizeisforeachgroup.InterpretingtheresultsInterpretingtheresultsIf30%(0.30)ofonegendersupportthebillandonly25%(0.25)oftheIf30%(0.30)ofonegendersupportthebillan

66、donly25%(0.25)oftheotherdoes,youotherdoes,youll llhavea71%chanceofdetectingadifferenceifyouhavea71%chanceofdetectingadifferenceifyousendout1000surveystoeach.Ifthepopulationproportionsaresendout1000surveystoeach.Ifthepopulationproportionsareactually0.30and0.35,youactually0.30and0.35,youll llhavea67%c

67、hanceofdetectingahavea67%chanceofdetectingadifference.difference.79791-proportionForaone-sampletestofproportion,entertheexpectedForaone-sampletestofproportion,entertheexpectedproportionunderthenullhypothesisforproportionunderthenullhypothesisforHypothesizedpHypothesizedpininthedialogbox.thedialogbox

68、.SupposeyouaretestingwhetherthedataareconsistentwithSupposeyouaretestingwhetherthedataareconsistentwiththefollowingnullhypothesisandwouldliketodetectanythefollowingnullhypothesisandwouldliketodetectanydifferenceswherethetrueproportionisgreaterthan0.73.differenceswherethetrueproportionisgreaterthan0.

69、73.假假假假设设:H0:p=0.7H1:p0.7H0:p=0.7H1:p0.7( wherepisthepopulationwherepisthepopulationproportionproportion)例:例:例:例:InMinitab,enter0.73inInMinitab,enter0.73inAlternativevaluesofpAlternativevaluesofp;enter;enter0.7in0.7inHypothesizedpHypothesizedp.(Thealternativeproportionisnotthe.(Thealternativeproport

70、ionisnotthevalueofthealternativehypothesis,butthevalueatwhichyouvalueofthealternativehypothesis,butthevalueatwhichyouwanttoevaluatepower.)wanttoevaluatepower.)80802-proportionForatwo-sampletestofproportion,entertheexpectedForatwo-sampletestofproportion,entertheexpectedproportionsunderthenullhypothes

71、isforproportionsunderthenullhypothesisforProportion2Proportion2intheinthedialogbox.dialogbox.SupposeabiologistwantstotestforadifferenceintheSupposeabiologistwantstotestforadifferenceintheproportionoffishaffectedbypollutionintwolakes.Theproportionoffishaffectedbypollutionintwolakes.Thebiologistwouldl

72、iketodetectadifferenceofbiologistwouldliketodetectadifferenceof0.030.03andandsuspectsthataboutonequartersuspectsthataboutonequarter(0.25)(0.25)offishinLakeAhaveoffishinLakeAhavebeenaffected.beenaffected.假假假假设设:H0:p1=p2H1:p1p2H0:p1=p2H1:p1p2InMinitab,enter0.22and0.28inInMinitab,enter0.22and0.28inProportion1valuesProportion1values;enter;enter0.25in0.25inProportion2Proportion2. .8181

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号