03HypothesisTesting

上传人:枫** 文档编号:579431773 上传时间:2024-08-26 格式:PPT 页数:31 大小:381.53KB
返回 下载 相关 举报
03HypothesisTesting_第1页
第1页 / 共31页
03HypothesisTesting_第2页
第2页 / 共31页
03HypothesisTesting_第3页
第3页 / 共31页
03HypothesisTesting_第4页
第4页 / 共31页
03HypothesisTesting_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《03HypothesisTesting》由会员分享,可在线阅读,更多相关《03HypothesisTesting(31页珍藏版)》请在金锄头文库上搜索。

1、HypothesisTesting假设检验 假设检验在统计方法中的地位假设检验在统计方法中的地位2课程目标课程目标什么是假设?介定 “原假设”和“备择假设”.说明相关术语什么是假设检验? 假设检验的分类.3总体总体: 统计总体统计总体用以定义所有可知或不可知参数(m,s)的数据或信息样品样品: 总体中具有共同特征的子集。可以计算其形成的统计表(X).我我我我 们们们们 以以以以 样样样样 本本本本 为为为为 基基基基 础础础础 做做做做 出出出出 总总总总 体体体体 决决决决 策策策策应取多少样本?应取多少样本?为何要选取样本?为何要选取样本?样本需要随机抽取吗?样本需要随机抽取吗?可能出现取

2、样可能出现取样错误吗?错误吗?总体和样本4样本样本 A所有的过程都有差异.来源于给定过程的样本也可能是多样化的.样本样本 B我们怎样区分随机变化的样本和真实总体的差别呢?怎样使用样本?5 对总体参数的具体数值所作的陈述总体参数包括总总体体均均值值、比例比例、方差方差等分析之前之前必需陈述我认为这种新药的疗效我认为这种新药的疗效我认为这种新药的疗效我认为这种新药的疗效比原有的药物更有效比原有的药物更有效比原有的药物更有效比原有的药物更有效! !什么是假设什么是假设?(hypothesis)6假设的种类原假设(Ho)通常用以描述现状除非其它方面有所说明,否则就是人为设想的。在Minitab中用“=

3、”表示备择假设(Ha):通常用以描述差別以证据为基础接受或拒绝的类型在Minitab中用“not=or”表示OrOr不是不是全全虚虚性性假设(相同)就是选择性假设(相区别的)假设(相同)就是选择性假设(相区别的)7定义假设原假设HO:X1=TargetHO:X1=mHO:X1-X2=0HO:m1-m2=0HO:X1=X2=X3=.XnHO:s1=s2HO:S1=S2HO:S1=S2=S3=.Sn备择性假设HA:m1m2不等式是针对两边的测试HA:X1X2HA:m1m2HA:X1X2单边测试用于假设.HA:m1m2HA:X1X2HA:X1-X20_HA:X1-X20_HA:s1s2_HA:s1S

4、2_把假设以等式陈述很有用把假设以等式陈述很有用. 8假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : : = 0 0H0 : : 0 0H0 : : 0 0备择假设备择假设H1 : : 0 0H1 : : 0 0双侧检验与单侧检验双侧检验与单侧检验双侧检验与单侧检验双侧检验与单侧检验 ( (假设的形式假设的形式假设的形式假设的形式) )9提出假设提出假设( (例题分析例题分析) )【例例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小

5、于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设,并说明你的理由。10提出假设提出假设( (例题分析例题分析) )【例例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,并说明你的理由。500g500g11提出假设提出假设( (例题分析例题分析) )【例例】一家研究机构估计,某城市中家庭拥有汽车的比例超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,并说

6、明你的理由。12什么是假设检验什么是假设检验? ? ( (hypothesistesthypothesistest) )1.先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程2.有参数检验和非参数检验3.逻辑上运用反证法,统计上依据小概率原理13假设检验中的小概率原理假设检验中的小概率原理什么小概率?什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定14假设检验的基本思想假设检验的基本思想. . . 因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒因此我们拒绝假设绝

7、假设绝假设绝假设绝假设绝假设 = 50= 50= 50. . . 如果这是总如果这是总如果这是总如果这是总如果这是总如果这是总体的真实均值体的真实均值体的真实均值体的真实均值体的真实均值体的真实均值样本均值样本均值样本均值 = 50 = 50抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布H H H0 00这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值样本均值样本均值样本均值 . . .20202015假设检验的过程假设检验的过程总体总体总体总体抽取随机样本抽取随机样本抽取

8、随机样本抽取随机样本均值均值均值均值 x x = 20= 20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设提出假设提出假设 拒绝假设拒绝假设 别无选择别无选择! 作出决策作出决策作出决策作出决策16为何要做假设检验?1.为了改进过程,我们需要确定影响均值和标准偏差的因素为了改进过程,我们需要确定影响均值和标准偏差的因素.2.一旦确定了这些因素并对改进措施进行了调整,我们就需要一旦确定了这些因素并对改进措施进行了调整,我们就需要验证其在过程中的切实效果。验证其在过程中的切实效果。3.若过程中存在统计上的重大差别,有时我们就不能利用图表若过程中存在统计上的重大差别,有

9、时我们就不能利用图表或算得的统计数据(样本均值和样本标准偏差)作出决策或算得的统计数据(样本均值和样本标准偏差)作出决策.4.在这种情况下,决定可能是主观的在这种情况下,决定可能是主观的.5.我们采用我们采用正统正统假设检验以客观地判断是否存在差別。假设检验以客观地判断是否存在差別。假设检验有助于判断一个明显的差别是否真实存在还是偶然的,假设检验有助于判断一个明显的差别是否真实存在还是偶然的,而且还可以提高差异真实性的可信度而且还可以提高差异真实性的可信度.数据帮助数据帮助每个每个人作出同样的决定。人作出同样的决定。17假设检验假设检验有罪有罪vs.vs.无罪的案例无罪的案例美国的司法体系可以

10、用于阐述假设检验的概念.在美国罪犯在被判有罪之前均是清白的.清白对应原假设.它需要强而有力的证据,必需“排除所有合理的怀疑”才能把被告定罪.若陪审团裁定被告有罪则相当于拒绝原假设接受备择假设.更具体些更具体些,我们拥有重要的证据证明差別的存在我们拥有重要的证据证明差別的存在.Ho : 被告是清白的被告是清白的.Ha : 被告有罪被告有罪.当得知真相后,可能的结果是什么当得知真相后,可能的结果是什么?18真相真相裁决裁决Ho, =Ha, not =Ho, =Ha, not =清白清白监禁监禁有罪有罪释放释放清白清白释放释放有罪有罪监禁监禁释放释放监禁监禁清白清白有罪有罪Type I 错误错误 (

11、 错误错误) 当当 Ho 是是无无误时而误时而拒绝拒绝 有时称作有时称作 生产者风险生产者风险Type II 错误错误 ( ( 错误错误) 是当是当 Ho有错误时却有错误时却接受接受 有时称作有时称作 消费者风险消费者风险.DecisionType 1错误错误 Type 2错误错误 正确正确决定决定(1- )正确正确决定决定(1- )真相真相Ho, =Ha, not =Ho, =Ha, not =法庭和商业上的决策风险19假设检验中的两类错误假设检验中的两类错误1. 第第 类错误类错误(弃真错误弃真错误)原假设为真时拒绝原假设第类错误的概率记为被称为显著性水平2. 第第 类错误类错误(取伪错误

12、取伪错误)原假设为假时未拒绝原假设第类错误的概率记为(Beta) 20 错误和错误和 错误的关系错误的关系 你不能同时减你不能同时减少两类错误少两类错误! 和和和和 的关系就像的关系就像的关系就像的关系就像翘翘板,翘翘板,翘翘板,翘翘板, 小小小小 就就就就大,大,大,大, 大大大大 就小就小就小就小21显著性水平显著性水平 ( (significantlevelsignificantlevel) )1. 是一个概率值2. 原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3. 表示为 (alpha)常用的 值有0.01, 0.05, 0.104. 由研究者事先确定22p值衡量决策风险的另一

13、种方法是通过衡量决策风险的另一种方法是通过P值值.P值是指一个因素可测的重要性水平.当样本和总体相对时,P值是指观测到其中差別的机会率.P值也指如果拒绝虚无性假设可能发生错误的概率(错误I)除非在基于工程判断上的例外,我们将错误I的可接受水平定在a=0.05.从而,任何小于0.05的P值就表示虚无性假设被拒绝。23置信区间和特征值的估计置信区间置信区间 确定了总体参数中样本确定了总体参数中样本统计可能的数值范围统计可能的数值范围.它它们可以们可以是单边也可是双边是单边也可是双边。样本均值、样本标准偏差、样本方样本均值、样本标准偏差、样本方异和其它样本统计被称为特征值评异和其它样本统计被称为特征

14、值评估者。因为它们是用以代表总体参估者。因为它们是用以代表总体参数的单一数的单一数数值。值。24置信水平与置信区间:所有的估计都有一个范围(基于一定的置信度),这个范围即所谓的置信区间。举个例子:在95%的置信度下估计某样本平均值为100+/-7,换句话说你有95的信心从总体中抽取的样本平均值应落在93107之间。不同置信水平下的置信区间:909598102105110-+-+-+-+-+-+-|-70%-|-80%-|-90%-|25特性值的区间估计:工程中总存在变异,这些变异通常导致试验结果与目标值之间存在偏移(当试验样本无限大时,这种偏移会趋近于零)。根据某一样本(样本大小有限)来估计总

15、体(样本无限大时)的整体的平均值和标准差就是区间估计.平均值估计:标准差估计:26显著性水平和拒绝域显著性水平和拒绝域( (双侧检验双侧检验) )抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布0 0 0临界值临界值临界值临界值临界值临界值 /2 /2 /2 /2/2 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH000拒绝拒绝拒绝H HH0001 - 1 - 1 - 置信水平置信水平置信水平置信水平置信水平置信水平27假设检验协议假设总是关于总体参数的假设总是关于总体参数的陈述陈述.1.定明原假设 (Ho ) HO : A国与B国居民身高相等 (mA=mB).规定选择性假设 (Ha )H

16、A : A国居民身高低于B国居民的身高 (mAmB).2.基于在需被测试的假设上,决定适合的统计测试.3.决定可接受的风险程度.a风险:通常5%(默认值)b风险:通常1020%(默认值)28假设检验协议(续)4.决定适合测试的样本数量5.从总体中选取需观察的样本群.6.计算样本的统计.7.用统计测试方法测验备择假设.8.在测试结果的基础上,根据先前确定的标准,做出选择或拒绝Ho的决定.9.转化结果.将统计的结论转换为现实的结果.统计结论:我们能从统计的角度证明差別吗?现实结果:我们需注意这些差別吗?29我们将假设检验作为证明差异的一种方法目标目标目标目标数数值值值值一个样本一个样本一个样本一个

17、样本 t t若干样本是否一致若干样本是否一致若干样本是否一致若干样本是否一致一致一致一致一致: : 两个两个两个两个 t t样本样本样本样本 或或或或ANOVAANOVA不一致不一致不一致不一致: : 用用用用F F测试测试测试测试 或均等或均等或均等或均等差异差异差异差异测测测测试试试试 事情发生的概率事情发生的概率事情发生的概率事情发生的概率:Chi Square Chi Square C C C C2 230一个总体参数的检验一个总体参数的检验z 检验检验(单侧和双侧单侧和双侧) t 检验检验(单侧和双侧单侧和双侧)z 检验检验(单侧和双侧单侧和双侧) 2 2 检验检验(单侧和双侧单侧和双侧)均值均值一个总体一个总体比例比例方差方差31

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号