第三讲1应用统计

上传人:n****m 文档编号:46151434 上传时间:2018-06-23 格式:PPT 页数:74 大小:1.10MB
返回 下载 相关 举报
第三讲1应用统计_第1页
第1页 / 共74页
第三讲1应用统计_第2页
第2页 / 共74页
第三讲1应用统计_第3页
第3页 / 共74页
第三讲1应用统计_第4页
第4页 / 共74页
第三讲1应用统计_第5页
第5页 / 共74页
点击查看更多>>
资源描述

《第三讲1应用统计》由会员分享,可在线阅读,更多相关《第三讲1应用统计(74页珍藏版)》请在金锄头文库上搜索。

1、第三讲 假设检验问题n 虽然我们不知道一批灯管的平均使用寿 命是多少,不知道一批产品的合格率是多少 ,不知道全校学生的生活费支出的方差是多 少,但我们可以事先提取一个假设值,比如 ,这批灯管的平均使用寿命是1500小时,这 批产品的合格率是95%,全校学生的生活费 支出的方差是1000,然后从中抽取一个样本 ,根据样本提供的信息来判断假设是否成立 。这就是统计上所说的假设检验。1一、假设检验的基本思路和概念1.两种统计推断n估计:求总体参数的近似值或近似值的 误差范围。基本方法是选择一个(组) 合适的模型;n检验:判断总体的某个性质是否成立。 基本方法是检验一个(组)给定的模型 。22.假设检

2、验的过程和思路概率意义下的反证法类似于“无罪推定”总体假设总体的 平均年龄是50岁拒绝样本均值是 20样本无效假设不可能!3什么是假设? (hypothesis)n 对总体参数的具体 数值所作的陈述n总体参数包括总 体均值、比例、方差 等n分析之前必需陈 述我认为这种新药的疗效我认为这种新药的疗效 比原有的药物更有效比原有的药物更有效! !4什么是假设检验?(hypothesis test)先对总体的参数(或分布形式)提出某种 假设,然后利用样本信息判断假设是否 成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率 原理5假设检验的基本思想. . 因此我们拒因此我们拒 绝假设绝假

3、设 = 50= 50. . 如果这是总如果这是总 体的真实均值体的真实均值样本均值样本均值m = 50抽样分布抽样分布H H0 0这个值不像我这个值不像我 们应该得到的们应该得到的 样本均值样本均值 .20206总体总体 假设检验的过程抽取随机样本抽取随机样本均值均值x x = 20= 20我认为人口的平 均年龄是50岁 提出假设提出假设拒绝假设别无选择! 作出决策作出决策7n【例】一种零件的生产标准是直径应为10cm,为 对生产过程进行控制,质量监测人员定期对一台加 工机床检查,确定这台机床生产的零件是否符合标 准要求。如果零件的平均直径大于或小于10cm, 则表明生产过程不正常,必须进行调

4、整。试陈述用 来检验生产过程是否正常的原假设和被择假设提出假设提出假设 ( (例题分析例题分析) )解:解:研究者想收集证据予以证明的研究者想收集证据予以证明的 假设应该是假设应该是“生产过程不正常生产过程不正常”。 建立的原假设和备择假设为建立的原假设和备择假设为H H0 0 : 10cm 10cm H H1 1 : 10cm10cm 8n【例】某品牌洗涤剂在它的产品说明书中声称 :平均净含量不少于500克。从消费者的利益出 发,有关研究人员要通过抽检其中的一批产品 来验证该产品制造商的说明是否属实。试陈述 用于检验的原假设与备择假设提出假设提出假设 ( (例题分析例题分析) )解:解:研究

5、者抽检的意图是倾向于证研究者抽检的意图是倾向于证 实这种洗涤剂的平均净含量并不符实这种洗涤剂的平均净含量并不符 合说明书中的陈述合说明书中的陈述 。建立的原假设。建立的原假设 和备择假设为和备择假设为H H0 0 : 500 500 H H1 1 : m012假设检验中的两类错误n1.第类错误(弃真 错误)n原假设为真时拒绝原 假设n第类错误的概率记 为n被称为显著性水平n2.第类错误(取伪 错误)n原假设为假时未拒绝 原假设n第类错误的概率记 为(Beta) 13H H0 0: : 无罪无罪假设检验中的两类错误假设检验中的两类错误 ( (决策结果决策结果) )陪审团审审团审 判裁决实际实际

6、情况无罪有罪无罪正确错误错误有罪错误错误正确H0 检验检验决策实际实际 情况H0为为真H0为为假未拒绝绝 H0正确决策 (1 )第类类 错误错误 (b )拒绝绝H0第类类 错误错误 ( )正确决策 (1-b )假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程14 和 b 呈相反关系b降低一类错误的概率另一类错 误的概率就会提高15显著性水平(significant level)n1.是一个概率值n2.原假设为真时,拒绝原假设的概 率n被称为抽样分布的拒绝域n3.表示为 (alpha)n常用的 值有0.01, 0.05, 0.10n4.由研究者事先确定16拒绝域和显著

7、性水平n拒绝域:原假设 H0 成立条件下,统计量落入 的小概率区域。统计量真的落入拒绝域你会 拒绝原假设。n显著性水平 :事先给定的形成拒绝域的小 概率,通常 = 0.01、0.05、0.10。n建立拒绝域的根据是什么?根据抽样分布, 统计量落入该区域的概率= 。n所谓检验就是选择一个拒绝域。17假设检验中的小概率原理n 什么小概率?n1.在一次试验中,一个几乎不可能 发生的事件发生的概率n2.在一次试验中小概率事件一旦发 生,我们就有理由拒绝原假设n3.小概率由研究者事先确定什么是小什么是小 概率?概率?18根据样本观测结果计算得到的,并据以对原 假设和备择假设作出决策的某个样本统计量对样本

8、估计量的标准化结果n原假设H0为真n点估计量的抽样分布 检验统计量检验统计量 ( (test statistictest statistic) )3.3. 标准化的检验统计量标准化的检验统计量 19显著性水平和拒绝域 (双侧检验 )抽样分布抽样分布0 0临界值临界值临界值临界值/2 /2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 01 - 1 - 置信水平置信水平20显著性水平和拒绝域 (双侧检验 )0 0临界值临界值临界值临界值 /2/2 /2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布1 - 1 - 置信水平置信水平21显著性水平和

9、拒绝域 (双侧检验 )0 0临界值临界值临界值临界值 /2 /2 /2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布1 - 1 - 置信水平置信水平22显著性水平和拒绝域 (双侧检验 )0 0临界值临界值临界值临界值 /2/2 /2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布1 - 1 - 置信水平置信水平23显著性水平和拒绝域 (单侧检验 )0 0临界值临界值 样本统计量样本统计量拒绝拒绝H H0 0抽样分布抽样分布1 - 1 - 置信水平置信水平24显著性水平和拒绝域 (左侧检验 )0 0临界值临界值 样本统计量样本

10、统计量拒绝拒绝H H0 0抽样分布抽样分布1 - 1 - 置信水平置信水平观察到的样本统计量观察到的样本统计量25显著性水平和拒绝域 (左侧检验 )0 0临界值临界值 样本统计量样本统计量拒绝拒绝H H0 0抽样分布抽样分布1 - 1 - 置信水平置信水平26显著性水平和拒绝域 (右侧检验 )0 0临界值临界值 样本统计量样本统计量拒绝拒绝H H0 0抽样分布抽样分布1 - 1 - 置信水平置信水平观察到的样本统计量观察到的样本统计量27显著性水平和拒绝域 (右侧检验 )0 0临界值临界值 样本统计量样本统计量抽样分布抽样分布1 - 1 - 置信水平置信水平拒绝拒绝H H0 028决策规则给定

11、显著性水平,查表得出相应的临 界值z或z/2, t或t/2将检验统计量的值与 水平的临界值进 行比较作出决策n双侧检验: |统计量| 临界值,拒绝H0n左侧检验:统计量 临界值,拒绝H029什么是P 值? (P-value)在原假设为真的条件下,检验统计量的观察 值大于或等于其计算值的概率n双侧检验为分布中两侧面积的总和反映实际观测到的数据与原假设H0之间不一 致的程度被称为观察到的(或实测的)显著性水平决策规则:若p值 5200n = 0.05nn = 36n临界值(c):检验统计量检验统计量: : 拒绝拒绝H H0 0 ( (P P = = 0.000088 m0 统计统计 量 已知: 未

12、知:拒绝绝域P值值决策拒绝H048总体均值的检验(小样本)n1.假定条件n总体服从正态分布n小样本(n m0 统计统计 量 已知: 未知:拒绝绝域P值值决策拒绝H0注:注: 已知的拒绝域同大样本已知的拒绝域同大样本50总体均值的检验(例题分析)n【例】一种汽车配件的平均长度要求为12cm ,高于或低于该标准均被认为是不合格的。 汽车生产企业在购进配件时,通常是经过招 标,然后对中标的配件提供商提供的样品进 行检验,以决定是否购进。现对一个配件提 供商提供的10个样本进行了检验。假定该供 货商生产的配件长度服从正态分布,在0.05 的显著性水平下,检验该供货商提供的配件 是否符合要求? 10个零

13、件尺寸的长长度 (cm) 12.210.812.011.811.9 12.411.312.212.012.351总体均值的检验(例题分析)nH0 : =12nH1 : 12n = 0.05ndf = 10 - 1= 9n临界值(c):检验统计量检验统计量: : 不拒绝不拒绝H H0 0样本提供的证据还不足以推翻样本提供的证据还不足以推翻 “该供货商提供的零件符合要该供货商提供的零件符合要 求求 ” ”的看法的看法决策:决策:结论:结论:t t0 02.2622.262-2.262-2.2620.0250.025拒绝拒绝 H H0 0拒绝拒绝 H H0 00.0250.02552总体均值的检验(

14、 t 检验) (P 值的计算与应用)n第1步:进入Excel表格界面,直接点击“f(x)”(粘贴 n 函数)n第2步:在函数分类中点击“统计”,并在函数名的n 菜单下选择“TDIST”,然后确定n第3步:在出现对话框的X栏中输入计算出的t的绝对 值n 0.7035,在Deg-freedom(自由度)栏中输入n 本例的自由度9,在Tails栏中输入2(表明是 双n 侧检验,如果是单测检验则在该栏输入1) n第4步:P值=0.499537958n P值=0.05,故不拒绝H0 53三、总体比率的检验1.总体比率单边检验H0: p p0 或 H0: p p0 例:Pine Greek高尔夫球场的性别

15、比率 问题。400个运动者中100个女性,能否认为女性比 率比过去的20%增加了?解 H0: p0.20, H1: p0.20;拒绝域的形状:54当=0.05时,拒绝域为你的结论? =0.250.2329 拒绝 H0利用大样本下样本比率的抽样分布得到拒绝域为:552.总体比率的双边检验给定显著性水平,大样本情况下你能写出相 应的拒绝域吗?56总体比例的检验(检验方法的总结)假设设双侧检验侧检验左侧检验侧检验右侧检验侧检验假设设形式H0: = 0 H1: 0H0 : 0 H1 : 0统计统计 量拒绝绝域P值值决策拒绝H057总体比例的检验(例题分析)n【例】一种以休闲和娱乐为 主题的杂志,声称其读者群 中有80%为女性。为验证 这一说法是否属实,某研究 部门抽取了由200人组成的 一个随机样本,发现有146 个女性经常阅读该杂志。分 别取显著性水平 =0.05和 =0.01 ,检验该杂志读者 群中女性的比例是否为80% ?它们的值各是多少?双侧检验双侧检验58

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号