统计学--假设检验说课材料

上传人:yulij****0329 文档编号:133561182 上传时间:2020-05-28 格式:PPT 页数:99 大小:923KB
返回 下载 相关 举报
统计学--假设检验说课材料_第1页
第1页 / 共99页
统计学--假设检验说课材料_第2页
第2页 / 共99页
统计学--假设检验说课材料_第3页
第3页 / 共99页
统计学--假设检验说课材料_第4页
第4页 / 共99页
统计学--假设检验说课材料_第5页
第5页 / 共99页
点击查看更多>>
资源描述

《统计学--假设检验说课材料》由会员分享,可在线阅读,更多相关《统计学--假设检验说课材料(99页珍藏版)》请在金锄头文库上搜索。

1、第7章假设检验 正如一个法庭宣告某一判决为 无罪 notguilty 而不为 清白 innocent 统计检验的结论也应为 不拒绝 而不为 接受 JanKmenta 统计名言 辛普森案 英语 O J Simpsonmurdercase 又称加利福尼亚人民诉辛普森案 英语 Peoplev Simpson 是美国加利福尼亚州最高法院对前美式橄榄球明星 演员O J 辛普森进行的刑事诉讼 在该案中 辛普森被指控于1994年犯下两宗谋杀罪 受害人为其前妻妮克尔 布朗 辛普森及其好友罗纳德 高曼 该案被称为是美国历史上最受公众关注的刑事审判案件 案发时间 1994年6月12日深夜案发后凌晨 辛普森门外有血

2、迹现场滴落的血痕中有辛普森的血 辛普森家中血手套和辛普森的脏衣服都有被害人的血 法庭战争检方的 铁证如山 与 梦幻律师团 在检方看来 本案可谓是 铁证如山 本案中无论是证据数量 还是证据的可信程度 在检方看来 都达到了很高的标准 控辩双方几个关键的地方 控方 检方在审判的最初几周出示证据 证明辛普森曾有对妮可尔的家庭暴力史 辩方 时遭受丈夫家庭暴力中 遭受丈夫伤害的概率为1 控方 鞋码与辛普森的相似 辛普森手上有划痕辩方 世界上与辛普森鞋码一样的人数不胜数 在左手有伤痕的人也不尽其数 所以这样的证据对案件的判断是没有任何价值的 控方 在犯罪现场发现的血液 DNA鉴定发现与辛普森是完全一致的 而

3、DNA鉴定两个人一致的可能性只有万分之 辩方 在洛杉矶300万人口中 就有300个人DAN一致 辛普森是洛杉矶人口的1人 所以 辛普森是杀人凶手的概率只有0 03 如果认为新浦森有罪的话 那么误判的概率将高达99 97 最终无罪释放 控方 平时遭受丈夫家庭暴力中 非正常死亡的 其凶手为丈夫的概率为80 控方 可能会有很多与辛普森鞋码一样的人 但也会有很多左手有划痕的人 但辛普森是一个嫌疑犯 不能把他放在所有的人当中去进行归类 于是只能放在嫌疑犯中 在嫌疑犯中 跟辛普森鞋码吻合的人的概率非常之小 法庭宣判过程 法官假定辛普森无罪 控方搜集证据证明他有罪 只有当证据充足的时候才能宣判有罪 否则要接

4、受法官的假定 辛浦森 Simpson sParadox 悖论 160 166 36 290 326 总的看 白人有19 160 12 的被告被判处死刑 与之对应 黑人只有17 166 10 的被告被判死刑 白人死刑率要高一些 但如果考虑受害者的种族 结论就相反了 当受害者是白人时 有11 63 17 5 的黑人被告被判死刑 而只有19 151 12 6 的白人被告被判死刑 当受害者是黑人时 白人被告没一个人 0 被判死刑 而黑人被告确有6 103 5 8 的被判死刑 控方 DNA鉴定辩方 把辛普森至于300万人群当中 但新浦是是嫌疑犯 所以应把他放在嫌疑犯这个人群中 那么样本与他一致的也就他一

5、个人 综上 只有辛普森一个人符合三个条件 第7章假设检验 7 1假设检验的基本问题7 2一个总体参数的检验 学习目标 1 理解假设检验的基本思想和基本步骤 2 理解假设检验的两类错误及其关系 3 熟练掌握一个总体平均数 总体成数各种假设检验方法 4 利用P 值进行假设检验 用Excel进行检验 假设检验知识结构 7 1假设检验的基本原理7 1 1怎样提出假设 7 1 2怎样做出决策 7 1 3怎样表述决策结果 第7章假设检验 7 1 1怎样提出假设 7 1假设检验的基本原理 1 什么是假设 假设 定义为一个调研者或管理者对被调查总体的某些特征所做的一种假定或猜想 是对总体参数的一种假设 常见的

6、是对总体均值或比例和方差的检验 在分析之前 被检验的参数将被假定取一确定值 我认为到KFC消费的人平均花费2 5美元 2 市场调研中常见的假设检验问题 一项跟踪调查的结果表明 顾客对产品的了解程度比6个月前所做的类似调查中的显示要低 结果是否明显降低 是否低到需要改变广告策略的程度 一位产品经理认为其产品购买者的平均年龄为35岁 为检验其假设 他进行了一项调查 调查表明购买者平均年龄为38 5岁 调查结果与其观点的差别是够足以说明此经理里的观点是不正确的 3 问题在哪里 某广告商宣称其代理的A产品的合格率达到99 质检人员为了验证 随机抽取了一件产品 发现是一件次品 质检人员会是什么反应呢 什

7、么是假设检验 hypothesistest 先对总体的参数 或分布形式 提出某种假设 然后利用样本信息判断假设是否成立的统计方法有参数检验和非参数检验逻辑上运用反证法 统计上依据小概率原理小概率是在一次试验中 一个几乎不可能发生的事件发生的概率在一次试验中小概率事件一旦发生 我们就有理由拒绝原假设 原假设 nullhypothesis 又称 0假设 研究者想收集证据予以反对的假设 用H0表示所表达的含义总是指参数没有变化或变量之间没有关系最初被假设是成立的 之后根据样本数据确定是否有足够的证据拒绝它总是有符号 或 H0 某一数值H0 某一数值H0 某一数值例如 H0 10cm null 也称

8、研究假设 研究者想收集证据予以支持的假设 用H1或Ha表示所表达的含义是总体参数发生了变化或变量之间有某种关系备择假设通常用于表达研究者自己倾向于支持的看法 然后就是想办法收集证据拒绝原假设 以支持备择假设总是有符号 或 H1 某一数值H1 某一数值H1 某一数值 备择假设 alternativehypothesis 例 一种零件的生产标准是直径应为10cm 为对生产过程进行控制 质量监测人员定期对一台加工机床检查 确定这台机床生产的零件是否符合标准要求 如果零件的平均直径大于或小于10cm 则表明生产过程不正常 必须进行调整 试陈述用来检验生产过程是否正常的原假设和被择假设 提出假设 例题分

9、析 解 研究者想收集证据予以证明的假设应该是 生产过程不正常 建立的原假设和备择假设为H0 10cmH1 10cm 例 某品牌洗涤剂在它的产品说明书中声称 平均净含量不少于500克 从消费者的利益出发 有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实 试陈述用于检验的原假设与备择假设 提出假设 例题分析 解 研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述 建立的原假设和备择假设为H0 500H1 500 例 一家研究机构估计 某城市中家庭拥有汽车的比例超过30 为验证这一估计是否正确 该研究机构随机抽取了一个样本进行检验 试陈述用于检验的原假设与备

10、择假设 提出假设 例题分析 解 研究者想收集证据予以支持的假设是 该城市中家庭拥有汽车的比例超过30 建立的原假设和备择假设为H0 30 H1 30 提出假设总结 H0 通常是将研究者不愿相信的 不认可的 想拒绝的结论H0 某一数值H0 某一数值H0 某一数值H1 与原假设是对立的 通常是研究者想要支持的 愿意相信的结果H1 某一数值H1 某一数值H1 某一数值先确定备择假设 再确定原假设原假设和备择假设必有一个成立 而且只有一个成立等号只能出现在原假设里因研究目的不同 对同一问题可能提出不同的假设 也可能得出不同的结论 备择假设没有特定的方向性 并含有符号 的假设检验 称为双侧检验或双尾检验

11、 two tailedtest 备择假设具有特定的方向性 并含有符号 或 称为右侧检验 双侧检验与单侧检验 双侧检验与单侧检验 假设的形式 以总体均值的检验为例 7 1 2怎样做出决策 7 1假设检验的基本原理 假设检验的步骤 1 提出原假设H0和备择假设H12 构造适当的检验统计量3 给定显著性水平 0 01 0 05 0 104 计算检验统计量的值5 做出判断 假设检验的基本思想 因此我们拒绝假设 50 样本均值 m 50 抽样分布 H0 两类错误与显著性水平 了解 研究者总是希望能做出正确的决策 但由于决策是建立在样本信息的基础之上 而样本又是随机的 因而就有可能犯错误原假设和备择假设不

12、能同时成立 决策的结果要么拒绝H0 要么不拒绝H0 决策时总是希望当原假设正确时没有拒绝它 当原假设不正确时拒绝它 但实际上很难保证不犯错误第 类错误 错误 原假设为正确时拒绝原假设第 类错误的概率记为 被称为显著性水平2 第 类错误 错误 原假设为错误时未拒绝原假设第 类错误的概率记为 Beta 显著性水平 significantlevel 事先确定的用于拒绝原假设H0时所必须的证据能够容忍的犯第 类错误的最大概率 上限值 2 原假设为真时 拒绝原假设的概率抽样分布的拒绝域3 表示为 alpha 常用的 值有0 01 0 05 0 104 由研究者事先确定 错误和 错误的关系 依据什么做出决

13、策 若假设为H0 500 H1 500 样本均值为495 拒绝H0吗 样本均值为502 拒绝H0吗 做出拒绝或不拒绝原假设的依据是什么 传统上 做出决策所依据的是样本统计量 现代检验中人们直接使用由统计量算出的犯第 类错误的概率 即所谓的P值 根据样本观测结果计算出对原假设和备择假设做出决策某个样本统计量对样本估计量的标准化结果原假设H0为真点估计量的抽样分布 检验统计量 teststatistic 标准化的检验统计量 用统计量决策 双侧检验 H1 m m0 I统计量I 临界值 拒绝H0 用统计量决策 左侧检验 H1 m m0 统计量 临界值 拒绝H0 抽样分布 H0 临界值 a 拒绝H0 1

14、 置信水平 RegionofRejection RegionofNonrejection 用统计量决策 右侧检验 H1 m m0 统计量 临界值 拒绝H0 抽样分布 H0 临界值 拒绝H0 1 置信水平 RegionofNonrejection RegionofRejection a 统计量决策规则 给定显著性水平 查表得出相应的临界值z 或z 2 t 或t 2将检验统计量的值与 水平的临界值进行比较作出决策双侧检验 H1 m m0 I统计量I 临界值 拒绝H0 3 1 96 拒绝左侧检验 H1 mm0 统计量 临界值 拒绝H0 3 1 96 拒绝当单侧检验时 只要统计量与z 或t 大小比较方

15、向与备择假设符合一致时 拒绝不过 总而言之 无论是哪一种检验形式 只要I统计量I 临界值 拒绝H0 用P值决策软件操作中的sig 即为P值 P value 如果原假设为真 所得到的样本结果会像实际观测结果那么极端或更极端的概率 也就是我们拒绝原假设面临的风险P值告诉我们 如果原假设是正确的话 我们得到得到目前这个样本数据的可能性有多大 如果这个可能性很小 就应该拒绝原假设被称为观察到的 或实测的 显著性水平决策规则 若p值 拒绝H0 即是说 拒绝原假设犯弃真错误的风险比事先假定的风险 还小 所以拒绝原假设也无妨 双侧检验的P值 左侧检验的P值 Z 拒绝H0 0 临界值 计算出的样本统计量 1

16、2P值 右侧检验的P值 Z 拒绝H0 0 计算出的样本统计量 临界值 1 2P值 用P值进行检验比根据统计量检验提供更多的信息统计量检验是我们事先给出的一个显著性水平 以此为标准进行决策 无法知道实际的显著性水平究竟是多少比如 根据统计量进行检验时 只要统计量的值落在拒绝域 我们拒绝原假设得出的结论都是一样的 即结果显著 但实际上 统计量落在拒绝域不同的地方 实际的显著性是不同的 比如 统计量落在临界值附近与落在远离临界值的地方 实际的显著性就有较大差异 而P值给出的是实际算出的显著水平 它告诉我们实际的显著性水平是多少 P值决策与统计量的比较 拒绝H0 P值决策与统计量的比较 拒绝H0的两个统计量的不同显著性 Z 拒绝H0 0 统计量1 P1值 统计量2 P2值 拒绝H0 临界值 7 1 3怎样表述决策结果 7 1假设检验的基本原理 假设检验不能证明原假设正确 假设检验的目的主要是收集证据拒绝原假设 而支持你所倾向的备择假设假设检验只提供不利于原假设的证据 因此 当拒绝原假设时 表明样本提供的证据证明它是错误的 当没有拒绝原假设时 我们也没法证明它是正确的 因为假设检验的程序没有提供

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号