假设检验在数据分析中的应用_卞为梅

上传人:f****u 文档编号:111193207 上传时间:2019-11-02 格式:PDF 页数:3 大小:1.16MB
返回 下载 相关 举报
假设检验在数据分析中的应用_卞为梅_第1页
第1页 / 共3页
假设检验在数据分析中的应用_卞为梅_第2页
第2页 / 共3页
假设检验在数据分析中的应用_卞为梅_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《假设检验在数据分析中的应用_卞为梅》由会员分享,可在线阅读,更多相关《假设检验在数据分析中的应用_卞为梅(3页珍藏版)》请在金锄头文库上搜索。

1、假设检验在数据分析中的 _ 应用 金陵石化卞 为梅 鬓 翼 耀 骂 戴 哗伽砷 询 多 压晌示角 词 如谁 蹄如结 娜 草 赎 动嚣 翼嚼 黯霎魏篡 卿卿 确乒哗 黔 黝 一 、 前言 假设检验又称 显著性检验 , 是利 用样本的实际资料来检验事 先对总体某匹数量特征所作的假 设是 否可信的一种统计方法 。 其 目的在于判断原假设的总体和当 前抽样所取自的总体是否发生显 著差异 , 它 首先对所研究的命题 提出一种假设一一无显著差 异 的 假设 , 然后通过一定 的方法 来验 证假设是否成立 , 从而得 出研究 的结论 。 金陵石化烷基苯厂 通过了 1509001;2000和1501400 1

2、 :199 6 的认证 , 目前两 个体系均 处 于 良好的运行状态 。 数据分析是 1 50900 1 中较为重 要 的 一个条 款 , 而假设检验在数据分析中 起到 十分重 要的作用 , 通 过对 收集的数据进行分析推断 , 为 其后的行动决策提供依据 。 二 、 假 设检验的步骤 1 . 建立假设 假设检验的第 一步是 建立 假设 , 通 常需 要建立 两个假设 : 原假设 H 。和备择假设 H l 。 2 . 寻找检验统计量 T , 确认 拒绝域的形式 根据 统计量的值把整个 样 本空间分成两个 部分 : 拒绝域 W与接受 域A 。 当样 本落在拒 绝域中 就拒绝原假设 , 否则就 保

3、留原假设 。 所以 , 在假设检 验中必须找出拒绝域 。 3 . 给出显著水平 a 在对原假设的真 伪进行判 断时 , 由于样本的随机 性 可 能 产生 两类错误 : 第一类错误是 原假设为真 , 由于样本的随机 性 , 使样本 观察 值落 在 拒 绝域 中 , 从而作出拒绝原假设的决 定 , 这类错误称为第一类错误 。 其发生的概率称为犯第一类错 误的 概率 , 也称为拒真 概率 , 记为 。 。 第二类错误是原 假设 为假 , 由 于样本的 随机 性 , 使 样本 观察 值落在接受域 A 中 , 从而作出保留原 假设的决 定 , 这 类错误称为第二类 错误 。 其 发生 的概率称为犯第二类

4、错误 , 也称为取伪概率 , 记为你若 要求犯第一类错误的概率不超 过 仪 , 由此给出的检验称为 水 平为 。 的检验 , 称 。 为显著性 水平 。 为使犯第二类错误的概 率不 过大 , 常 取 a 为0 .0 5 、 0 . 1 0 等 。 4 . 给出临界值 , 确 定拒绝域 有了显著性水平 。 后 , 可 以根据给定的检验统计量的 分 布 , 查表得到临界值 , 从西确定 具体的拒绝域 。 - 5瑕设的判断 根据样本观察值计算检验统 计量 的观察值 , 根据观察值是否 落在拒绝域中作出判断 。 当它落 在 拒绝 域中就作出拒绝原假设的 结论 , 否 则就作出保留原假设的 结论 。 三

5、 、 假设检验理论 设总体分布 为正 态分布 N (协护) , 从总体抽 取 样 本x l , xZ , x 。, 样本均值为又总体 方差龄 , 其均值 、 方差 的显 著 水平为 。 的检验如表 1 。 洒 群 价 姗 嘿 姗 麟 翼 哪 检检验法法条件件 H o o o H - - - 检验统计量量拒绝域域 u u u 检验验 ( T 已知 知 林蕊林。 。 卜卜。 。u之 . 签二l些皿 e s s s u ) ul习 习 林林林林幸协。 。 林卜。 。 t二 茎二卫口 . . . t) t,、 ( n一1) 卜卜卜卜林。 。 林。子 子 r二 臼一1 ) 5“ XZ 扮x , 1二 (

6、 n一1) 。2扮。了 了 仔戈仔子 子 A 一 一- 一 万 - - - X 2簇 x 气( n 一1) 。2二。了 了 。“并。了 了 仃0 - - - x z 岌x几 二 ( n 一1 ) 或或 x x x x x x x x x x x x x 2x 2 1、二 ( n 一1) ) ) 由于 。 未知 , 故选用 t 检验 根 据 显 著性 水平 a 二0 . 0 5 及备择假设 , 查 t 分布表知拒绝 域 为t t l、 ( n一1)= t ) to9 5 (16) = t) 1 . 7459 根 据 样本观 察值 , 求得 x二13 . 1471 5 = = 7 . 3636 因

7、而有 纂 t =竺 且担= = s /V n 13 . 1471一10 7 . 3636/为/丙 瓶瓶重 , g g g 36 6 635 5 536 6 6 34 4 4 36 6 6 35 5 5 37 7 734 4 435 5 536 6 637 7 735 5 5 34 4 436 6 634 4 4 实实重 , g g g 533 3 3537 7 7537 7 7535 5 5534 4 4535 5 5538 8 8537 7 7535 5 5538 8 8537 7 7534 4 4537 7 7534 4 4538 8 8 净净含量 , g g g497 7 7 502 2

8、 2501 1 1501 1 149 8 8 8500 0 0501 1 150 3 3 3500 0 0502 2 2500 0 0499 9 9503 3 3 498 8 8 504 4 4 四 、 分析判断实 际 问题 x= 5(0069 因而 , 有 u= 根据 上 面 的假设检验理论 , 结合实际情况 , 分析判断工作 中发现 的 问题 。 问题1 : 国家对定量包装商 品净含 量规定的 要求越来越严 格 , 根 据国家相 应 的法律法规 , 5009 装加佳清清洗涤剂净含 量 服从正 态分布(500 , 25) , 去 年H月份对 其 净含量 进行 检 验 , 结果如表 2 。 问

9、净含 量包装在 。=0 . 05水 平上是否符合规定要求? 分析 : 建立假设 : H 。: 卜=50 0 , HI : 林兴500 由于 。 已知 , 故选用 u 检验 根 据 显 著性水平 。=0 . 0 5 及备择假设 , 查 正 态分布表知 拒绝 域 为!u I )u 09 7 5 = !u I ) 1 . 96 。 如果 u )19 6 , 可认为净 含 量过剩 , 损害了企业 的利益 ; 如 果 u 蕊 一 1 . % , 可认为净含 量 不 足 , 损害了消费者的合法权 五 己 根 据样本 观察值 , 求得 X一协。 耐 V下 嘿乏檐 些 = 0 4648 由 于0 . 4648

10、 小于 1 . 96 , 样 本观察值未落在 拒 绝域中 , 所 以不能 拒 绝原假设 , 可认为该 批包装净含 量符合规定要求 。 问题2 : 根据国家 标 准GB 897 8 1 996污水综合 排放标准规 定 , 排 人河流 的 废水中 的氟化 物 含量不得超过 1 0m g/L 。 我 厂 废水 中氟化物 含 量 服从正 态分 布 。 现测定2 00 3年9月1 1日- 2 7 日倾人河流的废 水 中氟化物 的含 量 , 记录如 下 : 18 . 9 619 . 90 . 91 17 . 44 25 . 18 8 . 59 9 . 94 7 . 10 18 . 96 8 0巧 . 7

11、7 19 . 9125 . 64 试判断 。= =0 . 0 5水平 上 我 厂 是否符合环保规定? 分析 : 如果符合环保规定 , 那 么 林应该不超过IOm岁L , 不符 合的话应该大于 IOmg/ L 。 所以 建立假设 : H 0 : 协定1 0 , 卜 1O = 1 . 7622 由于它 大于1 . 745 9 , 所以样 本观察值落在拒绝域中 , 因此 在 。= 0 . 0 5水平 上 拒 绝 原假设 , 认 为我厂不符合环保标准规定 , 应 该采取措施来降低 废水中氟化物 含量 。 问题3 : 实验室 用色谱法重复分析一 烷基苯分子量 , 其分子量检验结 果服从 (林 , 护)

12、, 规定重复性偏 差不大于4 , 现对一烷基苯样本进 行1 0次重复性试验 , 结果如下 : 241 . 524 1 4 24 1 . 424 1 . 6 24 1 . 5241 . 4 24 1 . 724 1 . 4 241 . 6241 . 5 问 。二0 . 0 5水平上 色谱仪 波 动 能否合格? 分析 : 如 果波动 合格 , 那么 G 应该不超过4 , 所以建立假设 : H o : J 续4 , H l: a4 由于 协未知 , 故选 用 x, 检验 根据显著性 水平 a 二0 . 0 5 及备择假设 , 查扩分布表知拒 绝域为 xZ ) xZ工。 ( n一l) 二 xZ 多 6

13、 .1 44 1. 04 9 9 q4 7 黝砍 、麟 中瓣今蚤 sd = 0 , 0005934 本观瓤 纂瑟辈 粼殆葺 :宣崛端塔 氏天 平法 。 因此扛在新版工业直 链烷基 苯国 一 家标准 一 (GB灯 荔摆翼 黔畔畔 法 = 0 .00625 由于它远远 小于1 6 . 9 19 , 所以样本 观察 值未落在拒绝域 中 , 不能拒绝原假设 , 可以认 为该色谱仪波动非常小 , 数据 可信度才良高 。 问题牛 2 00 1 年 , 国家表面活性剂 标准化中心委托我厂负 责修订 烷基苯国家标准G B/T 517 73- 法 。 因为后者方便 、 快捷 , 而前者 较繁琐 , 且在实际操作

14、中 , 大多数 生产厂家者 哪密度计法 , 为此 , 我 们取了1 0个样 , 分别用 两种方法 进行测定 , 数据记录如表3 。 问 两种方法测定结果在 二二 0 .0 5水平上有无明显的差异? 分析 : 这种情况不能直接 设检验 : H 。: 林= 0 , HI : 林兴o 由于“未知 , 故选用 检验 根据显著性水 平 。=0 . 0 5 及备择假设 , 查 t分布表知 拒绝 域为 l t 办t ,卫二 (n 一l ) 二 l t ) t 09 7 5 ( 0 ) 二 l t降姆6 22 根据样本观察值 d 工 及 n = l 0 , 求得d 二0 . 0 0 0 0 9 淤骂澎 检验理论 , 分析己知数据 , 一 对总 体作出判断公可为行动决策提供 笠愁 粼豁熬魏鼻 具有推动和保障作用 。 令 参考文献 :一 _ 1 于善奇 应用统计技术 2 质量专业理论与实务 3 、 于善奇 样侧很假设 检验的理

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号