《精编》假设检验基本概述

上传人:tang****xu2 文档编号:133143527 上传时间:2020-05-24 格式:PPT 页数:65 大小:2.80MB
返回 下载 相关 举报
《精编》假设检验基本概述_第1页
第1页 / 共65页
《精编》假设检验基本概述_第2页
第2页 / 共65页
《精编》假设检验基本概述_第3页
第3页 / 共65页
《精编》假设检验基本概述_第4页
第4页 / 共65页
《精编》假设检验基本概述_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《《精编》假设检验基本概述》由会员分享,可在线阅读,更多相关《《精编》假设检验基本概述(65页珍藏版)》请在金锄头文库上搜索。

1、统计学 1 一 假设检验的概念 1 假设检验是统计推断的另一种方式 所谓假设检验就是首先对总体的分布函数形式或分布的某些参数做出假设 再根据所得样本数据 利用 小概率原理 对假设的正确性做出判断的统计推断过程与方法 2 假设检验与区间估计结合起来 构成完整的统计推断内容 假设检验分为两类 一类是参数假设检验 另一类是非参数假设检验 本章主要讨论参数假设检验 2 1 例子和小概率原理 1 例1 某企业生产一种零件 过去大量资料表明 零件的平均长度为4厘米 标准差为0 1 工艺改革后 抽查100个零件 测得样本平均长度为3 94厘米 问工艺改革前后零件长度是否发生显著变化 2 分析 A 这是有关改

2、革前后零件平均长度是否为4的假设检验 有两种可能 一是没有变化 但抽样随机性使样本均值与总体均值有差异 又未超出误差范围 则认为总体均值不变 二是发生显著变化 即样本均值与总体均值差异超出误差范围 认为总体均值发生显著变化 统计学 3 2 分析 B 根据样本平均数的抽样分布定理若对总体均值假设为真 则给定置信度 应有即 样本均值与总体均值之差在误差范围 接受假设 若即 样本均总体均值之差超出误差范围 发生概率为 它又很小 小概率事件发生 拒绝假设 认为发生显著变化 1 例子和小概率原理 统计学 4 1 例子和小概率原理 3 本例解 已知假设 给定 则有 可计算得这样小概率事件发生 拒绝原假设

3、认为工艺改革前后零件长度发生明显变化 统计学 5 1 例子和小概率原理 4 小概率原理 是指发生概率很小的随机事件在一次实验中是几乎不可能发生的 这种事件称为 实际不可能事件 小概率的标准是多大 5 的概率是不是小概率 这没有绝对的标准 一般我们以一个所谓显著性水平 0 1 作为小概率的界限 的取值与实际问题的性质有关 所以 统计检验又称显著性检验 根据这一原理 可以作出是否接受原假设的决定 统计学 6 2 假设检验的特点 1 采用反证法进行逻辑推理 即为检验某假设是否成立 先假定其正确 再根据抽样理论和样本信息判断假设产生结果是否合理 最后决定是否接受原假设 2 依据小概率原理 即小概率事件

4、发生 拒绝原假设 否则接受原假设 3 与区间估计的差别主要在于 区间估计是用给定的概率推断出总体参数的范围 而假设检验是以小概率为标准 对总体的状况所做出的假设进行判断 统计学 7 三 假设检验的步骤 一般有以下四步 1 提出原假设和备择假设 2 选择适当统计量 并确定其分布形式3 选择显著性水平 确定临界值 4 作出结论 统计学 8 1 提出原假设和备择假设 1 原假设又称零假设 是正待检验的假设记为H0 备择假设是拒绝原假设后可供选择的假设 记为H1 二者相互对立 检验结果取其一 2 假设的提出根据检验问题具体而定 并采取 不轻易拒绝原假设 原则 即把没有充分理由不能轻易否定的命题作为原假

5、设 把没有足够把握不能轻易肯定的命题作为备择假设 统计学 9 1 提出原假设和备择假设 3 假设有三种形式 统计学 10 1 提出原假设和备择假设 4 左侧检验和右侧检验统称单侧检验 采用那种检验根据实际问题决定 若只需判断有无显著差异或要求同时注意总体参数偏大或偏小 则采用双侧检验 若关心总体参数是否比某个值偏大或偏小 则采用单侧检验 统计学 11 2 选择适当统计量 并确定其分布形式 不同的假设选择不同的统计量作为检验统计量 例6 1 采用 统计学 12 3 选择显著性水平 确定临界值 1 显著性水平表示H0为真时拒绝H0的概率 即拒绝原假设所冒的风险 用表示 假设检验应用小概率原理 小概

6、率就是指 给定显著性水平后 就可由有关的概率分布表查得临界值从而确定H0的接受区域和拒绝区域 临界值就是接受区域和拒绝区域的分界点 统计学 13 3 选择显著性水平 确定临界值 2 不同形式假设H0的接受区域和拒绝区域不同 双侧检验的拒绝区域位于统计量分布曲线的两侧 左侧检验的拒绝区域位于统计量分布曲线的左侧 右侧检验的拒绝区域位于统计量曲线的右侧 如图所示 统计学 14 假设检验的接受区域和拒绝区域 a 双侧检验 b 左侧检验 c 右侧检验 统计学 15 4 作出结论 根据样本资料计算出统计量的具体值 并用以与临界值比较 作出接受或拒绝原假设的结论 如果检验统计量的值落在拒绝域内 说明样本所

7、描述的情况与原假设有显著性差异 应拒绝原假设 反之接受原假设 统计学 16 1 概念 1 第一类错误 当原假设为真 但由于样本的随机性使样本统计量落入拒绝区域 这时所做判断是拒绝原假设 也称拒真错误 事实上 小概率只是发生概率小 并不是不发生 犯第一类错误的概率也称拒真概率 即显著性水平 P 拒绝H0 H0为真 17 1 概念 2 第二类错误 当原假设为不真 但由于样本的随机性使样本统计量落入接受区域 判断是接受原假设 也称取伪错误 犯第二类错误的概率称为取伪概率 用 表示 即P 接受H0 H0不真 可见接受原假设是因为没有发生小概率事件 没有充足的理由拒绝它 所以 接受原假设并非肯定原假设正

8、确 含义是 不否定原假设 或 保留原假设 即原假设可能为真 需要进一步检验证实 统计学 18 2 假设检验的四种情况 假设检验中 原假设可能为真或不真 我们的判断 决策 有接受和拒绝两种 因此 检验有四种可能情况 如下表 统计学 19 3 两类错误概率的关系 1 二者互为消长 由于样本的随机性 完全避免两类错误是不可能的 只能尽量控制犯错误的概率 一般 当n固定时 减少 必然导致 增大 反之减少 必然会增大 以利用Z统计量进行右侧检验的情况为例要使小 则临界值Z 增大 这必然导致 增大 反之 要使 小 则必然导致 增大 二者关系如下图 统计学 20 两类错误概率的关系图 统计学 21 3 两类

9、错误概率的关系 2 和 的选择 取决于犯两类错误的代价 若拒真代价大 则取较小的 而容忍较大的 反之 若取伪代价更大 则取较大的 以求较小的 通常先确定 即原假设为真时拒绝它的概率事先得到控制 再次可见 原假设受到保护不轻易否定 统计学 22 4 检验功效 1 检验效果好与坏 与犯两类错误的概率都有关 首先 不能太大 另外 得到控制的条件下 犯取伪错误的概率要尽可能地小 即不取伪的概率1 应尽可能增大 1 越大 意味着当原假设不真实时 检验判断出原假设不真实的概率越大 检验的判别能力就越好 反之亦然 可见1 是反映统计检验判别能力大小的重要标志 我们称1 为检验功效或检验力 统计学 23 4

10、检验功效 2 影响检验功效的因素有显著性水平 样本容量 原假设与备选假设间的差异程度 给定 而使 减少 就必须增大样本容量n 因为增大n能降低抽样平均误差 样本统计量分布更集中 分布曲线更尖峭 使曲线尾部面积 和 都减小 原假设与备选假设间的差异程度越大 越小 结合 和 关系图得知 若真值右移 则增大 以为中心的曲线右移 使曲线左尾阴影部分减小 24 第二节总体均值 比例和方差的假设检验 学习以下问题 一 总体方差已知对正态总体均值的检验 二 总体方差未知对正态总体均值的检验 三 总体比例的假设检验 四 总体方差的假设检验 25 一 总体方差已知对正态总体均值的检验 学习以下问题 1 Z检验法

11、 2 例子 统计学 26 1 Z检验法 1 设总体为总体的一个样本 样本均值为 现在对总体均值进行检验 根据抽样分布定理5 1 样本均值在H0成立时 检验统计量Z及其分布为利用服从正态分布的统计量Z进行的假设检验称为Z检验法 统计学 27 1 Z检验法 2 检验时 根据已知的总体方差 样本容量和样本均值 计算出检验统计量Z的值 对给定的检验水平 查正态分布表得临界值 将Z值与临界值比较作出检验结论 统计学 28 1 Z检验法 3 具体检验时 若采用双侧检验 则临界值为 Z 2或Z 2 当 Z Z 2时 拒绝原假设 反之则接受原假设 若采用左侧检验 则临界值为 Z 2 当Z Z 2时 拒绝原假设

12、 反之 接受原假设 若采用右侧检验 则临界值为Z 2 当Z Z 2时 拒绝原假设 反之 接受原假设 统计学 29 2 例子 根据过去大量资料 某厂生产的产品的使用寿命服从正态分布N 1020 1002 现从最近生产的一批产品中随机抽取16件 测得样本平均寿命为1080小时 试在0 05的显著水平下判断这批产品的使用寿命是否有显著提高 解 根据题意 提出假设 检验统计量由 0 05 查表得临界值 z 1 645 由于Z 2 4 z 1 645 所以应拒绝H0而接受H1 这批产品的使用寿命显著提高 统计学 30 二 总体方差未知对正态总体均值的检验 学习以下内容 1 t检验 2 例子 31 1 t

13、检验 1 设总体 此时对总体均值检验不能用Z检验法 因为包含未知参数 我们可以用总体方差的无偏估计量样本方差S2代替 得到t统计量 由定理5 2可知 在H0成立时 检验统计量t及其分布为利用服从t分布的统计量去检验总体均值的方法称为t检验法 统计学 32 1 t检验 2 具体做法 根据题意提出假设 构造检验统计量t并根据样本信息计算其具体值 对于给定的检验水平 由t分布表查得临界值 将所计算的t值与临界值比较 作出检验结论 双侧检验时 若 t t 2时 拒绝原假设H0 反之则接受H1 左侧检验时 若当t t 时 拒绝原假设H0 反之则接受H1 右侧检验时 若当t t 时 拒绝原假设H0 反之则

14、接受H1 统计学 33 2 例子 某厂采用自动包装机分装产品 假定每包产品的重量服从正态分布 每包标准重量为1000克 某日随机抽查9包 测得样本平均重量为986克 样本标准差为24克 试问在0 05的检验水平上 能否认为这天自动包装机工作正常 解 根据题意检验目的是观察产品的平均每袋重量是否与标准重量一致 建立假设 检验统计量由 0 05 查表得临界值由于所以接受原假设 认为这天自动包装机工作正常 统计学 34 3 Z检验 t检验的适用条件 t检验法适用于小样本情况下总体方差未知时对正态总体均值的假设检验 随样本容量n增大 t分布趋于标准正态分布 因此大样本下 n 30 总体方差未知对总体均

15、值的假设检验通常近似采用Z检验法 同理 大样本下非正态总体均值的检验也可用Z检验法 原因根据大样本分布定理 总体分布形式不明或为非正态总体时 样本平均数趋近于正态分布 这时检验统计量Z中的总体标准差用样本标准差S代替 统计学 35 三 总体比例的假设检验 学习以下问题 1 检验方法 2 例子 36 1 检验方法 由比例抽样分布定理知 样本比例服从二项分布 大样本下二项分布近似服从正态分布 对总体比例的检验通常在大样本条件下进行 根据正态分布近似确定临界值 即用Z检验 具体 提出待检验假设 统计量为上式中 小写字母p代表样本的成数 大写字母P代表总体的成数 统计学 37 2 例子 某研究者估计本

16、市居民家庭的电脑拥有率为30 现随机抽查了200个家庭 其中68个家庭拥有电脑 试问该研究者的估计是否可信 10 解 依题意 可建立如下假设 样本比例p m n 68 200 0 34由于样本容量相当大 所以可以近似采用Z检验法给定 0 1 查正态分布表得临界值为1 645 由于 Z Z 2 应接受原假设 认为该研究者的估计是可信的 统计学 38 四 总体方差的假设检验 学习以下问题 1 检验的方法 2 例子 统计学 39 1 检验的方法 只讨论正态总体方差的检验 1 需要检验的原假设为备选假设为由于样本方差S2是总体方差 2的无偏估计量 自然可将S2与 2对比来构造检验统计量 检验统计量及其分布为这称为X2检验 给定检验的置信水平 可查分布表确定临界值和拒绝域 统计学 40 1 检验的方法 2 采用双侧检验时 建立假设临界值为拒绝域为采用左侧检验时 建立假设临界值为拒绝域为采用右侧检验时 建立假设临界值为拒绝域为 41 2 例子 根据长期正常生产的资料可知 某厂所产的维尼纶纤度服从正态分布 其方差为0 0025 现从某日产品中随机抽出20根 测得样本方差为0 0042 判断该日纤度的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号