数理统计课件1第4章

上传人:E**** 文档编号:91001588 上传时间:2019-06-20 格式:PPT 页数:29 大小:174KB
返回 下载 相关 举报
数理统计课件1第4章_第1页
第1页 / 共29页
数理统计课件1第4章_第2页
第2页 / 共29页
数理统计课件1第4章_第3页
第3页 / 共29页
数理统计课件1第4章_第4页
第4页 / 共29页
数理统计课件1第4章_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《数理统计课件1第4章》由会员分享,可在线阅读,更多相关《数理统计课件1第4章(29页珍藏版)》请在金锄头文库上搜索。

1、,第四章 非参数检验,第四章 非参数检验 非参数检验是不依赖于总体分布及参数的 假设检验 一、单样本检验 1.单样本卡方检验 检验样本观测值的频数与期望的频数是否有 显著性差异. 操作:从“非参数检验”菜单中选择“卡方检验” 例4.1:银行职员中教育水平是均服从均匀分布.,2.二项检验 二项检验是将每一类服从二项分布的观测 频率与服从二项分布并且具有概率参数p 的期望频率相比较. 操作:从“非参数检验”菜单中选择“二项分布检验” 例4.2:球类比赛挑边器观测结果 ABABBAAABBABBAAABABBABBABABBABA 原假设H0:P=P0 当p0.05时,认为服从二项分布并且具有 概率

2、参数p,3.游程检验 游程检验是一种随机性检验,游程是指样本 中出现的具有相同符号的连续串. 例:AABABB 有一个长度为2的A游程;一个长度为2的B游程 一个长度为1的A游程;一个长度为1的A游程。 如果序列是随机的,则游程不应太多,也不应太少, 根据两种符号类型的变化,选择检验统计量为U, U=游程总数目 当m+n=N20或m12,n12时,U近似正态分布, 可以得到相应P值。,-ZL U1+2mn/N,操作:游程检验 例4.3:两种操作方法对劳动效率的影响 第一法:64,76,55,82,59,82,70,75,61,64,73,83 第二法:77,80,80,65,93,91,84,

3、91,84,86 将数据依次由大到小排成序列,第一组用1表示, 第二组用2表示,变量名为zb 分界点为划分两类的试算点,值小于试算点的为 一类,其它形成第二类,当p0.05时,认为两种方法 有显著影响.,排序后: 产量 组别 产量 组别 产量 组别 55 1 75 1 84 2 59 1 76 1 84 2 61 1 77 2 86 2 64 1 80 2 91 2 64 1 80 2 91 2 65 2 82 1 93 2 70 1 82 1 73 1 83 1 本例中,1出现12次,2出现10次,中位数和众数都 为1,选择平均数作为分类点 p0.05时,认为有显著差异。,4.单样本K-S检

4、验 kolmogorov-smirnov 概述 K-S检验是一种拟合优度的非参数检验方法。单样本 K-S检验是利用样本数据推断总体是否服从某一理论 分布,适用于探索连续型随机变量的分布形态。 基本思想 根据样本数据和用户的指定构造出理论分布, 查分布表得到的相应的理论累计概率分布函数F(X), 利用样本数据计算各样本数据点的累计概率,得到 经验累计概率分布函数S(X);计算S(X)与F(X)在相 同变量值点x上的差D(x),得到差值序列D。 单样本K-S 检验主要对差值D序列进行研究。,零假设 样本来自的总体与指定的理论分布无显著差异。 统计量 K-S的z统计量、Z统计量的相伴概率。,操作:

5、单样本K-S检验 检验分布: 正态分布 均匀分布 泊松分布 指数分布 例4.4:汽车到达时间是否服从正态分布 到达时间:-5 -3 -1 0 1 2 4 7 8 观测频率: 1 1 2 1 5 5 3 1 1 p0.05 服从指定的分布,二、两个独立样本检验 两个独立样本检验 概述两个独立样本的非参数检验 是在对总体分布不甚了解的情况下,通过分析样本 数据均值或中位数的差异,推断样本来自的两个独 立总体的分布存在的显著性差异。本系统提供了四 种两个独立样本检验的方法: 曼-惠特尼U检验 沃尔德-沃尔佛威茨游程检验 柯尔莫哥洛夫-斯米尔诺夫检验 莫斯检验。,曼-惠特尼U检验 即两个独立样本的曼-

6、惠特尼U检验 (Mann-Whitney U)。 基本思想 曼-惠特尼U检验(Mann-Whitney U)只要是通过对平 均秩的研究来实现推断的。我们可以将数据按照升序 进行排序,这时每一个具体数据都会有一个在整个数 据中的位置或名次。 零假设 样本来自的两个独立总体的均值无显著差异。 统计量 平均秩、Mann-Whitney U、Wilcoxon W、Z统计量。,沃尔德-沃尔佛威茨游程检验 两个独立样本的游程检验 (Wald-Wolfowitz Runs)。 基本思想 两个独立样本游程检验与单样本游程检验的思想是相 同的,不同点在于如何得到游程数据。在两独立样本 的游程检验中,计算游程的方

7、法与观察值的秩有关。 首先,将两组样本混合并按升序排序。在数据排序的 同时,两组样本的每个观察值对应的样本组标志值序 列也随之重新排序;然后,对这个标志值序列按前面 讨论的方法求游程。,可以直观的理解,如果样本来自的两个总体的分布形 态存在较大的差距,那么计算出的游程数会相对较小。 如果游程数比较大,则应该是由于两样本数据充分混 合的结果,那么它们的分布应该不存在显著差异。为 作精确的判断,系统利用游程数构造计算Z统计量, 并依据正态分布表给出对应的显著性。如果显著性小 于或等于用户心中的显著性水平,则拒绝零假设, 认为样本来自的总体的分布存在显著性差异。 零假设 样本来自的两个总体的分布无显

8、著差异。 统计量 游程数、Z统计量、Z统计量的显著性。,柯尔莫哥洛夫-斯米尔诺夫检验即两个独立样本的 K-S检验(Kolmogorov-Smirnov Z)。 基本思想 两个独立样本的K-S检验的基本思想与前面 讨论的单样本K-S检验的基本思路是一致的,差别在于 这里处理的是观察值的秩,而非观察值本身。首先, 将两组样本混合并按升序排序;然后,分别计算两组 样本秩的累计频数和每个点上的累计频率;最后,将 两个累计频率相减,得到差值序列数据。两独立样本 的K-S检验仍然关注差值序列,系统将自动计算K-S Z 统计量,并依据正态分布表给出的显著性。如果显著 性小于或等于用户心中的显著性水平,则拒绝

9、零假 设,认为样本来自的两个独立总体的分布有显著差异。,零假设 样本来自的两个独立总体的分布无显著差异。 统计量 最大绝对值差、最大正差、最大负差、 Kolmogorov-Smirnov Z、Z的显著性。,莫斯检验即两个独立样本的极端反应检验 (Moses Extreme Reaction)。 基本思想: 两独立样本的极端反应检验(Moses Extreme Reaction), 也是一种检验样本来自的两总体分布是否存在显著差异 的检验,它将一个样本作为控制样本,另一个样本作为 实验样本。以控制样本作为对照,检验实验样本是否存 在极端反应。如果实验样本不存在极端反应,则认为两 独立总体分布无显

10、著性差异。相反,如果实验样本存在 极端反应,则认为两独立总体分布存在显著差异。首先, 将两组样本混合并按升序排序;然后,找出控制样本最 低秩和最高秩之间包含的观察个数,称为跨度。,为控制极端值对分析结果的影响,也可先去掉控制样本 两个最极端的观察值后再求跨度,这个跨度称为截头跨 度。本系统自动计算跨度和截头跨度后,会依据分布表 给出对应的相伴概率值。如果相伴概率值小于或等于用 户心中的显著性水平,则拒绝零假设,认为样本来自 的两个独立总体的分布存在显著差异。 零假设 样本来自的两个总体的分布无显著差异。 统计量 跨度、截头跨度。,操作: 两个独立样本检验 选择检验变量和分类变量 例9.5:两种

11、安眠药服用的效果延长时数: 人 1 2 3 4 5 6 7 8 9 10 x 1.9 0.8 1.1 0.1 0.1 4.4 5.5 1.6 4.6 3.4 y 0.7-1.6-0.2-1.2-0.1 3.4 3.7 0.8 0.0 2.0 两种分布不明,试问药效有无显著差异. 当p0.05时,有显著差异,三、多个独立样本 1.kruska-wallis 克鲁斯卡尔-沃利斯单向方差分析是检验k个 独立样本是否来自同分布总体的最常用的非 参数检验 2.median 多个独立样本的中位数检验,用以检验k个独立 样本是否来自同一总体。,四、两个相关样本检验 威尔科克森配对秩和检验wicoxon 基本

12、思想 首先,按照符号检验的方法,分别将第二组的各个观察值减去第一组样本的各个观察值,如果差值为正,则记为正号,差值为负,记为负号,并同时保存绝对差值数据;然后,将绝对差值数据按升序排序,并求出相应的秩;最后,分别计算正号秩总和W、负号秩总和W以及正号平均秩和负号平均秩。可以直观的理解,如果正号平均秩和负号平均秩大致相当,则可以认为两配对样本数据的正负变化程度基本相当,两配对总体的分布无显著差异。,零假设H0 样本来自的两配对总体分布无显著差异。 统计量 正号平均秩、负号平均秩、统计量Z、Z的显著性。,麦克尼马尔检验mcnear 基本思想 麦克尼马尔变化显著性检验将研究对象自身作为对照者,采用二

13、项分布检验,通过研究其“前后”的变化,计算二项分布概率值。如果概率值小于或等于用户心中的显著性水平,则拒绝H0,认为样本来自的两个配对样本总体的分布有显著性差异。 零假设H0 样本来自的两配对总体分布无显著差异。 统计量 检验前后频数、二项分布概率值。,符号检验sign 基本思想 两个相关样本的符号检验利用正、负符号个数的多少进行检验。首先,分别将第二组样本的各个观察值减去第一组样本的各个观察值,差值为正,则记为正号,差值为负,则记为负号,然后用S 和S 统计正负的个数。如果正负的个数大致相当,则两配对样本数据分布差距较小;若正负的个数相差较多,则两配对样本数据分布差距较大。因为在零假设前提下

14、,两个相关样本中的S 和S 的分布时概率值为0.5的二项分布,为精确计算,系统自动根据S 、S和n计算实际的概率值,如果该概率值小于或等于用户心中的显著性水平,则不能拒绝H0,认为样本来自的两个配对总体的分布无显著差异。,零假设H0 样本来自的两配对总体分布无显著差异。 统计量 正号个数S、负号个数S、二项分布概率值。,操作: 两个相关样本检验 选择检验变量和分类变量 例4.6:研究某一总体前后变化是否显著 前:70 76 56 63 63 56 58 60 65 65 75 66 56 59 70 后:48 54 60 64 48 55 54 45 51 48 56 48 64 50 54,

15、五、多个相关样本 概述 多个相关样本的非参数检验是用于检验多个配对样本的总体分布是否存在显著性差异。本系统提供了三种两个相关样本检验的方法: 科克伦Q检验、弗里德曼检验和肯德尔W检验。其中,科克伦Q检验处理的样本数据要求是二值的。弗里德曼检验要求数据是定距的。,1.科克伦Q检验 cochrans q 检验k个相关样本的频数或比例有无显著差异 2.弗里德曼检验 friedman 检验k个相关样本秩评定间的一致性的测度 3.肯德尔W检验 Kendalls W 用于k组秩评定间相关程度的测定,即多组秩之间 关联程度的测定。 例4.7:顾客对三种款式衬衣的喜爱程度 顾客: 1 2 3 4 5 6 7 8 9 款式A 2 2 2 1 3 1 2 1 1 款式B 3 3 3 3 2 2 3 3 3 款式C 1 1 1 2 1 3 1 2 3,操作: 多个相关样本检验 选择检验变量和分类变量 例4.7:顾客对三种款式衬衣的喜爱程度 顾客: 1 2 3 4 5 6 7 8 9 款式A 2 2 2 1 3 1 2 1 1 款式B 3 3 3 3 2 2 3 3 3 款式C 1 1 1 2 1 3 1 2 3,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号