2015-10-非参数差异分析

上传人:n**** 文档编号:37948433 上传时间:2018-04-24 格式:PDF 页数:115 大小:1.88MB
返回 下载 相关 举报
2015-10-非参数差异分析_第1页
第1页 / 共115页
2015-10-非参数差异分析_第2页
第2页 / 共115页
2015-10-非参数差异分析_第3页
第3页 / 共115页
2015-10-非参数差异分析_第4页
第4页 / 共115页
2015-10-非参数差异分析_第5页
第5页 / 共115页
点击查看更多>>
资源描述

《2015-10-非参数差异分析》由会员分享,可在线阅读,更多相关《2015-10-非参数差异分析(115页珍藏版)》请在金锄头文库上搜索。

1、实验设计和数据处理袁克虹 办公电话:26036355 办公地点:L楼305B 邮件: 2015.04.03课程主要内容数据获取收集方法网络获取,实验获取 数据预处理一致性、数据完整性、数据可靠性样本容量分析需要的样本数量 数据属性数据描述离散、中心趋势、整体、图示、总体描述个体、定性资料 正态检验偏度峰度检验、K-S检验,卡方检验 因素分析正态分布正态分布单因素单因素- -单水平单水平:假设检验假设检验; 单因素单因素- -多水平多水平:方差分析方差分析 ; ;双因素双因素 多水平多水平:方差分析方差分析 ; ;双因素双因素- -多水平多水平:方差分析方差分析 ; ; 单因素单因素- -多水平

2、多水平:数据区组分析数据区组分析; 多因素-多水平:正交试验设计: 1.正交表概述,2. 数据分析:1)极差法,2)方差分析法, 3. 交互影响正交表,4. 混合正交表、5.拉丁方设计 因素和水平1. 多因素实验筛选 2. 最佳水平获取方法3. 多指标问题不考虑分布1. 定性数据假设检验、分类资料检验 2. 非参数差异性分析 数据分析大数据分析 方法回归分析、统计推断和风险管理、时间序列分析、主成份 分析、聚类分析、统计模式分类技术, Meta分析上次课程主要内容四格表卡方检验分样本数量和每个元素的个 数 配对四格表卡方检验b+c和决定方法RXC表卡方检验RXC表卡方检验多个样本率间多重比较R

3、XC 有差异 比对多实验组与同一对照 组比较RXC有差异 与同一对照组 比对四格表四格表资料2公式的正确选择1)当n40,所有T 5时,用专用公式或普通公式;2 2() ()()()()ad bc n a b a c b d c d2)当n40,但有理论频数1T5时,用校正公式;3) nS2(x) 或 H1:S1(x)S2(x)把两组样本分别排成累计频数分布(对两个分布用相 同的间隔或分类,并利用尽可能多的间隔。计算检验统计量D值,如是单尾检验,应按H1的方向 计算D值。检验步骤显著性检验: 小样本情况下,及n1= n2=n,n30,用查表。 对于单尾检验和双尾检验,该表列出了不同显 著性水平

4、下的临界值。 大样本情况下n 不一定等于n但都小于40大样本情况下,n1不一定等于n2,但都小于40 的双尾检验,可用查表公式算出D的临界值。 当 n1和n2都较大,但又是单尾检验时,用算式22212 n(2) 124n nDnn实例设男、女两类消费者对某餐厅评分(1010分制)资料 如下表所示。现欲知两类消费者的评分分布是否相同 表:男、女两类消费者的评分实例两独立样本的非参数检验两独立样本的非参数检验 曼-惠特尼U检验 中位数检验 K-S检验 W W游程检验 W-W游程检验 独立双样本卡方检验W-W游程检验 单样本游程检验是用来检验变量值的出现 是否随机,而两独立变量的游程检验则是 用来检

5、验两独立样本来自的两总体的分布 是否存在显著差异。 两组独立样本来自的两总体 其原假设是:两组独立样本来自的两总体 的分布无显著差异。W-W游程检验 两独立样本的游程检验与单样本游程检验 的思想基本相同 不同的是计算游程数的方法, 两独立样本的 游程检验中,游程数依赖于变量的秩。W-W游程检验 要求检验这些新生儿的重量分布是否来自同一总体( 或来自有相同分布函数的两个总体)。先将上述两组 数据混合排序(第二样本的数据为蓝色):4.30 4.30 4.434.43 4.52 4.52 4.53 4.55 4.704.53 4.55 4.70 4.78 4.834.78 4.83 4.88 4.8

6、8 4.90 4.90 4.934.93 4.94 4.94 4.954.95 4.97 4.97 4.984.98 5.09 5.21 5.09 5.21 5.285.28 5.34 5.34 5.36 5.36 4.934.93 4.94 4.94 4.954.95 4.97 4.97 4.984.98 5.09 5.21 5.09 5.21 5.285.28 5.34 5.34 5.36 5.36 5.465.46两独立样本的非参数检验两独立样本的非参数检验 曼-惠特尼U检验 中位数检验 K-S检验 W W游程检验 W-W游程检验 独立双样本卡方检验独立双样本卡方检验 该法是单样本卡方检

7、验的推广,也是列联 表分析的应用。主要用于检验两个彼此独 立的样本的频率分布是否有差异,或是行 变量与列变量之间是否具有相关性。检验 步骤如下步骤如下: (1)独立随机抽取两个样本,将全部可能 观察值进行分组,得到如下表所示的频数 资料 (分布数列)独立双样本卡方检验独立双样本卡方检验例子 某市场研究公司对某国际体育产品公司生 产的A、 B两种品牌产品的消费群进行了一 次体育节目收视情况调查,以了解他们喜 欢收看哪些体育节目,从而为该企业提供 选择广告时段的参考资料调查结果如下选择广告时段的参考资料。调查结果如下 表所示:例子例子多独立样本的非参数检验多独立样本的非参数检验 多独立样本的非参数

8、检验是通过分析多组独立样本 数据,推断样本来自的多个总体的中位数或分布是 否存在显著差异。多组独立样本是指按独立抽样方 式获得的多组样本。主要包括: 多个独立样本的卡方检验 Kruskal-Wallis检验 Jonckheere-Terpstra检验 例:希望对北京、上海、成都、广州四个城市的周 岁儿童的身高进行比较分析。采用独立抽样方式获 得四组独立样本。多独立样本的非参数检验多独立样本的非参数检验 多个独立样本的卡方检验 Kruskal-Wallis检验 Jonckheere-Terpstra检验Jonckheere Terpstra检验多个独立样本的卡方检验基本原理和步骤: 将独立双样本

9、检验进一步推广,可得到多个总体 的检验或称“k个总体齐一性检验”。它与独立双 样本 检验之下的做法基本相同。 它可用来检验k个总体的分布是否相等的原假设 它可用来检验k个总体的分布是否相等的原假设。 检验步骤: (1)将调查数据按样本及观察点取值情况进行分 组,得如下表所示的二维列联表,表内为实际观 察频数Oij多个独立样本的卡方检验 样本实际观察频数表多个独立样本的卡方检验(2)计算期望频数Eij(3)计算卡方统计量。由皮尔逊定理,卡方统 计量为它服从自由度为(R-1)(K-1)的卡方分布。(4)作出检验结论。若 ,则拒绝H0,认为这K个 总体的分布不尽相同。多个独立样本的卡方检验例: 某女

10、士美容公司为了了解客户对旗下三个 子公司服务质量的评价,从各家公司的全 部固定客户中随机抽取部分(共950户), 经调查,评价意见如表所示。 本例采用检验 本例采用检验,即 H0:客户对三家子公司服务质量评价无差异 H1:客户对三家子公司服务质量评价有差异 将期望次数及(Oij-Eij)2/Eij列入下表多个独立样本的卡方检验客户对三家子公司服务质量的评价多个独立样本的卡方检验期望次数及(Oij-Eij)2/Eij由于所以H0被拒绝,即三家子公司的服务质量显著不同。多独立样本的非参数检验多独立样本的非参数检验 中位数检验 Kruskal-Wallis检验 Jonckheere-Terpstra

11、检验中位数检验 中位数检验通过对多组独立样本的分析,检 验它们来自的总体的中位数是否存在显著差 异。其原假设是:多个独立样本来自的多个 总体的中位数无显著差异。 基本思想是:如果多个总体的中位数无显著 差异,或者说多个总体有共同的中位数,那 么这个共同的中位数应在各样本组中均处在 中间位置上。于是,每组样本中大于该中位 数或小于该中位数的样本数目应大致相同多独立样本的非参数检验多独立样本的非参数检验 多个独立样本的卡方检验 Kruskal-Wallis检验 Jonckheere-Terpstra检验Jonckheere Terpstra检验Kruskal-Wallis检验 Kruskal-Wa

12、llis检验实质是两独立样本的曼-惠特尼U 检验在多个样本下的推广,也用于检验多个总体的 分布是否存在显著差异。 其原假设是:多个独立样本来自的多个总体的分布 无显著差异无显著差异。Kruskal-Wallis检验 基本思想是: 将多组样本数据混合并按升序排序,求出各变量值秩; 考察各组秩的均值是否存在显著差异。 如果各组秩的均值不存在显著差异,则是多 组数据充分混合,数值相差不大的结果,可 以认为多个总体的分布无显著差异; 如果各组秩的均值存在显著差异,则是多组 数据无法混合,某些组的数值普遍偏大,另 一些组的数值普遍偏小的结果,可以认为多 个总体的分布有显著差异。克鲁斯卡尔瓦利斯H 检验

13、在参数统计中,对方差分析是采用F检验进 行的,以检验推断多个正态总体均值是否 相等。 但当总体并不服从正态分布时,F检验就受 到了限制这时通常可用克鲁斯卡尔瓦到了限制。这时通常可用克鲁斯卡尔瓦 利斯的H检验法。 它可以看作是Wilcoxon-W检验或曼惠特 尼U检验的推广。克鲁斯卡尔瓦利斯H 检验 待检验假设为: H0:k 个样本来自不同一总体 H1:k 个样本不全来自同一总体克鲁斯卡尔瓦利斯H 检验(二)检验步骤 (1)把k个样本的观察值混合评秩。如果若干个观察 值相等,则用它们的平均秩赋值。 (2)计算每个样本所得到的秩次和Rj及平均秩 :式中,nj为第j样本(j=1,2,k)的容量。 记

14、n=n1+n2+nk, 则 的平均值 (即混合样合总的平均秩次)为:克鲁斯卡尔瓦利斯H 检验克鲁斯卡尔瓦利斯H 检验(4)作出检验结论。在给定的显著性水平 之下, 若 则拒绝H0,认为k个样本来自不同的总体。克鲁斯卡尔瓦利斯H 检验例子 某教学研究者欲知道不同专业学习后的统 计学考试成绩有无显著差异,在一次统考 之后,分别从会计、企管、信息、金融四 个专业的学生中随机抽取部分学生统计其 成绩结果如下表所示 表中名次为学生在成绩,结果如下表所示,表中名次为学生在 全部样本中的总名次。四个专业统计学考试成绩及名次例子 我们将40学生的成绩按低到高顺序评名次( 秩),结果也列入表中。例子 故拒绝H0

15、 认为不同专业学生的统计学考试成绩是有 显著差异的。 对于研究者而言,下一步的工作就是寻找对于研究者而言下一步的工作就是寻找 这种差异的真正原因。1.原始数据的多个样本比较2. 等级资料的多样本比较两种具体应用类似于单因素方差分析类似于单因素方差分析。设有设有k个对比组个对比组,各组样本含量各组样本含量、秩和秩和、平均秩次平均秩次分别记为分别记为:jn、jR、jR;12kNnnn 。则总秩和为则总秩和为(1) / 2N N ,平均秩平均秩次为次为(1) / 2N 。若没有或较少相持现象若没有或较少相持现象,则秩次的总离均差平方和为则秩次的总离均差平方和为: 2211()(1) /122NiNQiN N总(12.7)秩次的组间离均差平方和为秩次的组间离均差平方和为: Kruskal-Wallis H检验的基本思想:22 2111(1)()24kkj jj jjjRNN NQnRn组间(12.8)由式由式(12.5)H值的定义可得值的定义可得: /(QHQN组间总-1)(12.9)即检验统计量即检验统计量H为秩次的组间变异与总变异之比为秩次的组间变异与总变异之比。可见可见,H越大越大,组间变异越组间变异越大大,反之亦然反之亦然。 例 某医师检测3种卵巢功能异常患者血清中促黄体素的含量(U/L)资料见表第(1)、(3)、(5)栏。问3种患者血清中促黄体素的含量(U/

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 金融/证券 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号