《精编》卡方检验基本公式检验方法

上传人:tang****xu4 文档编号:133207070 上传时间:2020-05-25 格式:PPT 页数:47 大小:1.12MB
返回 下载 相关 举报
《精编》卡方检验基本公式检验方法_第1页
第1页 / 共47页
《精编》卡方检验基本公式检验方法_第2页
第2页 / 共47页
《精编》卡方检验基本公式检验方法_第3页
第3页 / 共47页
《精编》卡方检验基本公式检验方法_第4页
第4页 / 共47页
《精编》卡方检验基本公式检验方法_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《《精编》卡方检验基本公式检验方法》由会员分享,可在线阅读,更多相关《《精编》卡方检验基本公式检验方法(47页珍藏版)》请在金锄头文库上搜索。

1、 卡方检验 Chi squaretest stat9 检验 Chi squaretest 是现代统计学的创始人K Pearson提出的一种具有广泛用途的统计方法 该检验可用于两个及多个率 或者构成比 之间的比较 分类资料的关联度分析 拟合优度检验等 一 卡方检验的基本思想 首先介绍一个抽样分布 卡方分布属连续型分布可加性是其基本性质唯一参数 即自由度 3 84 7 81 12 59 P 0 05的临界值 2分布 Chi squaredistribution 称该分布具有可加性 卡方检验的基本思想 表7 1两组降低颅内压有效率的比较 P112 实际频数A actualfrequency 理论频数

2、T theoreticalfrequency 四格表 fourfoldtable 它反映了理论数与实际数的吻合情况 该统计量近似地服从自由度为 的卡方分布 查附表8 P715 3 84 7 81 12 59 P 0 05的临界值 2分布 Chi Squaredistribution 2检验的基本公式 上述检验统计量由K Pearson提出 因此许多统计软件上常称这种检验为Pearson sChi squaretest 下面将要介绍的其他卡方检验都是在此基础上发展起来的 二 四格表资料专用公式 为了省去计算理论频数T 可由基本公式推导出 直接由各格子的实际频数 a b c d 计算卡方值的公式

3、上面的例子 查附表8 P715 三 连续性校正公式 2分布是一连续型分布 而四格表资料属离散型资料 对其进行校正称为连续性校正 correctionforcontinuity 亦称Yates校正 Yates correction 校正公式 一般认为 四格表在n 40时出现有任一格1 T 5时 需要校正 例子 因为有一格1 T 5 且n 40时 所以应用连续性校正 2检验 例7 2P114 四 精确概率法 Fisher sexactprobability 在无效假设成立的前提下且周边合计固定时 产生任意一个四格表 i 的概率Pi服从于超几何分布 其计算式为 原理 P值为在无效假设成立的前提下 得

4、到现有样本四格表以及更极端情况下的四格表的概率 四格表资料分析小结 重要 Fisher sexactprobability法均适用卡方检验是一种近似检验 1 当n 40 T 5时 可用 然而当P值接近0 05时最好用Fisher sexactprobability法 2 当n 40 有任一格1 T 5时 可用Yates校正公式 3 当n 40或有T 1时 用Fisher sexactprobability 7 2配对四格表资料的 2检验 若a 甲 乙 b 甲 乙 c 甲 乙 d 甲 乙 将a b c d四种情况的对子数填入四格表 配对设计包括 1 同一批样品用两种不同的处理方法 2 观察对象根

5、据配对条件配成对子 同一对子内不同的个体分别接受不同的处理 3 在病因和危险因素的研究中 将病人和对照按配对条件配成对子 研究是否存在某种病因或危险因素 P114例7 3观察的结果只有阳性 阴性两种可能 清点成对资料时发现则存在四种情况 1 两种方法都出现阳性 共有11例 2 免疫荧光法阳性而乳胶凝集法却是阴性 共有12例 3 免疫荧光法阴性而乳胶凝集法却是阳性 共有2例 4 两种检测方法均为阴性结果 共有33例 上述几种情况整理成配对四格表 表7 3 配对四格表资料的 2检验 McNemar stest H0 b c来自同一个实验总体 B C H1 b c来自不同的实验总体 0 05 注 B

6、 C b c 2 补充 配对设计R R表 配对四格表实为配对2 2表实际工作中分类可能是多个 R个 McNemar检验的推广 例子 某研究所欲比较X线与CT对强直性脊柱炎 AS 骶髂关节病变的诊断价值 分析临床诊断为AS的患者136例 对272个骶髂关节分别拍摄X线平片与CT扫描 结果见下 问两种方法诊断骶髂关节病变的分级有无差别 7 4行 列表资料的检验 2 专用公式 1 多个样本率的比较2 样本构成比的比较3 双向无序分类资料的关联性检验 自由度 R 1 C 1 多个样本率或两个构成比比较的 2检验 表7 8三种疗法有效率的比较 H0 1 2 3 即三种疗法治疗周围性面神经麻痹的总体有效率

7、相等H1 三种疗法治疗周围性面神经麻痹的有效率不全相等 查 2界值表 得p 0 005 按 0 05水准 拒绝H0 接受H1 三种疗法治疗周围性面神经麻痹的有效率有差别 双向无序分类资料的关联性检验 表7 10某地5801人的血型 问题 1 两分类变量 行 列变量 有无关联 2 关联程度如何 分析步骤 H0 两种血型系统间无关联 独立性检验 H1 两种血型系统间有关联 结论 两种血型系统间虽然有关联性 有统计学意义 但列联系数数值较小 仍可认为关系不太密切 进一步计算列联系数 查界值表 P823 得 P 0 005 按 0 05检验水准拒绝H0 接受H1 认为两种血型系统间有关联 改错 P12

8、0中间 错 列联系数C取值范围在0 1之间 正确表述 完全缺乏相关时 C 0 完全相关时不等于1 C值大小R C有关 2 2表时 C 0 707 3 3表时 C 0 816 最大 两个C一般是不能比较的 观点 了解 双向无序资料的统计分析用卡方检验及列联系数是有争议的 也可用对数线性模型 精确概率法 似然比卡方检验等 R C表 2检验的应用注意事项 1 Pearson schi quaretest对理论频数有要求 对R C表 若较多格子 1 5 的理论频数小于5或有一个格子的理论频数小于1 则易犯第一类错误 出现某些格子中理论频数过小时怎么办 1 增大样本含量 最好 2 根据专业知识将相邻的行

9、或列进行合理合并 易丢失部分信息 有时甚至出假象 3 精确概率法 4 似然比 2检验 likelihoodratioChi squretest 2 R C表 2检验若有统计学意义 有必要进一步比较时 可考虑多重比较 本章第5节 R C表 2检验的应用注意事项 续 3 两组 多组比较时 若效应有强弱的等级 单向有序分类资料 如 2检验只能反映其构成比有无差异 不能比较效应的平均水平 故不能用 可采用非参数检验方法 秩和检验或Ridit分析 或cpd法 白求恩医科大学王广仪提出 有争议 4 行列两种属性皆有序时 双向有序分类资料 1 属性不同 考虑分析目的有三 单向有序行列表分析 线性趋势检验 本

10、章第六节 下述 或等级相关分析 后述 2 属性相同 是配对四格表的扩展 可作一致性检验 Kappa检验 7 5多个样本率比较的分割法 2 一 多个实验组间的两两比较 类似于Post hoc分析中探索性比较 H0 任两对比组的总体有效率相等H1 任两对比组的总体有效率不等 检验假设 以P119例7 6为例 进一步分析 检验水准调整 否则结果会自相矛盾 三种疗法治疗周围性面神经麻痹的实例中 检验水准调整为 对应的临界值 P122表7 11 注 k为被比较率的个数 表7 12三种疗法有效率的两两比较 P123 二 各实验组与同一对照组比关键是检验水平的校正 自学 7 6双向有序分组资料的线性趋势检验

11、 表7 13年龄与冠状动脉硬化的关系 P125 不作要求 7 7频数分布拟合优度检验 注意 理论频数F不宜过小 如不小于5 否则需要合并 u 2 95 4 1966 0 6737 P126例7 12给出泊松分布的拟合优度检验 关于自由度 改错 P127 2002年韩日世界杯64场比赛 每场各队进球数场次 实际数 理论数 03736 3914745 7722728 7831312 07423 79510 95 610 25合计128128 00 理论数为假定服从泊松分布成立所计算出的 完全随机设计 亦称成组设计 g个独立样本的比较 两个率的比较即四格表 g 2 多个率的比较即行 列表 g 2 有统计学意义 进一步比较 卡方分割等 构成比的比较即行 列表 本章第一节 第三节 第四节 配对设计两分类配对四格表 扩展成R分类 本章第二节 其他应用 总结

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号