计量资料两组均数的比较-t检验ppt课件

上传人:资****亨 文档编号:130412591 上传时间:2020-04-27 格式:PPT 页数:84 大小:1.91MB
返回 下载 相关 举报
计量资料两组均数的比较-t检验ppt课件_第1页
第1页 / 共84页
计量资料两组均数的比较-t检验ppt课件_第2页
第2页 / 共84页
计量资料两组均数的比较-t检验ppt课件_第3页
第3页 / 共84页
计量资料两组均数的比较-t检验ppt课件_第4页
第4页 / 共84页
计量资料两组均数的比较-t检验ppt课件_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《计量资料两组均数的比较-t检验ppt课件》由会员分享,可在线阅读,更多相关《计量资料两组均数的比较-t检验ppt课件(84页珍藏版)》请在金锄头文库上搜索。

1、 第六章计量资料两组均数的比较 t检验 主要内容假设检验的基本原理和步骤样本均数与总体均数的比较两相关样本均数的比较两独立样本均数的比较t检验的应用条件检验假设注意的问题案例讨论 假设检验的概念与原理 对所估计的总体首先提出一个假设 然后通过样本数据去推断是否拒绝这一假设 称为假设检验 hypothesistesting 为什么要进行假设检验 假设检验能够处理哪些问题 假设检验的基本思想是什么 假设检验的基本步骤有哪些 应用假设检验还要涉及哪些问题 假设检验的思维逻辑 实例 欲探讨男性成人肺炎患者的血红蛋白同男性健康成人有无区别 如果能够测量所有的男性成人肺炎患者和男性健康成人的血红蛋白数值

2、我们通过计算均数就可以进行大小的比较 可是 男性成人肺炎患者和男性健康成人的群体是无限大的 其血红蛋白值构成的总体也是无限的 若随机抽取两个样本 各10例 10例男性成人肺炎患者的血红蛋白 g dl 测量值 11 9 10 9 10 1 10 2 9 8 9 9 10 3 9 3 9 8 8 9 10例男性健康成人的血红蛋白 g dl 测量值 13 9 14 2 14 0 14 3 13 7 13 9 14 1 14 7 13 5 13 6 算得10例男性成人肺炎患者的血红蛋白均数为10 11 g dl 10例男性健康成人的血红蛋白均数为13 99 g dl 差别的原因 差别的原因可能有两种

3、本质上的差异抽样误差只要个体之间存在差异 抽样误差就不可避免 欲想知道差别到底是本质上的差异还是纯粹的抽样误差 需进行假设检验 借助抽样误差的分布规律 均数的分布 t分布 z分布 t变换 接受无效假设 拒绝H0 拒绝H0 t t 假设检验的原理 假设检验 hypothesistest 也称显著性检验 significancetest 采用的是小概率反证法的思想 即是事先对样本统计量的分布和总体参数作出某种假设然后判定样本统计量在总体分布所处的位置和对应的概率值如果样本统计量 如 在总体分布中的位置远离假定的参数 相对应的P值也小 如小于0 05 根据 小概率事件在一次试验中一般不可能发生 的原

4、理 统计学有理由认为样本统计量不是来自事先假定的总体 假设检验的基本步骤 例已知北方农村儿童前囟门闭合月龄为14 1月 某研究人员从东北某县抽取36名儿童 得囟门闭合月龄均值为14 3月 标准差为5 08月 问该县儿童前囟门闭合月龄的均数是否大于一般儿童 1 选择检验方法 建立检验假设并确定检验水准根据研究目的 研究设计的类型和资料特点 变量种类 样本大小 等因素选择合适的检验方法 并且将需要推断的问题表述为一对关于总体特征的假设 原假设 nullhypothesis 又称无效假设 记为H0 对立假设 alternativehypothesis 又称备择假设 记为H1 H1的内容直接反映了检验

5、单双侧 若H1中只是 0或 0 则此检验为单侧检验 它不仅考虑有无差异 而且还考虑差异的方向 单双侧检验的确定 首先根据专业知识 其次根据所要解决的问题来确定 若从专业上看一种方法结果不可能低于或高于另一种方法结果 此时应该用单侧检验 一般认为双侧检验较保守和稳妥 例建立的原假设为 14 1 月 为该县儿童前囟门闭合月龄总体均数 意为 总体上该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平相同 对立假设为 14 1 月 意为 该县儿童前囟门闭合月龄的平均水平高于一般儿童的平均水平 检验水准 sizeofatest 用希腊字母 表示 实践中常取0 05或0 01等数值 它将小概率事件具体化

6、即规定概率不超过 就是小概率 如果P值大于 在成立的假设下发生较为可能的事件 没有充足的理由对提出怀疑 于是做出不拒绝的决策无论做出哪一种推断结论 接受或是拒绝 都面临着发生判断错误的风险 这就是假设检验的两类错误 第一节样本均数与总体均数的比较 基本思想与步骤 1 假设检验 H0 总体均数为 0 即 0H1 0 其对立假设H1包括 0和 0两种可能 一般情况下均采用双侧检验 2 计算统计量推断样本来自的总体均数 与已知的某一总体均数 0 常为理论值或标准值 有无差别 3 确定P值P值的意义是 如果总体状况和一致 统计量获得现有数值以及更不利于的数值的可能性 概率 有多大 第二节两相关样本均数

7、的比较 配对设计主要适用于以下情况 同一受试对象处理前后的比较 或两个部位的数据 若为某种处理前后的数据 需要经历的处理时间较长 测量结果稳定 同一样品 或受试对象 用两种处理方法 或测量等 检测的结果 根据非处理因素配对后 两个受试对象分别接受两种不同处理的数据 基本思想与步骤 第三节两独立样本均数的比较 两组独立样本 twoindependentsample 将受试对象随机分配成两个处理组 每一组随机接受的一种处理一般把这样获得的两组资料视为代表两个不同总体的样本 推断它们的总体均数是否相等从两个人群 例如某年龄组男性与女性 分别随机抽取一定数量的观察对象 测量某项指标进行比较在实际工作中

8、这类资料也按完全随机设计的两样本比较来对待 基本思想和步骤 例某职防所测定了某工厂不同工种的两个车间的氟作业工人的尿氟含量 mol L 资料如下 问两车间的氟作业工人的尿氟含量有无差别 甲车间 126 12143 20139 41161 11123 21110 3398 06151 4486 7631 56乙车间 86 7193 14106 5190 11121 32116 1456 9278 7861 14100 30 二 两样本所属总体方差不等 Satterthwaite近似法 例为探讨硫酸氧钒对糖尿病性白内障的防治作用 研究人员将已诱导糖尿病模型的20只大鼠随机分为两组 一组用硫酸氧钒治

9、疗 DV组 另一组作对照观察 D组 12周后测大鼠血糖含量 mmol L 结果为 DV组12只 样本均数为6 5mmol L 标准差为1 34mmol L D组8只 样本均数为13 7mmol L 标准差为4 21mmol L 试问两组动物血糖含量的总体均数是否相同 第四节t检验的应用条件 一 图示法 P Pplot Q Qplot 二 矩法偏度系数 skewness 峰度系数 kurtosis 三 W检验法 一 资料正态分布正态性检验 normalitytest 一 图示法 期望概率 期望累计概率 图100个样本均数的P P图 P P图 图100个样本均数的Q Q图 Q Q图 1 矩法是利用

10、数学上的矩原理来检验偏度和峰度 偏度指分布不对称的程度和方向 用偏度系数 coefficientofskewness 衡量 样本偏度系数用g1表示 总体偏度系数用 1表示 理论上 总体偏度系数 1 0为对称 1 0为正偏态 1 0为负偏态 二 统计检验法 总体峰度系数 2 0为正态峰 2 0为尖峭峰 2 0为平阔峰 样本峰度系数用g2表示只有同时满足对称和正态峰两个条件时 才能认为资料服从正态分布 检验偏度的统计量 检验峰度统计量 例试用矩法对表中计算机模拟抽样所得100个样本均数进行正态性检验 1 建立检验假设 确定检验水准H0 1 0且 2 0 即总体服从正态分布H1 1 0或 和 2 0

11、 即总体不服从正态分布 0 10 欲不拒绝H0 宜稍大以减少II型错误 2 计算检验统计量 3 确定P值 作出推断结论 峰度P 0 50 偏度P 0 50 按 0 10水准 不拒绝H0 无统计学意义 还不能认为这些样本均数的总体不服从正态分布 三 W检验由Shapiro和Wilk于1965年提出 简称为W法 适用于小样本资料 计算时需要采用常数表 大样本时计算很复杂 例7 6 用小鼠研究正常肝核糖核酸 RNA 对癌细胞的生物学作用 测定水层RNA诱导肝癌细胞的果糖二磷酸酯酶 FDP 活性的结果如下 请分析FDP活性是否服从正态分布 排序后的数据一分为二 一 F检验 二 方差齐性 方差齐性检验

12、采用两个方差比值F分布图 F值从0起 这张图的F值在计算时分子分母没有分大小 大的可以是分子 也可以为分母 就是双侧检验但是为了简便起见 实际应用时仅给了大于等于1的界限值 0 025的界限值 只能将大的方差当分子 所以看起来是单侧检验 实际上理论基础是双侧检验 例某口腔医院选择 吉林市 40 50岁慢性牙周炎患者536例 测得吸烟组 201人 菌斑指数 PLI 均值为84 71 标准差为8 14 非吸烟组 335人 菌斑指数的均值为82 20 标准差为6 18 两样本数据是否具有方差齐性 两总体方差相等 58 常用的变量变换有对数变换 平方根变换 倒数变换 平方根反正弦变换等 应根据资料性质

13、选择适当的变量变换方法 实际资料若不满足正态性或 和方差齐性的假定 尤其当是小样本资料时 这时如用一般的t检验可能会导致偏离真实结果较远 对于明显偏离上述应用条件的资料 可通过变量变换的方法加以改善 三 当资料不满足正态性和方差齐性条件的处理方法 变量变换 59 1 对数变换X lgXX lg X 1 当原始数据较小或有0时X lg X K 或X lg K X 对数变换适用于 对数正态分布资料 各样本标准差与均数成比例或变异系数是常数或接近某一常数的资料 60 2 平方根变换X X 或 当原始数据较小或有0时平方根变换适用用于 服从Poisson分布的资料 也即各样本方差与均数成比例者 轻度偏

14、态分布的资料 61 3 平方根反正弦变换 1 用角度表示 X sin 1 2 用弧度表示 X sin 1 其中 为圆周率平方根反正弦变换适用于率或百分比的资料 4 倒数变换X 1 X倒数变换适用于数据两端波动较大的资料 一 假设检验的两类错误 第四节假设检验中需注意的问题 m m0 m1 m m0 m0 H1 m m1 m0 a b 减少 增加 I型错误 将会增加 减少 II型错误增大n同时降低a与b 与 间的关系 1 称为假设检验的功效 powerofatest 其意义是 当所研究的总体与H0确有差别时 按检验水平 能够发现它 拒绝H0 的概率如果1 0 90 则意味着当H0不成立时 理论上

15、在每100次抽样中 在 的检验水准上平均有90次能拒绝H0 一般情况下对同一检验水准 功效大的检验方法更可取 二 正确理解P值的意义 P值很小时 拒绝H0 接受H1 但是不要把很小的P值误解为总体参数间差异很大 拒绝H0只是说差异不为零 P值小只是说犯第 类错误的机会远小于 何时用单侧检验 何时用双侧检验 根据专业知识 科学推理来决定 没有任何可参考的资料 用双侧稳妥 一 置信区间具有假设检验的主要功能如果无效假设 d 0 1 2 0不在置信区间范围内 差别有统计学意义 否则 无统计学意义配对资料差值 d双侧95 置信区间两独立样本资料总体均数差值 1 2 的双侧 1 置信区间 利用前例资料

16、估计儿童血红蛋白在健康教育干预措施前后差值的总体均数的可信区间为 利用前例计算两个总体均数间差值的置信区间为 2 置信区间可提供假设检验没有提供的信息 图7 1置信区间可以提供的信息 3 假设检验提供 而置信区间不提供的信息 在统计推断结论为拒绝H0时 假设检验可以报告确切的P值 从而较为精确地说明检验结论的概率保证 置信区间只能在预先确定的置信度100 1 水平上进行推断在不能拒绝H0的场合 假设检验可以对检验的功效做出估计 从而可以评价是否在识别差异能力较强的情形下不拒绝H0的 而置信区间并不提供这方面的信息置信区间与相应的假设检验既能提供相互等价的信息 又有各自不同的功能 把置信区间与假设检验结合起来 可以提供更为全面 完整的信息 1 假设检验是依据样本提供的有限信息对总体作推断的统计学方法 是在对研究总体的两种对立的判断之间做选择的决策程序2 假设检验的逻辑是 小概率事件在一次抽样中不太可能出现 3 假设检验的过程 小结 假设检验过程 拒绝无效假设 建立检验假设和确定检验水准 不拒绝无效假设 计算统计量 确定P值 推断 第二步 第一步 第三步 第四步 一个样本均数与总体均数的比

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号