计量资料两组均数的比较-t检验ppt课件

资源描述

《计量资料两组均数的比较-t检验ppt课件》由会员分享，可在线阅读，更多相关《计量资料两组均数的比较-t检验ppt课件（84页珍藏版）》请在金锄头文库上搜索。

1、第六章计量资料两组均数的比较 t检验主要内容假设检验的基本原理和步骤样本均数与总体均数的比较两相关样本均数的比较两独立样本均数的比较t检验的应用条件检验假设注意的问题案例讨论假设检验的概念与原理对所估计的总体首先提出一个假设然后通过样本数据去推断是否拒绝这一假设称为假设检验 hypothesistesting 为什么要进行假设检验假设检验能够处理哪些问题假设检验的基本思想是什么假设检验的基本步骤有哪些应用假设检验还要涉及哪些问题假设检验的思维逻辑实例欲探讨男性成人肺炎患者的血红蛋白同男性健康成人有无区别如果能够测量所有的男性成人肺炎患者和男性健康成人的血红蛋白数值

2、我们通过计算均数就可以进行大小的比较可是男性成人肺炎患者和男性健康成人的群体是无限大的其血红蛋白值构成的总体也是无限的若随机抽取两个样本各10例 10例男性成人肺炎患者的血红蛋白 g dl 测量值 11 9 10 9 10 1 10 2 9 8 9 9 10 3 9 3 9 8 8 9 10例男性健康成人的血红蛋白 g dl 测量值 13 9 14 2 14 0 14 3 13 7 13 9 14 1 14 7 13 5 13 6 算得10例男性成人肺炎患者的血红蛋白均数为10 11 g dl 10例男性健康成人的血红蛋白均数为13 99 g dl 差别的原因差别的原因可能有两种

3、本质上的差异抽样误差只要个体之间存在差异抽样误差就不可避免欲想知道差别到底是本质上的差异还是纯粹的抽样误差需进行假设检验借助抽样误差的分布规律均数的分布 t分布 z分布 t变换接受无效假设拒绝H0 拒绝H0 t t 假设检验的原理假设检验 hypothesistest 也称显著性检验 significancetest 采用的是小概率反证法的思想即是事先对样本统计量的分布和总体参数作出某种假设然后判定样本统计量在总体分布所处的位置和对应的概率值如果样本统计量如在总体分布中的位置远离假定的参数相对应的P值也小如小于0 05 根据小概率事件在一次试验中一般不可能发生的原

4、理统计学有理由认为样本统计量不是来自事先假定的总体假设检验的基本步骤例已知北方农村儿童前囟门闭合月龄为14 1月某研究人员从东北某县抽取36名儿童得囟门闭合月龄均值为14 3月标准差为5 08月问该县儿童前囟门闭合月龄的均数是否大于一般儿童 1 选择检验方法建立检验假设并确定检验水准根据研究目的研究设计的类型和资料特点变量种类样本大小等因素选择合适的检验方法并且将需要推断的问题表述为一对关于总体特征的假设原假设 nullhypothesis 又称无效假设记为H0 对立假设 alternativehypothesis 又称备择假设记为H1 H1的内容直接反映了检验

5、单双侧若H1中只是 0或 0 则此检验为单侧检验它不仅考虑有无差异而且还考虑差异的方向单双侧检验的确定首先根据专业知识其次根据所要解决的问题来确定若从专业上看一种方法结果不可能低于或高于另一种方法结果此时应该用单侧检验一般认为双侧检验较保守和稳妥例建立的原假设为 14 1 月为该县儿童前囟门闭合月龄总体均数意为总体上该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平相同对立假设为 14 1 月意为该县儿童前囟门闭合月龄的平均水平高于一般儿童的平均水平检验水准 sizeofatest 用希腊字母表示实践中常取0 05或0 01等数值它将小概率事件具体化

6、即规定概率不超过就是小概率如果P值大于在成立的假设下发生较为可能的事件没有充足的理由对提出怀疑于是做出不拒绝的决策无论做出哪一种推断结论接受或是拒绝都面临着发生判断错误的风险这就是假设检验的两类错误第一节样本均数与总体均数的比较基本思想与步骤 1 假设检验 H0 总体均数为 0 即 0H1 0 其对立假设H1包括 0和 0两种可能一般情况下均采用双侧检验 2 计算统计量推断样本来自的总体均数与已知的某一总体均数 0 常为理论值或标准值有无差别 3 确定P值P值的意义是如果总体状况和一致统计量获得现有数值以及更不利于的数值的可能性概率有多大第二节两相关样本均数

7、的比较配对设计主要适用于以下情况同一受试对象处理前后的比较或两个部位的数据若为某种处理前后的数据需要经历的处理时间较长测量结果稳定同一样品或受试对象用两种处理方法或测量等检测的结果根据非处理因素配对后两个受试对象分别接受两种不同处理的数据基本思想与步骤第三节两独立样本均数的比较两组独立样本 twoindependentsample 将受试对象随机分配成两个处理组每一组随机接受的一种处理一般把这样获得的两组资料视为代表两个不同总体的样本推断它们的总体均数是否相等从两个人群例如某年龄组男性与女性分别随机抽取一定数量的观察对象测量某项指标进行比较在实际工作中

8、这类资料也按完全随机设计的两样本比较来对待基本思想和步骤例某职防所测定了某工厂不同工种的两个车间的氟作业工人的尿氟含量 mol L 资料如下问两车间的氟作业工人的尿氟含量有无差别甲车间 126 12143 20139 41161 11123 21110 3398 06151 4486 7631 56乙车间 86 7193 14106 5190 11121 32116 1456 9278 7861 14100 30 二两样本所属总体方差不等 Satterthwaite近似法例为探讨硫酸氧钒对糖尿病性白内障的防治作用研究人员将已诱导糖尿病模型的20只大鼠随机分为两组一组用硫酸氧钒治

9、疗 DV组另一组作对照观察 D组 12周后测大鼠血糖含量 mmol L 结果为 DV组12只样本均数为6 5mmol L 标准差为1 34mmol L D组8只样本均数为13 7mmol L 标准差为4 21mmol L 试问两组动物血糖含量的总体均数是否相同第四节t检验的应用条件一图示法 P Pplot Q Qplot 二矩法偏度系数 skewness 峰度系数 kurtosis 三 W检验法一资料正态分布正态性检验 normalitytest 一图示法期望概率期望累计概率图100个样本均数的P P图 P P图图100个样本均数的Q Q图 Q Q图 1 矩法是利用

10、数学上的矩原理来检验偏度和峰度偏度指分布不对称的程度和方向用偏度系数 coefficientofskewness 衡量样本偏度系数用g1表示总体偏度系数用 1表示理论上总体偏度系数 1 0为对称 1 0为正偏态 1 0为负偏态二统计检验法总体峰度系数 2 0为正态峰 2 0为尖峭峰 2 0为平阔峰样本峰度系数用g2表示只有同时满足对称和正态峰两个条件时才能认为资料服从正态分布检验偏度的统计量检验峰度统计量例试用矩法对表中计算机模拟抽样所得100个样本均数进行正态性检验 1 建立检验假设确定检验水准H0 1 0且 2 0 即总体服从正态分布H1 1 0或和 2 0

11、即总体不服从正态分布 0 10 欲不拒绝H0 宜稍大以减少II型错误 2 计算检验统计量 3 确定P值作出推断结论峰度P 0 50 偏度P 0 50 按 0 10水准不拒绝H0 无统计学意义还不能认为这些样本均数的总体不服从正态分布三 W检验由Shapiro和Wilk于1965年提出简称为W法适用于小样本资料计算时需要采用常数表大样本时计算很复杂例7 6 用小鼠研究正常肝核糖核酸 RNA 对癌细胞的生物学作用测定水层RNA诱导肝癌细胞的果糖二磷酸酯酶 FDP 活性的结果如下请分析FDP活性是否服从正态分布排序后的数据一分为二一 F检验二方差齐性方差齐性检验

12、采用两个方差比值F分布图 F值从0起这张图的F值在计算时分子分母没有分大小大的可以是分子也可以为分母就是双侧检验但是为了简便起见实际应用时仅给了大于等于1的界限值 0 025的界限值只能将大的方差当分子所以看起来是单侧检验实际上理论基础是双侧检验例某口腔医院选择吉林市 40 50岁慢性牙周炎患者536例测得吸烟组 201人菌斑指数 PLI 均值为84 71 标准差为8 14 非吸烟组 335人菌斑指数的均值为82 20 标准差为6 18 两样本数据是否具有方差齐性两总体方差相等 58 常用的变量变换有对数变换平方根变换倒数变换平方根反正弦变换等应根据资料性质

13、选择适当的变量变换方法实际资料若不满足正态性或和方差齐性的假定尤其当是小样本资料时这时如用一般的t检验可能会导致偏离真实结果较远对于明显偏离上述应用条件的资料可通过变量变换的方法加以改善三当资料不满足正态性和方差齐性条件的处理方法变量变换 59 1 对数变换X lgXX lg X 1 当原始数据较小或有0时X lg X K 或X lg K X 对数变换适用于对数正态分布资料各样本标准差与均数成比例或变异系数是常数或接近某一常数的资料 60 2 平方根变换X X 或当原始数据较小或有0时平方根变换适用用于服从Poisson分布的资料也即各样本方差与均数成比例者轻度偏

14、态分布的资料 61 3 平方根反正弦变换 1 用角度表示 X sin 1 2 用弧度表示 X sin 1 其中为圆周率平方根反正弦变换适用于率或百分比的资料 4 倒数变换X 1 X倒数变换适用于数据两端波动较大的资料一假设检验的两类错误第四节假设检验中需注意的问题 m m0 m1 m m0 m0 H1 m m1 m0 a b 减少增加 I型错误将会增加减少 II型错误增大n同时降低a与b 与间的关系 1 称为假设检验的功效 powerofatest 其意义是当所研究的总体与H0确有差别时按检验水平能够发现它拒绝H0 的概率如果1 0 90 则意味着当H0不成立时理论上

15、在每100次抽样中在的检验水准上平均有90次能拒绝H0 一般情况下对同一检验水准功效大的检验方法更可取二正确理解P值的意义 P值很小时拒绝H0 接受H1 但是不要把很小的P值误解为总体参数间差异很大拒绝H0只是说差异不为零 P值小只是说犯第类错误的机会远小于何时用单侧检验何时用双侧检验根据专业知识科学推理来决定没有任何可参考的资料用双侧稳妥一置信区间具有假设检验的主要功能如果无效假设 d 0 1 2 0不在置信区间范围内差别有统计学意义否则无统计学意义配对资料差值 d双侧95 置信区间两独立样本资料总体均数差值 1 2 的双侧 1 置信区间利用前例资料

16、估计儿童血红蛋白在健康教育干预措施前后差值的总体均数的可信区间为利用前例计算两个总体均数间差值的置信区间为 2 置信区间可提供假设检验没有提供的信息图7 1置信区间可以提供的信息 3 假设检验提供而置信区间不提供的信息在统计推断结论为拒绝H0时假设检验可以报告确切的P值从而较为精确地说明检验结论的概率保证置信区间只能在预先确定的置信度100 1 水平上进行推断在不能拒绝H0的场合假设检验可以对检验的功效做出估计从而可以评价是否在识别差异能力较强的情形下不拒绝H0的而置信区间并不提供这方面的信息置信区间与相应的假设检验既能提供相互等价的信息又有各自不同的功能把置信区间与假设检验结合起来可以提供更为全面完整的信息 1 假设检验是依据样本提供的有限信息对总体作推断的统计学方法是在对研究总体的两种对立的判断之间做选择的决策程序2 假设检验的逻辑是小概率事件在一次抽样中不太可能出现 3 假设检验的过程小结假设检验过程拒绝无效假设建立检验假设和确定检验水准不拒绝无效假设计算统计量确定P值推断第二步第一步第三步第四步一个样本均数与总体均数的比

展开阅读全文