最新医学统计03精品课件

资源描述

《最新医学统计03精品课件》由会员分享，可在线阅读，更多相关《最新医学统计03精品课件（130页珍藏版）》请在金锄头文库上搜索。

1、医学统计医学统计0303概率分布概率分布参数估计与假设检验参数估计与假设检验EPIDATAEPIDATA数据管理软件数据管理软件总体均数总体均数总体标准差总体标准差正态分布的公式正态分布的公式和和是正态分布的两个参数，是正态分布的两个参数，和和决定了决定了x的概率分布；习惯上用的概率分布；习惯上用 N (, 2)表示均数为表示均数为，标，标准差为准差为的正态分布。的正态分布。二、正态分布的特征二、正态分布的特征(1)(1)集中性：集中性：正态分布是一条单峰分布，高正态分布是一条单峰分布，高峰位置在均数处。峰位置在均数处。 (2)(2)对称性：对称性：正态分布以均数为中心，左右正态分布以均数为

2、中心，左右完全对称。完全对称。(3)(3)正态分布曲线的正态分布曲线的形态形态取决于两个参数，取决于两个参数，即总体均数即总体均数和总体标准差和总体标准差。(4)(4)正态分布曲线下的面积分布具有一定的正态分布曲线下的面积分布具有一定的规律性规律性。当当固定不变时，固定不变时，越大，曲线沿横轴越大，曲线沿横轴越向右移动；反之，越向右移动；反之，越小，则曲线沿横轴越向左移越小，则曲线沿横轴越向左移动，所以动，所以叫正态曲线叫正态曲线N（, 2）的）的位置参数位置参数，。1. 位置参数：位置参数：正态分布位置随参数正态分布位置随参数变换示意图变换示意图=1=1.5=22. 形状参数形状参数：

3、正态分布形态随参数正态分布形态随参数变换示意图变换示意图当当固定不变时，固定不变时，越大，曲线越平阔；越大，曲线越平阔；越小，曲线越尖峭，越小，曲线越尖峭，叫正态曲线叫正态曲线N（, 2）的）的形形状参数状参数。三、正态分布面积分布规律三、正态分布面积分布规律（1 1）正态分布曲线与横轴所夹面积为）正态分布曲线与横轴所夹面积为1 1。（2 2）区间在（）区间在（- -， + +）内的面积或概率）内的面积或概率为为0.6830.683，此区间之外概率为，此区间之外概率为0.3170.317，左右两侧各，左右两侧各0.15850.1585。（3 3）区间在（）区间在（-1.96-1.96，

4、 +1.96+1.96）内的面）内的面积或概率为积或概率为0.950.95，此区间之外概率为，此区间之外概率为0.050.05，左右，左右两侧各两侧各0.0250.025。（4 4）区间在（）区间在（-2.58-2.58， +2.58+2.58）内的面）内的面积或概率为积或概率为0.990.99，此区间之外概率为，此区间之外概率为0.010.01，左右，左右两侧各两侧各0.0050.005。正态分布应用于以下正态分布应用于以下 3 3 个方面：个方面：1.1.制定医学参考值范围制定医学参考值范围2.2.质量控制质量控制3.3.统计方法的理论基础统计方法的理论基础四、正态分布的应用四、正态分布的

5、应用1.1.制定医学参考值范围制定医学参考值范围参考值范围参考值范围（reference range)reference range)：指所谓：指所谓“正常正常人人”的解剖、生理、生化等指标的波动范围。的解剖、生理、生化等指标的波动范围。制定方法：制定方法：制定参考值范围时，首先要制定参考值范围时，首先要确定一批样本含量足确定一批样本含量足够大够大的的“正常人正常人”。测量测量样本人群相应指标的值，测量的过程中要严样本人群相应指标的值，测量的过程中要严格控制各种误差。格控制各种误差。而后而后根据指标的实际用途确定单侧或双侧界值根据指标的实际用途确定单侧或双侧界值，根据研究目的和使用要求选定适

6、当的百分界值，根据研究目的和使用要求选定适当的百分界值，常用常用95%95%。单侧临界值：标准正态分布单侧尾部面积等于时所对应的正侧变量值，记作Z。双侧临界值：标准正态分布双侧尾部面积之和等于时所对应的正侧变量值，记作Z/2。以不同的方法计算参考值范围：以不同的方法计算参考值范围：举例1：调查某地120名健康女性血红蛋白，直方图显示其分布近似正态，均数 X =117.4, 标准差S =10.2 ，试估计该地健康女性血红蛋白的95%参考值范围。解析： 1. 分布近似正态2. 过高过低均为异常3. 求上、下界值正态分布法求参考值范围设定双侧界值上界：下界：所以，该地健康女性血红蛋白的所以，该

7、地健康女性血红蛋白的95%参考值范围是参考值范围是（97.41，137.39）g/l。举例2：某地调查120名健康成年男性的第一秒肺通气量得均数 X =4.2(L), 标准差S =0.7(L)，试据此估计其第一秒肺通气量的95%参考值范围。解析： 1. 分布近似正态2. 仅过低为异常3. 求下界值正态分布法求参考值范围单侧下限下界：所以，该地健康成年男子第一秒肺通气量的所以，该地健康成年男子第一秒肺通气量的95%参考值参考值范围为不低于范围为不低于3.05（L）。）。 2.质量控制质量控制基本原理：基本原理：许多临床检验指标，当影响某一指标的随机许多临床检验指标，当影响某一指标的随机因素

8、很多，而每个因素所起的作用均不太因素很多，而每个因素所起的作用均不太大时，这个指标的大时，这个指标的随机波动随机波动属于随机误差，属于随机误差，则往往则往往服从正态分布服从正态分布。质量控制领域的质量控制领域的“3 3原则原则”：其意义是指其意义是指正常情况下检测误差服从正态分布，根据正常情况下检测误差服从正态分布，根据正态分布的曲线面积或概率分布理论可知，正态分布的曲线面积或概率分布理论可知，3 3之外的观察值出现的概率不到之外的观察值出现的概率不到3 3，如如果超过这一值，则提示测量或产品质量有果超过这一值，则提示测量或产品质量有问题。问题。统计学规定：统计学规定：以以x x为中心线，为中

9、心线，x2S x2S 为警戒为警戒线，线，x3Sx3S为控制线，根据以上的规定还可为控制线，根据以上的规定还可以绘制出质量控制图。以绘制出质量控制图。中心线中心线警戒线警戒线控制线控制线控制线控制线警戒线警戒线3.3.统计方法的理论基础统计方法的理论基础 t t 分布、分布、F F 分布、分布、x2分布都是在正态分布的分布都是在正态分布的基础上推导出来的，基础上推导出来的，u u 检验也是以正态分布为检验也是以正态分布为基础的。基础的。二项分布、二项分布、PoissonPoisson分布的极限为正态分布，分布的极限为正态分布，在一定条件下，可以按正态分布原理来处理。在一定条件下，可以按正态分布

10、原理来处理。第二节第二节二项分布和二项分布和PoissonPoisson分布分布变量类型为二分类时，变量均现为两个对变量类型为二分类时，变量均现为两个对立的可能结果，每个个体的观察结果只能立的可能结果，每个个体的观察结果只能取其中之一，这类变量需按二项分布取其中之一，这类变量需按二项分布(binomial distribution)(binomial distribution)规律进行统计分规律进行统计分析。析。毒性试验：白鼠毒性试验：白鼠死亡死亡生存生存临床试验：病人临床试验：病人治愈治愈未愈未愈临床化验：血清临床化验：血清阳性阳性阴性阴性事件事件成功（成功（A）失败（非失败（非A

11、）这类这类“成功成功失败型失败型”试验称为试验称为Bernoulli试验。试验。一、二项分布一、二项分布( (一一) )二项分布的概念二项分布的概念【例【例3-13-1】临床上用针灸治疗某型头痛，有效】临床上用针灸治疗某型头痛，有效率为率为60%60%，现以该法治疗，现以该法治疗3 3例，其中例，其中2 2例有效的例有效的概率是多大概率是多大? ?有效的概率是有效的概率是0.6 0.6 无效的概率是无效的概率是0.4 0.4 3 3人接受针灸治疗后的有效和无效的所有可能组合，人接受针灸治疗后的有效和无效的所有可能组合，就排列方式而言有就排列方式而言有8 8 种；如只计算有效或无效的种；如只计算

12、有效或无效的数目而不考虑其顺序时，则只有数目而不考虑其顺序时，则只有 4 4 种组合。种组合。又由于结果是独立的，病例间互不影响，则根据又由于结果是独立的，病例间互不影响，则根据概率的乘法法则可以计算各种排列的连乘概率，概率的乘法法则可以计算各种排列的连乘概率，再根据概率的加法法则，可以算出无效数或有效再根据概率的加法法则，可以算出无效数或有效数分别为数分别为0 0、1 1 、2 2 、3 3 时的概率。时的概率。SPSS计算( (二二) )二项分布的特征二项分布的特征【例【例3-23-2】大样本研究显示，某中药制剂不良反应发】大样本研究显示，某中药制剂不良反应发生率为生率为5%5%，现随机抽

13、取，现随机抽取5 5人服用此药，试求：人服用此药，试求：其中其中m m个人个人(m=0(m=0、1 1、2 2、3 3、4 4、5)5)有反应的概率。有反应的概率。至多有至多有2 2人有反应的概率。人有反应的概率。有人有反应的概率。有人有反应的概率。至多有至多有2人反应的概率：人反应的概率： P（X2）=P（0）+P（1） +P（2）有人反应的概率：有人反应的概率： P（X1）=1-P（0）SPSS计算PDF.BINOM（m，5，0.05）总体发生率总体发生率抽样人抽样人数数发生数发生数PDF.BINOM(quant,n,prob)PDF.BINOM(quant,n,prob)。数值。返回当每

14、次。数值。返回当每次试验的成功概率是试验的成功概率是prob prob 时，时，n n次试验中的成功次试验中的成功次数将等于次数将等于quantquant的概率。当的概率。当n n为为1 1时，这等同于时，这等同于 PDF.BERNOULLIPDF.BERNOULLI。CDF.BINOM（m，5，0.05）总体发生率总体发生率抽样人抽样人数数发生数发生数CDF.BINOM(quant,n,prob)CDF.BINOM(quant,n,prob)。数值。返回。数值。返回n n次试次试验（每次成功的概率为验（每次成功的概率为probprob）中成功次数将小）中成功次数将小于等于于等于quantqu

15、ant的累积概率。当的累积概率。当n n为为1 1时，这等同于时，这等同于 CDF.BERNOULLICDF.BERNOULLI。3 3、二项分布的图形和正态近似、二项分布的图形和正态近似(1)(1)二项分布的图形：二项分布的图形：如果已知如果已知n n和和，则按二项，则按二项分布概率公式可计算出不同的分布概率公式可计算出不同的X X取值时的概率，我取值时的概率，我们可以用们可以用X X为横轴，取值概率为横轴，取值概率 P P为纵轴，可绘制出为纵轴，可绘制出二项分布的图形。二项分布的图形。不难发现，二项分布的图形是一个离散型分布，不难发现，二项分布的图形是一个离散型分布，其形状决定于两个参数其

16、形状决定于两个参数n n和和，当，当为为0.50.5时，图时，图形对称；当形对称；当不等于不等于0.50.5时，图形呈偏态，但当样时，图形呈偏态，但当样本量增大时，图形逐渐趋于对称。本量增大时，图形逐渐趋于对称。SPSSSPSS演示二项分布图概念演示二项分布图概念(2)(2)二项分布的正态近似：二项分布的正态近似：根据统计学上的中心极限定理，当根据统计学上的中心极限定理，当n n较大，较大，且且n n与与n(1-n(1-)较接近时，二项分布将接较接近时，二项分布将接近于正态分布。近于正态分布。当当n n趋向无穷大时，二项分布趋向无穷大时，二项分布B(nB(n，) )的极的极限分布就是正态分布限

17、分布就是正态分布NnNn，n n(1-(1-) )。一般地说，如果一般地说，如果n n与与n(1-n(1-) )大于大于5 5时，即时，即可用正态分布近似原理处理二项分布问题，可用正态分布近似原理处理二项分布问题，以简化计算。以简化计算。( (三三) )二项分布的应用二项分布的应用在应用二项分布时，必须注意其在应用二项分布时，必须注意其应用条件应用条件：(1)(1)二项分布中的观察单位数通常是事先确定的。二项分布中的观察单位数通常是事先确定的。(2)(2)各观察单位各观察单位只有互相对立的两种结果只有互相对立的两种结果，如成功，如成功与失败、生存和死亡等。与失败、生存和死亡等。(3)(3)若两

18、种对立结果中的一种结果若两种对立结果中的一种结果( (阳性阳性) )的概率为的概率为，则其对立结果的概率为则其对立结果的概率为1-1-。实际工作中总。实际工作中总体概率体概率往往是未知的，但可以往往是未知的，但可以从大量观察中获从大量观察中获得的比较稳定的样本频率作为总体概率的估计值得的比较稳定的样本频率作为总体概率的估计值。(4)(4)n n个观察单位的观察结果相互独立个观察单位的观察结果相互独立。即观察单。即观察单位之间发现的结果不能互相影响，如要求疾病无位之间发现的结果不能互相影响，如要求疾病无传染性、无家族聚集性。传染性、无家族聚集性。【例【例 3 -3】大样本调查显示，新生儿畸形发生

19、率为】大样本调查显示，新生儿畸形发生率为1%，现随机调查某地，现随机调查某地 500 名新生儿，其中只有名新生儿，其中只有1例例发生畸形，问该地新生儿畸形发生率是否低于一般。发生畸形，问该地新生儿畸形发生率是否低于一般。首先计算首先计算500500名新生儿发生名新生儿发生1 1例畸形的概率例畸形的概率 P P（X X11）= P= P（0 0）+ P+ P（1 1）=0.0398=0.0398说明当地至多发生说明当地至多发生1 1例畸形的概率是例畸形的概率是0.03980.0398，小于，小于0.050.05，是小概率事件。所以可以认为，是小概率事件。所以可以认为当地新生儿畸形发生率不等于当地

20、新生儿畸形发生率不等于1%1%。互相之间的高与低，通过互相之间的高与低，通过1/500=0.0020.011/500=0.00250X50时，可按近似正态原理计算可时，可按近似正态原理计算可信区间，公式为：信区间，公式为：【例【例4-74-7】用计数器测得某放射性物质】用计数器测得某放射性物质1010分钟内分钟内发出的脉冲数为发出的脉冲数为500500，求每，求每1010分钟脉冲计数的总分钟脉冲计数的总体均数的体均数的95%95%可信区间。可信区间。第二节第二节假设检验假设检验一、假设检验的基本思想一、假设检验的基本思想假设检验假设检验(hypothesis testing)(hypothe

21、sis testing)又称又称显著性显著性检验检验(significance test)(significance test)，其基本思想是：，其基本思想是：先提出两总体相等的假设，然后看实际抽先提出两总体相等的假设，然后看实际抽到的样本与已知总体差异是否属到的样本与已知总体差异是否属小概率事小概率事件（件（p0.05p0.05），），若不属小概率事件则接受若不属小概率事件则接受原假设，若属小概率事件则拒绝原假设。原假设，若属小概率事件则拒绝原假设。二、假设检验步骤二、假设检验步骤1.1.建立假设、确定检验水准建立假设、确定检验水准(1)(1)零假设或无效假设：零假设或无效假设： H H0

22、0：= =0 0，即两，即两总体均数相同。总体均数相同。(2)(2)备择假设或有统计学意义假设备择假设或有统计学意义假设H H1 1：0 0，即两总体均数不同。根据专业知，即两总体均数不同。根据专业知识及数据特征，备择假设识及数据特征，备择假设H H1 1 也有单侧形式：也有单侧形式： 0 0 。选择双侧检验，还是单侧检验需依据数据特选择双侧检验，还是单侧检验需依据数据特征和专业知识进行确定。征和专业知识进行确定。 2.2.选择检验方法、计算统计量选择检验方法、计算统计量假设检验的方法应针对不同研究目的、设计假设检验的方法应针对不同研究目的、设计及资料的类型选定，并计算相应的检验统及资料的类型

23、选定，并计算相应的检验统计量。计量。如在总体方差已知的情况下，进行两均数的如在总体方差已知的情况下，进行两均数的比较用比较用z z检验或检验或u u检验；在总体方差未知情检验；在总体方差未知情况下，进行两均数的比较用况下，进行两均数的比较用 t t 检验等。检验等。3.3.确定确定P P值、作出推论值、作出推论根据计算的检验统计量，确定根据计算的检验统计量，确定P P值，值，P P值是在值是在H H0 0成立的情况下随机抽样，获得大于及等于成立的情况下随机抽样，获得大于及等于或或( (和和) )小于及等于现有样本资料求得的检小于及等于现有样本资料求得的检验统计量的概率。验统计量的概率。三、假设

24、检验的两类错误三、假设检验的两类错误假设检验可帮助我们判断两总体假设检验可帮助我们判断两总体与与0 0是是否相等的问题。但无论是接受否相等的问题。但无论是接受H H0 0或拒绝或拒绝H H0 0( (接受接受H H1 1) )的统计推断，都有一定程度上犯错的统计推断，都有一定程度上犯错误的可能，常概括为第一类错误和第二类误的可能，常概括为第一类错误和第二类错误错误( (或称或称I I型错误和型错误和IIII型错误型错误) )。1.I1.I型错误型错误(type I error)(type I error) 用用表示，是指表示，是指H H0 0原本是正确的，但正确的原本是正确的，但正确的H H0

25、 0被拒被拒绝绝( (接受接受H1)H1)所犯的错误称为所犯的错误称为I I型错误，故又称假阳型错误，故又称假阳性率、误诊率，即弃真错误。性率、误诊率，即弃真错误。也就是说，当也就是说，当定为小概率定为小概率0.050.05时，如时，如H H0 0 原本正原本正确，即两总体参数相同，那么在确，即两总体参数相同，那么在100100次抽样推断中次抽样推断中有有9595次的可能会接受次的可能会接受H H0 0的正确判断，也会有的正确判断，也会有5 5次的次的可能会拒绝可能会拒绝H H0 0的不正确判断，这就是的不正确判断，这就是允许犯允许犯I I型错型错误的概率为误的概率为0.050.05，即，即=

26、0.05=0.05。必要时也可取。必要时也可取= = 0.010.01或或=0.10=0.10。2.II2.II型错误型错误(type II err(type II err）用用表示，是指表示，是指H H0 0原本是不正确的，但错误原本是不正确的，但错误的的H H0 0被接受了所犯的错误称为被接受了所犯的错误称为IIII型错误，故型错误，故又称假阴性率、漏诊率，即取伪错误。又称假阴性率、漏诊率，即取伪错误。也就是说，当也就是说，当定为定为0.100.10时，如时，如H H0 0原本不正原本不正确，即两总体参数不同，那么在确，即两总体参数不同，那么在100100次抽样次抽样推断中有推断中有 90

27、90次的可能会拒绝次的可能会拒绝H H0 0接受接受H H1 1的正的正确判断，也有确判断，也有10 10 次的可能会接受次的可能会接受H H0 0的不正的不正确判断，确判断，这就是允许犯这就是允许犯 IIII型错误的概率为型错误的概率为0.100.10，即，即=0.10=0.10。根据专业需要或研究性质不同也可取根据专业需要或研究性质不同也可取=0.20=0.20。接受接受 H Ho o真实真实H Ho o 对对H Ho o 错错I I类错误类错误（-风险）风险）IIII类错误类错误（-风险）风险）正确正确正确正确拒绝拒绝 H Ho o3 .3 .检验效能检验效能( power of t

28、est )( power of test )(1) 1-(1) 1-表示表示 H H 0 0原本成立，按原本成立，按检验水准检验水准和样本信息作出接受和样本信息作出接受H H 0 0正确判断的能力，正确判断的能力，称可信度。称可信度。(2) 1-(2) 1-表示表示H H0 0原本不成立，按原本不成立，按检验水准检验水准和样本信息作出接受和样本信息作出接受H H1 1正确判断的能力，称正确判断的能力，称为检验效能或把握度。当为检验效能或把握度。当=0.10=0.10，此时检，此时检验效能为验效能为0.90.9或或90%90%。4.4.检验效能（把握度）的影响因素检验效能（把握度）的影响因素(1

29、)(1)总体参数间差异总体参数间差异越大，检验效能越高或把握度越大，检验效能越高或把握度越大。因越大。因| |- -0 0| |越大，得到越大，得到|x-|x-0 0| |越大的概率越大的概率越高，同时增大拒绝越高，同时增大拒绝H H0 0接受接受H H1 1的机会。的机会。(2)(2)个体差异或个体差异或标准差标准差越小，检验效能越高或把握越小，检验效能越高或把握度越大。因标准差与标准误成正比，而与检验统度越大。因标准差与标准误成正比，而与检验统计量计量z z成反比。成反比。(3)(3)样本含量样本含量n n越大，检验效能越高或把握度越大。越大，检验效能越高或把握度越大。因标准误与标准差成正

30、比而与因标准误与标准差成正比而与n n成反比。成反比。(4)(4)检验水准检验水准越大越大，检验效能越高或把握度越大。，检验效能越高或把握度越大。因为因为n n一定时，一定时，与与呈反向变化，呈反向变化，增大，增大，减减小，小，1-1-增大，故增大增大，故增大可提高检验效能。可提高检验效能。四、假设检验的注意事项四、假设检验的注意事项1.1.严密的抽样设计严密的抽样设计差异比较是建立在同质基础上的，差异比较是建立在同质基础上的，同质同质是假设检是假设检验的前提条件，实际上就是要保证样本或比较组验的前提条件，实际上就是要保证样本或比较组间的均衡可比性，即要求除了对比的因素外，其间的均衡可比性，即

31、要求除了对比的因素外，其它影响结果的因素应尽可能相同或基本相近。其它影响结果的因素应尽可能相同或基本相近。其具体实施方法是具体实施方法是严格做到随机抽样和控制混杂因严格做到随机抽样和控制混杂因素素，严密科研设计和抽样设计。，严密科研设计和抽样设计。2.2.检验方法的选择检验方法的选择各种类别的假设检验和检验统计量的方法很多，各种类别的假设检验和检验统计量的方法很多，因此因此所选用的检验方法必须符合其适用条件。所选用的检验方法必须符合其适用条件。这这些条件主要包括研究目的、设计方法、资料类型、些条件主要包括研究目的、设计方法、资料类型、样本含量等。样本含量等。3.P3.P值的大小并不表示实际差别

32、的大小值的大小并不表示实际差别的大小若若 P P，则拒绝则拒绝H H0 0接受接受H H1 1，这只说明，这只说明| |- - 0 0|0|0，并不能根据，并不能根据P P值的大小判别值的大小判别与与0 0或或x x与与0 0 之间的具体差别大小；之间的具体差别大小；P P值越小只能说明作出拒绝值越小只能说明作出拒绝H H0 0，接受，接受H H1 1的推的推论时犯错误的机会越小，与论时犯错误的机会越小，与| |- -0 0| |或或|x-|x-0 0| |的大小无关。的大小无关。如如P0.01P0.01比比P0.05P0.05更有理由拒绝更有理由拒绝H H0 0，接受，接受H H1 1，并不

33、表示，并不表示P0.01P0.01时，时，与与0 0或或x x与与0 0之间实际差别比之间实际差别比P0.05P0.05时时与与0 0或或x x与与0 0之间实际差别更大。之间实际差别更大。 4.4.假设检验的推断结论不能绝对化假设检验的推断结论不能绝对化(1)(1)假设检验中是否接受假设检验中是否接受H H0 0不仅决定于总体不仅决定于总体间是否相同，而且与抽样误差的大小、样间是否相同，而且与抽样误差的大小、样本例数的多少、检验水准的高低以及单双本例数的多少、检验水准的高低以及单双侧检验都有关。侧检验都有关。(2)(2)若统计结论和专业结论一致，则最终结若统计结论和专业结论一致，则最终结论也

34、一致；若论也一致；若统计结论和专业结论不一致，统计结论和专业结论不一致，则最终结论需根据专业知识而定则最终结论需根据专业知识而定。判断被判断被试因素的有效性时，要求在统计上和专业试因素的有效性时，要求在统计上和专业上都有意义。上都有意义。5.5.可信区间与假设检验的关系可信区间与假设检验的关系统计推断中的可信区间估计与假设检验的具统计推断中的可信区间估计与假设检验的具体含义、思路和作用各有不同，但目的一体含义、思路和作用各有不同，但目的一致，相互补充，尤其在统计检验方面有致，相互补充，尤其在统计检验方面有异异曲同工曲同工或或相互验证相互验证的功效。的功效。(1)(1)可信区间兼具参数估计和假设

35、检验双重可信区间兼具参数估计和假设检验双重功效功效(2)(2)可信区间比假设检验有可能提供更多信可信区间比假设检验有可能提供更多信息之处：息之处：可信区间不但能回答差别有无统可信区间不但能回答差别有无统计学意义，还能提示差别有无实际意义。计学意义，还能提示差别有无实际意义。-均有统计学意义，其中：均有统计学意义，其中：提示既有统计学意义又有提示既有统计学意义又有实际意义。实际意义。提示有统计学意义，也可能有实际意义。提示有统计学意义，也可能有实际意义。提示仅有统计学意义，而无实际意义。提示仅有统计学意义，而无实际意义。、均无统计学意义，其中：均无统计学意义，其中：可信区间包含有实际意可信区间

36、包含有实际意义的界值和义的界值和H0H0，提示可能样本太小，抽样误差太大，以下，提示可能样本太小，抽样误差太大，以下但包含但包含H0H0，提示既无统计学意义，也无实际意义。尚难作，提示既无统计学意义，也无实际意义。尚难作出结论。出结论。可信区间的上限在有实际意义的界值以下但包可信区间的上限在有实际意义的界值以下但包含含H0H0，提示既无统计学意义，也无实际意义。，提示既无统计学意义，也无实际意义。(3)(3)可信区间不能完全取代假设检验可信区间不能完全取代假设检验可信区间用作假设检验只能在规定的可信区间用作假设检验只能在规定的水准上揭水准上揭示差异有无统计学意义。而不能象假设检验那样示差异有无

37、统计学意义。而不能象假设检验那样得到精确的概率得到精确的概率p p。所以，把可信区间与假设检验。所以，把可信区间与假设检验结合起来，互相补充，才是完整的分析。结合起来，互相补充，才是完整的分析。因此在结果报告时，同时显示假设检验的检验统因此在结果报告时，同时显示假设检验的检验统计量值、计量值、P P值和可信区间的信息为宜。值和可信区间的信息为宜。参数估计参数估计假设检验假设检验五、假设检验的分类五、假设检验的分类根据是否正态分布：根据是否正态分布：分参数检验和非参数检分参数检验和非参数检验验根据处理因素根据处理因素：分单因素分析和多因素分析：分单因素分析和多因素分析根据比较类型：根据比较类型：

38、分优效性、等效性和非劣效分优效性、等效性和非劣效性。性。六、常用假设检验方法的选择六、常用假设检验方法的选择两均数两均数比比较样本与本与总体比体比较样本均数与本均数与总体均数比体均数比较的的t检验两两样本本比比较配配对资料料配配对t检验符号秩和符号秩和检验非配非配对资料料两独立两独立样本比本比较的的t检验两两组资料的秩和料的秩和检验中位数中位数检验多多组均均数比数比较完全随机完全随机设计资料料单因素方差分析因素方差分析H检验，多个，多个样本两两比本两两比较的秩和的秩和检验配伍配伍组设计资料料两因素方差分析两因素方差分析M检验拉丁方拉丁方设计资料料三向方差分析三向方差分析正交正交设计多向方差分析

39、多向方差分析多因素分析多因素分析一般方法：一般方法：判别分析、聚类分析、主成分分判别分析、聚类分析、主成分分析、因子分析、典型相关分析析、因子分析、典型相关分析回归分析：回归分析：直线回归、多元回归、逐步回归直线回归、多元回归、逐步回归曲线拟合与非线性回归：曲线拟合与非线性回归：曲线拟合、曲线拟合、Cox 回归、回归、 Logistic 回归回归六、常用假设检验方法的选择六、常用假设检验方法的选择无序无序资料料两两样本比本比较卡方卡方检验，四格表精确概率法，四格表精确概率法配配对资料料配配对资料的卡方料的卡方检验多多组率比率比较RXC表表资料的卡方料的卡方检验有序有序资料料等等级资料料Ridi

40、t分析分析H检验六、常用假设检验方法的选择六、常用假设检验方法的选择第三节第三节正态性检验与变量转换正态性检验与变量转换一、正态性检验一、正态性检验有些统计方法只适用于正态分布或近似正态有些统计方法只适用于正态分布或近似正态分布资料，如用均数和标准差描述数值资分布资料，如用均数和标准差描述数值资料的集中或离散情况、用正态分布法确定料的集中或离散情况、用正态分布法确定正常值范围、正常值范围、t t检验与检验与F F检验等，因此在用检验等，因此在用这些方法前，需考虑资料是否服从正态分这些方法前，需考虑资料是否服从正态分布。布。这可以通过我们这可以通过我们已有的经验已有的经验或或正态性检验正态性检

41、验来来判断。判断。( (一一) )医药研究经验医药研究经验以经验来决定资料是否服从正态分布，尤其以经验来决定资料是否服从正态分布，尤其对小样本资料对小样本资料(n20)(n20)有着重要的作用。有着重要的作用。 ( (二二) )正态性检验正态性检验(test of normality)(test of normality)二、数据转换二、数据转换数据转换数据转换(data conversion)(data conversion)是将数据从一种表现是将数据从一种表现形式变为另一种表现形式的过程，目的都是为了形式变为另一种表现形式的过程，目的都是为了使数据符合统计检验方法的应用条件。常用的数使数据

42、符合统计检验方法的应用条件。常用的数据转换方法如下：据转换方法如下：1.1.对数变换对数变换( (IogarithmicIogarithmic transformation) transformation)将原将原始数据变量始数据变量x x的对数值作为新的分析变量，适用于的对数值作为新的分析变量，适用于对数正态分布资料。常用于：对数正态分布资料。常用于：使服从对数正态使服从对数正态分布的资料正态化。分布的资料正态化。使资料达到方差齐性要求，使资料达到方差齐性要求，特别是各样本的变异系数比较接近时。特别是各样本的变异系数比较接近时。使曲线使曲线直线化。直线化。2.2.平方根变换平方根变换将原始数

43、据变量将原始数据变量 x x 的平方根作为新的的平方根作为新的分析变量。常用于分析变量。常用于:轻度偏态资料正轻度偏态资料正态化。态化。观察值服从观察值服从 Poisson Poisson 分布的分布的计数资料。当各样本的方差与均数呈计数资料。当各样本的方差与均数呈正相关时正相关时, ,均数大均数大, ,方差也大方差也大, ,用此变换用此变换可使资料达到方差齐的要求。可使资料达到方差齐的要求。3.3.平方根反正弦变换平方根反正弦变换4.4.倒数变换倒数变换EPIDATAEPIDATA数据管理软件数据管理软件数据管理的一种常用软件EpiData 特点简单易学、实用性强简单易学、实用性强对计算机硬

44、件要求不高对计算机硬件要求不高CRFCRF设计便捷设计便捷与与CRFCRF形式一致的可视数据录入界面形式一致的可视数据录入界面数据核查功能强大且实现简便数据核查功能强大且实现简便数据转换功能强大数据转换功能强大单机单机适合小型临床研究、流行病学调查等EpiData 语言设置语言设置EpiData文件组成EpiData EntryEpiData Entry由由3 3 种基本种基本文件组成文件组成: :调查表文件调查表文件(.QES(.QES文件文件),),它的作用是定义调查表(CRF)的结构，即录入界面格式。数据文件数据文件(.REC(.REC文件文件),),所有录入的数据就存在这个文件之中

45、。数据录入核查文件数据录入核查文件(.CHK(.CHK文文件件),),定义字段输入数据的有效性。EpiData的数据库特点EpiData记录数最好不要超过200,000300,000。设计录入界面时整个录入界面不能超过999行。（EXCEL为230、FOXPRO为256） EpiData数据管理流程数据管理流程建立调查表文件创建数据库建立核查文件录入数据数据库管理输出数据EpiData的主界面CRF（病例报告表）设计字段名：a 字段类型：文本、数字、日期等字段长度字段编辑器建立数据库数据核查允许录入的范围允许录入的范围跳转跳转是否必须录入是否必须录入定位字段位置定位字段位置数据录入打开数据库文件打开数据库文件数据录入数据查找数据处理一致性检验数据合并数据转换数据转换谢谢！谢谢！

展开阅读全文

最新医学统计03精品课件

最新文档