卫生统计学重点笔记

资源描述

《卫生统计学重点笔记》由会员分享，可在线阅读，更多相关《卫生统计学重点笔记（7页珍藏版）》请在金锄头文库上搜索。

1、医师资格考试蓝宝书-预防医学医学统计学方法第一节基本概念和基本步骤（非常重要）一、统计工作的基本步骤设计（最关键、决定成败）、搜集资料、整理资料、分析资料。总体：根据研究目的决定的同质研究对象的全体，确切地说，是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。实际工作中，经常是从总体中随机抽取一定数量的个体，作为样本，用样本信息来推断总体特征。样本的指标为统计量。由于总体中存在个体变异，抽样研究中所抽取的样本，只包含总体中一部分个体，这种由抽样引起的差异称为抽样误差。抽样误差愈小，用样本推断总体的精确度愈高；反之，其精确度愈低。某事件发生的可能性大小称为概率，用P表示，在01

2、之间，0和1为肯定不发生和肯定发生，介于之间为偶然事件，或为小概率事件。二、变量的分类变量：观察单位的特征，分数值变量和分类变量。第二节数值变量数据的统计描述（重要考点）一、描述计量资料的集中趋势的指标有1 .均数均数是算术均数的简称，适用于正态或近似正态分布。2 .几何均数适用于等比资料，尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布，经对数变换后（用原始数据的对数值lgX代替X）服从正态分布，观察值不能为0,同时有正和负。3 .中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布，特别是偏态分布资料的集中位置，以及分布不明或分布末端无确定数据资料

3、的中心位置。不能求均数和几何均数，但可求中位数。百分位数是个界值，将全部观察值分为两部分，有X%比小，剩下的比大，可用于计算正常值范围。二、描述计量资料的离散趋势的指标1 .全距和四分位数间距。2 .方差和标准差最为常用，适于正态分布，既考虑了离均差（观察值和总体均数之差），又考虑了观察值个数，方差使原来的单位变成了平方，所以开方为标准差。均为数值越小，观察值的变异度越小。3 .变异系数多组间单位不同或均数相差较大的情况。变异系数计算公式为：CV=s/XX 100%,公式中s为样本标准差，X为样本均数。三、标准差的应用表示观察值的变异程度（或离散程度）。在两组（或几组）资料均数相近、度量

4、单位相同的条件下，标准差大，表示观察值的变异度大，即各观察值离均数较远，均数的代表性较差；反之，表示各观察值多集中在均数周围，均数的代表性较好。（常考！）四、医学参考值的计算方法，单双侧问题，医学为95%医学参考值是指正常人体或动物体的各种生理常数，由于存在变异，各种数据不仅因人而异，而且同一个人还会随机体内外环境的改变而改变，因而需要确定其波动的范围，即正常值范围。医学参考值的计算公式：正态分布资料95%医学参考值：X 土（双侧）；X+或永（单侧），s为标准差。百分位数法和（双侧）；P5或P95 （单侧）。第三节数值变量数据的统计推断（重要考点）一、标准误，标准误与标准差和样本含量的关

5、系标准差和标准误的区别。样本标准误等于样本标准差除以根号下样本含量。标准误与标准差成正比；与样本含量的平方根成反比。因此。为减少抽样误差，应尽可能保证足够大的样本含量。样本标准差与样本标准误是既有联系又有区别的两个统计量，二者的联系是公式：二者的区别在于：样本标准差是反映中本中各观测值 Xi, X2,，Xn变异程度大小的一个指标，它的大小说明了对该样本代表性的强弱。样本标准误是样本平均数1, 2,的标准差，它是抽样误差的估计值，其大小说明了样本间变异程度的大小及精确性的高低。（掌握！）二、t分布和标准正态 u分布关系均以0为中心左右两侧完全对称的分布，只是t分布曲线顶端较u分布低，两端翘。

6、（v逐渐增大，t分布逐渐逼近u分布）。正态分布的特点：以均数为中心左右两侧完全对称分布；两个参数，均数u （位置参数）和s （变异参数）；对称均数的两侧面积相等。三、总体均数的估计样本统计量推算总体均数有两个重要方面：区间估计和假设检验。样本均数估计总体均数称点估计。总体均数区间估计（可信区间）的概念：按一定的可信度估计未知总体均数所在范围。其统计上习惯用95% （或99%）可信区间表示总体均数科有 95% （或99%）的可能在某一范围。可信区间的两个要素，一为准确度，反映在可信度1- “的大小，即区间包含总体均数的概率大小，当然愈接近 1愈好；二是精度，反映在区间的长度，当然长度愈小愈好

7、。在样本例数确定的情况下，二者是矛盾的，需要兼顾。总体均数可信区间的计算方法：1 .当n小按t分布的原理用式计算可信区间为：X t ”/2, vSX2 .当n足够大因n足够大时，t分布逼近;1分布，按正态分布原理。用式估计可信区间为：X2Sx可信区间与医学参考值范围的区别：二者的意义和算法不同。四、假设检验的步骤1 .建立假设：H0 （无效，两样本代表的总体均数相同）（备择，两样本来自不同总体），当拒绝H0就接受H,不拒绝就不接受 H。2 .确定显着性水平：区分大概率和小概率事件的标准，通常取a=。3 .计算统计量：根据资料类型和分析目的选择适当的公式计算。4 .确定概率P值：将计算得到

8、的t值或u值查界值表得到 P值和a值比较。5 .做出推断结论。I t I值、P值与统计结论a1 t 1值P值统计结论不拒绝H,差别无统计学意义 (v)拒绝H,接受H,差别有统计学意义 (v)拒绝H,接受H,差别有高度统计学意义五、两均数的假设检验 (常考！)1 .样本均数与总体均数比较 u检验和t检验用于样本均数与总体均数的比较。理论上要求样本来自正态分布总体实际中，只要样本例数n较大，或n小但总体标准差b已知，就选用u检验。n较小且b未知时，用于 t检验。两样本均数比较时还要求两总体方差等。Xt SX以算得的统计量t ,按表所示关系作判断。2 .配对资料的比较在医学研究中，常用配

9、对设计。配对设计主要有四种情况：同一受试对象处理前后的数据；同一受试对象两个部位的数据；同一样品用两种方法(仪器等)检验的结果；配对的两个受试对象分别接受两种处理后的数据。情况的目的是推断其处理有无作用；情况、的目的是推断两种处理(方法等)的结果有无差别。tSdSd /. nv二对子数-1 ;如处理前后或两法无差别，则其差数 d的总体均数应为 0,可看作样本均数d和总体均数0的比较。d为差数的均数；S4为差数均数的标准误，Sd为差数的标准差;n为对子数。因计算的统计量是t ,按表所示关系作判断。3.完全随机设计的两样本均数的比较体均数科1与科2是否相等。根据样本含量t检验用于两本本含量

10、ni、两样本方差相差显着则需用 tu检验：两样本量足够大，n2较小时, 检验。n50。亦称成组比较。目的是推断两样本各自代表的总 n的大小，分u检验与t检验。且要求两总体方差相等，即方差齐。若被检验的Xi X2SX大2X2SC(nin2)nin2222 Si2(ni-1) S2(ni-1)sc-ni n2 - 2v=(ni-i)+(n 2-i)=n i+n2-2式中S,二，为两样本均数之差的标准误，Sc2为合并估计方差(combined estimateXi X2variance )。算得的统计量为t,按表所示关系做出判断。4 . I型错误和n型错误弃真，拒绝正确的 H为I型错误”表示，若显

11、着性水平a定为，则犯I型错误的概率；接受错误的H为n型错误，概率用3表示，3值的大小很难确切估计。当样本含量一定时，两者反比，增大 n,当a一定时，可减少3。 i-3称为检验效能或把握度，其统计意义是若两总体确有差别，按a水准能检出其差别的能力。客观实际拒绝H不拒绝HH成立I型错误（a）推断正确1- aH不成立推断正确（1-3）n型错误（3）5 .假设检验注意事项保证组间可比性；根据研究目的、资料类型和设计类型选用适当的检验方法，熟悉各种检验方法的应用条件；“显着与否”是统计学术语，为“有无统计学意义”，不能理解为“差别是不是大”；结论不能绝对化。第四节分类变量资料的统计描述（一般考点）相对

12、数是两个有关联事物数据之比。常用的相对数指标有构成比、率、相对比等。一、构成比表示事物内部各个组成部分所占的比重，通常以100为例基数，故又称为百分比。其公式如下：事物内部某一构成部分的个体数X 100%事物内部各构成部分的个体数总和该式可用符号表达如下：构成比=A X 100%ABC构成比有两个特点：（1）各构成部分的相对数之和为100%.（2）某一部分所占比重增大，其他部分会相应地减少。二、率用以说明某种现象发生的频率或强度，故又称频率指标，以100, 1000, 10000或100000为比例基数（K）均可，原则上以结果至少保留一位整数为宜，其计算公式为：率和构成比不同之处：率的大小仅

13、取决于某种现象的发生数和可能发生该现象的总数，不受其他指标的影响，并且各率之和一般不为1。.某现象实际发生例数.率=x K该式亦可用符号表达如下A（）阳性率=（J- X K （若算阴性率则分子为 A（-）A（） A（）式中A（+）为阳性人数，A（-）为阴性人数。三、相对比表示有关事物指标之对比，常以百分数和倍数表示，其公式为：相对比：甲指标/乙指标（或X 100%）或用符号表本为：A/B X K四、注意事项构成比和率的不同，不能以比代率；计算相对数时，观察例数不宜过小；率的比较注意可比性，特别是混杂因素的问题，有的话，可用标准化法和分层分析消除；观察单位不同的几个率的平均率不等于几个率的算术

14、均数；样本率或构成比的比较应做假设检验。第五节分类变量资料的统计推断（非常重要）一、率的抽样误差用抽样方法进行研究时，必然存在抽样误差。率的抽样误差大小可用率的标准误来表示，计算公式如下:o p=:兀（j式中：b p为率的标准误，兀为总体阳性率， n为样本含量。因为实际工作中很难知道总体阳性率兀，故一般采用样本率P来代替，而上式就变为Y(1nP)二、总体率的可信区间由于样本率与总体率之间存在着抽样误差，所以也需根据样本率来推算总体率所在的范围，根据样本含量 n和样本率P的大小不同，分别采用下列两种方法：(一)正态近似法(常考！)当样本含量n足够大，且样本率 P和(1-P)均不太小，如n

15、P或n (1-P)均 5时，样本率的分布近似正态分布。则总体率的可信区间可由下列公式估计：总体率(兀)的95%可信区间：p总体率(兀)的99%可信区间：p(二)查表法当样本含量n较小，如nW 50,特别是P接近0或1时，则按二项分布原理确定总体率的可信区间，其计算较繁，读者可根据样本含量 n和阳性数x参照专用统计学介绍的二项分布中 95%可信限表。三、u检验(非常重要！)当样本含量n足够大，且样本率 P和(1-P)均不太小，如nP或n (1-P)均 5时，样本率的分布近似正态分布。样本率和总体率之间、两个样本率之间差异的判断可用u检验。1 .样本率和总体率的比较公式u= | p-兀| /(tp= | p-兀| / 兀(1兀)n ；2 .两样本率比较公式u= |P1-P2|/Sp1-P2=1P1-P21/ Jpc(1pc)(1/n11/n2)2 .也

展开阅读全文

卫生统计学重点笔记

最新文档