医学统计学知识点汇总

资源描述

《医学统计学知识点汇总》由会员分享，可在线阅读，更多相关《医学统计学知识点汇总（19页珍藏版）》请在金锄头文库上搜索。

1、医学统计学总结绪论1、随机现象：在同一条件下进行试验，一次试验结果不能确定，而在一定数量的重复试验之后呈现统计规律的现象。2、同质：统计学中对研究指标影响较大的，可以控制的主要因素。3、变异：同质基础上各观察单位某变量值的差异。数值变量：变量值是定量的，由此而构成的资料称为数值变量资料或计量资料，其数值是连续性的，称之为连续型变量。变量无序分类变量：所分类别或属性之间无顺序和程度上的差异分类变量：定性变量有序分类变量：有顺序和程度上的差异4、总体：根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。可以分为有限总体和无限总体。5、样本：是按随机化原则从同质总体中随机抽取的部分

2、观察单位某变量值的集合。样本代表性的前提：同质总体，足够的观察单位数，随机抽样。统计学中，描述样本特征的指标称为统计量，描述总体特征的指标称为参数。6、概率：描述随机事件发生的可能性大小的一个度量。若P（A）=1，则称A为必然事件；若P（A）=0，则称A为不可能事件；随机事件A的概率为0P1.小概率事件：若随机事件A的概率P，则称随机事件A为小概率事件，其统计学意义为：小概率事件在一次随机试验中认为是不可能发生的。统计描述1、频数分布有两个重要的特征：集中趋势和离散程度。频数分布有对称分布和偏态分布之分。后者是指频数分布不对称，集中趋势偏向一侧，如偏向数值小的一侧为正偏态分布，如偏向数值大的一

3、侧为负偏态分布。2、常用的集中趋势的描述指标有：均数，几何均数，中位数等。均数:适用于正态或近似正态的分布的数值变量资料。样本均数用表示，总体均数用表示。几何均数：适用于等比级数资料和对数呈正态分布的资料。注意观察值中不能有零，一组观察值中不能同时有正值和负值。中位数：适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。3、常用的离散程度的描述指标有：全距，四分位数间距，方差，标准差，变异系数。全距：任何资料，一组中最大值与最小值的差。四分位数间距：适用于偏态分布以及分布的一端或两端无确切数据资料。方差和标准差：正态分布资料。标准差表示观察值的变异度的大小。变异系数：比较度量单位不同或

4、均数相差悬殊的两组资料的变异度。4、标准正态分布：对正态分布的（X-）/进行u的变换，u=（X-）/,则正态分布变换为=0，=1的标准正态分布，亦称u分布。u被称为标准正态变量或标准正态离差。两个参数：是位置参数，是形状参数。用N（0,1）表示标准正态分布。常用估计医学参考值范围的方法有：（1）正态分布方法：适用于正态或近似正态分布的资料。双侧界值：Xu/2S 单侧上界：X+uS，或单侧下界：X-uS（2）对数正态分布方法：适用于对数正态分布资料。双侧界值：Lg-1（X lgxu/2S lgx ）单侧上界：Lg-1（X lgx +uS lgx），或单侧下界：Lg-1（X lgx -uS

5、lgx）（3）百分位数法：用于偏态分布资料以及资料中一端或两端无确切数值的资料。双侧上界：P2.5和P97.5；单侧上界：P95，或单侧下界：P5参考值范围（%）单侧双侧80 0.842 1.282 90 1.282 1.645 95 1.645 1.96 99 2.326 2.576常用的u值表5、分类变量资料的统计描述：常用相对数指标描述，包括：率，构成比，相对比。率：说明某现象发生的频率或强度。（病死率不等于死亡率）构成比：说明某现象内部组成部分所占的比重或分布，常以百分数表示。相对比：亦称比，是A、B 2个有关指标之比，说明A为B的若干倍或百分之几。两个指标可以性质相同，也可以性质

6、不同。应用相对数时的注意事项： 1、计算相对数的分母不宜过小；2、分析时不能以构成比代替率；3、对观察单位数不等的几个率，不能直接相加求其平均率；4、比较相对数时应注意其可比性；5、对样本率（或构成比）的比较应遵循随机抽样，并做假设检验。6、标准化法：标准化的目的在于消除混杂因素对结果的影响，使资料更具有可比性。其基本思想是：将所比较的两组或多组资料的构成按统一的“标准”调整后，计算标化率，使其更具有可比性。标准化率的计算方法：亦称标化率，直接法用于已知被标化组的年龄别率，以及已知标准组的年龄别人口数或年龄别人口构成比时；间接法用于已知被标化组的年龄别人口数与发病（死亡）总数，但年龄别率未知，

7、以及已知标准组年龄别发病（死亡）率与总发病（死亡）率时。通常可从下列3种方法选用标准组：以两组资料中任一组的年龄别人口数或构成比作为标准组；以两组资料合并的各年龄组的人口数或构成比作为标准组；以公认的或便于与他人资料比较的标准作为标准组。7、统计表：结构：由标题、标目、线条和数字构成。编制统计表的要求：标题：概括表的内容，列于表的上方居中，应注明时间和地点；标目：主语和谓语分别列于横、纵标目，文字简明，层次清楚。横标目列于表的左侧，通常为被研究的事物，纵标目列于表的上端，为说明横标目的统计指标。线条：通常，除表的顶线、底线、纵标目下以及合计上的横线外，其余线条均省去，顶线和底线应略粗些，表的左

8、上角不宜用斜线。数字：用阿拉伯数字表示，同一指标的小数位数要一致并对齐，数字暂缺或无数字者分别用“”或“-”表示，数字为0者要记作“0”，不应空项，为方便核实和分析，应有合计。备注：一般不列入表内，必要时可用“*”标出，列于表下。8、统计图：条图：用于相互对比关系的资料；圆图与百分条图：适用于百分构成比资料，表示事物各组成部分所占的比重或构成；线图：用于连续性资料，用于说明事物在时间上的发展变化，或某现象随另一现象而变动的情况；直方图：表示连续性资料的频数分布；散点图：适用于直线相关分析，说明两个变量间的数量关系和变化趋势。抽样分布与参数估计抽样研究的目的是用样本信息来推断总体特征，即统计推断

9、，包括两个内容：一是总体参数的估计，二是假设检验。1、抽样误差：由于变异的存在，抽样研究所造成的样本统计量与总体参数之间的差异或各样本统计量之间的差异称为抽样误差。常用标准误反映均数抽样误差的大小；用率的标准误p反映率的抽样误差的大小；用Possion计数的标准误反映其抽样误差的大小。2、中心极限定理和正态分布推理：从正态分布N（，2）总体中以固定n随机抽取样本，样本均数的分布仍服从正态分布，即使是从偏态分布总体中随机抽样，只要n足够大，的分布也近似正态分布。样本均数的均数仍为，样本均数的标准差为。样本均数的抽样误差（简称标准误）是反映均数抽样误差大小的指标。 = 用样本均数S作为的估计值，

10、则=3、t分布：将看成变量值，那么可将正态变量进行u变换（u=-/）后，也可将N（，）变换成标准正态分布N（0，1）。常用s作为的估计值，统计量为t，此分布为t分布。统计量 t= t曲线的形态变化与自由度v的大小有关。v越小，t值越分散，曲线越低平，v逐渐增大时，则t分布逐渐逼近正态分布，当v=无穷大时，t分布即为u分布。4、总体均数的估计有两种方法：一种是点估计，即用统计量估计总体均数；二是区间估计，亦称可信区间。（1）未知且n小：-t/2，v sx+t/2，v sx（2）未知，但n足够大，t分布逼近u分布：-u/2sx+u/2sx（3）已知：-u/2x+u/2x标准差和标准误的比较标准差

11、标准误S= =表示观察值的变异程度大小估计均数的抽样误差大小计算变异系数CV=100% 估计总体均数可信区间 -t/2，v sx+t/2，v sx确定医学参考值的范围进行假设检验计算标准误数值变量资料的假设检验1、假设检验的原理：假设在一次抽样研究中得出了u1.96，则P0.05，此为小概率事件，依据“小概率事件在一次随机试验中认为是不可能发生的”的定理，可认为此样本不是来自该总体。2、步骤：建立假设和确定检验水准；假设有两种，一种是检验假设，常称无效假设或零假设，记为H0，假设样本所代表的总体参数与已知总体参数相等；另一种是备择假设，记为H1，是与H0相联系且对立的假设；检验水准，亦称

12、显著性水准，是判断拒绝或不拒绝H0，也是允许犯型错误的概率，通常用0.05。选定检验方法和计算统计量确定P值，做出推断结论。P值是指从H0所规定的总体中随机抽样时，获得等于及大于现有样本统计量的概率。3、t检验：适用于：样本均数与总体均数比较（未知且n50或n30）；成组设计的两小样本均数的比较（n1，n2均小于30或50）；配对设计的两样本均数比较。应用条件：当样本含量较小（n50或n30）时，要求样本来自正态分布总体；用于成组设计的两样本均数比较时，要求两样本来自总体方差相等的总体。4、单样本t检验：用于样本均数与已知总体均数的比较，研究目的是推断样本所代表的总体均数与已知总体均数0有无差

13、别。统计量t= v=n-15、配对t检验：用于配对设计资料的两均数的比较。其研究目的是推断某种处理有无作用，或两种处理的效果有无差别。配对设计类型有3种：先将受试对象按配比条件配对，然后用随机分组方法将各对中的2个受试对象分别分配到不同的处理组；同一对象分别接受2种不同处理；同一对象处理前后。t= （是差值的样本均数）v=n-16、两样本t检验：用于完全随机设计的两样本均数的比较，两个样本来自两个总体，其研究目的是推断两样本所分别代表的总体均数是否相等。t= v=n1+n2-27、单样本u检验：用于样本均数与已知总体均数比较，其研究目的同t检验。研究目的是推断样本所代表的总体均数与已知总体均数

14、0有无差别。其统计量 u=8、两样本的u检验：用于完全随机设计的两样本均数的比较，两个样本来自两个总体，其研究目的是推断两样本所分别代表的总体均数是否相等。其统计量为：u=9、正态性检验和方差齐性检验：资料在做假设检验之前首先应该检验资料是否来自正态总体，并且它们的方差是否齐。10、两类错误：型错误：拒绝了实际上成立的H0,即样本来自=0的总体，由于抽样的偶然性，按=0.05检验水准拒绝了H0,接受H1。这类在假设检验中拒绝了原本正确的H0的错误称为型错误。，理论上犯型错误的概率为，值得大小视研究目的而定。通常设=0.05。型错误：不拒绝了实际上不成立的H0, 即样本来自0的总体，由于抽样的偶然性，按=0.05检验水准不拒绝H0，这类在假

展开阅读全文