医学统计学知识点汇总

资源描述

《医学统计学知识点汇总》由会员分享，可在线阅读，更多相关《医学统计学知识点汇总（17页珍藏版）》请在金锄头文库上搜索。

1、医学统计学总结绪论1、随机现象：在同一条件下进行试验，一次试验结果不能确定，而在一定数量的重复试验之后呈现统计规律的现象。2、同质：统计学中对研究指标影响较大的，可以控制的主要因素。3、变异：同质基础上各观察单位某变量值的差异。数值变量：变量值是定量的，由此而构成的资料称为数值变量资料或计量资料，其数值是连续性的，称之为连续型变量。变量无序分类变量：所分类别或属性之间无顺序和程度上的差异分类变量：定性变量有序分类变量：有顺序和程度上的差异4、总体：根据研究目的确定的同质研究对象中所有观察单位某变量值的集合。可以分为有限总体和无限总体。5、样本：是按随机化原则从同质总体中随机抽取的部分观察

2、单位某变量值的集合。样本代表性的前提：同质总体，足够的观察单位数，随机抽样。统计学中，描述样本特征的指标称为统计量，描述总体特征的指标称为参数。6、概率：描述随机事件发生的可能性大小的一个度量。若 P（A）=1，则称 A 为必然事件；若 P（A）=0，则称 A 为不可能事件；随机事件 A 的概率为 0P1.小概率事件：若随机事件 A 的概率 P，则称随机事件 A 为小概率事件，其统计学意义为：小概率事件在一次随机试验中认为是不可能发生的。统计描述1、频数分布有两个重要的特征：集中趋势和离散程度。频数分布有对称分布和偏态分布之分。后者是指频数分布不对称，集中趋势偏向一侧，如偏向数值小的一侧为正偏

3、态分布，如偏向数值大的一侧为负偏态分布。2、常用的集中趋势的描述指标有：均数，几何均数，中位数等。均数:适用于正态或近似正态的分布的数值变量资料。样本均数用表示，总体均数用x 表示。几何均数：适用于等比级数资料和对数呈正态分布的资料。注意观察值中不能有零，一组观察值中不能同时有正值和负值。中位数：适用于偏态分布资料以及频数分布的一端或两端无确切数据的资料。3、常用的离散程度的描述指标有：全距，四分位数间距，方差，标准差，变异系数。全距：任何资料，一组中最大值与最小值的差。四分位数间距：适用于偏态分布以及分布的一端或两端无确切数据资料。方差和标准差：正态分布资料。标准差表示观察值的变异度的大小

4、。变异系数：比较度量单位不同或均数相差悬殊的两组资料的变异度。4、标准正态分布：对正态分布的（X-）/ 进行 u 的变换，u=（X-）/,则正态分布变换为 =0，=1 的标准正态分布，亦称 u 分布。u 被称为标准正态变量或标准正态离差。两个参数：是位置参数，是形状参数。用 N（0,1）表示标准正态分布。常用估计医学参考值范围的方法有：（1）正态分布方法：适用于正态或近似正态分布的资料。双侧界值：Xu /2 S 单侧上界：X+u S，或单侧下界：X-u S（2）对数正态分布方法：适用于对数正态分布资料。双侧界值：Lg -1（X lgxu/2 S lgx ）单侧上界：Lg -1（X l

5、gx +u S lgx），或单侧下界：Lg -1（X lgx -u S lgx）（3）百分位数法：用于偏态分布资料以及资料中一端或两端无确切数值的资料。双侧上界：P 2.5和 P97.5；单侧上界：P 95，或单侧下界：P 5常用的 u 值表5、分类变量资料的统计描述：常用相对数指标描述，包括：率，构成比，相对比。率：说明某现象发生的频率或强度。（病死率不等于死亡率）构成比：说明某现象内部组成部分所占的比重或分布，常以百分数表示。相对比：亦称比，是 A、B 2 个有关指标之比，说明 A 为 B 的若干倍或百分之几。两个指标可以性质相同，也可以性质不同。应用相对数时的注意事项：1、计算相对数

6、的分母不宜过小；2、分析时不能以构成比代替率；3、对观察单位数不等的几个率，不能直接相加求其平均率；4、比较相对数时应注意其可比性；5、对样本率（或构成比）的比较应遵循随机抽样，并做假设检验。6、标准化法：标准化的目的在于消除混杂因素对结果的影响，使资料更具有可比性。其基本思想是：将所比较的两组或多组资料的构成按统一的“标准”调整后，计算标化率，使其更具有可比性。标准化率的计算方法：亦称标化率，直接法用于已知被标化组的年龄别率，以及已知标准组的年龄别人口数或年龄别人口构成比时；间接法用于已知被标化组的年龄别人口数与发病（死亡）总数，但年龄别率未知，以及已知标准组年龄别发病（死亡）率与总发病（死

7、亡）率时。通常可从下列 3 种方法选用标准组：以两组资料中任一组的年龄别人口数或构成比作为标准组；以两组资料合并的各年龄组的人口数或构成比作为标准组；以公认的或便于与他人资料比较的标准作为标准组。7、统计表：结构：由标题、标目、线条和数字构成。编制统计表的要求：标题：概括表的内容，列于表的上方居中，应注明时间和地点；标目：主语和谓语分别列于横、纵标目，文字简明，层次清楚。横标目列于表的左侧，通常为被研究的事物，纵标目列于表的上端，为说明横标目的统计指标。线条：通常，除表的顶线、底线、纵标目下以及合计上的横线外，其余线条均省去，顶线和底线应略粗些，表的左上角不宜用斜线。参考值范围（%）单侧双

8、侧80 0.842 1.28290 1.282 1.64595 1.645 1.9699 2.326 2.576数字：用阿拉伯数字表示，同一指标的小数位数要一致并对齐，数字暂缺或无数字者分别用“”或“-”表示，数字为 0 者要记作“0” ，不应空项，为方便核实和分析，应有合计。备注：一般不列入表内，必要时可用“*”标出，列于表下。8、统计图：条图：用于相互对比关系的资料；圆图与百分条图：适用于百分构成比资料，表示事物各组成部分所占的比重或构成；线图：用于连续性资料，用于说明事物在时间上的发展变化，或某现象随另一现象而变动的情况；直方图：表示连续性资料的频数分布；散点图：适用于直线相关分析，说明

9、两个变量间的数量关系和变化趋势。抽样分布与参数估计抽样研究的目的是用样本信息来推断总体特征，即统计推断，包括两个内容：一是总体参数的估计，二是假设检验。1、抽样误差：由于变异的存在，抽样研究所造成的样本统计量与总体参数之间的差异或各样本统计量之间的差异称为抽样误差。常用标准误反映均数抽样误差的大小；用率的标准误 p反映率的抽样误差的大小；用xPossion 计数的标准误反映其抽样误差的大小。2、中心极限定理和正态分布推理：从正态分布 N（， 2）总体中以固定 n 随机抽取样本，样本均数的分布仍服从正态分布，即使是从偏态分布总体中随机抽样，只要 n 足够大，x的分布也近似正态分布。样本均数

10、的均数仍为，样本均数的标准差为。x样本均数的抽样误差（简称标准误）是反映均数抽样误差大小的指标。x= 用样本均数 S 作为的估计值，则 =xn xsnS3、t 分布：将看成变量值，那么可将正态变量进行 u 变换（u= -/）后，也可将x xN（，）变换成标准正态分布 N（0，1）。常用 s 作为的估计值，统计量为 t，此分2x布为 t 分布。统计量 t= t 曲线的形态变化与自由度 v 的大小有关。v 越小，t 值越分xs散，曲线越低平，v 逐渐增大时，则 t 分布逐渐逼近正态分布，当 v=无穷大时，t 分布即为u 分布。4、总体均数的估计有两种方法：一种是点估计，即用统计量

11、估计总体均数；二是区间估x计，亦称可信区间。（1）未知且 n 小： -t/2，v sx +t/2，v sxx（2）未知，但 n 足够大，t 分布逼近 u 分布： -u/2 sx +u/2 sx（3）已知： -u/2 x +u/2 x标准差和标准误的比较标准差标准误S= =1)(2nx xsn表示观察值的变异程度大小估计均数的抽样误差大小计算变异系数 CV= 100% 估计总体均数可信区间xs-t/2，v sx +t/2，v xsx确定医学参考值的范围进行假设检验计算标准误数值变量资料的假设检验1、假设检验的原理：假设在一次抽样研究中得出了 u1.96，则 P0.05，此为小概率事

12、件，依据“小概率事件在一次随机试验中认为是不可能发生的”的定理，可认为此样本不是来自该总体。2、步骤：建立假设和确定检验水准；假设有两种，一种是检验假设，常称无效假设或零假设，记为 H0，假设样本所代表的总体参数与已知总体参数相等；另一种是备择假设，记为H1，是与 H0相联系且对立的假设；检验水准，亦称显著性水准，是判断拒绝或不拒绝 H0，也是允许犯型错误的概率，通常用 0.05。选定检验方法和计算统计量确定 P 值，做出推断结论。P 值是指从 H0所规定的总体中随机抽样时，获得等于及大于现有样本统计量的概率。3、t 检验：适用于：样本均数与总体均数比较（未知且 n50 或 n30）；成组

13、设计的两小样本均数的比较（n 1，n 2均小于 30 或 50）；配对设计的两样本均数比较。应用条件：当样本含量较小（n50 或 n30）时，要求样本来自正态分布总体；用于成组设计的两样本均数比较时，要求两样本来自总体方差相等的总体。4、单样本 t 检验：用于样本均数与已知总体均数的比较，研究目的是推断样本所代表的总体均数与已知总体均数 0有无差别。统计量 t= v=n-1n/s0x5、配对 t 检验：用于配对设计资料的两均数的比较。其研究目的是推断某种处理有无作用，或两种处理的效果有无差别。配对设计类型有 3 种：先将受试对象按配比条件配对，然后用随机分组方法将各对中的 2个受试对象分别

14、分配到不同的处理组；同一对象分别接受 2 种不同处理；同一对象处理前后。t= （是差值的样本均数）v=n-1n/sd6、两样本 t 检验：用于完全随机设计的两样本均数的比较，两个样本来自两个总体，其研究目的是推断两样本所分别代表的总体均数是否相等。t= = = v=n1+n2-221xS)1(2nsxc)1(2)1( 22 nnssx7、单样本 u 检验：用于样本均数与已知总体均数比较，其研究目的同 t 检验。研究目的是推断样本所代表的总体均数与已知总体均数 0有无差别。其统计量 u= n/s0x8、两样本的 u 检验：用于完全随机设计的两样本均数的比较，两个样本来自两个总体，其研究目的是推断两样本所分别代表的总体均数是否相等。其统计量为：u= =21xs21/nsx9、正态性检验和方差齐性检验：资料在做假设检验之前首先应该检验资料是否来自正态总体，并且它们的方差是否齐。10、两类错误：型错误：拒绝了实际上成立的 H0,即样本来自 = 0的总体，由于抽样的偶然性，按=0.05 检验水准拒绝了 H0,接受 H1。这类在假设检验中拒绝了原本正确的 H0的错误称为型错误。，理论上犯型错误的概率为，值得大小视研究目的而定。通常设 =0.05。型错误：不拒绝了实际上不成立的 H0, 即样本来自 0的总体，由于

展开阅读全文

医学统计学知识点汇总

最新文档