医学统计学-知识梳理

资源描述

《医学统计学-知识梳理》由会员分享，可在线阅读，更多相关《医学统计学-知识梳理（12页珍藏版）》请在金锄头文库上搜索。

1、均数方差标准差均数标准差/标准误样本 X2S估计值 XS总体 2 均数2.58 标准差：表示集中位置、离散程度均数2.58 标准误：表示平均水平、抽样误差大小 P75一、标准差的主要作用是估计正常值的范围实际应用中，估计观察值正常值范围应该用标准差（s），表示为“Mean SD”。此写法综合表达一组观察值的集中和离散特征的变异情况，说明样本平均数对观察值的代表性。s 的大或小说明数据取值的分散或集中。s 与样本均数合用, 主要是在大样本调查研究中,对正态或近似正态分布的总体正常值范围进行估计。如果不是为了正常值范围估计，一般不用。当数据与正态分布相差很大，或者虽为正态分布, 但样本容

2、量太小(小于 30 或 100)，也不宜用估计正常值范围。二、标准差还可用来计算变异系数（CV）当两组观察值单位不同, 或两均数相差较大时，不能直接用标准差比较其变异程度的大小, 须用变异系数系数来做比较。：2.2 标准误的正确使用一、标准误用来衡量抽样误差的大小和了解用样本平均数来推论总体平均数的可靠程度。在抽样调查中，往往通过样本平均数来推论总体平均数，样本标准误适用于正态或近似正态分布的数据, 是主要描述小样本试验中，样本容量相同的同质的多个样本平均均数间的变异程度的统计量。即如果多次重复同一个试验, 它们之间的变异程度用。显然它越小，样本平均数变异越小，越稳定，用样本平均数估计总

3、体均数越可靠。因此，为说明它的稳定性、可靠性或通过几个对几组数据进行比较(这是科研论文中最常见的) ，应当用描述数据。实际应用中应该写成“平均数标准误”或而英文表示为“Mean SE” 的形式。二、标准误还可以进行总体平均数的区间估计与点估计（置信区间）。根据正态分布原理，与合用还可以给出正态总体平均数的可信区间估计即推论总体平均数的可靠区间，例如常用（其中 t0.05 (n-1)为样本容量是 n 的 t 界值）表示总体均值的 95%可信区间, 意指总体平均数有 95%的把握在所给范围内。三、标准误还可用来进行平均数间的显著性检验，从而判断平均数间的差别是否是由抽样误差引起的。例

4、如：某当地小麦良种的千粒重=34 克，现在从外地引入一新品种，通过多小区的田间试验得到千粒重的平均数=35.2 克，问新引进品种千粒重与当地良种有无显著差异？新引进品种千粒重与当地良种有无显著差异实质是判断与的差别是否是有田间试验是抽样误差引起，所以要进行显著性检验，这里用 t 测验进行检验，而，由于，故，所以认为新引进品种千粒重与当地良种千粒重的不同是由于田间试验是抽样误差引起，因此他们之间无显著差异。所以在进行平均数间的显著性检验是必须用到。总之，标准差和标准误最常用的统计量，二者都是衡量样本变量(观察值) 随机性的指标，只是从不同角度来反映误差，二者在统计推断和误差分析中都有重要的应用。

5、如果没有标准差，人们就无法看出一组观察值间变异程度有多大，这些数字到底有无代表性，如果没有标准误又很难看出我们的样本平均数是否可以代表总体平均数。所以二者都非常重要。定量资料的统计描述：频数分布表：全距，R=最大值- 最小值；组距 =全距/组数，（组数 8-9 人一组）频数分布图：直方图集中位置的描述：平均数 31.算数均数：总体均数，样本均数。适用定量资料，对称分布，正态或近似正态X2.几何均数：G，适用变量值呈倍数关系，偏态尤其对数变换后正态或近似正态3.中位数：M，各种分布（不对称，两端无确切值，分布不明确），正态等于算数均数，对数正态等于几何均数。离散程度描述：51.极差：R，

6、同全距，各种分布，但一般单峰、对称、小样本2.四分位数间距：P 75P25，（不对称，两端无确切值，分布不明确），P 25， P50， P75，共三点将全部观察值分为四部分3.方差：总体 2，样本 S2（计算时除以自由度 n-1）。单峰对称。4.标准差：总体，样本 S。单峰对称，对数变换后正态或近似正态使用几何标准差。5.变异系数：CV=S/ *100%。适用不同计量单位（身高和体重），或均数相差很大X正态分布及其应用：N(, 2)特征：4横轴上方均数处最高；均数为中线，左右对称；位置参数/总体均数，形态参数/标准差；曲线下面积分布有一定规律，对称，1.64590.00%，1.96

7、95.00%，2.5899.00%。6.正态分布：N（，）经标准化转换为标准正态分布/Z 分布：Z （0,1）2XZ7.制定医学参考限值时，分双侧（）、单侧，单侧又分只有下限（-）、只有上限（+）。定性资料描述：分类/计数资料，性别，疾病感染情况，病情轻重.，相对数进行统计描述。相对数：31.率：频率（发病率、患病率），0 到 1 之间；速率（肿瘤患者 5 年生存率），分母乘以时间数（125 人追踪 2 年死亡 2 人，年死亡率=2/125*2 *100%）0 到。2.构成比:3.相对比：两个有关联的指标比值（变异系数，相对危险度，比值比.）应用注意：足够的观察单位数；不能以构成比代替率

8、，事物内部各组分所占比重不能说明某现象发生的频率或强度大小；分别将分子和分母合计求合计率；相对数的比较注意可比性，其他的年龄、性别等相同或相近，可分层或标准化再比较；样本率、样本构成比应做假设检验再比较（是比较其所代表的总体有无差异）。率的标准化：标准化率：p= （p i 被标化组死亡率，N i 标准组年龄别人口，N 标准组总人口）i标准化死亡率比：SMR=被标化组实际死亡数/预期死亡数被标化组实际死亡数= 本年龄组死亡率 *标准组本年龄组人口（用被标化组年龄别死亡率去预测标准人口中可能死亡人数）总体均数的估计：抽样误差：由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。样本均数的

9、标准差= 均数的标准误，其估计值：（进行一次抽样即可估计均数标准误）nSXt 分布（总体均数的区间估计，t 检验.）1nS/-Xv，t 分布特征：以 t=0 为左右对称的单峰分布；曲线形态取决于自由度大小，n 越小，越大，样本间差异越大，n，t 分布就是标准正态分布（Z 分布）。X总体均数的估计：点估计用作为，无法评价可信程度。X区间估计：21、单样本：n 不论大小，双侧（1-）置信区间（确切法）XvSt，2/n100，t 接近 Z，双侧（1-）置信区间（1.645 1.96 2.58）（正态近似法）vZ，2/2、两样本：两均数之差的标准误： n 1、n 2 不论大小，

10、（确切法）)1(221nSCX n 1、n 2 均较大时，t 接近 Z，则（正态近似法）2121SCX两总体均数差值的置信区间：（ 1 2）为（t 与 Z 根据条件可互换）21/21-Xvt，t 检验:Students t 检验，从样本均数推总体均数条件：t 检验，单样本中，n50，总体正态分布。t检验，两小样本，总体正态分布，但两样本总体方差不等。公式好复杂，P 96Z 检验，两大样本，n 均50，单峰、近似正态。1、单样本 t 检验：样本所代表的总体均数与已知总体均数 0 比较 1nS/-Xt0v，2、配对 t 检验：配对的两受试对象分别接受 2 种不同处理；同一样品用两种方法或仪

11、器检测；同一受试对象两不同部位测定数据。H0 为两总体均数相同，差值的样本均数所代表的总体均数为 0，则dd（n 为对子数）1/Sn/0-dtdv，3、两独立样本/成组 t 检验：两样本分别正态分布， H0 为两总体均数相等，则 n 1、n 2 不论大小，（确切法）2)21(1nvnSXtc， n 1、n 2 均50，t 接近 Z，（正态近似法）21nSX4、两样本几何均数 t 检验：（抗体滴度等）不服从正态，但服从对数正态，公式同成组 t 检验。正态性检验：图示法：P-P 图法，Q-Q 图法统计检验法：W 检验（n50），矩法检验（总体偏度、峰度），D 检验方差齐性检验：两总体方差齐性

12、检验，判断两总体方差是否相等，F 检验（进行假设检验，=0.10 ，查 F 界值表）1(2121 nvSF，（较小）较大）多样本方差齐性检验：q 检验！Levene 检验（可两总体）， Bartlett 检验。用于方差分析。方差分析 ANOVA/F 检验：总体均数之间差别？多样本均数的比较，通过对数据变异的分析来推断两个/多个样本均数所代表的总体均数是否有差别。应用条件：各样本是相互独立的随机样本，均服从正态；各样本总体方差相等，即方差齐性。总变异：数据的均方 MS 总，处理影响+随机误差（个体差异+测量误差）组间变异：MS 组间，处理因素的影响组内变异：MS 组内，随机误差的

13、影响)21,vMSF分母（服从自由度分子组内组间1、完全随机设计资料：成组设计的多个样本，单因素两水平/多水平方差分析。 3 变异NXC2）（ )540(Tn，同质的受试对象随机分配到各处理组，各组样本含量相等或不等。SS 总 =SS 组间 +SS 组内 V 总 =V 组间 +V 组内 1XMS2总NCNXCknXvi 221/S）（，）（组间组间组间 v 总 =N-1 V 组间 =k-1 V 组内 =N-k ) v1 组间，v2 组内21,vF分母（服从自由度分子组内组间注意：总体均数不全相同，两两之间比较用另外的方法。2、随机区组设计资料；配

14、伍组设计，两因素。3 变异受试对象按照性质分成 b 个区组/配伍组，每个区组随机分配到 k 个处理组。MS 总 =MS 处理组 +MS 区组 +MS 误差 v 总 =v 处理组 +v 区组 +v 误差 =(处理-1)+(区组-1)+误差=N-1 S=M处理误差处理处理， vSF区组误差区组区组，F同理：总体均数不全相同，两两之间比较用另外的方法。3、多个样本均数两两比较，即上面的“注意”、“同理”SNK 法，q 检验 Dunnett-t 检验4、交叉设计资料，分两阶段和多阶段（）两阶段交叉设计：一、二组患者和 A、B 处理方法，一患者服药顺序 AB ，二组患者 BA。5、析

15、因设计资料6、重复测量资料检验：样本率或构成比推总体率/构成比之间两个及以上的比较2x1、独立样本列联表资料1）22 列联表（四格表）成组连续性校正（Yates 校正）3 种 )()(22cdbanx（n40，1T5） -22（n40，或 T1）（确切概率法，以上均适用）A 实际频数，T 理论频数（总有效率乘以各组人数）Tx222）R 行C 列列联表资料多个样本率/两个或多个构成比 v=(R-1)(C-1)122CRnx注意：必须绝对数，不能相对数，因 x2 与频数有关；理论频数太小：1/5 以上格子的理论频数5，或一个格子理论频数1。或计算最小理论频数5，可以计算；（太小解决方法：增大样本含量；确切概率法；与邻近行或列合并；删去）。总数数的乘积最小行、列对应的合计minT有序多分类变量用秩和检验/Ridit 检验；多个样本率（或构成比）拒绝无效假设时，只能说各总体率之间总的来说有差别，不能说明彼此之间有差别或两者之间有差别。2、配对设计资料 1）配对 22 列联表配对设计且结果为“二分类”（独立列联表数据相互独立，配对设计为研究对象先按某

展开阅读全文