医学统计学复习要点

资源描述

《医学统计学复习要点》由会员分享，可在线阅读，更多相关《医学统计学复习要点（20页珍藏版）》请在金锄头文库上搜索。

1、第一章绪论1、数据/资料的分类：、计量资料，又称定量资料或者数值变量；为观测每个观察单位某项治疗的大小而获得的资料。、计数资料，又称定性资料或者无序分类变量；为将观察单位按照某种属性或者类别分组计数，分组汇总各组观察单位数后而得到的资料。、等级资料，又称半定量资料或者有序分类变量。为将观察单位按某种属性的不同程度分成等级后分组计数，分类汇总各组观察单位数后而得到的资料。2、统计学常用基本概念：、统计学（statistic是关于数据的科学与艺术，包括设计、搜集、整理、分析和表达等步骤，从数据中提炼新的有科学价值的信息。、总体（population）指的是根据研究目的而确定的同

2、质观察单位的全体。、医学统计学（medical statistics）:用统计学的原理和方法处理医学资料中的同质性和变异性的科学和艺术，通过一定数量的观察、对比、分析，揭示那些困惑费解的医学问题背后的规律性。、样本（sample）:指的是从总体中随机抽取的部分观察单位。、变量（variable）:对观察单位某项特征进行测量或者观察，这种特征称为变量。、频率（frequency）:指的是样本的实际发生率。、概率（probability ）：指的是随机事件发生的可能性大小。用大写的P表示。3、统计工作的基本步骤：、统计设计：包括对资料的收集、整理和分析全过程的设想与安排；、收集资料

3、：采取措施取得准确可靠的原始数据；、整理资料：将原始数据净化、系统化和条理化；、分析资料：包括统计描述和统计推断两个方面。频数分布的类型包括对称分布和偏态分布；偏态分布主要分为右偏态分布（也称正偏态分布）和左偏态分布（也称负偏态分布）。频数表的用途包括以下几个方面：、描述频数分布的类型；、描述频数分布的特征；、便于发现一些特大或特小的离群值；、便于进一步做统计分析和处理。2. 集中趋势指标的适用条件、计算方法和意义。统计学用平均数（average）这一指标体系来描述一组变量值的几种位置或者平均水平。常用的平均数有算术均数、几何均数和中位数。、算数均数，简称均数（mean），可

4、用于反映一组呈对称分布的变量值在数量上的平均水平。计算方法包括直接计算法和频数表法（公式见2-2）。、几何均数（geometric mean），可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平，在医学研究中常用于免疫学的指标。（计算公式见于2-3）、中位数（median），适用于各种分布类型的资料，尤其是偏态分布资料和一端或者两端无确切数值的资料。、百分位数（percentile）是一种位置指标，是一个界值，其重要用途是确定医学参考值范围（reference range）。直接计算法（公式见于 2-7、2-8）频数表法（2-9、2-10）第二章计量资料的统计描述1. 频数

5、表的编制方法，频数分布的类型及频数表的用途、求极差（range）:也称全距，即最大值和最小值之差，记作R；、确定组段数和组距，组段数通常取10-15组；、根据组距写出组段，每个组段的下限为L,上限为U，变量X值得归组统一定为L w X v U，最后一组包括下限。、分组划记并统计频数。3、离散趋势指标的适用条件、计算方法和意义。描述数据变异大小的常用统计指标有极差、四分位数间距、方差、标准差和变异系数。、极差，一组变量值的最大值与最小值之差。、四分位数间距（quartile range , QR）是把全部变量值分为四部分的分位数后，由第3四分位数和第1四分位数相减而得。它一般和中位数

6、一起描述偏态分布资料的分布特征。QR=P75-P25。单侧:、方差(variance)也称均方差(mean square deviation )离均差平方和与样本含量的比值。计算公式为2-11、标准差(standard deviation)是方差的正平方根，其单位与原变量值得单位相、百分位数法：适用于偏态分布资料医学参考值范围的制定，所要求的样本含量比正态分布要多(不低于100 )。同。计算公式为 2-13、2-14计算公式为2-25、2-26:双侧：单侧:、变异系数(coefficient of variation)记作CV，多用于观察指标单位不同时, 或者均数相差较大时两者变异程度

7、的比较。计算公式为2-164. 正态分布的图形，正态分布的特征，正态曲线下面积的分布规律。正态分布的特征：、在直角坐标的横轴上方呈钟形曲线，两端与X轴永不相交，且以 X=卩为对称轴，左右完全对称。、在X=卩处，f (X)取最大值，远离卩，其值越小。、正态分布有两个参数，位置参数(1和形态参数(T , (1决定正态分布的曲线在坐标轴上的左右移动，越大越右移；6决定曲线的弓背程度，越小峰值越高。正态分布曲线下的面积分布有一定的规律。X轴与正态曲线所夹面积恒等于1或者 100%区间1 6的面积为68.27%;区间1 土 1.96 6的面积为95.00%,区间1 土 2.58 6的面积为9

8、9.00%。5. 医学参考值范围的意义和估计方法。医学参考值(reference value)是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标常数，也称正常值。由于存在个体差异，生物医学数据并非常数，而是在一定范围内波动，故采用医学参考值范围(medical referenee range)作为判定正常和异常的参考标准。通常使用的医学参考值范围有 90%、95%、99% 、正态分布法：数据服从或者近似服从正态分布，或者通过适当的变换转换为正态分布，采用此方法之前一般要对资料进行正态性检验且要求样本含量足够大(如n 100)计算公式为2-23、2-24:双侧：第三章总体均

9、数的估计与假设检验仆基本概念：抽样误差(sampling error):指的是由于个体变异产生、随机抽样造成的样本统计量与总体参数的差异。标准误(standard error , SE):指的是样本统计量的标准差。均数的标准误(standard error of mean , SEM ):指的是样本均数的标准差。探SEM反映样本均数之间的离散程度，也反映样本均数与相应总体均数间的差异。均数的标准误的计算公式为3-1、3-2统计推断(statistical inference):通过抽样研究的方法从总体中随机抽取一个样本，用样本的信息来推断总体的特征的统计学方法，包括参数估计和假设检

10、验。2、标准差的用途：、反映资料的离散趋势。标准差越小，说明变异程度越小，均数的代表性越好；用于计算变异系数；用于计算标准误；结合均数和正态分布规律估计参考值范围。3、u分布与t分布：u分布(也称Z分布)：指的是总体均数为 0,总体标准差为1的标准正态分布 N(0,12 )。t分布：随机变量X服从总体均数为1，总体标准差为6的正态分布N(1，6 2 )，则可以通过u变换将一般的正态分布转化为标准正态分布。但是通常获得的资料为样本的均数标准误，因此经过转换后并不是完全意义上的标准正态分布，而是服从 t分布。（计算公式为3-3）B、两总体均数之差的可信区间：前提：两总体方差相等，但均数

11、不等计算公式见于 3-12、3-13、3-14t分布主要用于总体均数的区间估计和t检验。4、可信区间：从固定样本含量的已知总体总进行重复随机抽样试验，根据每个样本可算得一个可信区间，则平均有1-a （如95%）的可信区间包含了总体参数，而不是总体参数落在该范围的可能性为1- a。5、参考值范围和总体均数可信区间的区别见课本表3-26、标准差与标准误的区别和联系：均数的标准误标准差丿意反映 X的抽样误反映一组数据的离散情义差大小况记法匚 X( Sx )C( S)计算二二 nS X= S. nS =XT控制方法增加 n不能通过统计方法来控制7、总体均数可信区间的计算：根据总体标准差b是否已

12、知以及样本含量 n的大小而异，通常有t分布和u分布两类方法。A、单一总体均数的可信区间：a、总体标准差b已未知：按t分布双侧和单侧公式见 3-5、3-6、3-7 b、b已知或者未知，但 n足够大（如60）时：按u分布双侧和单侧公式见 3、8、3-9、3-108、t分布图的特征：、单峰分布，以 0为中心，左右对称；、t分布的曲线形态取决于自由度v的大小，自由度越小，贝Ut值越分散，曲线的峰部越矮而尾部翘得越高；、当自由度逼近无穷的时候，样本标准误接近总体标准误，t分布逼近标准正态分布。（标准正态分布是t分布的特例）9、t检验的适用条件t检验（t test/Student t-test）当

13、b未知且样本含量较小时（如 nv 60），理论上要求t 检验的样本随机地取自正态分布的总体，两小样本均数比较式还要求两样本所对应的两总体方差相等，即方差齐性。在实际应用中，如与上述条件略有偏离，对结果影响也不大。10、假设检验A、假设检验的基本思想：利用小概率反证法的思想，从问题的对立面（H。）出发简介判断要解决的问题（H1 ）是否成立。即在假设 H。成立的条件下计算检验统计量，然后根据获得的 P值来判断。B、假设检验的基本步骤：建立检验假设，确定检验水准；计算检验统计量；确定P值，做出推断结论。C、假设检验的错误I型错误：拒绝了实际上成立的H0，这类“弃真”的错误；（a ）n型错

14、误：“接受”了实际上不成立的H0,这类“取伪”的错误。（3）注意：a越小，3越大；反之a越大，3越小；若重点是减少I型错误，一般取a =0.05 ;若重点是减少n型错误，一般取3 =0.10或者0.20甚至更高；若要同时减小I型和n型错误，唯一的方法就是增加样本含量n ;拒绝H0,只可能犯I型错误；接受 H0,只可能犯n型错误。资料或数据计量资料（已知均数和/或标准差）两样本（样本含量较小，60）单样本t检验适用于已知样本均数和已知总体均数的比较t分布(v=n-1 )对方差齐与否无要求正态分布t值配对样本t检验适用于配对设计的计量资料t分布(v=n-1 )对方差齐与否无要求正态分布t值两样本t检验/ 成组t检验方差齐适用于任意两计量资料的比较t分布(v=n 1+ n2-2 )方差齐正态分布t值方差不齐Cochran&Cox 近似 t 检验t分布方差不齐正态分布t值（校正t值）Satterthwaite 近似 t 检验t分布方差不齐正态分布t值（校正自由度）两样本的方差比较时，可以使用F检验，分子为较大的样本方差（自由度为n1-1）;分母为较小的样本方差（自由度为n2-1）。F值满足F分布，统计值为F值。多样本完全随机设计资料的方差

展开阅读全文