医学统计学名词解释名解复习资料

资源描述

《医学统计学名词解释名解复习资料》由会员分享，可在线阅读，更多相关《医学统计学名词解释名解复习资料（3页珍藏版）》请在金锄头文库上搜索。

1、1. 总体(population)：根据研究目的所确定的同质观察单位的全体。只包括(确定的时间和空间范围内)有限个观察单位的总体，称为有限总体(finite population)。假想的，无时间和空间概念的，称为无限总体(infinite population)。2. (总体)参数(parameter):总体的统计指标或特征值。总体参数是事物本身固有的、不变的。3. 样本(sample)：从总体中随机抽取的部分个体。4. 样本含量(sample size):样本中所包含的个体数。5. 变量(variable)：观察对象个体的特征或测量的结果。由于个体的特征或指标存在个体差异，观察结果在测量

2、前不能准确预测，故称为随机变量(random variable),简称变量(variable)。变量的取值称为变量值或观察值(observation) o根据变量的取值特性，分为数值变量和分类变量。6. 数值变量(Numerical variable):又称为计量资料、定量资料，指构成其的变量值是定量的，其表现为数值大小，有单位。对每个观察单位用定量的方法测定某项指标的数值，组成的资料。7. 计数资料：将全体观测单位按照某种性质或特征分组，然后再分别清点各组观察单位的个数。分类变量(categorical variable):或称定性变量，其取值是定性的，表现为互不相容的类别或或属性，有

3、两种情况：1) 无序分类(unordered categories):包括二项分类，如上述“性别变量，表现为互相对立的结果；多项分类，如上述“血型”变量，表现为互不相容的多类结果。2) 有序分类(ordered categories):各类之间有程度上的差别，或等级顺序关系，有“半定量”的意义，亦称等级变量。等级资料：介于计量资料和计数资料之间的一种资料，通过半定量方法测量得到。8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。9. 抽样误差(sampling error):由于抽样造成的统计量与参数之间的差别，特点是不能避免的，可用标准误描述其大小。10. 误差(e

4、rror)：统计上所说的误差泛指测量值与真值之差，样本指标与总体指标之差。主要有以下二种：系统误差和随机误差。11. 可信区间(confidence interval, CI):按一定的概率或可信度(1-a )用一个区间估计总体参数所在范围，这个范围称作可信度1-a的可信区间，又称置信区间。12总体均数的可信区间：按一定的概率大小估计总体均数所在的范围(CI)。常用的可信度为95%和99%，故常用95%和 99%的可信区间。13. 变异(variation)：同质事物间的差别。由于观察单位通常即为观察个体，故变异亦称为个体变异(individual variation)。SS组间14.

5、组间变异(variation between group):用各组均数与总均数的离均差平方和表示n(xi - x)2 V组间=k-1, k为实验分组数，组间均方为MS组fSS /( k-1)Ss 组内魄(Xti-n-within (ijithin y oup):用各组均数与总均数的离均差平方和表示)=y (ni - l)s2，各组自由度为niT，则组内自由度为V组内=N-k，组内均方为MS亲SS组内I 1组间组间组间/( N-k)i j16. 平均数(average):也叫平均值，是一组(群)数据典型或有代表性的值。这个值趋向于落在根据数据大小排列的数据的中心，包括算术平均数(arithm

6、etic mean)、几何平均数(geometric mean)、中位数(median)等。17. 中位数(median):将一组观察值按升序或降序排列，位次居中的数，常用M表示。适用于偏态分布资料或不规则分布(n+l)/2n/2资料和开口资料。所谓“开口”资料，是指数据的一端或两端有不确定值。当n为奇数时，M=X()/；当n为偶数时，M=X/ + X /2。(n+1)/2n/218.1百分位数(percen tile)：是一种位置指标，以P表示，一个百分位数Px将全部观察值分为两个部分，理论上有x%的观察值小于Px小，有(1-X%)的观察值大于Px。19. 变异系数(coefficient

7、 of variance, CV):亦称离散系数(coefficient of dispersion)，为标准差与均数之比，常用百分数表示。CV = sX x 100%,变异系数没有度量衡单位，常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。20. 统计表(statistical table):统计表就是以表格的形式，表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。m_A发生的试验次数 n=试验的总次数21. 频率(relative frequency):在n次随机试验中，事件A发生了 m次，则比值称为事件A在n次试验中出现的频率(relative freq

8、uency)。m称为出现的频数 (frequency)。在实际工作中，当观察单位的例数足够多时，可以用频率来代替概率。频率是概率的估计值。22. 概率(probability)：在重复试验中，事件A的频率，随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p 就称为事件A出现的概率(probability),记作P(A )或P。描述随机事件发生的可能性大小的数值，常用P来表示。23. 统计量(statistic)：由样本所算出的统计指标或特征值。24. 相关系数(correlation coefficient):用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标，称为相关

9、系数，又称为积差相关系数(coefficient of product-moment correlation)，总体相关系数用希腊字母p表示，而样本相关系数用r表示，取值范围均为-1, 1。25. 回归系数(regression coefficien t)：直线回归方程Y = a+bX的系数b称为回归系数，也就是回归直线的斜率(slope)，表示X每增加一个单位，Y平均改变b个单位。26. 参考值范围(reference range):也称为正常值范围(normal range)，医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。绝大多数：可以是90%、95%、99%等等，最

10、常用的是95%。正常人：不是指健康人，而是指排除了影响所研究指标的疾病和有关因素的同质人群。又称参考值范围，是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。27. 正偏态和负偏态分布：频数分布可分为对称分布和非对称分布两种类型。非对称分布又称为偏态分布，是指观察值偏离中央的分布。当尾部偏向数轴正侧(或右侧)时，称正偏态(或右偏态)分布，如人体中一些重金属元素的分布等。反之，尾部偏向数轴负侧(或左侧)时，则称为负偏态(或左偏态)分布。28. 统计推断(statistic inference)：从总体中随机抽取一定含量的样本进行研究，目的是通过样本

11、的信息判断总体的特征，这一过程称为统计推断。29. 标准误(standard error, SE):在统计理论上将样本统计量的标准差称为标准误，用来衡量抽样误差的大小。据此，样本均数的标准差称为标准误。30. 参数估计(parameter estimation):由样本信息估计总体参数。它包括两种：点估计(point estimation)和区间估计 (interval estimation)。31. 点估计(point estimation):直接用样本统计量作为对应的总体参数的估计值。32. 区间估计(interval estimation)：按一定的概率或可信度(l-a )用一个区间

12、估计总体参数所在范围，这个范围称作可信度l-a的可信区间(confidence interval, CI),又称置信区间。这种估计方法称为区间估计。33. 95%可信区间含义：如果重复若干次样本含量相同的抽样，每个样本均按同一方法构建95%可信区间，则在这些可信区间中，理论上有95个包含了总体参数，还有5个未估计到总体均数。34. I类错误(t ypel error)：统计学上规定，拒绝了实际上成立的H ,这类“弃真”的错误称为I型错误或第一类错误，I型错误的概率用a表示。035.11类错误(t ypellerror)：统计学上规定，不拒绝实际上不成立的H ,这类“存伪”的错误称为II型错

13、误或第二类错误, II型错误的概率用0表示。036. 检验效能(power of a test):又称把握度，即两总体确有差别，按a水准能发现它们有差别的能力。37. 参数检验：总体分布已知，对其中一些未知参数进行估计或检验。这类统计推断的方法叫参数统计或参数检验。参数检验：假定比较数据服从某分布，、通过参数的估计量(x, s)对比较总体的参数(卩)作检验，统计上称为参数法检验 (parametric test) o 如 t、u 检验、方差分析。38. 非参数检验：适用于任意分布(distributionfree)的统计方法，这种方法称为非参数统计。这种假设检验方法，比较的是分布而不是参数，

14、故称为非参数检验。非参数检验：是指在统计检验中不需要假定总体分布形式和用参数估计量，直接对比较数据的分布进行统计检验的方法，称为非参数检验(nonparametric test).39. 率(rate):又称频率指标，用以说明某现象发生的频率或强度。常以百分率(%)、千分率)、万分率(1/万)、十万分率(1/10万)等表示。其计算公式为：率_实际发生某现象的观察单位数%比例基数血率_可能发生某现象的观察单位总数比例基数(K)40.构成比(proportion)：又称构成指标，它说明一种事物内部各组成部分所占的比重或分布，常以百分数表示，其计算公式为：x 100%某一组成部分的观察单位数同

15、一事物内各组成部分的观察单位总数41.比(ratio):又称相对比，是A、B两个有关指标之比，说明A为B的若干倍或百分之几，它是对比的最简单形式。其计算公式为：比=A/B。统计学(Statistics)：运用概率论、数理统计的原理与方法，研究数据的搜集；分析；解释；表达的科学。总体(population)：大同小异的研究对象全体。更确切的说，总体是指根据研究目的确定的、同质的全部研究单位的观测值。样本(sample)：来自总体的部分个体，更确切的说，应该是部分个体的观察值。样本应该具有代表性，能反映总体的特征。利用样本信息可以对总体特征进行推断。抽样误差(sampling error)在

16、抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异，以及多个样本统计量之间的差异。可用标准误描述其大小。标准误(Standard Error)样本统计量的标准差，反映样本统计量的离散程度，也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比，与样本例数的平方根呈反比，故欲降低抽样误差，可增加样本例数区间估计(interval estimation)：将样本统计量与标准误结合起来，确定一个具有较大置信度的包含总体参数的范围，该范围称为置信区间(confidence interval，CI)，又称可信区间。参考值范围描述绝大多数正常人的某项指标所在范围；正态分布法(标准差)、百分位数法，参考值范围用于判断某项

展开阅读全文

医学统计学 名词解释 名解 复习资料

医学统计学名词解释名解复习资料