医学统计学名词解释概念总结

上传人:人*** 文档编号:459768874 上传时间:2022-09-18 格式:DOCX 页数:7 大小:27.02KB
返回 下载 相关 举报
医学统计学名词解释概念总结_第1页
第1页 / 共7页
医学统计学名词解释概念总结_第2页
第2页 / 共7页
医学统计学名词解释概念总结_第3页
第3页 / 共7页
医学统计学名词解释概念总结_第4页
第4页 / 共7页
医学统计学名词解释概念总结_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《医学统计学名词解释概念总结》由会员分享,可在线阅读,更多相关《医学统计学名词解释概念总结(7页珍藏版)》请在金锄头文库上搜索。

1、医学统计学一一概念复习提纲,给点建议吧,感觉全了。一 名解医学统计学: 是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: 参数估计:用样本的指标去推断总体相应的指标 假设检验:由样本的差异推断总体之间是否可能存在的差异同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。总体(population)是根据研

2、究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分 为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方 法获得的样本。随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分 观察单位的过程。随机抽样是样本具有代表性的保证。变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是

3、生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何 两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。(1) 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、 测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。(2) 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观 察值是定性的,表现为互不相容的类别或属性。(3) 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的

4、观察单位数,称为等级资料(ordi nal data)。概率:概率(probability )又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0 P (A) 1。频率:在相同的条件下,独立重复做n次试验,事件A出现了 m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P (A) = m/n。随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。 误差变量一般服从正态分布。随机误差可以通过统计处理来估计

5、。抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动 的随机变量。系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散 在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一 个常数来表示,而且,理论上讲,每个变量的

6、取值服从特定的概率分布。参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通 过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是 在总体参数附近波动的随机变量。频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用p表示,样

7、本均数用X表示。几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。中位数(median) Md将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观 察值在位次上的平均水平。极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。百分位数(percentile)是将n个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范 围。四分位数间距(inter-quartile range)是由第3四分位数和第1四分位数相减

8、计算而得,常与中位数一起使用,描述偏态分布资料的分布特征, 较极差稳定。方差(varianee):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。标准差(standard deviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。变异系数(coefficient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV表示。计算:标准差/均数*100%统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statistical in fere nee)

9、。抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差(sampli ng error )o标准误及X s :通常将样本统计量的标准差称为标准误(standard error of mean, SEM ),它反映了样本均数间的离散程度,也反映了样本均 数与总体均数的差异,说明均数抽样误差的大小。可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。 参数估计:指用样本指标值(统计量)估计总体指标值(参数)。假设检验中P的含义:指从H0规定的总体随机抽得等于及大于(或等于及小于)现有样本

10、获得的检验统计量值的概率。I型错误(type I error ),指拒绝了实际上成立的H0,这类弃真的错误称为I型错误,其概率大小用a表示。II型错误(type II error),指接受了实际上不成立的H0,这类存伪的误称为II型错误,其概率大小用B表示。检验效能:1-B称为检验效能(power of test),它是指当两总体确有差别,按规定的检验水准a所能发现该差异的能力。率(rate)又称频率指标,说明一定时期内某现象发生的频率或强度。计算公式为:发生某现象的观察单位数/可能发生某现象的观察单位总数*100%,表示方式有:百分率()、千分率(。)等。构成比(proportion)又称构

11、成指标,说明某一事物内部各组成部分所占的比重或分布。计算公式为:某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%,表示方式有:百分数等。比(ratio)又称相对比,是A、B两个有关指标之比,说明A是B的若干倍或百分之几。计算公式为: A/B ,表示方式有:倍数或分数等。非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型 的,用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。参数统计:通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检

12、验,称为参数统计(parametric statistics)秩次:变量值按照从小到大顺序所编的秩序号称为秩次(rank)。秩和:各组秩次的合计称为秩和(rank sum),是非参数检验的基本统计量。直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是 回归分析中最基本、最简单的一种,故又称简单回归(simple regression)。回归系数(regression coefficient )即直线的斜率(slope),在直线回归方程中用b表示,b的统计意义为X每增(减)一个单位时,Y平均改变 b

13、个单位。相关系数r:用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。二 相关概念医学科研数据统计分析大致分以下 4个步骤。1.1 数据整理1.2 统计描述1.3 统计推断1.4 结果表达频数表的制作 求全距R 找到资料中的最大值A和最小值B 计算全距 R, 划分组段 确定组数 确定组距 确定各组段的上下限 下限(lower limit)上限(upper limit) 第一组段,其下限可取小于最小观察值得数 半开半闭区间 - , - ) 画表频数分布表和频数分布图的用途 揭示频数分布的特征 集中趋势 集中趋势是指一组数据向某一个位置聚集或集中的倾向。 离散趋势 离散趋势反映的

14、是一组数据的分散性和变异度,即各个数据离开集中位置的程度。 便于观察数据的分布类型 正态分布 集中趋势的指标:均数 离散趋势的指标:标准差 偏态分布 集中趋势的指标:中位数离散趋势的指标:四分位间距算术平均数几何平均数中位数符号XGM含义各观察值相加除以观察值的个数所得之商。N各观察值的乘积开n次方所得之根一组观察值按顺序排列,居中者。应用条件正态或近似正态分布对数正态分布极偏态或分布不清的资料计算公式说明加权法计算中X值的含义中位数为百分位数的特例标准差的意义和用途1. 说明资料的离散趋势(或变异程度),标准差的值越大,说明变异程度越大,均数的代表性越差.标准差与原始数据的单位一致,在科技论

15、文报告中,均数与标准差经常被同时用来描述资料的集中趋势与离散趋势。1. 用于计算变异系数2. 用于计算标准误3. 结合均值与正态分布的规律,估计参考值的范围。变异系数(coefficient of variation)适用范围1 观察指标单位不同,如身高、体重 不同单位资料2 均数相差悬殊变异系数的特点及相应的用途 没有单位n 反映标准差占均数的百分比或标准差是均数的几倍n 可用来比较度量衡单位不同的资料的变异度 不受平均水平的影响n 反映的是以均数为基数的相对变异的大小n 比较均数相差悬殊的资料的变异度变异指标小结1极差较粗,适合于任何分布2标准差与均数的单位相同,最常用,适合于近似正态分布3变异系数主要用于单位不同或均数相差悬殊资料4平均指标和变异指标分别反映资料的不同特征,常配套使用如正态分布:均数、标准差; 偏态分布:中位数、四分位间距 相对数使用应注意的问题1. 根据需要正确选择相对数,常见错误是以构成比代率。2. 分母应当够大。分母小于 20 时可靠性较差。如果分母太小,宜用绝对数表示。3. 计算观察单位数不等的几个率的平均率时,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 建筑资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号