生物医学研究的统计方法定量资料的统计描述

上传人:豆浆 文档编号:48695678 上传时间:2018-07-19 格式:PPT 页数:64 大小:382KB
返回 下载 相关 举报
生物医学研究的统计方法定量资料的统计描述_第1页
第1页 / 共64页
生物医学研究的统计方法定量资料的统计描述_第2页
第2页 / 共64页
生物医学研究的统计方法定量资料的统计描述_第3页
第3页 / 共64页
生物医学研究的统计方法定量资料的统计描述_第4页
第4页 / 共64页
生物医学研究的统计方法定量资料的统计描述_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《生物医学研究的统计方法定量资料的统计描述》由会员分享,可在线阅读,更多相关《生物医学研究的统计方法定量资料的统计描述(64页珍藏版)》请在金锄头文库上搜索。

1、第二章 定量资料的统计描述教学目的和要求n了解频数分布表/图的编制方法及用途;n掌握定量资料集中趋势和离散趋势常用的统计描述指标及各自的适用条件。第一节 频数分布表与频数分布图第二节 集中趋势的统计描述第三节 离散趋势的统计描述讲 授 内 容第一节 频数分布表与频数分布图 频数(率)分布表:将各变量值出现的频数(率)列表即称为频数(率)分布表。 频数(率)分布图:将各变量值出现的频数(率)以图形的形式展现即称为频数(率)分布图。一、离散型定量变量的频率分布n例2-1 1998年某山区96名孕妇产前检查次数资料如下:0,3,2,0,1,5,6表2-1 1998年某山区96名孕妇产前检查次数频率分

2、布图2-1 1998年某山区96名孕妇产前检查次数频率分布二、连续型定量变量的频率分布1. 求MAX、MIN、RR=MAX-MINR=143.3-116.2=27.1(cm)2. 求“组段”数,组段和组距(1)“组段”数一般取10个左右;(2)组距=R/预计的组段数;(3)第一组段要包括MIN,最末组段包括MAX,并同时写出上下限。本例 i=R/10=2.71 33.列表划计146图2.2 某市100名8岁男童身高(cm)的频数分布身高(cm)频数三、频数表的用途1. 揭示资料的分布类型 对称分布:高峰位于中部,左右两侧的频数大体对称。正态分布为最常见的一种。 偏态分布:正偏态分布儿童疾病年龄

3、分布;负偏态分布老年疾病年龄分布。对称分布偏态分布正偏负偏频数分布高峰位于 中部,左右两恻的 频数大体对称。高峰偏于右侧,长 尾向左侧延伸,则 为负偏态。高峰偏于左侧, 长尾向右侧延伸 ,则为正偏态2 描述分布的集中趋势和离散趋势 集中趋势(central tendency) 离散趋势( tendency of dispersion)当集中趋势与离散趋势结合起来时能全面反映频数的分布。3 便于发现某些特大或特小的可疑值4 便于进一步计算指标和统计分析 第二节 集中趋势的统计描述v概念:集中趋势是指一组定量资料集中位置的特征值,反应一组观测值的平均水平。包括算术均数、几何均数、中位数、众数。 一

4、、均数(mean)1.概念:均数是算术均数(arithmetic mean)的简称,指n个性质相同的定量数据之和除以n所得的结果。总体均数用希腊字母表示,样本均数用 表示。2. 均数的计算(1)直接法:适用于观 察值的个数较少时。例2-3 测得8只正常大鼠血清总酸性磷酸酶(TACP)含量为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。求其算术均数。 (2)加权法:适用于样本例数较多时或 者频数表资料。各组段的频数组中值(下限+上限)/2例2 计算例1中100名8岁男童的平均身高。 算术均数的应用场合:均数能反映全部观察值的平均数量水平,因而应用甚广。它适用于对

5、称分布,特别是正态分布的定量资料。二、几何均数G1.概念:对n个性质相同的定量数据分别取对数变换后,按算术均数计算,然后再求其反对数所得的结果,叫几何均数。2.计算(1) 直接法:适用于观察值个数较少时。方法:将n个观察值(X1,X2,X3,Xn)直接相乘再开n次方。 公式 :n例 设有5份血清样品,滴度分别为:1:1, 1:10, 1:100, 1:1000, 1:10000 求其平均滴度。n G或Glg-1(lg1+lg10+lg100+lg1000+lg10000)/5)lg-1(0+1+2+3+4)/5) lg-12=100即:平均滴度为1:100。(2)加权法 用于样本量较大的频数表

6、资料 。可用下式计算:Glg-1 (f lgX/f)例 有95名麻疹易感儿童,接种麻疹疫苗一 个月后,血凝抑制抗体滴度见表3.4。试求 平均滴度。 Glg-1 (f lgX/f)lg-1(145.0948/95) 33.68即:95名易感儿童接种疫苗一个月后,血凝抑制抗体的平均滴度为1:33.68 几何均数的应用场合几何均数适用于经对数转换后成对称分布的资料,或者说是等比资料,如抗体的滴度,血清效价等。中位数和百分位数1.概念:(1)中位数(median):把一组变量值从小到大排列,位于中间位置的变量值叫中位数,用M表示。(2)百分位数(percentile):为一种位置指标,一个PX将总体或

7、样本的全部观察值分为两部分,理论上有X%的观察值比它小,(100-X)%的观察值比它大,P50分位数即是中位数。 MP50MinP0MaxP100PxX%(100-X)%2.计算方法:(1)直接由原始数据计算中位数n为奇数时n为偶数时(2)用频数表计算中位数及百分位数 步骤:按所分组段,由小到大计算累计频数和累计频率根据公式计算中位数及其它百分位数Px 所在组段的组距 Px 所在组段的下限Px 所在组段的频数fL 为小于 L 的各组段累计频数计算中位数时 ,X=50, 即M=P50。 例3.3 有164例沙门氏菌食物中毒病人的潜伏期(小时)见表3.5,求该潜伏期的中位数、百分位数P5和P95。

8、 P5、M、P95分别位于第一、第三和第五组段。所在组段下限值L分别为:0、24、48。所在组频数分别为21、44、12,L前累计频数分别为0、79、14 6。由公式得:P 5 L i / f5 ( n5 % f L )0 12/21(1645%0) 4.7(小时) M L i / fm ( n/2 f L ) 24 12/44(164/2 79) 24.8(小时) P95 Li / f95 ( n95 % f L )4812/12(16495%146) 57.8(小时)3.应用(1)中位数(median):可用于任何分布的资料集中趋势的统计描述,但更常用于偏态分布资料、分布的一端或两端无确定

9、数值时集中趋势的描述。(2)百分位数:A、用于描述数据某一百分位的位置,最常用的是 P50,即中位数;也可用两个百分位数的结合来描 述一组资料的分布特征。B、用于确定参考值范围:WBC95%参考值范围:P2.5P97.5过高过低均异常肺活量95%参考值范围:P5 过低异常尿铅95%参考值范围:P95 过高异常。四、众数(mode):是一组数据中出现频率最高的那个数;一组数据的众数可以是1个,也可能有多个。n无众数 原始数据: 10 5 9 12 6 8一个众数一个众数 原始数据原始数据: 6 : 6 5 5 9 8 9 8 5 55 5多于一个众数多于一个众数 原始数据原始数据: : 25 2

10、5 28 28 2828 36 36 42 42 4242中位数、算术均数和众数的关系众数 中位数 算术均数众数 中位数 算术均数算术均数 中位数 众数 正偏态分布对称分布负偏态分布第三节 离散趋势的统计描述一、极差(极差(Range,RRange,R)计算:R=极大值极小值优点:简单明了缺点:1、R只考虑最大值和最小值之差,不能反映组 内其它观察值的变异度;2、样本例数越多,抽到极大值和极小值的可 能性越大,故例数悬殊时不易比较极差。二、四分位数间距(四分位数间距(uartileuartile range, range,)计算:=P75-P25意义及特点:类似值,但比其稳定,考虑了中间50%

11、观察值的变异度。缺点:未考虑全部观察值的变异度。例 有164例沙门氏菌食物中毒病人的潜伏期(小时) 见表3.5, 求该潜伏期的四分位数间距。 P 25 L i / f25 ( n25 % f L )12 12/58(16425%21) 16.14(小时) P 75 L i / f 75 ( n75 % f L )24 12/44(16475%79) 36(小时) Q= P 75 - P 25 =36-16.14=19.86 (小时)即该潜伏期的四分位数间距为19.86小时 。三、方差(方差(arianceariance)概念:1 总体方差:一组性质相同的定量数据中的 每一个与其总体算术均数的差

12、的平方和除 以数据个数,所得的结果叫做总体方差。2 样本方差:一组性质相同的定量数据中的 每一个与其样本算术均数的差的平方和除 以数据个数与1的差值,所得的结果叫做样 本方差。总体方差样本方差自由度,表示随机变量 能自由取值的个数。意义及特点:克服了值的不足,考虑了每个变量值 的离散情况并消除了的影响。其单位是原度量单 位的平方。例 从表6中3组男孩体重资料分别求出方差。表6 三组同龄男孩体重(kg)分组 1 2 3 4 5甲2628303234乙2427303336丙2629303134四、标准差(标准差(Standard deviationStandard deviation)概念:方差的

13、单位为原单位平方,不便使 用。为了应用的方便,对总体方差开平 方标准差。标准差的计算(1)直接法:用于样本量 较小的资料例3.6:计算有10名学生数学成绩的标准差。 (2)加权法:用于样本量较大的频数表资料。例3.7 以表3.3的资料为例,计算其标准差。 标准差的应用:(1)表示变量分布的离散程度;(2)概略估计正态分布资料的频数分布;(3)结合样本含量,计算标准误;(4)结合均数,计算变异系数。 五、变异系数(变异系数(Coefficient of Coefficient of variation,CVvariation,CV)概念:又叫变异度或离散系数,是同一组资料的标准差与均数之比。应用

14、:CV为相对数,无单位,主要用于比较度量衡单位不同或均数相差悬殊的资料的变异度。其数值越小,说明观察值的变异度越小,均数的代表性越好。n例7-11 某地7岁男孩身高的均数为123.10cm,标准差为4.71 cm;体重的均数为22.29kg,标准差为2.26kg。试比较身高、体重何者变异度大。身高体重由此可见,7岁男孩体重的变异度大于身高的变异度或者说身高比体重稳定。集中趋势 离散趋势 应用场合算术均数 方差、标准差 适用于对称分布,特别是正态分布几何均数正偏态分布资料或对数正态分布资 料中位数 极差及 及百分位数 四分位数间距变异系数 适用于任何分布资料,特别是偏态 分布、分布不明、分布末端无确定 值适用于均数相差悬殊或度量衡单位 不同的资料【思考题】1 描述数值变量集中趋势和离散趋势的指标各有哪些?各自的应用是什么?2 测定某地健康妇女255人的两种血象指标 结果为:红细胞数(1012/L)的均数为 4.178,标准差为0.291;血红蛋白(g/L) 的均数为117.6,标准差为10.2。能否说血红蛋白的变异比红细胞数的变异大?应 如何比较?

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号