医学统计学--统计描述

上传人:小** 文档编号:56539495 上传时间:2018-10-13 格式:PPT 页数:115 大小:1.24MB
返回 下载 相关 举报
医学统计学--统计描述_第1页
第1页 / 共115页
医学统计学--统计描述_第2页
第2页 / 共115页
医学统计学--统计描述_第3页
第3页 / 共115页
医学统计学--统计描述_第4页
第4页 / 共115页
医学统计学--统计描述_第5页
第5页 / 共115页
点击查看更多>>
资源描述

《医学统计学--统计描述》由会员分享,可在线阅读,更多相关《医学统计学--统计描述(115页珍藏版)》请在金锄头文库上搜索。

1、生物医学研究的统计方法 第2章,统计描述,讲授内容,第一节 定量资料的统计描述 第二节 定性资料的统计描述 第三节 统计表和统计图,生物医学研究的统计方法 第2章,教学目的和要求,了解频数分布表的编制方法及应用; 掌握定量资料集中趋势和离散趋势常用的统计描述指标及应用;掌握率、频率的概念及应用; 能根据资料的特征,选择合适的统计表或统计图进行描述。,生物医学研究的统计方法 第2章,定量资料的统计描述,第 一 节,一、频数表与频数分布图 二、集中趋势的统计描述 三、离散趋势的统计描述,生物医学研究的统计方法 第2章,定量资料的统计描述,【例1】某地2008年100名8岁男童身高资料(cm),生物

2、医学研究的统计方法 第2章,问题1:该100名8岁男童的平均身高是多少? 问题2:最高身高是多少?最低身高是多少?身高的分布范围是多少? 问题3:身高在132136cm占多大比例? 问题4:如何用一个直观的统计图来描述身高的分布规律?分布是否对称?,生物医学研究的统计方法 第2章,【解析】此问题涉及如何对定量资料进行统计描述?问题1 集中趋势问题2 离散趋势问题3,4 频数分布表和频数分布图,生物医学研究的统计方法 第2章,(一)频数表的概念:为频数分布表的简称,将各数值变量的值及其相应的频数列表即称为频数分布表。频率可用百分数或小数表示,频率的和为100%或1。,生物医学研究的统计方法 第2

3、章,一、连续变量频数表与频数分布图,(二)频数表的编制方法: 1. 求MAX、MIN、R R=MAX-MIN R=143.3-116.2=27.1(cm) 2. 求“组段”数,组段和组距 (1)“组段”数一般为10-15个; (2)组距一般为R/10取整; (3)第一组段要包括MIN,最末组段包括MAX,并同时写出上下限。 本例 i=R/10=2.71 3 3.列表划计,生物医学研究的统计方法 第2章,146,生物医学研究的统计方法 第2章,(三)频数表的用途1.揭示频数的分布特征(1)集中趋势 central tendency(2)离散趋势 tendency of dispersion(3)

4、当集中趋势与离散趋势结合起来时能全面反映频数的分布。l 对称分布:高峰位于中部,左右两侧的频数大体对称。正态分布为最常见的一种。l 偏态分布:正偏态分布儿童疾病年龄分布;负偏态分布老年疾病年龄分布。,生物医学研究的统计方法 第2章,对称分布,生物医学研究的统计方法 第2章,偏态分布,正偏,负偏,频数分布高峰位于中部,左右两恻的频数大体对称。,高峰偏于右侧,长尾向左侧延伸,则为负偏态。,高峰偏于左侧,长尾向右侧延伸,则为正偏态,2.便于发现某些特大或特小的可疑值。 3.当样本含量足够大时,以频率作为概率的估计值。 4.作为陈述资料的形式。,生物医学研究的统计方法 第2章,二、集中趋势指标 概念:

5、集中趋势是指一组定量资料集中位置的特征值,说明这种变量值大小的平均水平,常用平均数描述。包括算术均数、几何均数、中位数、百分位数等。,生物医学研究的统计方法 第2章,(一)均数: 1.概念:均数是算术均数的简称,指n个性质相同的定量数据之和除以n所得的结果。总体均数用希腊字母表示,样本均数用 表示。,生物医学研究的统计方法 第2章,均数的计算 (1)直接法:适用于观察值的个数较少时。,生物医学研究的统计方法 第2章,例 某地10名18岁健康男大学生身高(cm)分别为168.7,178.4,170.0, 170.4, 172.1, 167.6,172.4,170.7,177.3,169.7求平均

6、身高。,生物医学研究的统计方法 第2章,(2)加权法:适用于样本例数较多时或者频数表资料。,生物医学研究的统计方法 第2章,例2 计算例1中100名8岁男童的平均身高。,生物医学研究的统计方法 第2章,生物医学研究的统计方法 第2章,算术均数的应用场合:均数能反映全部观察值的平均数量水平,因而应用甚广。它适用于对称分布,特别是正态分布的定量资料。,(二)几何均数G1.概念:对n个性质相同的定量数据分别取对数变换后,按算术均数计算,然后再求其反对数所得的结果,叫几何均数。,生物医学研究的统计方法 第2章,2.计算(1) 直接法:适用于观察值个数较少时。,生物医学研究的统计方法 第2章,方法:将n

7、个观察值(X1,X2,X3,Xn)直接相乘再开n次方。,公式:,例3.2 设有5份血清样品,滴度分别为:1:1, 1:10, 1:100, 1:1000, 1:10000 求其平均滴度。,生物医学研究的统计方法 第2章,G或Glg-1(lg1+lg10+lg100+lg1000+lg10000)/5)lg-1(0+1+2+3+4)/5) lg-12=100即:平均滴度为1:100。较好地代表了观察值的平均水平。,生物医学研究的统计方法 第2章,(2)加权法 用于样本量较大的频数表资料。可用下式计算:Glg-1 (f lgX/f)例3.3 有95名麻疹易感儿童,接种麻疹疫苗一个月后,血凝抑制抗体

8、滴度见表3.4。试求平均滴度。,生物医学研究的统计方法 第2章,生物医学研究的统计方法 第2章,Glg-1 (f lgX/f)lg-1(145.0948/95) 33.68即:95名易感儿童接种疫苗一个月后,血凝抑制抗体的平均滴度为1:33.68,生物医学研究的统计方法 第2章,几何均数的应用场合几何均数适用于经对数转换后成对称分布的资料,或者说是等比资料,如抗体的滴度,血清效价等。,生物医学研究的统计方法 第2章,(三)中位数和百分位数1.概念:(1)中位数(median):把一组变量值从小到大排列,位于中间位置的变量值叫中位数,用M表示。(2)百分位数(percentile):为一种位置指

9、标,一个PX将总体或样本的全部观察值分为两部分,理论上有X%的观察值比它小,(100-X)%的观察值比它大,P50分位数即是中位数。,生物医学研究的统计方法 第2章,2.计算方法: (1)直接由原始数据计算中位数n为奇数时n为偶数时,生物医学研究的统计方法 第2章,生物医学研究的统计方法 第2章,(2)用频数表计算中位数及百分位数 步骤:,生物医学研究的统计方法 第2章,按所分组段,由小到大计算累计频数和累计频率,根据公式计算中位数及其它百分位数,生物医学研究的统计方法 第2章,Px 所在组段的组距,Px 所在组段的下限,Px 所在组段的频数,fL 为小于 L 的各组段累计频数,计算中位数时,

10、X=50, 即M=P50。,生物医学研究的统计方法 第2章,例3.3 有164例沙门氏菌食物中毒病人的潜伏期(小时)见表3.5,求该潜伏期的中位数、百分位数P5和P95。,P5、M、P95分别位于第一、第三和第五组段。所在组段下限值L分别为:0、24、48。所在组频数分别为21、44、12,L前累计频数分别为0、79、14 6。由公式得: P 5 L i / f5 ( n5 % f L )0 12/21(1645%0) 4.7(小时) M L i / fm ( n/2 f L ) 24 12/44(164/2 79) 24.8(小时) P95 Li / f95 ( n95 % f L )481

11、2/12(16495%146) 57.8(小时),生物医学研究的统计方法 第2章,3.应用 (1)中位数(median):可用于任何分布的资料集中趋势的统计描述,但更常用于偏态分布资料、分布的一端或两端无确定数值时集中趋势的描述。,生物医学研究的统计方法 第2章,(2)百分位数:A、用于描述数据某一百分位的位置,最常用的是P50,即中位数;也可用两个百分位数的结合来描述一组资料的分布特征。B、用于确定参考值范围:WBC95%参考值范围:P2.5P97.5过高过低均异常肺活量95%参考值范围:P5 过低异常尿铅95%参考值范围:P95 过高异常。,生物医学研究的统计方法 第2章,(四)众数(mo

12、de):,是一组数据中出现频率最高的那个数; 一组数据的众数可以是1个,也可能有多个。,生物医学研究的统计方法 第2章,中位数、算术均数和众数的关系,生物医学研究的统计方法 第2章,正偏态分布,对称分布,负偏态分布,(一)、极差(Range,R) 计算:R=极大值极小值 意义:反映观察值变异度的大小。 优点:简单明了 缺点: 1、R只考虑最大值和最小值之差,不能反映组内其它观察值的变异度; 2、?样本例数越多,抽到极大值和极小值的可能性越大,故样本例数悬殊时不易比较极差。,生物医学研究的统计方法 第2章,三、离散趋势指标,(二)、四分位数间距(uartile,)计算:=P75-P25 意义及特

13、点:类似值,但比其稳定,考虑了中间50%观察值的变异度。 缺点:未考虑全部观察值的变异度。,生物医学研究的统计方法 第2章,生物医学研究的统计方法 第2章,例 有164例沙门氏菌食物中毒病人的潜伏期(小时)见表3.5, 求该潜伏期的四分位数间距。,P 25 L i / f25 ( n25 % f L )12 12/58(16425%21) 16.14(小时) P 75 L i / f 75 ( n75 % f L )24 12/44(16475%79) 36(小时) Q= P 75 - P 25 =36-16.14=19.86 (小时)即该潜伏期的四分位数间距为19.86小时。,生物医学研究的

14、统计方法 第2章,常用的变异指标(三)、方差(ariance) 概念: 1 总体方差:一组性质相同的定量数据中的每一个与其总体算术均数的差的平方和除以数据个数,所得的结果叫做总体方差。2 样本方差:一组性质相同的定量数据中的每一个与其样本算术均数的差的平方和除以数据个数与1的差值,所得的结果叫做样本方差。,生物医学研究的统计方法 第2章,离均差平方和:总体方差:样本方差:,生物医学研究的统计方法 第2章,n-1为自由度(degree of freedom),表示随机变量能自由取值的个数。如有一四个(n=4)数据的样本,受到 的条件限制,在自由确定4、2、5三个数据后,第四个数据只能是9,否则

15、。因而这里的自由度=n-1=4-1=3。推而广之,任何统计量的自由度=n-限制条件的个数。,生物医学研究的统计方法 第2章,离均差平方和常用SS或lxx表示,意义及特点:克服了值的不足,考虑了每个变量值的离散情况并消除了的影响。其单位是原度量单位的平方。 例7-9 从表7-6中3组男孩体重资料分别求出方差。表7-6 三组同龄男孩体重(kg),生物医学研究的统计方法 第2章,生物医学研究的统计方法 第2章,甲组,乙组,丙组,常用的变异指标(四)、标准差(Standard deviation)概念:方差的单位为原单位平方,不便使用。为了应用的方便,对总体方差开平方标准差。,生物医学研究的统计方法

16、第2章,样本标准差,总体标准差,标准差的计算 (1)直接法:用于样本量较小的资料例3.6:计算有10名学生数学成绩的标准差。,生物医学研究的统计方法 第2章,生物医学研究的统计方法 第2章,(2)加权法:用于样本量较大的频数表资料。例3.7 以表3.3的资料为例,计算其标准差。,生物医学研究的统计方法 第2章,生物医学研究的统计方法 第2章,标准差的应用:(1)表示变量分布的离散程度; (2)概略估计正态分布资料的频数分布;? (3)结合样本含量,计算标准误; (4)结合均数,计算变异系数。,生物医学研究的统计方法 第2章,常用的变异指标(五)、变异系数(Coefficient of variation,CV) 概念:又叫变异度或离散系数,是同一组资料的标准差与均数之比。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号