定量资料的统计描述ppt医学课件

上传人:ni****g 文档编号:567522618 上传时间:2024-07-21 格式:PPT 页数:41 大小:281.50KB
返回 下载 相关 举报
定量资料的统计描述ppt医学课件_第1页
第1页 / 共41页
定量资料的统计描述ppt医学课件_第2页
第2页 / 共41页
定量资料的统计描述ppt医学课件_第3页
第3页 / 共41页
定量资料的统计描述ppt医学课件_第4页
第4页 / 共41页
定量资料的统计描述ppt医学课件_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《定量资料的统计描述ppt医学课件》由会员分享,可在线阅读,更多相关《定量资料的统计描述ppt医学课件(41页珍藏版)》请在金锄头文库上搜索。

1、 定量资料的统计描述定量资料的统计描述1.主要内容主要内容1、频数分布表的编制和用途、频数分布表的编制和用途 频数分布的特征和类型频数分布的特征和类型2、集中趋势指标、集中趋势指标均数、几何均数、中位数均数、几何均数、中位数3、离散趋势指标、离散趋势指标极差、四分位数间距、方差、标准差、变异系数极差、四分位数间距、方差、标准差、变异系数 百分位数百分位数2.(一)、频数分布表的编制(一)、频数分布表的编制 3.某地儿研所测得该地某地儿研所测得该地150名名12岁健康男童体重岁健康男童体重(kg)原始数据如下,试编制频数表。原始数据如下,试编制频数表。25.2 34.9 34.3 38.1 41

2、.3 27.8 33.8 37.7 28.4 33.5 47.3 34.8 30.5 36.2 51.0 38.0 43.8 40.9 37.5 36.6 33.4 47.4 36.4 41.4 36.5 42.5 33.7 29.3 39.6 37.5 39.6 33.2 32.1 29.9 43.7 33.8 35.1 37.8 32.4 38.5 28.2 36.5 23.4 35.8 34.1 27.6 42.6 23.1 37.1 44.0 35.6 44.5 46.5 35.0 31.8 36.4 36.2 47.9 38.7 20.5 37.1 29.2 38.2 41.1 36

3、.2 43.5 32.8 36.3 31.8 30.6 38.5 39.6 28.7 33.7 35.1 42.9 20.1 35.4 26.5 42.0 39.6 38.7 35.4 51.231.4 34.1 25.3 29.6 38.2 43.7 33.8 24.5 29.2 45.9 32.5 23.536.8 27.2 34.0 34.7 44.4 41.2 35.3 42.6 34.1 30.0 31.4 40.827.3 48.6 35.8 29.7 45.6 41.8 33.0 28.3 33.3 35.1 40.6 38.237.6 25.5 37.3 37.5 41.5 3

4、8.4 44.2 43.2 31.5 40.2 34.5 37.437.8 33.4 32.2 33.4 32.4 32.8 36.8 45.7 41.2 40.9 36.5 47.935.7 39.3 42.2 35.3 30.1 27.2 4.1. 找出最大值和最小值,计算极差。找出最大值和最小值,计算极差。l最大值为最大值为51.2kg,l最小值为最小值为20.1kg,l极差极差R=51.2-20.1=31.1kg。l极极差差(R)也也叫叫全全距距,它它是是一一组组变变量量值值中中最最大大值值与最小值之差。与最小值之差。5.2.按极差大小决定组段数、组段和组距。按极差大小决定组段数、组段

5、和组距。 l 确确定定组组段段数数:组组段段数数的的多多少少一一般般根根据据观观察察单单位位的的多多少少来来确确定定,过过多多或或过过少少均均不不能能更更好好地地反反映映资资料料的的分分布布特特征征,以以能能够够反反映映频频数数分分布布的的特特点点为为宜宜,一一般般分分为为815组组,观观察察单单位位少少时时可可相相对对少少些些,观观察察单单位位较较多多时时组组段段数可酌情多些。本例初步确定为数可酌情多些。本例初步确定为10个组。个组。l 确确定定组组距距:相相邻邻组组段段下下限限值值之之差差称称为为组组距距,一一般般分分组组时时取取组组距距相相等等。组组距距=极极差差/组组数数,常常取取整整

6、数数作作组组距距,取取整整只只是是为为了了方方便便资资料料的的整整理理汇汇总总。本本例例组组距距=30.1/10= 3.113。6.l划划分分组组段段:各各组组段段应应有有明明确确的的界界限限,便便于于汇汇总总,每每个个组段的起点称组段的起点称“下限下限”,终点称,终点称“上限上限”。l第第一一组组段段必必须须包包括括最最小小值值,一一般般取取略略小小于于最最小小值值的的整整数数作作为为第第一一组组的的下下限限,但但是是第第一一组组的的下下限限值值不不能能等等于于最小值。最小值。l各各组组段段即即不不重重叠叠,也也不不能能留留空空隙隙,所所以以每每一一组组段段均均为为半开闭区间,后一组的下限就

7、是前一组的上限。半开闭区间,后一组的下限就是前一组的上限。l 组段中的横线组段中的横线不能省略,它表示连续型资料。不能省略,它表示连续型资料。l 最最后后一一个个组组段段应应该该包包括括最最大大值值,并并且且封封口口,但但最最后后一一个组段的上限不能等于最大值。个组段的上限不能等于最大值。7.l本例最小值为本例最小值为20.1,故取,故取20为第一组的下限。为第一组的下限。l第二组下限即第二组下限即20+3=23,余类推。,余类推。 l最后一个组段为最后一个组段为5053,包括最大值,包括最大值51.2。l3.列表划记,统计各组段频数。列表划记,统计各组段频数。l4.计算频率与累计频率计算频率

8、与累计频率8.9.频数分布的两个特征频数分布的两个特征l体体重重虽虽有有轻轻有有重重,但但都都向向35组组段段集集中中,数数据据大大多多数数集集中中在在3238组组段段,共共83人人,占占总总人人数数的的55%,这这种种趋趋势势称为集中趋势。称为集中趋势。l另另一一方方面面,随随体体重重逐逐渐渐变变大大或或变变小小,仍仍有有小小部部分分变变量量值值存存在在,称称这这种种特特征征为为离离散散趋趋势势,其其变变异异程程度度是是可可以以测测定定得。得。l集集中中趋趋势势和和离离散散趋趋势势是是频频数数分分布布的的两两个个重重要要特特征征,测测定定其集中趋势和离散趋势就可较全面地分析所研究的事物。其集

9、中趋势和离散趋势就可较全面地分析所研究的事物。10.频数分布的类型频数分布的类型 l频数分布分为对称分布和偏态分布两种类型。频数分布分为对称分布和偏态分布两种类型。l对对称称分分布布是是指指集集中中位位置置在在正正中中,左左右右两两侧侧频频数数分分布布大大体体对对称称,如如上上表表所所示示。若若将将其其绘绘制制成成频频数分布直方图,则更清楚。数分布直方图,则更清楚。l直直方方图图是是以以x(本本例例为为体体重重)为为横横坐坐标标,频频数数或或百百分分数数为为纵纵坐坐标标,用用矩矩形形面面积积大大小小表表示示频频数数多多少。少。11. 某地某地150名名12岁男童体重频数分布图岁男童体重频数分布

10、图 12.频数分布的类型频数分布的类型l偏偏态态分分布布指指集集中中位位置置偏偏向向一一侧侧,频频数数分分布布不不对对称。称。l一一些些以以儿儿童童为为主主的的传传染染病病,患患者者的的年年龄龄分分布布,集集中中位位置置偏偏于于年年龄龄小小的的一一侧侧,频频数数尾尾部部向向右右侧侧延伸,称为正偏态(峰)分布,如图延伸,称为正偏态(峰)分布,如图13.120例链球菌感染咽炎患者潜伏期分布图(正偏峰分布)例链球菌感染咽炎患者潜伏期分布图(正偏峰分布) 14.l一些慢性病患者的年龄分布,其集中位置偏向年龄一些慢性病患者的年龄分布,其集中位置偏向年龄大的一侧,频数尾部向左侧延伸,称为负偏态(峰)大的一

11、侧,频数尾部向左侧延伸,称为负偏态(峰)分布,如图分布,如图15.207例某恶性肿瘤患者年龄分布(负偏峰分布)例某恶性肿瘤患者年龄分布(负偏峰分布) 16.频数表的用途频数表的用途 l作作为为统统计计资资料料描描述述的的一一种种表表达达方方式式,可可以以揭揭示示资资料料分分布类型与特征。布类型与特征。l便于计算统计指标和进一步分析处理。便于计算统计指标和进一步分析处理。l便便于于发发现现资资料料中中远远离离群群体体的的某某些些特特大大或或特特小小的的可可疑疑值值,必要时经检验后舍去。必要时经检验后舍去。l正正态态性性判判断断的的图图示示法法,为为用用正正态态近近似似法法确确定定参参考考值值范范

12、围打基础。围打基础。17.(二)、集中趋势指标(二)、集中趋势指标 l平平均均数数是是统统计计学学中中最最重重要要、应应用用最最广广泛泛的的一一个个指指标标体体系系。用用来来描描述述一一组组变变量量的的集集中中趋趋势势、中中心心位位置置或或平平均均水水平平,常常作作为为一一组组资资料料的的代代表表值值,使使资资料料产产生生简明概括的印象,又便于组间的比较。简明概括的印象,又便于组间的比较。l平均数的计算和应用必须具备同质基础。平均数的计算和应用必须具备同质基础。l常用的平均数有均数、几何均数和中位数。常用的平均数有均数、几何均数和中位数。18.1、均数(、均数(mean)l均均数数是是算算术术

13、均均数数的的简简称称,它它反反映映了了一一组组观观察察值值在在数数量量上上的平均水平。总体均数用希腊字母的平均水平。总体均数用希腊字母表示,样本均数用表示,样本均数用 表示。表示。l均均数数的的计计算算 均均数数的的计计算算方方法法有有直直接接法法和和加加权权法法,计计算算机运算中多采用直接法。机运算中多采用直接法。19.均数的计算均数的计算l直直接接法法是是将将所所有有性性质质相相同同的的观观察察值值x1,x2,x3xn,直直接相加再除以观察值的个数接相加再除以观察值的个数n。例例:10名名12岁岁健健康康男男童童体体重重(kg)分分别别为为39.6,33.2,32.1,29.9,43.7,

14、33.8,35.1,37.8,32.4,38.5,求平均体重。求平均体重。20.均数的计算均数的计算l加加权权法法 当当资资料料中中相相同同观观察察值值较较多多时时,可可将将相相同同观观察察值值的的个个数数,即即频频数数f乘乘以以该该观观察察值值x,以以代代替替相相同同观观察察值值逐逐个个相相加加。对对于于频频数数表表资资料料,可可用用各各组组段段的的频频数数为为f,以以相相应应的组中值为的组中值为x,代入公式计算均数。代入公式计算均数。l从从该该公公式式中中可可以以看看出出,某某一一变变量量值值x的的频频数数越越大大,则则该该变变量量值值对对均均数数的的影影响响越越大大,因因此此频频数数也也

15、叫叫权权数数,这这样样计计算算出出来来的的均均数数又又叫叫加加权权均均数数。权权越越大大,该该变变量量值值对对均均数数的的影响也越大,故称加权法。影响也越大,故称加权法。21.均数的计算均数的计算22.均数的两个重要特征均数的两个重要特征 l离离均均差差的的总总和和等等于于零零,即即各各变变量量值值与与均均数数之之差差的代数和等于零。的代数和等于零。 证明:证明: l各各离离均均差差的的平平方方和和小小于于各各观观察察值值X与与任任何何数数a之之差的平方(差的平方( )。)。23.均数的应用均数的应用 l用用途途:用用来来描描述述一一组组变变量量值值的的平平均均水水平平,具具有有代代表表性性,

16、因此变量值必须是同质的。因此变量值必须是同质的。l应应用用条条件件:适适用用于于呈呈对对称称分分布布的的资资料料,特特别别是是正正态态分分布布或或者者近近似似正正态态分分布布的的资资料料,因因为为这这时时均均数数位位于于分分布布的中心,最能反映分布的集中趋势。的中心,最能反映分布的集中趋势。24.2、几何均数(、几何均数(geometric mean,G)l有有些些医医学学资资料料,如如抗抗体体的的滴滴度度、细细菌菌计计数数、传传染染病病的的潜潜伏伏期期等等,其其频频数数分分布布明明显显偏偏态态,各各观观察察值值之之间间呈呈倍倍数数变变化,这时应该用几何均数反映其平均增(减)倍数。化,这时应该

17、用几何均数反映其平均增(减)倍数。l几何均数的计算几何均数的计算直直接接法法:是是将将n n个个观观察察值值x x1 1,x x2 2,x x3 3x xn n的的乘乘积积开开n n次次方方所得的根。所得的根。加权法:加权法:25.几何均数的应用几何均数的应用l用用于于等等比比级级数数资资料料和和对对数数正正态态分分布布资资料料, 如如:某某些些传传染病的潜伏期、抗体滴度、细菌计数等。染病的潜伏期、抗体滴度、细菌计数等。l同一组资料的几何均数小于算术均数。同一组资料的几何均数小于算术均数。l观观察察值值不不能能为为0 0。因因为为0 0不不能能取取对对数数,也也不不能能与与任任何何其其它它数数

18、呈呈对对数数关关系系。可可以以把把所所有有的的变变量量值值均均加加上上一一个个较较小的常数,如加小的常数,如加1 1。l观观察察值值不不能能同同时时有有正正值值和和负负值值。若若全全是是负负值值,计计算算是是可把负号去掉,得出结果后再加上负号。可把负号去掉,得出结果后再加上负号。26.3、中位数(、中位数(M)和百分位数(和百分位数(P)l中中位位数数(median, M)是是将将一一组组观观察察值值从从小小到到大大按按顺顺序序排排列列,位位次次居居中中的的数数值值对对应应的的观观察察值值就就是是中中位位数数。因因而而全全部部观观察察值值中中,大大于于和和小小于于中中位位数数的的观观察察值值的

19、的个个数相等。数相等。l百百分分位位数数(percentile,P)是是指指把把一一组组资资料料的的全全部部观观测测值值分分为为两两部部分分,理理论论上上讲讲,有有x%的的观观测测值值比比Px小小,有有(100-x)%的的观观测测值值比比Px大大。中中位位数数是是特特定定的的百百分分位数,即位数,即P50,它是表示一组资料集中位置的指标。它是表示一组资料集中位置的指标。27.直接法计算中位数直接法计算中位数 l将原始观察值按大小顺序排列:将原始观察值按大小顺序排列:n n为奇数时,为奇数时, n n为偶数时,为偶数时, l例:例:临临床床观观察察7 7名名某某病病患患者者,其其潜潜伏伏期期(天

20、天)分分别别为为:2 2,3 3,3 3,5 5,6 6,9 9,1616,求其平均潜伏天数。,求其平均潜伏天数。 M M5 5临临床床观观察察8 8名名某某病病患患者者,其其潜潜伏伏期期(天天)分分别别为为:2 2,3 3,3 3,5 5,6 6,9 9,1616,20 20 求其平均潜伏天数。求其平均潜伏天数。 M M(5+65+6)/2/25.55.528.频数表法频数表法l lM=P50lLx: 第第x百分位数所在组段的下限;百分位数所在组段的下限;lfx:第第x百分位数所在组段的频数;百分位数所在组段的频数;lix:第第x百分位数所在组段的组距;百分位数所在组段的组距;lfL:小于小

21、于L各组段的累计频数。各组段的累计频数。29.中位数和百分位数的应用中位数和百分位数的应用 l中中位位数数不不是是由由全全部部观观察察值值的的数数量量值值综综合合计计算算出出来来的的,只只受受居居中中变变量量值值波波动动的的影影响响,不不受受两两端端特特小小值值和和特特大大值值的的影影响响,仅仅仅仅反反映映了了位位次次居居中中的的观观察察值值的的水水平平,因因此此中中位位数数常常用用于于描描述述偏偏态态分分布布或或末末端端无无确确定定数数据据时时资资料的集中位置。料的集中位置。l百百分分位位数数用用于于描描述述样样本本或或总总体体观观察察值值序序列列在在某某百百分分位位置置水水平平,多多个个百

22、百分分位位数数结结合合应应用用时时,可可更更全全面面地地描描述述总体或样本的分布特征,可用来确定医学参考值范围。总体或样本的分布特征,可用来确定医学参考值范围。l由由于于位位于于中中部部的的百百分分位位数数比比较较稳稳定定,所所以以最最常常用用的的百百分位数是中位数,它有较好的代表性。分位数是中位数,它有较好的代表性。30.(三)、离散程度指标(三)、离散程度指标l三三组组同同性性别别、同同年年龄龄儿儿童童的的体体重重(kgkg)如如下下,分析其集中趋势与离散趋势。分析其集中趋势与离散趋势。甲组甲组 26 28 30 32 34 26 28 30 32 34 X X甲甲=30=30kgkg乙组

23、乙组 24 27 30 33 36 24 27 30 33 36 X X乙乙=30=30kgkg丙组丙组 26 29 30 31 34 26 29 30 31 34 X X丙丙=30=30kgkg 哪一组数值的代表性好?哪一组数值的代表性好?31.l离散趋势即个体值之间的变异程度,数据越分离散趋势即个体值之间的变异程度,数据越分散,变异程度越高。散,变异程度越高。极差极差四分位数间距四分位数间距方差方差标准差标准差变异系数变异系数32.1、极差(、极差(range,R)l极极差差也也叫叫全全距距,表表示示一一组组观观察察值值中中最最大大值值与与最最小小值值之之差差,反反映映个个体体差差异异的的

24、范范围围。极极差差大大,说说明明变变异异度度大大,各各变变量量值离均数越远,数据越分散;反之亦然。值离均数越远,数据越分散;反之亦然。l缺点:缺点:由由于于计计算算极极差差时时只只采采用用了了最最大大值值和和最最小小值值,未未考考虑虑组组内内其其它它数数据据的的变变异异程程度度,因因此此用用极极差差反反映映变变异异度度不够全面,稳定性也差;不够全面,稳定性也差;另另外外,当当样样本本例例数数增增大大时时,得得到到较较大大或或较较小小观观察察值值的机会可能会变大,所以极差也可能更大。的机会可能会变大,所以极差也可能更大。 33.2、四分位数间距(、四分位数间距(quartile range ,Q

25、R)lQR=QU-QL=P75P25l四四分分位位数数间间距距包包含含一一半半的的观观测测值值,其其值值越越大大,变变异异程程度越大;其值越小,变异程度越小。度越大;其值越小,变异程度越小。l优优点点:采采用用四四分分位位数数间间距距来来反反映映一一组组资资料料的的变变异异程程度度,比比极极差差稳稳定定。一一般般来来说说,样样本本例例数数越越多多,四四分分位位间间距距越越稳稳定定。实实际际工工作作中中,常常与与中中位位数数结结合合使使用用,描描述述偏偏态分布资料的分布特征。态分布资料的分布特征。 l缺点:不能全面地反映所有观察值的变异程度。缺点:不能全面地反映所有观察值的变异程度。34.l极差

26、极差R 四分位数间距四分位数间距QRl 离均差(离均差(x-) 离均差总和离均差总和 (x)=0 l 离均差绝对值和离均差绝对值和 |x|l 离均差平方和离均差平方和 (x)2 l 均方(方差)均方(方差)2= (x)2/N l 标准差标准差3 3、方差与标准差、方差与标准差35.l但是在实际工作中,总体方差往往是未知的,常用样本但是在实际工作中,总体方差往往是未知的,常用样本方差方差s2来估计。在公式中,用来估计。在公式中,用 代替代替 ,用,用n代替代替N,这这时计算的结果往往比总体方差时计算的结果往往比总体方差2要小,所以分母用要小,所以分母用n-1来代替来代替N,即公式变为:即公式变为

27、: 这时样本方差这时样本方差s2是总体方差是总体方差2的无偏估计。的无偏估计。lN-1:自由度,常用自由度,常用或或df表示,是指随机样本研究中,表示,是指随机样本研究中,可独立地随机选择变动的观测值的个数。可独立地随机选择变动的观测值的个数。36.l三三组组同同性性别别、同同年年龄龄儿儿童童的的体体重重(kg)如如下下,分分析析其其集中趋势与离散趋势。集中趋势与离散趋势。甲组甲组 26 28 30 32 34 X甲甲=30kg R=8 S=3.16乙组乙组 24 27 30 33 36 X乙乙=30kg R=12 S=4.74丙组丙组 26 29 30 31 34 X丙丙=30kg R=8

28、S=2.91丙组数值的代表性好。丙组数值的代表性好。37.标准差的应用标准差的应用l标标准准差差是是反反映映数数据据变变异异程程度度的的指指标标,其其大大小小受受每每一一个个观观察察值值的的影影响响,变变异异程程度度大大,标标准准差差也也大大。各各观观察察值值同同加加(或或减减)一一个个不不为为零零的的常常数数,标标准准差差仍仍保保持持不不变变;但但每每一一个个观观察察值值同同乘乘(或或除除)一一个个不不为为零零的的常常数数,其其标标准准差差等等于于原原标标准差乘(或除)以该常数的绝对值。准差乘(或除)以该常数的绝对值。l常用于描述对称分布,尤其是正态分布资料的离散程度。常用于描述对称分布,尤

29、其是正态分布资料的离散程度。l可以反映样本均数的代表性。可以反映样本均数的代表性。l可用于标准误、变异系数等统计指标的计算。可用于标准误、变异系数等统计指标的计算。 38.4 4、变异系数(、变异系数(CVCV) lCV =s/ CV =s/ 100%100%l它是反映相对变异度的指标。它是反映相对变异度的指标。l变异系数常用于:变异系数常用于:测量单位不同的几组资料变异度的比较;测量单位不同的几组资料变异度的比较;均数相差悬殊的几组资料变异度的比较均数相差悬殊的几组资料变异度的比较。39.小小 结结 l频数的分布特征:集中趋势和离散趋势。频数的分布特征:集中趋势和离散趋势。l频数的分布类型:

30、对称分布和偏态分布。频数的分布类型:对称分布和偏态分布。l 平平均均数数是是描描述述频频数数分分布布集集中中位位置置的的指指标标,它它代代表表一一组观察值的平均水平。组观察值的平均水平。均均数数:描描述述对对称称分分布布,特特别别是是正正态态或或近近似似正正态态分分布布的平均数量水平。的平均数量水平。几几何何均均数数:反反映映等等比比级级数数资资料料或或对对数数正正态态分分布布资资料料的平均增(减)倍数。的平均增(减)倍数。中中位位数数:常常用用于于反反映映偏偏态态分分布布、分分布布不不明明或或分分布布末末端无确定值的资料的位次居中的观察值水平端无确定值的资料的位次居中的观察值水平 。40.l

31、百百分分位位数数描描述述观观察察序序列列在在某某百百分分位位置置的的水水平平,它它是是分分布布的的百百分分界界值值,可可用用于于确确定定医医学学参参考考值值范范围围,适适用用于于任何分布。任何分布。l描述频数分布离散程度的指标有:描述频数分布离散程度的指标有:方方差差与与四四分分位位间间距距,后后者者较较稳稳定定,但但均均不不能能综综合合反映各观察值的变异程度;反映各观察值的变异程度; 方方差差和和标标准准差差,最最为为常常用用,对对正正态态及及近近似似正正态态分分布尤为重要;布尤为重要;变变异异系系数数,可可用用于于资资料料度度量量单单位位不不同同或或均均数数相相差差悬殊时变异度的比较。悬殊时变异度的比较。 41.

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号