计量资料的统计描述

上传人:ni****g 文档编号:570182214 上传时间:2024-08-02 格式:PPT 页数:72 大小:827KB
返回 下载 相关 举报
计量资料的统计描述_第1页
第1页 / 共72页
计量资料的统计描述_第2页
第2页 / 共72页
计量资料的统计描述_第3页
第3页 / 共72页
计量资料的统计描述_第4页
第4页 / 共72页
计量资料的统计描述_第5页
第5页 / 共72页
点击查看更多>>
资源描述

《计量资料的统计描述》由会员分享,可在线阅读,更多相关《计量资料的统计描述(72页珍藏版)》请在金锄头文库上搜索。

1、第二章第二章计量资料的统计描述计量资料的统计描述第一节第一节 频数分布频数分布第二节第二节 集中趋势的描述集中趋势的描述第三节第三节离散趋势的描述离散趋势的描述第四节第四节 正态分布正态分布第五节第五节 医学参考值范围的制定医学参考值范围的制定第一节第一节频数分布频数分布 一、频数分布表(一、频数分布表(frequencytable)例例2-1测得测得130名健康成年男子脉搏资料名健康成年男子脉搏资料(次次/分分)如下,试编制如下,试编制频数表和观察频数分布情况。频数表和观察频数分布情况。75767269667257687172697273828082676973647458706460776

2、677646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876编制频数表的步骤编制频数表的步骤编制频数表步骤流程图编制频数表步骤流程图(1)求极差求极差(range):即最大值与最小值之差,又称为):即最大值与最小值之差,又称为全距。全距。R845

3、7=27(次次/分分)(2)决定分组组数、组距决定分组组数、组距:根据研究目的和样本含量:根据研究目的和样本含量n确定分组组数,通常分为确定分组组数,通常分为815个组。组距个组。组距=极差极差/组数,组数,为方便计,组距为极差的十分之一为方便计,组距为极差的十分之一,再略加调整。再略加调整。27/10=2.73(3)列出组段列出组段:第一组段的下限略小于最小值,最后一:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。个组段上限必须包含最大值。5659808385(4)划记计数划记计数:用划记法将所有数据归纳到各组段,得:用划记法将所有数据归纳到各组段,得到各组段的频数。到各组段的

4、频数。频数表的编制步骤频数表的编制步骤表2-1 130名健康成年男子脉搏(次/分)的频数分布表Nf f 二、频数分布图三、频数表和频数分布图用途三、频数表和频数分布图用途1描述频数分布的描述频数分布的类型类型(对称分布、偏态分布)(对称分布、偏态分布)(1 1)对称分布)对称分布 :若:若各组段的频数以中各组段的频数以中心位置左右两侧大心位置左右两侧大体对称,就认为该体对称,就认为该资料是对称分布资料是对称分布 是否为对称分布?是否为对称分布?(2)偏态分布)偏态分布:1)右偏态分布(正偏态分布):右侧的组段数多于)右偏态分布(正偏态分布):右侧的组段数多于左侧的组段数,频数向右侧拖尾。左侧的

5、组段数,频数向右侧拖尾。 表表2-2 115名正常成年女子血清转氨名正常成年女子血清转氨酶(酶(mmol/L)含量分布)含量分布 2)左偏态分布(负偏态分布): 左侧的组段数多于右侧的组段数,频数向左侧拖尾。 表表2-3 101名正常人的血清肌红蛋白含量分布名正常人的血清肌红蛋白含量分布2描述频数分布的描述频数分布的特征特征表表21数据的频数分布特征:数据的频数分布特征:数据数据变异(离散)变异(离散)的范围在的范围在5784(次(次/分分)数数据据集集中中(平平均均)的的组组段段在在6873(次次/分分)之之间间,尤尤以以组组段段的的人人数数71(次次/分分)最最多多。且上下组段的频数分布基

6、本对称。且上下组段的频数分布基本对称。3便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值 4便于进一步做统计分析和处理便于进一步做统计分析和处理第二节第二节集中趋势的描述集中趋势的描述 统计上使用平均数(统计上使用平均数(average)这一指标体系来描)这一指标体系来描述一组变量值的集中位置或平均水平。述一组变量值的集中位置或平均水平。常用的平均数有常用的平均数有:算术均数(均数)(算术均数(均数)(mean)几何均数(几何均数(geometricmean)中位数中位数(median)与百分位数()与百分位数(percentile)众数(众数(mode)一、算术均数一、算术均数算

7、术均数:简称均数(算术均数:简称均数(mean)可可用用于于反反映映一一组组呈呈对对称称分分布布的的变变量量值值在在数数量量上上的的平平均均水水平平或或者者说说是是集集中中位位置置的特征值。的特征值。1、计算方法、计算方法(1)直接计算法)直接计算法公式公式:举例:试计算举例:试计算4,4,4,6,6,8,8,8,10的均数?的均数?例例2-1测得测得130健康成年男子脉搏资料健康成年男子脉搏资料(次次/分分)如下,试编制频如下,试编制频数表和观察频数分布情况。数表和观察频数分布情况。7576726966725768717269727382808267697364745870646077667

8、7646776757571656276727160677575737966697978707270727872677280687061707372718170667571637774766865776977757964797376618064697073696865706966816364807478768466707360768273646573736380687670797764706669737876(2)加权法)加权法(利用频数表):利用频数表):公式 :k:频频数数表表的的组组段段数数, f :频频数数, X:组中值。:组中值。表2-2 130名健康成年男子脉搏(次/分)的频数分布表

9、Nf ffXfXfXfX2 22、应用、应用均数均数适用于对称分布,特别适用于对称分布,特别是正态分布资料。是正态分布资料。二、二、几何均数(几何均数(geometricmean) 可用于反映一组经可用于反映一组经对数对数转换转换后呈对称分布或正态分后呈对称分布或正态分布的变量值在数量上的平均布的变量值在数量上的平均水平。水平。几何均数(几何均数(geometric meangeometric mean)几何均数几何均数:变量变量对数值的对数值的算术均算术均数数的反对数的反对数。 其他对数(如自然对数)变换获得相同的几何均数例例2-5有有8份血清的抗体效价分别为份血清的抗体效价分别为1:5,1

10、:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗体效价。求平均抗体效价。平均抗体效价为:平均抗体效价为:1:57(2)加权法)加权法公式:公式: 例例2-669例类风湿关节炎(例类风湿关节炎(RA)患者)患者血清血清EBV-VCA-lgG抗体滴度的分布见表抗体滴度的分布见表2-4第第(1)、(2)栏,求其平均抗体滴度。栏,求其平均抗体滴度。2、应用:、应用: 适用于成等比数列的资料,适用于成等比数列的资料,特别是服从对数正态分布资特别是服从对数正态分布资料。料。三、三、中位数与百分位数中位数与百分位数11个大鼠存活天数:个大鼠存活天数:4,10,7,50,3,

11、15,2,9,13,60,60平均存活天数平均存活天数?(一)中位数(一)中位数(median)是将每个变量值从小到大排列,是将每个变量值从小到大排列,位置位置居于中间的那个变量居于中间的那个变量值值。计算计算公式公式: n为奇数时为奇数时 n为偶数时为偶数时例例2-39名中学生甲型肝炎的潜伏期名中学生甲型肝炎的潜伏期分别为分别为12,13,14,14,15,15,15,17,19天,求其天,求其中位数中位数。频数表资料的中位数频数表资料的中位数下限值下限值L上限值上限值Ui; fm中位数中位数M例21频数表中位数的计算Nf f中位数71+3x(130x50%59)/26应用应用1、各种分布类

12、型的资料、各种分布类型的资料2、特别适合大样本、特别适合大样本偏态偏态分布资料或者分布资料或者一端或两端无确切数值的资料一端或两端无确切数值的资料。 百分位数示意图百分位数示意图(二)百分位数(二)百分位数(percentile) 例例对某医院细菌性痢疾治愈者的住对某医院细菌性痢疾治愈者的住院天数统计,院天数统计,120名患者的住院天数从小到名患者的住院天数从小到大排列如下,试求大排列如下,试求第第5百分位数和百分位数和第第99百分百分位数。位数。患患者者:住院天数住院天数:(1)n=120,为整数为整数: 2频数表法 公式: 当 时,公式(2-9)即为中位数的计算公式 例例2-9试分别求例试

13、分别求例21频数表的第频数表的第25、第、第75百分位数。百分位数。P2565+3x(130x25%19)/15P7574+3x(130x75%85)/19 设设有有甲甲、乙乙、丙丙三三名名医医生生,分分别别对对相相同同的的5份份血血样样进进行行红红细细胞胞计计数数(万万/mm3),甲甲得得出出了了560、540、500、460、440,乙乙得得出出了了520、510、500、490、480,丙丙得得出出了了510、505、500、495、490,见见下下图图2,三三名名医医生生的的计计数数结结果果得得到到的均数均为的均数均为500,5个数值之和均为个数值之和均为2500。第三节第三节离散趋势

14、的描述离散趋势的描述甲医生得出的5个观察值间的差异(离散程度)较大,而丙医生得出的5个观察值间的差异(离散程度)较小。常用统计指标:常用统计指标:极差、四分位数间距、极差、四分位数间距、方差、标准差和变异系数。方差、标准差和变异系数。一、极差(一、极差(Range)极差,用极差,用R表示:即一组变量值最大表示:即一组变量值最大值与最小值之差。值与最小值之差。对于书中例对于书中例2-1数数据,有据,有简单,但仅利用了两端点值,稳定性差。二、四分位数间距二、四分位数间距(quartilerange) 四分位数间距,用Q表示: Q=下四分位数: 上四分位数:例21数据P2565+3x(130x25%

15、19)/15P7574+3x(130x75%85)/19三、方差与标准差三、方差与标准差 1.方差(方差(variance)也称均方差)也称均方差(meansquaredeviation),反映一组数),反映一组数据的平均离散水平。据的平均离散水平。总体方差总体方差样本方差样本方差离均差平方和SS2、公式: 样本标准差用 表示 ,其度量单位与均数一致,所以最常用。公式:离均差平方和SS 标准差的公式还可以写成 :利用频数表计算标准差的公式为例2-11 对例2-1的前10个数据: 75,76,72,69,66,72,57,68,71,72, 用直接法计算标准差。例2-12 利用表2-2中的数据和

16、频数表法计算标准差。Nf ffXfXfXfX2 2标准差的意义和用途1.说明资料的离散趋势(或变异程度),标准差的值越大,说明变异程度越大,均数的代表性越差; .。 标准差与原始数据的单位一致,在科技论文报告中,均数与标准差经常被同时用来描述资料的集中趋势与离散趋势。2.用于计算变异系数3.用于计算标准误(见第四章)4.结合均值与正态分布的规律,估计参考值的范围(见第五节)。四、变异系数四、变异系数 变异系数(coefficient of variation,CV) 常用于比较度量单位不同度量单位不同或均数相差均数相差悬殊悬殊的两组(或多组)资料的变异程度。 某地某地7岁男孩身高的均数为,标准

17、差为;岁男孩身高的均数为,标准差为;体重均数为,标准差为体重均数为,标准差为2.26kg,比较其变异度?比较其变异度? 第四节第四节正态分布正态分布正态曲线(正态曲线(normal curvenormal curve)的发现)的发现deMoivre(1667-1754),),publishedin1733Laplace(1749-1827)Gauss(1777-1855)正态分布)正态分布:又称又称高斯分高斯分布布(Gaussiandistribution)一、正态分布的概念和特征一、正态分布的概念和特征1正态分布曲线的数学表达式正态分布曲线的数学表达式(概率密度函数,概率密度函数,proba

18、bilitydensityfunction,pdf ) ,2正态分布的特征正态分布的特征正态曲线下面积分布有一定的规律,总面积正态曲线下面积分布有一定的规律,总面积=1。累积面积规律:累积面积规律:图图2-7 正态曲线面积分布示意图正态曲线面积分布示意图 二、标准正态分布二、标准正态分布见见P404405,ZN(0,1)2例2-1的130名健康成年男子脉搏资料的均数、标准差分别为:与5.80 (次/分);问在正态分布假定下,脉搏在6575(次/分)之间有多少人?一、基本概念一、基本概念第五节第五节医学参考值范围的制定医学参考值范围的制定 1.意意 义义 : 医医 学学 参参 考考 值值 ( r

19、eferencevalue)是是指指包包括括绝绝大大多多数数正正常常人人的的人人体体形形态态、机机能能和和代代谢谢产产物物等等各各种种生生理理及及生生化化指指标标常常数数,也称正常值。也称正常值。由由于于存存在在个个体体差差异异,生生物物医医学学数数据据并并非非常常数数而而是是在在一一定定范范围围内内波波动动,故故采采用用医医学学参参考考值值范范围围作作为为判判定定正正常常和和异异常常的的参参考考标标准准,但但不不是是“金标准金标准”。2.单、双侧问题,常依据医学专业知识而定单、双侧问题,常依据医学专业知识而定 双侧双侧:如:血清总胆固醇、血液白细胞数无论过低或过如:血清总胆固醇、血液白细胞数

20、无论过低或过高均属异常高均属异常单侧上限单侧上限:如:血清转氨酶、如:血清转氨酶、体内有毒物质过高异常体内有毒物质过高异常(越低越好(越低越好,P5) 3.有有90%、95%、99%等医学参考等医学参考值范围,值范围,最常用的是最常用的是95%。计算医学参考值范围的常用方法:计算医学参考值范围的常用方法:1、正态分布法、正态分布法2、百分位数法、百分位数法二、正态分布法二、正态分布法公式:公式:单侧单侧下限下限单侧单侧上限上限ZZZZ单侧单侧下限下限单侧单侧上限上限 例例2-16 测得某年某地名正常人的尿汞值测得某年某地名正常人的尿汞值如下表,试制定正常人尿汞值的如下表,试制定正常人尿汞值的95%参考参考值范围。值范围。 表表2-7 282名正常人尿汞值(名正常人尿汞值( )测量结果)测量结果单侧上限单侧上限医学参考值范围的制定医学参考值范围的制定医学参考值范围的制定医学参考值范围的制定 %90 90 95959999正态分布法正态分布法正态分布法正态分布法百分位数法,百分位数法,百分位数法,百分位数法,双侧双侧双侧双侧双侧双侧双侧双侧单侧单侧单侧单侧单侧上界单侧上界单侧上界单侧上界单侧上界单侧上界单侧上界单侧上界单侧下界单侧下界单侧下界单侧下界单侧下界单侧下界单侧下界单侧下界单侧单侧单侧单侧

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号