2019年统计学第二章计量资料的统计描述课件

上传人:我*** 文档编号:145618674 上传时间:2020-09-22 格式:PPT 页数:85 大小:1.03MB
返回 下载 相关 举报
2019年统计学第二章计量资料的统计描述课件_第1页
第1页 / 共85页
2019年统计学第二章计量资料的统计描述课件_第2页
第2页 / 共85页
2019年统计学第二章计量资料的统计描述课件_第3页
第3页 / 共85页
2019年统计学第二章计量资料的统计描述课件_第4页
第4页 / 共85页
2019年统计学第二章计量资料的统计描述课件_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《2019年统计学第二章计量资料的统计描述课件》由会员分享,可在线阅读,更多相关《2019年统计学第二章计量资料的统计描述课件(85页珍藏版)》请在金锄头文库上搜索。

1、第二章 计量资料的统计描述Descriptions of Measurement Data,Content,Frequence distribution Description of central tendency Measures of dispersion Normal destribution Range of reference value,第一节 频数分布,一、频数分布表(frequency table) : 例2-1 从某单位2019年的职工体检资料中获得101名正常成年女子的血清总胆固醇( )的测量结果如下,试编制频数分布表。,编制步骤如下: 1. 求极差 : 极差(range

2、)也称全距,即最 大值和最小值之差,记作R。 本例:,。,2确定组距(i) : 组段数通常取组 10-15组 本例组距 3写组段: 组下限(L):每个组段的起点 组上限(U):每个组段的终点,组 段 2.30 2.60 2.90 3.20 5.605.90,2.30,2.60,4分组段划记并统计频数,2.30,2.60,频数表:由各组段及其频数所构成的统 计表。,二、频数分布图,三、频数表和频数分布图用途,1描述频数分布的类型 (1)对称分布 :若各组段的频数以频数最多组段为中心左右两侧大体对称,就认为该资料是对称分布,(2)偏态分布 : 1)右偏态分布(skewed to the right

3、 distribution)也称正偏态分布(positive skewness distribution):右侧的组段数多于左侧的组段数,频数向右侧拖尾,2)左偏态分布(skewed to the left distribution)也称负偏态分布(negative skewness distribution):左侧的组段数多于右侧的组段数,频数向左侧拖尾,2描述频数分布的特征 变异的范围在2.305.90 有明显的统计分布规律,数据主要集中在3.504.70 之间,尤以组段的人数3.804.10 最多,且上下组段数的频数分布基本对称。,3便于发现一些特大或特小的可疑值,4便于进一步做统计分析

4、和处理,第二节 集中趋势的描述,统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。 常用的平均数有: 算术均数 几何均数 中位数,一、算术均数,算术均数:简称均数(mean) 可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。,1、计算方法,(1)直接计算法 公式 :,例2-2 用直接法计算例2-1某单位101名正常成年女子的血清总胆固醇的均数。,(2)加权法: 公式 : 计算4,4,4,6,6,8,8,8,10的均数?,例2-3 利用表2-1计算101名正常成年女子的血总胆固醇的均数。,式中k表示频数表的组段数, 及 分别表示各组段

5、的频数和组中值,如表2-1第1个组段的组中值为, 余类推(见表2-1的第(3)栏)。在这里,频数起到了“权”(weight)的作用,即某个组段频数多,权数就大,其组中值对均数的影响也大;反之,影响则小,2、应用,适用于对称分布,特别是正态分布资料。,二、 几何均数,几何均数(geometric mean): 可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。 1、计算方法 (1)、直接计算法 公式: 或,例2-4 某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为,10,20,40,40,160,求几何均数。,(2)加权法,公式:,例2-5 69例类风湿关

6、节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。,故例类风湿关节炎患者血清EBV-VCA-lgG抗体的平均滴度为:1:150.6。,2、应用: 适用于成等比级数的资料,特别是对数正态分布资料。,三、 中位数与百分位数,(一)中位数 中位数(median):是将变量值从小到大排列,位置居于中间的那个变量值。 例: 1,3,7,5,100 中位数为多少?,计算,公式: n为奇数时 n为偶数时,例2-6 7名病人患某病的潜伏期分别为2,3,4,5,6,9,16天,求其中位数。,本例n=7,为奇数 例2-7 8名患者食物中毒的潜伏期分别为1,2,

7、2,3,5,8,15,24小时,求其中位数。 本例n=8,为偶数,应用,适用于: 1、各种分布类 型的资料 2、特别是偏态分布资料和开囗资料(一端或两端无确切数值的资料)。,(二)百分位数,百分位数(percentile)是一种位置指标,用 来表示。 一个百分位数 将全部变量值分为两部分,在不包含 的全部变量值中有 的变量值比它小, 变量值比它大。,1直接计算法,设有x个原始数据从小到大排列,第x百分位数的计算公式为: 当 为带有小数位时: 当 为 整数时:,例2-9 对某医院细菌性痢疾治愈者的住院天数统计,名患者的住院天数从小到大的排列如下,试求第5百分位数和第99百分位数。,患 者: 住院

8、天数: n=120,120X5%=6,为整数:,例2-9 对某医院细菌性痢疾治愈者的住院天数统计,名患者的住院天数从小到大的排列如下,试求第5百分位数和第99百分位数。,患 者: 住院天数: ,带有小数,取整后trunc(118.8)= 118,2频数表法,公式:,式中,、,和,分别为第,X,百分位数所在组段,的下限、组距和频数,,为小于,各组段的累计频数,,n,为总例数。,例2-10 某地118名链球菌咽喉炎患者的潜伏期频数表见表2-5第(1)、(2)栏,试分别求中位数及第25、第75百分位数。,第三节 离散趋势的描述,例2-11 三组同龄男孩的身高值(cm),常用统计指标:极差、四分位数间

9、距、方差、标准差和变异系数。,一、 极差 极差,用R表示:即一组变量值最大值与最小值之差。,二、四分位数间距,四分位数间距,用QR表示: QR= 下四分位数: 上四分位数:,例2-12 续例2-10。已知P25=39.2,P75=67.7,计算118名链球菌咽喉炎患者潜伏期的四分位数间距。 (天) 请回答: 四分位数间距可以看成大小在中间的一半变量值的全距( R )。,四分位数间距可以看成一半变量值的极差。,三、方差与标准差,1、 方差(variance)也称均方差(mean square deviation),反映一组数据的平均离散水平。 样本方差用 表示,2、 公式: 样本标准差用 表示

10、公式:,标准差的公式还可以写成 : 利用频数表计算标准差的公式为,例2-12 续例2-10,计算三组资料的标准差。,甲组:,四、 变异系数,变异系数(,coefficient of variation,)记为,CV,,,多用于观察指标单位不,同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿,童,身高与成人身高变异程度的比较。,某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg,比较其变异度?,(观察指标单位不同),均数相差较大时:,第四节 正态分布,正态分布:又称为Gauss分布(Gaussian distribution)。,

11、设想当原始数据的频数分布图的观察人数逐渐增加且组段不断分细时,图2-4中的直条就不断变窄,其顶端则逐渐接近于一条光滑的曲线。这条曲线形态呈钟形,两头低、中间高,左右对称,近似于数学上的正态分布。在处理资料时,我们就把它看成是正态分布。,一、正态分布的概念和特征,1正态分布曲线的数学函数表达式 如果随机变量 的分布服从概率密度函数,2正态分布的特征,(4)正态曲线下的面积分布有一定的规律。,对公式(2-17)积分 :,正态分布是一个分布族,对应于不同的参数,m,和,s,会产生不同位置、,不同形状的正态分布。,正态分布除了可估计频数分布外,还是许多统计方法的基础,并可应用于质量控制及制定医学参考值

12、范围。,第五节 医学参考值范围的制定,一、基本概念 医学参考值(reference value)是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标常数,也称正常值。 由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故采用医学参考值范围(medical reference range)作为判定正常和异常的参考标准。,医学参考值范围涉及到采用单侧界值还是双侧界值的问题,这通常依据医学专业知识而定。,双侧 : 血清总胆固醇无论过低或过高均属异常 白细胞数无论过低或过高均属异常 单侧 : 1、血清转氨酶仅过高异常 2、肺活量仅过低异常,医学参考值范围有 、 、 等, 最常用的为 。 计算医学参考值范围的常用方法: 1、正态分布法 2、百分位数法,二、方法,1、正态分布法: 许多生物医学数据服从或近似服从正态分布,如同年龄同性别儿童的身高值、体重值,同性别健康成人的红细胞数等; 有些医学资料虽然呈偏态分布,但若能通过适当的变量变换转换为正态分布,也可采用正态分布法制定参考值范围。,适用:正态分布资料,公式:,2、百分位数法,适用:各种分布资料特别是偏态分布资料,公式:,例2-17 测得某年某地名正常人的尿汞值如下表,试制定正常人尿汞值的参考值范围。,正常人的尿汞值为偏态分布,且过高为异常,应计算第95百分位数,THANK YOU !,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号