[医学]2第04章 统计描述定量

上传人:tia****nde 文档编号:70522612 上传时间:2019-01-17 格式:PPT 页数:34 大小:1.02MB
返回 下载 相关 举报
[医学]2第04章 统计描述定量_第1页
第1页 / 共34页
[医学]2第04章 统计描述定量_第2页
第2页 / 共34页
[医学]2第04章 统计描述定量_第3页
第3页 / 共34页
[医学]2第04章 统计描述定量_第4页
第4页 / 共34页
[医学]2第04章 统计描述定量_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《[医学]2第04章 统计描述定量》由会员分享,可在线阅读,更多相关《[医学]2第04章 统计描述定量(34页珍藏版)》请在金锄头文库上搜索。

1、第四章 统计描述,统计分析,统计描述 计算描述数据特征的指标来反映数据的规律 统计图、统计表反映数据规律 是统计推断的基础 统计推断 用样本信息来推论总体信息,第一节 频数分布,数据分析的第一步是:了解数据分布范围、集中位置、分布形态等特征 频数:某个测量值的个(例)数。 频数分布表(frequency distribution table): 又称频数表,是将原始数据进行适当分组后得到各组的频数而形成的表格。 编制方法:手工、软件(如SAS、SPSS等),例4-1 1998年某山区96名孕妇产前检查次数资料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7等共9

2、6个数值,一、计量资料的频数分布,分别清点每一种取值的个数; 也可以将尾部的多个取值作为一个组进行计数。 本例编制频数表如下:,制作要点:,例4-2 抽样调查某地120名18岁35岁健康男性居民血清铁含量(mol/L),数据如下:,手工编制频数表步骤:,(1)找出最小值和最大值 (2)计算最大值与最小值之差 R = 最大值最小值 = 29.64-7.42 =22.22(mol/L) (3)确定组段数与组距: 组段数一般可在1015之间选择。 组距= R /预计的组段数。 本例如果预计取12个组段,则组距长度约为22.22/12=1.85,取整数2。 (4)列表划记 列出组段,要求第一组包括最小

3、值,最后一组包括最大值;各组段不能重叠,故每一组段均为半开半闭区间。6表示6,8)。最后一组应写出上限和下限。,最终经过整理的频数表,用图形表示直方图(histogram),二、计数资料及等级资料的频数分布表,直接清点每种类别或属性的频数,整理成表格,如:100名大学生性别的频数分布,三、频数表的用途,1、陈述资料的重要形式 2、揭示资料的分布类型 3、描述集中位置和离散程度 4、发现数据中的离群值,四、频数分布特征及类型,1、频数分布的两个特征: 集中趋势 离散趋势 2、频数分布的类型: 对称分布 偏态分布: 集中位置偏向小的一侧叫正偏态,反之叫负偏态,第二节 计量资料的统计描述,请问:以下

4、两组同学的成绩是否相同?,从集中位置和离散程度(变异大小)两个方面进行描述,一、描述集中趋势的统计指标,通常以集中位置来描述集中趋势,也称为位置度量指标(measures of location); 常用的位置度量指标有: 算术均数 几何均数 中位数,1、算术均数(arithmetic mean,简称均数,mean),适用范围:适合描述对称分布资料的集中位置(也称为平均水平)。,(1)直接法:,表示符号: (mu,总体) (x-bar,样本),计算公式:,例4-3 测得8只正常大鼠血清总酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,

5、3.38。试求其算术均数。,算术均数 =(4.20+6.43+2.08+3.45+2.26+4.04+5.42+3.38)/8 = 3.9075 (U/L),(2)加权法:,此为加权均数,f 指权重,加权均数=2228/120=18.57 直接法均数=18.61,2、几何均数(Geometric Mean),适用范围:适用于观察值变化范围跨越多个数量级的资料。其频数图一般呈正偏峰分布。在医学研究中常见的如抗体滴度、效价等。 表示符号:G 计算公式:,(1)直接法:,例4-5 7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64, 1:64,1:128,1:512。

6、试计算其几何均数。,(2)加权法:,实际上是求取对数后的加权算术均数,然后取反对数,例4-6 52例慢性肝炎患者的HBsAg滴度数据如表4-4。试计算滴度的几何均数。,52例慢性肝炎患者的HBsAg滴度的几何均数为1120。,3、中位数(Median,M),含义:指将一组观察值从小到大排序后,位置居中的那个值。 适用范围:可用于各种分布的定量资料;主要用于偏态分布资料、有离群值或不确定值的资料。 表示符号:M 计算公式:,n为奇数:,n为偶数:,常用的描述离散趋势的统计指标有: (1)全距(极差) (2)四分位数间距 (3)方差 (4)标准差 (5)变异系数,二、描述离散趋势的统计指标,1、全

7、距 (极差,Range,R),定义:一组数据中最大值与最小值之差。 特点:简单、稳定性较差。 用途:粗略反映一组数据的变异大小。,例前面两组同学成绩的极差 甲组 R=90-50=40 乙组 R=80-60=20,2、四分位数间距(Quartile Range ,Q),百分位数(percentile,Xp%):是一个数值。该数值将一组资料的全部观察值分为两部分,有p%的观察值比它小,有(100-p)%的观察值比它大。,显然,中位数就是p=50时的百分位数X50%,从表4-2可判断出位于“18-”这个组段。将相应数据代入式(4-8),请确定X75% 计算式中的相关数据?,例4-8 试利用表4-2的

8、频数表求例4-2中血清铁含量的中位数。,该组血清铁资料的中位数为18.74(mol/L),四分位数间距定义为 Q=X75%-X25% 其中, X75%称为上四分位数 X25%称为下四分位数 特点:类似极差,比极差稳定 用途:一般与中位数一起描述偏态分布资料的分布特征。,注意:很多统计书直接用P加上相应数字表示分位数,如 上四分位数:P75, 下四分位数:P25, 中位数:P50,定义:,3、方差 (Variance),特点:全面反映一组数据的平均变异水平、度量单位与原指标不同。 用途:描述对称分析资料变异程度,实际运用中,多采用样本方差 计算公式为:,定义:方差的算术平方根。,4、标准差 (Standard Deviation,S),特点:同方差、但度量单位与原指标相同、使用更广泛。 用途:同方差,描述对称分析资料变异程度,定义:,5、变异系数 (Coefficient of Variation,CV),特点:无单位、相对变异程度、百分比形式 用途:用于量纲不同变量间变异程度的比较、 用于均数差别较大的变量间变异程度的比较,体重的相对变异要大于身高的相对变异,例4-16 通过十省调查得知,农村刚满周岁的女童体重均数为8.42kg,标准差为0.98kg;身高均数为72.4cm,标准差为3.0cm。试计算周岁女童身高与体重的变异系数。,谢谢,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号