医学]医学统计学2011-10-21描述

上传人:tia****nde 文档编号:69676055 上传时间:2019-01-14 格式:PPT 页数:125 大小:1.27MB
返回 下载 相关 举报
医学]医学统计学2011-10-21描述_第1页
第1页 / 共125页
医学]医学统计学2011-10-21描述_第2页
第2页 / 共125页
医学]医学统计学2011-10-21描述_第3页
第3页 / 共125页
医学]医学统计学2011-10-21描述_第4页
第4页 / 共125页
医学]医学统计学2011-10-21描述_第5页
第5页 / 共125页
点击查看更多>>
资源描述

《医学]医学统计学2011-10-21描述》由会员分享,可在线阅读,更多相关《医学]医学统计学2011-10-21描述(125页珍藏版)》请在金锄头文库上搜索。

1、数值变量资料的统计描述,广州医学院预防医学教研室 2011-10-21,一、数值变量资料的统计描述 频数表的编制方法 找全距(R) R=最大值 最小值 定组距(i) i =全距 / 组数 写组段 第一组组段包括最小值 最后一组组段包括最大值 划 记 各组段的观察单位数即各组段的频数, 频数分布的特征 集中趋势 变量值集中分布的位 置 离散趋势 变量值围绕集中位置 的分布情况 频数分布的类型 对称分布 (见表、图),某地区130名正常成年男子红细胞数(1012/L)的频数分布 红细胞数 划 记 频 数 (1) (2) (3) 3.70 | | 2 3.90 | | | | 4 4.10 正 |

2、| | | 9 4.30 正正正 | 16 4.50 正正正正 | | 22 4.70 正正正正正 25 4.90 正正正正 | 21 5.10 正正正 | | 17 5.30 正 | | | | 9 5.50 | | | | 4 5.705.90 | 1 合 计 130,偏态分布 正偏态分布 238名正常人发汞值(g/g) 的中位数和百分位数的频数表计算 发 汞 值 频 数 累计频数 累计频率(%) (1) (2) (3) (4)=(3)/238 0.3 20 20 8.4 0.7 66 86 36.1 1.1 60 146 61.3 1.5 48 194 81.5 1.9 18 212 8

3、9.1 2.3 16 228 95.8 2.7 6 234 98.3 3.1 1 235 98.7 3.5 0 235 98.7 3.94.3 3 238 100.0,负偏态分布 某些青年恶性肿瘤死亡率的年龄分布 年龄组 恶性肿瘤死亡率1/10万 0 0.5 10 12 20 15 30 76 40 189 50 234 60 386 70 286,二、集中趋势(Central tendency) 的描述 平均数(average)常用于描述一组变量值的集中趋势,是反映同质资料的平均水平或集中位置的特征值。 均数 常用平均数 几何均数 中位数,常用平均数 均数 (算术均数) (mean) 表示符

4、号 总体均数 () 样本均数 () 应 用 对称分布资料,尤其是正态分布资料 计算方法 1+ 2+ n 直接法= = n n f 1 1+f 2 2+f kk f 加权法= = f 1 +f 2+f k n,常用平均数 几何均数 (geometric mean) 表示符号 (G) 应 用 变量值呈倍数关系,对数正态分布资料 计算方法 直接法 G = n x1 x2 xn lgx1+lgx2+lgxn lgx 加权法 G = lg1 = lg1 n n f1lgx1+f2lgx2+fklgxk f lgx G = lg1 = lg1 n n,常用平均数 中位数 (median) 表示符号 (M)

5、 偏态分布资料 应 用 变量值分布一端或两端无确定数值 分布不明资料 计算方法 直接用变量值计算 M = X n+1 (n为奇数时) 2 1 或 M= X n + X n+1 (n为偶数时) 2 2 2,i n 用频数表计算 M = L + ( fL ) fx 2 附:百分位数 ( Percentile,Px ) 描述变量值序列在某百分位位置的水平,多个百分位数结合可更全面地描述变量值的分布特征。 i Px = L + (n x% fL ) fx,三、离散趋势 (fendency of dispersion) 描述变量值的离散趋势用变异指标 全距 常用变异指标 标准差 变异系数 四分位数间距,

6、常用变异指标 全距 (range, 简记为R) 反映变量值的变异范围 R = 最大值 最小值 各种类型资料都可应用,但只作 参考资料,常用变异指标 方差 (variance) 和 标准差(standard deviation) 定义公式 ( ) 2 ( ) 2 2 = = N N ( ) 2 ( ) 2 S2 = S = n 1 n 1,应用公式 2 ( ) 2 / n 直接法 S = n 1 f2 ( f ) 2 / n 加权法 S = n 1, 方差和标准差 用 途 1. 表示变量值的离散程度,用于两组 变量值比较时,要求其性质相同, 均数相差不大 2. 与均数结合,表示均数的代表性 (s

7、),常用变异指标 变异系数 (coefficient of variation, 简记为CV) 定义:CV = s / 100% 用途:比较两组或多组单位不同 或均数相差较大资料的变 异程度,常用变异指标 四分位数间距 ( quartile, 简记为Q) 四分位数间距为特定的百分位数,可看作为中间1/2变量值的全距 Q = Qu QL Qu = P75 (上四分位数) QL = P25(下四分位数) 用途:用于表示偏态分布资料的变异程度,常与中位数配合使用,正态分布及其应用 正态分布的概念和特征 正态分布是以均数为中心呈对称的钟型分布 正态分布的特征有: 1) 正态分布曲线在均数处最高 2)

8、正态分布以均数为中心,左右对称且逐渐减少 3) 正态分布曲线的两个参数和,记作N (,) 4) 正态曲线下的面积为1 (或100%),正态分布,正态分布,正态分布函数,正态曲线下的面积分布规律: 1 占正态曲线下面积的68.27% 1.96 占正态曲线下面积的95.00% 2.58 占正态曲线下面积的99.00% 若样本含量较大(n100),则上式可用代替, 用s代替。 则上式可写为: 1S 占正态曲线下面积的68.27% 1.96S 占正态曲线下面积的95.00% 2.58S 占正态曲线下面积的99.00%, 标准正态分布 标准正态分布为服从均数为0,标准 差为1,即N(0,1)的正态分布

9、其转换公式为:u = -/ 标准正态曲线的面积分布规律: -1 u +1 占总面积的68.27% -1.96 u +1.96 占总面积的95.00% -2.58 u +2.58 占总面积的99.00%,标准正态分布,标准正态分布(standard normal distribution)函数 其中 Z=(X-)/,标准正态分布, 正态分布的应用与临床参考值的确定 正态曲线面积分布规律可用于估计医学临床参考值与质量控制 临床参考值的确定方法 1) 正态分布法: 用于正态分布的资料 双侧参考值 US 单侧参考值 - US 或 + US,2) 百分位数法: 用于偏态分布资料 双侧参考值(= 0.05

10、) P2.5 P97.5 单侧参考值(= 0.05) P5 或 P95,常用统计指标,集中趋势 算术平均数 中位数 几何平均数,离散趋势 全距 平均差 方差与标准差,1. 集中趋势,集中趋势(measures of central tendency)是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。 集中趋势包括算术平均数、加权平均数、几何平均数、调和平均数、中位数、众数等。,算术平均数,算术平均数(arithmetic mean)是所有观察值的总和除以总频数所得之商,简称为平均数或均数。,算术平均数的优点,反应灵敏; 严密确定,简明易懂,计算方便; 适合代数

11、运算; 受抽样变动的影响较小; 样本算术平均数是总体平均数的最好估计值,算术平均数的缺点,易受两极端数值(极大或极小)的影响; 某村农户收入状况 120, 127, 130, 131, 132, 132, 135, 136, 137, 139, 140, 145, 146, 149, 153, 158, 160, 320, 400 平均数162.63 一组数据中某个数值的大小不够确切时就无法计算其算术平均数。,中位数,中位数(median)是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。 中位数的原始数值计算方法: 12 14 15 15 17 18 20 2

12、3 24: 17 12 14 15 15 17 18 20 23 24 25: 17.5 中位数的应用及其优缺点,中位数的应用及其优缺点,中位数虽然也具备一个良好的集中量所应具备的某些条件,例如比较严格确定、简明易懂,计算简便,受抽样变动影响较小,但是它不适合进一步的代数运算。它适用于以下几种情况: 一组数据中有特大或特小两极端数值时; 一组数据中有个别数据不确切时; 资料属于等级性质时。,几何平均数,几何平均数(geometric mean)是N个数值连乘积的N次方根。计算公式为 当一个数列的后一个数据是以前一个数据为基础成比例增长时,要用几何平均数求其平均增长率。,2. 离散趋势,离散趋势

13、:用于表示数据的变异程度或离散程度。常用的差异量有全距、平均差、方差、标准差和变异系数等。,全距,全距(range)指一组数据中最大值与最小值之差。 优点:概念清楚,意义明确,计算简单; 缺点:容易受极端数值的影响,反应不灵敏。,平均差,平均差(average deviation)就是每一个数据与该组数据的中位数(或算术平均数)离差的绝对值的算术平均数。,计算公式:,方差和标准差,方差(variance)指离差平方的算术平均数 定义公式和计算公式:,标准差,标准差(standard deviation)是指离差平方和平均后的方根。即方差的平方根。 定义公式和计算公式:,样本的方差与标准差,样本的方差 样本的标准差,变异系数,变异系数(coefficient of variation):标准差与其算术平均数的百分比。 其计算公式为 用途: 两种单位不同 单位相同而两个平均数相差较大的资料。,位置量*,百分位数(percentile)频数分布中相对于某个特定百分点的原始分数,它表明在分布中低于该分数的个案占总频数的百分比。 中位数与四分位数(quartile),百分等级(percentile rank)频数分布中低于特定原始分数的频数百分比。,Content,Frequence distribution Descri

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号