计量资料的统计描述2014

上传人:n**** 文档编号:50619699 上传时间:2018-08-09 格式:PPT 页数:41 大小:799.50KB
返回 下载 相关 举报
计量资料的统计描述2014_第1页
第1页 / 共41页
计量资料的统计描述2014_第2页
第2页 / 共41页
计量资料的统计描述2014_第3页
第3页 / 共41页
计量资料的统计描述2014_第4页
第4页 / 共41页
计量资料的统计描述2014_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《计量资料的统计描述2014》由会员分享,可在线阅读,更多相关《计量资料的统计描述2014(41页珍藏版)》请在金锄头文库上搜索。

1、第二讲 计量资料的统计描述中南大学卫生统计教研室 杨土保频数分布一、频数分布表(frequency table) 编制频数分布表可了解其分布的范围、数 据最集中的区间以及分布的形态。 例2-1 从某单位1999年的职工体检资料 中获得101名正常成年女子的血清总胆 固醇()的测量结果如下,试编制频数 分布表。2.35 4.21 3.32 5.35 4.17 4.13 4.48 3.98 4.73 2.78 4.26 3.58 4.34 4.84 4.41 3.99 3.80 3.87 4.78 3.95 3.92 3.58 3.66 4.28 3.78 4.57 4.26 3.26 3.50

2、2.70 4.61 4.75 2.91 3.93 3.78 4.13 3.91 4.59 3.26 4.19 3.00 2.68 4.52 4.91 3.84 3.68 3.18 4.83 3.87 3.95 3.91 4.52 4.28 5.13 3.27 4.15 4.55 4.80 3.41 4.12 3.95 4.06 5.71 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.17 4.95 4.15 3.25 4.36 3.29 4.33 3.63 3.30 3.75 5.08 4.53 3.92 3.58 3.84 3.60 3.19 4.50

3、4.50 5.35 3.51 4.06 3.07 3.55 3.96 4.59 3.52 4.83 4.23 3.57频数分布编制步骤如下: 求极差(range,R):也称全距,即最大值和最小值 之差,本例R=5.71-2.35=3.36(mmol/L)。 确定组段数和组距:组段数(10-15组)。组距可通过极 差除以组段数求得,本例i=3.36/10=0.30。3写出组段: 每个组段的下限为L、上限为U,起始 组段和最后组段应分别包含全部变量值的最小值和最 大值,见表2-1第(1)栏。 4分组划记并统计频数:各组段的频数见表2-1第(2)栏 ,然后求频数合计,完成频数表。 频数分布组 段 频

4、数f 组中值X fx fx2(1) (2) (3) (4)=(2)(3) (5)=(2)(3)2 2.30 1 2.45 2.45 6.00 2.60 3 2.75 8.25 22.69 2.90 6 3.05 18.30 55.82 3.20 8 3.35 26.80 89.78 3.50 17 3.65 62.05 26.48 3.80 20 3.95 79.00 312.05 4.10 17 4.25 72.25 307.06 4.40 12 4.55 54.60 248.43 4.70 9 4.85 43.65 211.70 5.00 5 5.15 25.75 132.61 5.30

5、2 5.45 10.90 59.41 5.605.90 1 5.75 5.75 33.06 合 计 101 409.75 1705.09频数分布二、频数分布图 根据表2-1资料,以各组段血清总胆固醇 含量为横坐标、频数为纵坐标,可绘制 频数分布图(graph of frequency distribution), 图2-1频数分布三、频数表和图的用途 1、描述频数分布的类型对称分布:各组段的频数以频数最多 组段为中心左右两侧大体对称; 偏态分布:频数最多组段不在中心位 置,其两侧组段数不对称。 正(右)偏态分布(见图2-2)负(左)偏态分布(见图2-3)频数分布图2-2频数分布图2-3频数分布

6、2描述频数分布的特征 从表2-1可看出 这些数据的分布特征有两点:变异的 范围在;有明显的统计分布规律,数 据主要集中在之间,尤以组段的人数最 多,且上下组段数的频数分布基本对称 。 3便于发现一些特大或特小的可疑值 4便于进一步做统计分析和处理集中趋势的描述集中趋势描述数据的集中位置和平均水平 。 常用指标:算术均数几何均数中位数集中趋势的描述1、算术均数(Mean):适应于对称分布的资料 。 1)直接计算法:计算公式为式中X1,X2和Xn为所有观察值,n为样本含量, (希腊字母,读作sigma)为求和的符号。 例2-1资料得: 集中趋势的描述2)频数表法:计算公式为表2-1资料得:集中趋势

7、的描述2.几何均数几何均数(geometric mean)可用于反 映一组经对数转换后呈对称分布的变量 值在数量上的平均水平,在医学研究中 常适用于免疫学的指标。其计算公式为集中趋势的描述例2-4 某地5例微丝蚴血症患者治疗七年 后用间接荧光抗体试验测得其抗体滴度 倒数分别为,求几何均数。或故5份血清抗体效价的平均滴度为。集中趋势的描述对于频数表资料,几何均数的计算公式为例2-5,见表2-4资料.计算结果如下:集中趋势的描述3.中位数中位数(median)是将个变量值从小到大排列,位置居于中间的 那个数。适用范围:各种分布类型的资料(如是偏态分布资料和一端或两 端无确切数值的资料。奇数:次居中

8、的变量值偶数:次居中的两个变量值的均数。集中趋势的描述例:8名患者食物中毒的潜伏期分别为 1,2,2,3,4,8,15,24小时,求其中位数。本例,为偶数,得集中趋势的描述4.百分位数百分位数(percentile)是一种位置 指标,用来表示。一个百分位数将全部 变量值分为两部分,在不包含的全部变 量值中有的变量值比它小,变量值比它 大。故百分位数是一个界值,其重要用 途是确定医学参考值范围(reference range)。中位数实际上是第百分位数。 集中趋势的描述百分位数的计算公式为式中LX、iX和fX分别为第百分位数所在组段的下 限、组距和频数,fL为小于各组段的累计频 数, LX为总例

9、数。即为中位数的计算公式离散趋势的描述1.极差 极差:一组变量值最大值与最小值之差。极差不能反映所有数据的变异大小 ,且受样本含量的影响较大。即使 在不变的情况下,每次抽样得到的 极差值相差也大,故其稳定性较差 。离散趋势的描述2.四分位数间距四分位数(quartile)是把全部变量值分为 四部分的百分位数,即第1四分位数(QL=P25 )、第2四分位数(M=P50)、第3四分位数( QU=P75)。四分位数间距(quartile range)是 由第3四分位数和第1四分位数相减而得,记 为QR。它一般和中位数一起描述偏态分布资 料的分布特征。离散趋势的描述3.方差与标准差 方差(varian

10、ce)也称均方差(mean square deviation),反映一组数据的平均离散水平。 离均差:每一个变量值与均数的差值, 离均差平方和(sum of squares):离均差平方后 相加得到的值 方差:离均差平方和除以得到的值总体方差用 表 示离散趋势的描述方差计算公式为标准差:离散趋势的描述4.变异系数 变异系数(coefficient of variation)记为, 多用于观察指标单位不同时的变异程度 的比较。其计算公式为正态分布正态分布(normal distribution)是最常见、 最重要的一种连续型分布。图2-4中的直条就不断变窄,其顶端 则逐渐接近于一条光滑的曲线。曲

11、线形态呈钟形,两头低、中间高 ,左右对称,近似于数学上的正态分布 。正态分布图2-4正态分布1、正态分布的特征 (1)在直角坐标上方呈钟型曲线,两端 与X轴永不相交,且以X=为对称轴, 左右完全对称。 (2)在X=处,f(X)取最大值;X越远 离,f(X)值越小。正态分布(3)正态分布有两个参数,即位置参数 和形态参数。若固定,改变值,曲 线沿着X轴平行移动,其形状不变(见 图2-5)。若固定,越小,曲线越陡 峭;反之,越大,曲线越平坦(见图2 -6) 正态分布图2-5正态分布图2-6正态分布(4)正态曲线下的面积分布有一定的规 律。 轴与正态曲线所夹面积恒等于或; 区间 的面积为68.27%

12、,区间 的面积为95.00%,区间 的面积为99.00%。见图2-7。 正态分布图2-7正态分布标准正态分布正态分布是一个分布族,对应于不同的参 数和会产生不同位置、不同形状的正态分 布。为了应用方便,令即将 的正态分布转化为 的标 准正态分布(standard normal distribution), 式中的称为标准正态变量 参考值范围的制定1.基本概念医学参考值(reference value)是指包括绝 大多数正常人的人体形态、机能和代谢产物 等各种生理及生化指标常数,也称正常值。 由于存在个体差异,生物医学数据并非常数 而是在一定范围内波动,故采用医学参考值 范围(medical r

13、eference range)作为判定正常 和异常的参考标准。通常使用的医学参考值 范围有、等,最常用的为。 参考值范围的制定2.制定方法 1)正态分布法许多生物医学数据服从或近似服从正态 分布,如同年龄同性别儿童的身高值、体重 值,同性别健康成人的红细胞数等;有些医 学资料虽然呈偏态分布,但若能通过适当的 变量变换转换为正态分布,也可采用正态分 布法制定参考值范围。采用此方法前一般要 对资料进行正态性检验,且要求样本含量足 够大(如100),其计算公式为 参考值范围的制定双侧参考值范围:单侧参考值范围: 表2-6 界值表参考值范围 (%) 单 侧 双 侧 80 0.84 1.28 90 1.28 1.64 95 1.64 1.96 99 2.33 2.58参考值范围的制定2)百分位数法偏态分布资料医学参考值范围的制 定通常采用百分位数法,所要求的样本 含量比正态分布法要多(不低于100) ,其计算公式为双侧参考值范围: 单侧参考值范围: 或

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号