统计学之计量资料的统计描述

上传人:luobi****88888 文档编号:94013126 上传时间:2019-07-31 格式:PPT 页数:49 大小:331.50KB
返回 下载 相关 举报
统计学之计量资料的统计描述_第1页
第1页 / 共49页
统计学之计量资料的统计描述_第2页
第2页 / 共49页
统计学之计量资料的统计描述_第3页
第3页 / 共49页
统计学之计量资料的统计描述_第4页
第4页 / 共49页
统计学之计量资料的统计描述_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《统计学之计量资料的统计描述》由会员分享,可在线阅读,更多相关《统计学之计量资料的统计描述(49页珍藏版)》请在金锄头文库上搜索。

1、第二章 计量资料的统计描述 Descriptions of Measurement Data,Content,Frequency distribution Description of central tendency Measures of dispersion Normal distribution Range of reference value,一、频数分布表(frequency table) : 例2.1 某地150名正常成年男子红细胞数 例2-2 某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇的测量结果。 试编制频数分布表。,第一节 频数分布,表2.1 某地

2、150名正常成年男子红细胞数(1012/L),例2-2 用直接法计算例2-1某单位101名正常成年女子的血清总胆固醇的均数。,一、频数分布表 (frequency table) 用途:用于描述资料的分布特征 频数:在一批样本中,相同情形出现的次数称为该情形的频数。,1. 频数表的编制步骤,例1 求极差(range):即最大值与最小值之差,本例极差: R=5.883.79=2.09(1012/L) (2) 决定组数、组段和组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分10-15个组,为方便计,组距参考极差的十分之一, 再略加调整。 本例i= R /10=2.09/10=0.2090

3、.2。,(3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。 (4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。,二、频数分布图,三、频数表和频数分布图用途,1描述频数分布的类 型 (1)对称分布 :若各组段的频数以频数最多组段为中心左右两侧大体对称,就认为该资料是对称分布,(2)偏态分布 : 1)右偏态分布(skewed to the right distribution)也称正偏态分布(positive skewness distribution):右侧的组段数多于左侧的组段数,频数向右侧拖尾,2)左偏态分布 (skewed

4、to the left distribution)也称负偏态分布(negative skewness distribution):左侧的组段数多于右侧的组段数,频数向左侧拖尾,2. 描述计量资料分布的集中趋势和离散 趋势,集中趋势(central tendency):变量值集中位置。本例在组段“4.7”。 平均水平指标 离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。离“中心”位置越远,频数越小;且围绕“中心”左右对称。 变异水平指标,3便于发现一些特大或特小的可疑值,4便于进一步做统计分析和处理,第二节 集中趋势的描述,计量资料(定量资料、数值变量资料

5、) 总体:有限或无限个(定量)变量值 样本:从总体随机抽取的n个变量值: X1, X2, X3, Xn n为样本例数(样本大小、样本含量),一、描述集中趋势的特征数(平均指标),总称为平均数(average)反映了资料的集中趋势( central tendency )。常用的有: 1. 算术均数(arithmetic mean),简称均数 (mean) 2. 几何均数(geometric mean) 3. 中位数 (median),一、算术均数,算术均数:简称均数(mean) 可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。,符号:总体 样本 适用条件:资料呈对称分

6、布,尤其是正态或近似正态。计算: (1)直接法 (2)频数表法,均数(mean),为求和符号,读成sigma;f :“权数”,例:计算4,4,4,6,6,8,8,8,10的均数?,例2-2 用直接法计算例2-1某单位101名正常成年女子的血清总胆固醇的均数。,例: 计算101名正常成年女子的血总胆固醇的均数。,二、 几何均数,几何均数(geometric mean):变量对数值的算术均数的反对数。 可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。,2. 几何均数(geometric mean),几何均数的适用条件与实例,适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料

7、;如抗体滴度资料,例 血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数。,此例的算术均数为22222,显然不能代表滴度的平均水平。同一资料,几何均数均数,例 某地5例微丝蚴血症患者治疗七年后用间接荧光抗体试验测得其抗体滴度倒数分别为,10,20,40,40,160,求几何均数。,(2)加权法,公式:,例2-5 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。,故例类风湿关节炎患者血清EBV-VCA-lgG抗体的平均滴度为:1:150.6。,3. 中位数(median),中位数计算公

8、式与实例,先将观察值按从小到大顺序排列,再按以下公式计算:,特点:仅仅利用了中间的12个数据,例2-6 7名病人患某病的潜伏期分别为2,3,4,5,6,9,16天,求其中位数,本例n=7,为奇数 例2-7 8名患者食物中毒的潜伏期分别为1,2,2,3,5,8,15,24小时,求其中位数。 本例n=8,为偶数,均数、中位数二者关系,正态分布时: 均数中位数 正偏态分布时:均数中位数 负偏态分布时:均数中位数,小结: 集中趋势的描述平均数,平均数:描述一组变量值的集中位置或平均水平的指标体系。 不同的分布使用不同的指标 (算术)均数:正态或近似正态或观察值相差不大的小样本资料 几何均数:对数正态分

9、布或等比级数资料 中位数 :一般偏态分布(传染病发病的潜伏期),第三节 离散趋势的描述,例2-11 三组同龄男孩的身高值(cm),描述离散趋势的特征数 (变异(variation)指标),反映数据的离散度( Dispersion )。即个体观察值的变异程度。常用的指标有: 1. 极差(Range) (全距) 2. 百分位数与四分位数间距 Percentile and Quartile range 3. 方差 Variance 4. 标准差Standard Deviation 5. 变异系数 Coefficient of Variation,例:设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,

10、每人数5个计数盘,得结果如下(万/mm3),甲,乙,丙,1.极差(Range),120,40,20,符号:R 意义:反映全部变量值的变动范围。 优点:简便,如说明传染病、食物中毒的最长、最短潜伏期等。 缺点:1. 只利用了两个 极端值 2.n大,R也会大 3.不稳定 适用范围:任何计量资料;是参考变异指标,2.百分位数与四分位数间距 Percentile and quartile range,百分位数 :数据从小到大 排列;在百分尺度下,所占百分比对应的值。记为Px。 四分位间距: QP75 P25,P100(max) P75 P50(中位数) P25 P0(min),Px,百分位数的应用,确

11、定医学参考值范围 (reference range): 如95参考值范围P97.5P2.5; 表示有95正常个体的测量值在此范围。,二、方差与标准差,1、 方差(variance)也称均方差(mean square deviation),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。反映一组数据的平均离散水平。 总体方差用 表示 样本方差用 S2 表示,样本方差为什么要除以(n1)?,数理统计证明,n代替N后,计算出的样本方差对总体方差的估计偏小。对于样本资料,对离均差平方和取平均时分母用n-1代替n。分母为n-1,称为自由度(能自由取值的变量的个数)。,4.标准差,标准差 (s

12、tandard deviation)即方差的正平方根;其单位与原变量X的单位相同。,标准差的公式还可以写成 : 利用频数表计算标准差的公式为,标准差的计算,5.变异系数(coefficient of variation),符号:CV,适用条件:观察指标单位不同,如身高、体重 同单位资料,但均数相差悬殊,意义:挑选指标时变异系数越小,指标越好。,变异指标小结,1极差较粗,适合于任何分布 2标准差与均数的单位相同,最常用,适合于近似正态分布 3变异系数主要用于单位不同或均数相差悬殊资料 4平均指标和变异指标分别反映资料的不同特征, 常配套使用 如 正态分布:均数、标准差; 偏态分布:中位数、四分位半间距,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号