数值变量资料的统计分析--变异程度的描述

上传人:suns****4568 文档编号:88921145 上传时间:2019-05-13 格式:PPT 页数:29 大小:1.55MB
返回 下载 相关 举报
数值变量资料的统计分析--变异程度的描述_第1页
第1页 / 共29页
数值变量资料的统计分析--变异程度的描述_第2页
第2页 / 共29页
数值变量资料的统计分析--变异程度的描述_第3页
第3页 / 共29页
数值变量资料的统计分析--变异程度的描述_第4页
第4页 / 共29页
数值变量资料的统计分析--变异程度的描述_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《数值变量资料的统计分析--变异程度的描述》由会员分享,可在线阅读,更多相关《数值变量资料的统计分析--变异程度的描述(29页珍藏版)》请在金锄头文库上搜索。

1、离散趋势指标 ( 变异程度的统计描述) ( Measures of Dispersion ),要求: 掌握:标准差的含义及计算方法;变异系数的计算方法和应用。 熟悉:其他描述离散趋势的常用指标。,离散趋势(dispersion tendency)指标 三组同年龄、同性别儿童的体重(kg) 甲组 26 28 30 32 34 乙组 24 27 30 33 36 丙组 26 29 30 31 34,30 30 30,标准差的意义,标准差是表示一组观察者离散程度或变异程度的统计指标; 描述一个变量的所有观察值与均数的平均离散程度的指标。,全距表示一群变量值的最大值与最小值之差,反映个体差异的范围,用

2、R表示。全距大,说明变异度大;反之,说明变异度小。 甲组 26 28 30 32 34 乙组 24 27 30 33 36,R=8,R=12,一、全距(range),1.不能全面反映资料的离散程度; 2.不稳定,易受极端值的影响,抽样 误差大。,优点,缺点,1.表示变异范围,简单明了、容易使用,如用于说明传染病、食物中毒等的最短、最长潜伏期等; 2.各种分布类型的资料均可用。,全距(range),二、四分位数间距 (quartile interval),四分位数间距是上四分位数(QU=P75)和下四分位数(QL=P25)之差,用Q表示(QU-QL)。该数值越大,说明变异度越大;反之,说明变异度

3、越小。,某地630名正常女性血清甘油三脂含量(mg/dl),L: 组段的下限; iM: 组距; fx: 频数; fL: Px所在组段之前的累积频数。,1.与中位数配套,用于偏态分布资料及分布的一端或两端无确切数值的资料; 2.比全距稳定。,未考虑到每个观察值的变异度。,优点,缺点,四分位数间距 (quartile interval),三、平均差距指标 (一)平均偏差(Mean Difference) 甲班: 乙班:,特点:直观 , 易理解;但由于用了绝对值,不便于数学处理,实际中很少使用。,(二)离均差平方和(Sum of Square,SS) 为了克服平均偏差的缺点,可以不通过取绝对值,而是

4、通过取平方来避免正负抵消,即使用离均差平方和,其计算公式为 SS 通常作为一个中间统计量使用。,(三)方差 (Variance) 方差是将离均差平方和再取平均,即 注意:对于样本资料,分母用的是n-1,称为自由度(degree of freedom,df )。 方差的特点:便于数学上的处理,但由于有平方,度量衡发生变化,不便于实际应用。,方差(variance),自由度n限制条件的个数,用表示。 (n1):当 选定时,n个变量值 中能自由变动的变量值的个数。,方差越大,资料的离散程度越 大(全面考虑了每个观察值); 不受观察值个数的影响。,优点,缺点,一些资料不适用于以平方表示。,方差(var

5、iance),四、标准差 (Standard Deviation) 将方差取平方根,还原成与原始观察值单位相同的变异量度即为标准差: 例如对于例3.1经计算有 甲患者:,同理乙患者:,例 三组同年龄、同性别儿童的体重(kg) 甲组 26 28 30 32 34 乙组 24 27 30 33 36 丙组 26 29 30 31 34,标准差,直接法,标准差,加权法,标准差应用 1.表示观察值分布的离散程度。均数相近、度量单位相同的条件下,S越大,观察值的变异程度越大,均数的代表性越差。 2. 结合均数计算CV。 3.结合均数描述正态分布资料的分布特征和估计医学参考值范围 4. 结合样本含量计算标

6、准误。,五、变异系数(Coefficient of Variation ) 主要用于对均数相差较大或单位不同的几组观察值的变异程度进行比较。 例3.3 测得某地成年人舒张压均数为77.5mmHg,标准差为10.7mmHg;收缩压均数为122.9mmHg,标准差为17.1mmHg。试比较舒张压和收缩压的变异程度。,变异系数 Coefficient of variation (CV),应用,1.表示数据分布的相对离散程度 2.比较均数相差悬殊的两组或多组资料的离散程度 3.比较度量衡单位不同的两组或多组 资料的变异程度,某地20岁男子160人,身高均数为166.06cm,标准差为4.95cm;体重

7、均数为53.72kg,标准差为4.96kg。比较身高与体重的变异程度。 20岁男子体重的变异程度比身高的 变异程度大。,某地不同年龄女童的身高(cm)资料如下表所示 。试比较不同年龄身高的变异程度。 某地不同年龄女童身高的变异程度,年龄组 人数 均数 标准差 CV(%) 12月 100 56.3 2.1 3.7 56月 120 66.5 2.2 3.3 33.5岁 300 96.1 3.1 3.2 55.5岁 400 107.8 3.3 3.1,小结 全距与四分位数间距:后者较稳定,但均不能综合反映各观察值的变异程度。 标准差:最为常用,对正态分布尤为重要 变异系数:可用于多组资料间度量衡单位

8、 不同或均数相差悬殊时作变异度的比较。 以上指标都是数值越小,说明观察值 的变异度越小,均数的代表性越好。 平均指标和变异指标常配套使用 如 正态分布:均数、标准差; 偏态分布:中位数、四分位间距,练习:,某市1974年为了解该地居民发汞的基础水平, 为汞污染的环境监测积累资料,调查了留住该市一年以上, 无明显肝、肾疾病,无汞作业接触史的居民238人的发汞含量(mol/kg)如下:,用何种指标说明本资料的集中位置和变异程度较好?并计算之。,某检验师测定了10名正常成年钢铁工人的血红蛋白值(g/dl)和红细胞数(万/mm3)如下,试比较这两个检测项目的结果哪个变异性大?,血红蛋白(g/dL) 13.0 13.6 14.0 14.5 14.6 14.7 15.2 15.5 15.8 16.0 血细胞数(万/mm3) 510 515 517 518 520 522 524 525 528 530,小 结 1.描述一组观察值,除需要表示其平均水平外,还要说明它的离散或变异的情况。 2.衡量变异程度大小的指标有多种: 极差、四分位数间距、方差、标准差和变异系数。其中应用最多的是标准差和变异系数。,作业:,1、标准差与全距、四分位数间距比较,有哪些优点? 2、变异系数在什么情况下应用?它与标准差有什么区别和联系?,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号