变异程度的统计描述

上传人:宝路 文档编号:46691985 上传时间:2018-06-27 格式:PPT 页数:55 大小:1.23MB
返回 下载 相关 举报
变异程度的统计描述_第1页
第1页 / 共55页
变异程度的统计描述_第2页
第2页 / 共55页
变异程度的统计描述_第3页
第3页 / 共55页
变异程度的统计描述_第4页
第4页 / 共55页
变异程度的统计描述_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《变异程度的统计描述》由会员分享,可在线阅读,更多相关《变异程度的统计描述(55页珍藏版)》请在金锄头文库上搜索。

1、第三章 变异程度的统计描述 ( Measures of Dispersion )要求:掌握:标准差的含义及计算方法; 变异系数的计算方法和应用。熟悉:其他描述离散趋势的常用指 标。 离散趋势(dispersion tendency)指标三组同年龄、同性别儿童的体重(kg)甲组 26 28 30 32 34乙组 24 27 30 33 36丙组 26 29 30 31 3430 30 30 全距表示一群变量值的最大值与最小值 之差,反映个体差异的范围,用R表示。全 距大,说明变异度大;反之,说明变异度 小。甲组 26 28 30 32 34乙组 24 27 30 33 36R=8R=12全距(r

2、ange)1.不能全面反映资料的离散程度; 2.不稳定,易受极端值的影响,抽样误差大。优点缺点1.表示变异范围,简单明了、容易使用,如 用于说明传染病、食物中毒等的最短、最长 潜伏期等; 2.各种分布类型的资料均可用。全距(range)四分位数间距 (quartile interval)四分位数间距是上四分位数(QU=P75)和 下四分位数(QL=P25)之差,用Q表示(QU- QL)。该数值越大,说明变异度越大;反 之,说明变异度越小。 某地630名正常女性血清甘油三脂含量(mg/dl)甘油三脂频数 累计频数累计频率(%) 0.10 27 27 4.30.40169196 31.10.701

3、67363 57.61.00 94457 72.51.30 81538 85.41.60 42580 92.11.90 28608 96.52.20 14622 98.72.50 4626 99.42.80 3629 99.83.10 1630100.0 合计630 - -L: 组段的下限; iM: 组距; fx: 频数; fL: Px所在组段之前的累积频数。1.与中位数配套,用于偏态分布资料及分布 的一端或两端无确切数值的资料; 2.比全距稳定。未考虑到每个观察值的变异度。优点缺点四分位数间距 (quartile interval)方差(variance)自由度n限制条件的个数,用表示。 (

4、n1):当 选定时,n个变量值中能自由变动的变量值的个数。二、平均差距指标(一)平均偏差(Mean Difference) 如对于例3.1:甲患者: 乙患者: 特点:直观 , 易理解;但由于用了绝对值,不便于数学处理,实际中很少使用。 (二)离均差平方和(Sum of Square,SS)为了克服平均偏差的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和,其计算公式为SS 通常作为一个中间统计量使用。(三)方差 (Variance) 方差是将离均差平方和再取平均,即注意:对于样本资料,分母用的是n-1,称为自由度(degree of freedom,df )。方差的特

5、点:便于数学上的处理,但由于有平方,度量衡发生变化,不便于实际应用。 (1) 方差越大,资料的离散程度越 大(全面考虑了每个观察值); (2) 不受观察值个数的影响。优点缺点一些资料不适用于以平方表示。方差(variance)(四)标准差 (Standard Deviation) 将方差取平方根,还原成与原始观察值单位相同的变异量度即为标准差:例如对于例3.1经计算有 甲患者: 同理乙患者:例 三组同年龄、同性别儿童的体重(kg ) 甲组 26 28 30 32 34 乙组 24 27 30 33 36 丙组 26 29 30 31 34 直接法加权法14岁岁女孩身高平均值值与标标准差(cm)

6、加权权法计计算用表 身高(cm)频频数(fi)组组中值值( X)f i Xif i Xi21242126252317521283130390507001321113414741975161362213830364189681403914255387863961442714639425755321481615024003600001525154770118580156315847474892160164216232452488合计计130( fi)18600 (f i Xi)2666824 (f i Xi2)标准差应用 1.表示观察值分布的离散程度。均数相近 、度量单位相同的条件下,S越大,观察

7、 值的变异程度越大,均数的代表性越差 。 2. 结合均数计算CV。 3.结合均数描述正态分布资料的分布特征 和估计医学参考值范围 4. 结合样本含量计算标准误。(五)变异系数(Coefficient of Variation )主要用于对均数相差较大或单位不同的几组观察值的变异程度进行比较。例3.3 测得某地成年人舒张压均数为77.5mmHg,标准差为10.7mmHg;收缩压均数为122.9mmHg,标准差为17.1mmHg。试比较舒张压和收缩压的变异程度。变异系数Coefficient of variation (CV)应用1.表示数据分布的相对离散程度 2.比较均数相差悬殊的两组或多组资料

8、的 离散程度 3.比较度量衡单位不同的两组或多组 资料的变异程度某地20岁男子160人,身高均数为 166.06cm,标准差为4.95cm;体重均数 为53.72kg,标准差为4.96kg。比较身高 与体重的变异程度。20岁男子体重的变异程度比身高的 变异程度大。某地不同年龄女童的身高(cm)资料如 下表所示 。试比较不同年龄身高的变异程 度。某地不同年龄女童身高的变异程度 年龄组 人数 均数 标准差 CV(%) 12月 100 56.3 2.1 3.7 56月 120 66.5 2.2 3.3 33.5岁 300 96.1 3.1 3.2 55.5岁 400 107.8 3.3 3.1小结

9、全距与四分位数间距:后者较稳定,但均 不能综合反映各观察值的变异程度。 标准差:最为常用,对正态分布尤为重要 变异系数:可用于多组资料间度量衡单位 不同或均数相差悬殊时作变异度的比较。以上指标都是数值越小,说明观察值 的变异度越小,均数的代表性越好。 平均指标和变异指标常配套使用如 正态分布:均数、标准差;偏态分布:中位数、四分位间距 练习:某市1974年为了解该地居民发汞的基础水平, 为汞污染的环境监测积累资料,调查了留住该市一 年以上, 无明显肝、肾疾病,无汞作业接触史的居 民238人的发汞含量(mol/kg)如下: 用何种指标说明本资料的集中位置和变异程度 较好?并计算之。 发 汞 值1

10、.5 3.5 5.57.5 9.5 11.5 13.5 15.5 17.5 19.5 人 数2066604818166103某检验师测定了10名正常成年钢铁工人的血红蛋白值(g/dl)和红细胞数(万/mm3)如下,试比较这两个检测项目的结果哪个变异性大? 血红蛋白(g/dL) 13.0 13.6 14.0 14.5 14.6 14.7 15.2 15.5 15.8 16.0 血细胞数(万/mm3) 510 515 517 518 520 522 524 525 528 530238名正常人发发汞值值(g/g)的频频数表 发发汞值值频频数累计频计频 数累计频计频 率 (%) 0.320208.4

11、 0.7668636.1 1.16014661.3 1.54819481.5 1.91821289.1 2.31622895.8 2.7623498.3 3.1123598.7 3.5023598.7 3.94.33238100.0正态分布和医学参考值范围要求:掌握:正态分布及其特征,正态曲线下 面积分布的规律。熟悉:医学参考值范围,参考值范围估 计的步骤,参考值范围估计的正态分布法 和百分位数法。标准正态分布。了解:参考值范围估计的对数正态分布 法。图3-1 某地成年男子红细胞数的分布逐渐接近正态分布示意图 一、正态分布(Normal Distribution) 正态分布曲线:高峰位于中央,

12、两侧逐渐下降、低平,左右完全对 称、两端不与横轴相交的钟型曲线。 正态分布:以均数为中心,中间多,两侧呈对称性逐渐减少的 钟型分布。正态分布的密度函数f(x)为:由上式可见,正态分布的图形由 和 所决定, XN( , 2)主要特征:1.以 为中心的对称分布2.钟型曲线3.曲线下面积分布有规律4.两个参数决定位置和变异图3-2 正态分布曲线下的面积 图3-3 三种不同均值的正态分布 图3-4 三种不同标准差的正态分布 正态曲线下的面积F(x)的计算:标准正态变换(u变换)u为标准正态变量 或标准正态离差u变换的特点:若X服从正态分布,则u服从标准正态分布 标准正态分布:指均数为0、标准差 为1的

13、正态分布,记为N(0,1)二、标准正态分布 (Standard Normal Distribution) 表中曲线下面积为 - u 的面积;即 P ( u)可以利用标标准正态态分布表求出与原始变变量X 有关的概率值值。1. 标准正态分布:求曲线下(u1,u2)范围 内的面积。 (1) u 0:查表,分别求从-到u2与从-到u1的面积; 两者之差为所求面积。u2u1u1 u2 例:u1= - 1.50,u2= - 0.31则(-1.50,- 0.31)范围内的面积(2) u 0:利用正态分布的对称性求曲线 下从-到u范围的面积。例:从- 到u=1.76范围内的面积。1.761.760.03921

14、-0.0392=0.96080.03922. 非标准正态分布:求曲线下任意 (x1,x2)范围内的面积。(1)先作标准正态变换; (2)再查标准正态分布表求得面积。例:已知110名7岁男童身高。现欲估计该地身高界于 116.5cm到119.0cm范围内7岁男童比例及110名7岁男童中身高界于此值范围内的人数。 (1) 标准正态分布变换:(2) 查表得:(3) 求D:估计该地身高界于116.5119.0cm范围 内的7岁男童比例为13.92%;估计110名7岁男童中有15名男童的身高 界于116.5119.0cm范围内。11013.9215 思考题:该地80%的男孩身高集中的范围?三、正态分布的应用 1. 估计频数分布例:出生体重低于2500g为低体重儿。 若由某项研究得某地婴儿出生体重均数为 3200g,标准差为350g,估计该地当年低 体重儿所占的比例。查表 ,即从-到 2500的比例为2.28%,故估计该地 当年低体重儿所占的比例为2.28%。2. 制定医学参考值范围(Reference Value Range) 3. 质量控制 为了控制实验中的误 差,实验室的质量控制中,常以 作为上、下警戒限;以 作 为上、下控制限。 (2s和3s是1.96s与2.58s的近似值)。4. 统计处理方法的基础 +3 +2 + - -2 -3 一、基本概念通常指正常人(排除了对

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号