数值变量资料的统计描述

上传人:第*** 文档编号:56607908 上传时间:2018-10-14 格式:PPT 页数:43 大小:477.50KB
返回 下载 相关 举报
数值变量资料的统计描述_第1页
第1页 / 共43页
数值变量资料的统计描述_第2页
第2页 / 共43页
数值变量资料的统计描述_第3页
第3页 / 共43页
数值变量资料的统计描述_第4页
第4页 / 共43页
数值变量资料的统计描述_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《数值变量资料的统计描述》由会员分享,可在线阅读,更多相关《数值变量资料的统计描述(43页珍藏版)》请在金锄头文库上搜索。

1、,第三章 数值变量资料的统计描述,数值变量资料的分类 离散型资料(discrete data) 连续型资料(continuity data),离散型资料,连续型资料,第一节 频数分布表和频数分布图,频数分布表:常用于样本量较大资料的统计描述。 频数分布图:用图示的方法描述频数分布的特点,比频数表更直观、形象。,一、离散型定量资料的频数分布,图3-1 某年某市120名1岁男童乳牙数的频数分布,二、连续型定量资料的频数分布,求全距(range,R) ,R129.5101.2=28.30(cm) 划分组段 确定组数 确定组距 确定各组段的上下限 列出频数表,图3-2 某市120名6岁女孩的身高分布,

2、身 高 频 数,频数分布两个重要特征 集中趋势 离散趋势 频数分布类型 对称分布:集中位置在中间,左右两则的频数基本对称。 偏态分布:集中位置偏向一侧,左右频数不对称。 正偏态:集中位置偏向数值小的一侧(左侧) 负偏态:集中位置偏向数值大的一侧(右侧),正偏态(左偏态),负偏态(右偏态),第二节 集中趋势的描述,描述定量资料集中趋势常用的统计指标为平均数(average)。算术均数几何均数中位数/百分位数,一、算术均数(mean),适于描述正态分布或近似正态分布资料的集中趋势(, ) 方法 直接法 加权法,直接法(direct method),例3-3 现有10名6岁女孩的身高值(cm)为11

3、0.9,120.4,108.2,121.2,112.3,121.8,117.0,111.4,117.2,108.3,试求其算术均数。,加权法(weight method),cm,直接法:115.76 cm,二、几何均数(geometric mean,G),观察值呈倍数关系或其频数分布明显偏态,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描述其集中趋势。 方法 直接法 加权法,例3-4 有5人接种某种疫苗后,测定抗体滴度分别为1:8,1:16,1:32,1:64,1:128,求几何均数。,加权法,三、中位数(median,M)和百分位数(percen

4、tile,Px),中位数 :将一组观察值按大小顺序排列后,位于中间位置的观察值称中位数。全部观察值中,大于和小于中位数的观察值个数相等。中位数可用于各种分布的资料,在实际工作中主要用于偏态分布资料、两端无确切值或分布不明确的资料。 资料为对称分布,M 方法 直接法 频数表法,直接法,频数表法,百分位数,将观察值从小到大排列后,等分成100份,位于第x百分位置上的数值称第百分之x位数,记为Px。对于样本含量过小的资料不宜计算百分位数。 一个百分位数Px将全部数据分为两个部分,有x的数据比Px小,有(100X)的数据比Px大,故百分位数是一个位置指标。 计算,例3-9 计算例38中表35的百分位数

5、P25 、P75 、P90 的值。,(mmol/L)(mmol/L)(mmol/L),第三节 离散趋势的描述,例3-10 三组同性别、同年龄儿童的体重(kg)资料如下: 甲组 16 18 20 22 24 乙组 14 17 20 23 26 丙组 16 19 20 21 24,描述离散趋势的常用指标有 极差 四分位数间距 方差 标准差 变异系数,一、极差(range,R),极差亦称全距,即一组观察值中最大值与最小值之差。极差大,说明变异度大;反之,说明变异度小 极差可用于反映各种分布资料的变异程度,简单明了,但也存在缺点 只涉及最大值和最小值,不能反映组内其他数据的变异程度 样本较大时,抽样误

6、差大,因此抽到最大值和最小值的可能性也越大,故样本例数相差较大时,不宜比较其极差,二、四分位数间距(quartile range,Q/ Qu- Ql ),P25 P75 四分位数间距常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度,其值越大,表示观察值分布的离散程度越大,反之越小。 四分位数间距与极差相比,相对比较稳定,但它只反映了居中间的50%数据的变异情况,仍未考虑到每个观察值的变异情况,不能代表全部观察值的离散程度。,三、方差(variance),方差是描述对称分布,特别是正态分布或近似正态分布资料离散程度的常用指标。,自由度(degree of freedom, )的意义

7、是随机变量在一定条件下能“自由”取值的变量值个数,若变量取值受k个条件的限制,其自由度为nk。,四、标准差(standard deviation,S/SD),标准差是在统计中应用最多的变异指标。标准差是方差的算术平方根,与变量值的单位相同。标准差适于描述对称分布定量资料的离散程度。,计算方法 直接法加权法,直接法,加权法,五、变异系数(coefficient of variation,CV),变异系数(亦称离散系数)为相对数,没有单位,便于资料间的比较。它常用于比较测量单位不同,或均数相差悬殊的几组资料的离散程度,不同单位几组资料离散程度的大小比较,均数相差悬殊的几组资料间比较,不同分布类型数值变量资料集中、离散趋势的统计描述,作业,P27 1 4: i=1cm, 第1组: 58; 5 7,Happy National Day and Mid-Autumn Festival to You!,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号