二、数值变量统计描述

上传人:自*** 文档编号:25908485 上传时间:2017-12-19 格式:PPT 页数:90 大小:2.22MB
返回 下载 相关 举报
二、数值变量统计描述_第1页
第1页 / 共90页
二、数值变量统计描述_第2页
第2页 / 共90页
二、数值变量统计描述_第3页
第3页 / 共90页
二、数值变量统计描述_第4页
第4页 / 共90页
二、数值变量统计描述_第5页
第5页 / 共90页
点击查看更多>>
资源描述

《二、数值变量统计描述》由会员分享,可在线阅读,更多相关《二、数值变量统计描述(90页珍藏版)》请在金锄头文库上搜索。

1、School of public healthShandong University,数值变量资料的统计描述,Descriptive Statistics,Descriptive Statistics,频数分布表(frequency table), 离散型资料(discrete data):是指变量取值可以一一列举的资料。例如,每个育龄妇女现有的子女数。 如1998年某山区96名孕妇产前检查次数资料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7。 连续型资料(continuity data):是指变量取值不能一一列举(即变量取值为一定范围内的任意值)的资料。例

2、如,人体的身高(cm)、体重(kg) 等。, 数值变量资料的分类:,Descriptive Statistics,表2-1 1998年某地96名孕妇产前检查次数分布, 离散型资料(discrete data),Descriptive Statistics,频数分布表(frequency table),根据表2-1频数的分布可绘出频数分布图。,Descriptive Statistics,频数分布表(frequency table), 离散型资料(discrete data),1998年某校100名18岁健康女大学生(cm)资料,Descriptive Statistics,频数分布表(freq

3、uency table), 连续型资料( continuity data),1998年某校100名18岁健康女大学生(cm)资料,Descriptive Statistics,频数分布表(frequency table), 连续型资料( continuity data),例1 测得130名健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。, 频数表的编制:,Descriptive Statistics,频数分布表(frequency table),(1)求极差(range):即最大值与最小值之差,又称为全距。R84 57 =27(次/分)(2) 决定分组组数、组距:根据研究目

4、的和样本含量n确定分组组数,通常分为1015个组。组距=极差/组数,为方便计,组距为极差的十分之一, 再略加调整。 27/10=2.7 3 (3) 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值。56 59 80 8385(4) 划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。,Descriptive Statistics,频数分布表(frequency table), 频数表的编制:,表2-3 130名健康成年男子脉搏(次/分)的频数分布表,Nf,Descriptive Statistics,频数分布表(frequency table), 频数表的编制:,

5、频数分布图,Descriptive Statistics,频数分布表(frequency table), 编制频数表的基本步骤:,频数分布表(frequency table),Descriptive Statistics, 频数表的用途:,频数分布表(frequency table),Descriptive Statistics, 频数表的用途:,1描述频数分布的类型和特征,Descriptive Statistics,频数分布表(frequency table),(1)对称分布 :若各组段的频数以中 心位置左右两侧大体对称,就认为该资料是对称分布, 频数表的用途:,1描述频数分布的类型和特征

6、,是否为对称分布?,Descriptive Statistics,频数分布表(frequency table),(2)偏态分布 :1)正偏态分布:右侧的组段数多于左侧的组段数,频数向右侧拖尾。2)负偏态分布:左侧的组段数多于右侧的组段数,频数向左侧拖尾。, 频数表的用途:,1描述频数分布的类型和特征,Descriptive Statistics,频数分布表(frequency table),表23数据的频数分布特征:数据变异(离散)的范围在5784 (次/分 )数据集中(平均)的组段在6873 (次/分)之间,尤以组段的人数71(次/分)最多。且上下组段的频数分布基本对称。, 频数表的用途:,

7、1描述频数分布的类型和特征,Descriptive Statistics,频数分布表(frequency table), 频数表的用途:,2便于发现一些特大或特小的可疑值,3便于进一步做统计分析和处理,Descriptive Statistics,频数分布表(frequency table),描述数值变量资料的集中趋势(central tendency)指标,统计上使用平均数(average)这一指标体系来描述一组变量值的集中位置或平均水平。常用的平均数有: 算术均数(均数)(mean) 几何均数(geometric mean) 中位数 (median)与百分位数(percentile) 众数

8、(mode),Descriptive Statistics, 算术均数(arithmetic mean :简称均数(mean) 可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。, 计算方法:,直接法:,例2.2 某地随机抽取10名18岁健康男大学生身高(cm)分别为168.7,178.4,170.0,170.4,172.1,167.6,172.4,170.7,177.3,169.7,求平均身高。,(cm),Descriptive Statistics,描述数值变量资料的集中趋势(central tendency),描述数值变量资料的集中趋势(central tend

9、ency)指标,例:测得130健康成年男子脉搏资料(次/分)如下,计算平均水平。, 算术均数(arithmetic mean :简称均数(mean),直接法:,Descriptive Statistics,描述数值变量资料的集中趋势(central tendency),描述数值变量资料的集中趋势(central tendency)指标,公式 :,k: 频数表的组段数, f :频数,X:组中值。, 算术均数(arithmetic mean :简称均数(mean),加权法:,权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用。当各组的次数都相同时,即当f1=f2=f3=fn

10、时:加权算术平均数就等于简单算术平均数。,描述数值变量资料的集中趋势(central tendency),Descriptive Statistics,描述数值变量资料的集中趋势(central tendency)指标,表2-2 130名健康成年男子脉搏(次/分)的频数分布表,Nf,fX,fX2,Descriptive Statistics, 算术均数(arithmetic mean :简称均数(mean), 特点:,各个标志值与其算术平均数的离差之和等于零。各标志值与算术平均数离差的平方和为最小值。对于任意两个变量x和y,它们的代数和的算术平均数等于两个变量的算术平均数的代数和。,Descr

11、iptive Statistics,描述数值变量资料的集中趋势(central tendency),描述数值变量资料的集中趋势(central tendency)指标, 算术均数(arithmetic mean :简称均数(mean), 适用条件:,1.均数反映一组同质观察值的平均水平,并可作为样本的代表值与其他样本进行比较。2.均数适用于描述单峰对称分布,特别是正态或近似正态分布资料的集中趋势。,意义:一组性质相同的观察值在数量上的平均水平。表示 (总体) X(样本)计算:直接法、间接法、计算机特征: (X- X)=0 估计误差之和为0。应用:正态分布或近似正态分布注意:合理分组,才能求均数

12、,否则没有意义。,小结:,Descriptive Statistics,描述数值变量资料的集中趋势(central tendency),描述数值变量资料的集中趋势(central tendency)指标, 几何均数( geometric mean ),例题:血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数。,此例的算术均数为22222,显然不能代表滴度的平均水平。同一资料,,Descriptive Statistics,描述数值变量资料的集中趋势(central tendency),描述数值变量资料的集中趋势(central tendency)指标,

13、几何均数:变量对数值的算术均数的反对数。, 几何均数( geometric mean ),Descriptive Statistics,描述数值变量资料的集中趋势(central tendency),描述数值变量资料的集中趋势(central tendency)指标,例 有8份血清的抗体效价分别为1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗体效价。,平均抗体效价为: 1:57, 几何均数( geometric mean ),Descriptive Statistics,描述数值变量资料的集中趋势(central tendency),描述

14、数值变量资料的集中趋势(central tendency)指标,例 69例类风湿关节炎(RA)患者血清EBV-VCA-lgG抗体滴度的分布见表2-4第(1)、(2)栏,求其平均抗体滴度。, 几何均数( geometric mean ),Descriptive Statistics,描述数值变量资料的集中趋势(central tendency),描述数值变量资料的集中趋势(central tendency)指标,适用于成等比数列的资料,特别是服从对数正态分布资料。, 几何均数( geometric mean ), 适用条件:,变量值中不能有0;不能同时有正值和负值;若全是负值,计算时可先把负号去

15、掉,得出结果后再加上负号。, 注意事项:,Descriptive Statistics,描述数值变量资料的集中趋势(central tendency),描述数值变量资料的集中趋势(central tendency)指标, 几何均数( geometric mean ),小结 意义:N个数值的乘积开N次方即为这N个数的几何均数 表示:G 计算: 应用:原始数据分布不对称,经对数转换后呈对称分布 的资料。例如:抗体滴度,Descriptive Statistics,描述数值变量资料的集中趋势(central tendency),描述数值变量资料的集中趋势(central tendency)指标,例题:11个大鼠存活天数:4,10,7,50,3,15,2,9,13,60,60平均存活天数?, 中位数( median )和百分位数( percentile ),中位数 定义:将一组变量值从小到大按顺序排列,位次居中的变量值称为中位数(median,简记为M)。1.直接法:用于例数较少时 n为奇数时 n为偶数时,Descriptive Statistics,描述数值变量资料的集中趋势(central tendency),描述数值变量资料的集中趋势(central tendency)指标,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号