医学统计学课件 02第二章数值变量资料的统计描述

上传人:清晨86****784 文档编号:320673788 上传时间:2022-07-01 格式:PPT 页数:72 大小:5.97MB
返回 下载 相关 举报
医学统计学课件 02第二章数值变量资料的统计描述_第1页
第1页 / 共72页
医学统计学课件 02第二章数值变量资料的统计描述_第2页
第2页 / 共72页
医学统计学课件 02第二章数值变量资料的统计描述_第3页
第3页 / 共72页
医学统计学课件 02第二章数值变量资料的统计描述_第4页
第4页 / 共72页
医学统计学课件 02第二章数值变量资料的统计描述_第5页
第5页 / 共72页
点击查看更多>>
资源描述

《医学统计学课件 02第二章数值变量资料的统计描述》由会员分享,可在线阅读,更多相关《医学统计学课件 02第二章数值变量资料的统计描述(72页珍藏版)》请在金锄头文库上搜索。

1、2022/6/281第二章第二章 数值变量资料的统计描述数值变量资料的统计描述 医学统医学统计学计学人民卫生出版社人民卫生出版社 学习要求学习要求 掌握:掌握:常用的集中趋势指标和离散趋势指标以及各常用的集中趋势指标和离散趋势指标以及各指标的适用条件;正态曲线下面积的分布规律;医学参考指标的适用条件;正态曲线下面积的分布规律;医学参考值范围的制定。值范围的制定。 熟悉:熟悉:数值变量资料频数表的编制方法和用途。数值变量资料频数表的编制方法和用途。 了解:了解:正态分布的概念及特征;质量控制的意义。正态分布的概念及特征;质量控制的意义。 第一节第一节 频数分布表频数分布表 v频数频数是指变量值出

2、现的次数或个数。是指变量值出现的次数或个数。v频数分布频数分布就是变量在其取值范围内各组段的分布就是变量在其取值范围内各组段的分布情况。情况。v频数分布可以用频数分布表、频数分布图来表示。频数分布可以用频数分布表、频数分布图来表示。编制频数分布表是统计分析资料的第一步编制频数分布表是统计分析资料的第一步。v下面以例下面以例2.12.1,20132013年某小学年某小学120120名名8 8岁健康男孩身岁健康男孩身高(高(cmcm)测量资料为例讲解如何编者频数分布表)测量资料为例讲解如何编者频数分布表和频数分布图。和频数分布图。例例2.1 2013年某小学年某小学120名名8岁男孩身高(岁男孩身

3、高(cm)测量资料)测量资料124.5126.2128.1130.6132.6125.4126.5128.4124.5129.5124.7127.8128.3131.7125.8126.8129.5125.6127.6129.8125.4120.3122.3118.2116.7121.6116.8121.6115.1122.0121.6118.7121.8124.5121.7122.7116.3124.0119.0124.5121.7124.9130.0123.5128.2119.7126.1131.3123.7114.7122.3122.8128.6122.0132.4122.0123.51

4、16.2126.1119.1126.5118.4121.0119.1116.8131.1120.4115.2118.0122.3114.2116.9126.4114.3127.2118.3127.8123.0117.3123.2119.8122.1120.4124.8122.3114.4120.5115.0122.7116.8125.6121.1124.8122.7119.5128.2124.1127.3120.0122.7118.2127.1122.5116.3125.1124.5112.3121.3127.0113.4118.9127.6125.2121.5122.4129.1122.61

5、34.5118.2132.9最小值最大值一、频数表的编制一、频数表的编制计算极差计算极差:即最大值和最小值之差,本例:即最大值和最小值之差,本例: R=134.5-112.3=22.2(cm) 确定确定组段和段和组距距 :分组的目的是反映数据分布的特:分组的目的是反映数据分布的特征,组数通常根据观察例数的多少而定,一般以征,组数通常根据观察例数的多少而定,一般以815个组数为宜。各组段的起点称为个组数为宜。各组段的起点称为“下限下限”,终点,终点称为称为“上限上限”。每个组段都是半开半闭区间,即只。每个组段都是半开半闭区间,即只包括下限,不包括上限。为计算方便,组距包括下限,不包括上限。为计算

6、方便,组距i= R/10,再适当取整。,再适当取整。 本例组距本例组距i=R/10=2.22(cm),取整数为),取整数为=2cm。 各组段不能重叠,每个组段都是半开半闭区间,各组段不能重叠,每个组段都是半开半闭区间,第一组段应包括所有观察值中的最小值,其下限一第一组段应包括所有观察值中的最小值,其下限一般取包括最小值的、较为整齐的数值。最后一个组般取包括最小值的、较为整齐的数值。最后一个组段必须包括最大值,其余各个组段首尾相连段必须包括最大值,其余各个组段首尾相连 绘制频数表绘制频数表 统计出各组段内的数据个数,统计出各组段内的数据个数,绘制频数表绘制频数表. 见表见表2-1。用划记或分卡法

7、将各观察单位归如各组段,用划记或分卡法将各观察单位归如各组段,然后清点各组段内观察值个数即得各组段然后清点各组段内观察值个数即得各组段频数。频数。表表2-1、120名名8岁健康男孩身高(岁健康男孩身高(cm)资料频数分布)资料频数分布组段频数f频率(%)累计频数累计频率(%)112 2 1.7 2 1.7114 7 5.8 9 7.5116 9 7.5 18 15.01181411.7 32 26.71201512.5 47 39.21222117.5 68 56.71241815.0 86 71.71261512.5101 84.212810 8.3111 92.5130 5 4.2116

8、96.7132 3 2.5119 99.2134136 1 0.8120100.0最小组段包最小组段包含最小值含最小值最大组段包含最大值最大组段包含最大值相邻组段不能相邻组段不能有重复数字有重复数字二、频数分布图二、频数分布图为了能更直观地了解频数分布情况,通常在编制为了能更直观地了解频数分布情况,通常在编制频数分布表的基础上,绘制频数分布图。可以更频数分布表的基础上,绘制频数分布图。可以更加直观形象地表达频数分布的信息,并可与频数加直观形象地表达频数分布的信息,并可与频数分布表互为补充。分布表互为补充。 常见的频数分布图为直方图(常见的频数分布图为直方图(histogram),是),是一种用

9、垂直条段代表频数分布的图形,以身高组一种用垂直条段代表频数分布的图形,以身高组段为段为X轴,标度是各组的组距;以频数为轴,标度是各组的组距;以频数为Y轴,标轴,标度是各组频数大小。见图度是各组频数大小。见图2-1。三、频数分布表和频数分布图的主要用途三、频数分布表和频数分布图的主要用途1揭示频数分布的特征集中趋势集中趋势集中趋势集中趋势 离散趋势离散趋势离散趋势离散趋势 2揭示频数分布的类型对称分布:正态分布对称分布:正态分布Symmetric Normal distributionSymmetric Normal distribution偏态分布偏态分布Skewed distribution

10、Skewed distribution正偏态分布正偏态分布正偏态分布正偏态分布Positively skewedPositively skewed负偏态分布负偏态分布负偏态分布负偏态分布Negatively skewedNegatively skewed资料分布资料分布正态分布正态分布:中间高、两中间高、两边低、左右对称边低、左右对称负偏态分布:负偏态分布:长尾向长尾向左左延伸延伸正偏态分布:正偏态分布:长尾向长尾向右右延伸延伸三、频数分布表和频数分布图的主要用途三、频数分布表和频数分布图的主要用途3便于发现某些特大或特小的可疑值:便于发现某些特大或特小的可疑值:在频数分布在频数分布表的两端,

11、连续出现几个组段的频数为表的两端,连续出现几个组段的频数为0后,又出现后,又出现一些特大或特小值,让人怀疑这些数据的准确性,对一些特大或特小值,让人怀疑这些数据的准确性,对于这些数据需要进一步的检查和核对。于这些数据需要进一步的检查和核对。 4便于进一步计算统计指标和做统计分析。便于进一步计算统计指标和做统计分析。5大样本资料的陈述形式:大样本资料的陈述形式:描述一个大样本资料时,描述一个大样本资料时,如将所有原始数据都罗列出来,往往显得过于冗长繁如将所有原始数据都罗列出来,往往显得过于冗长繁琐,令人毫无印象,也看不出数据的分布特征与类型。琐,令人毫无印象,也看不出数据的分布特征与类型。但是如

12、果改用频数分布表描述,能让人快速判断出数但是如果改用频数分布表描述,能让人快速判断出数据的分布特征和类型,令人印象深刻。据的分布特征和类型,令人印象深刻。 2.2 集中趋势指标集中趋势指标 集中趋势指标,主要用于描述一组同质数值变量集中趋势指标,主要用于描述一组同质数值变量的平均水平或集中趋势,亦称的平均水平或集中趋势,亦称平均数平均数。常用的主。常用的主要有:要有:算术均数算术均数几何均数几何均数中位数中位数一、算术均数一、算术均数 简称均数,总体均数用简称均数,总体均数用表示,样本均表示,样本均数用数用 表示。用于描述正态分布资料或近表示。用于描述正态分布资料或近似正态分布资料。似正态分布

13、资料。直接法直接法 常用于小样本资料。公式为常用于小样本资料。公式为: 加权法加权法 用于频数表资料。公式为用于频数表资料。公式为 二、几何均数二、几何均数 用于描述等比关系资料或对数正态分布资料,用G表示。直接法 用于小样本数据。公式为: 加权法 用于样本中有较多相同变量值或频数表资料。 有有5个人的血清抗体效价为个人的血清抗体效价为1:10,1:100, 1:1000,1:10000,1:100000。求平均血清抗体。求平均血清抗体效价。效价。5 5个人的平均血清抗体效价为个人的平均血清抗体效价为1 1:10001000抗体效价抗体效价1:101:201:401:801:160合计合计人数

14、人数5920106505050人的血清平均抗体效价为人的血清平均抗体效价为1 1:41.7041.70,即,即1:421:42计算几何均数对变量值的要求计算几何均数对变量值的要求不能同时有正值和负值不能有0若全为负值,应先按正值计算,得出结果后再加负号。三、中位数及百分位数三、中位数及百分位数 中位数,用M表示,指将一组变量值按从小到大的顺序排列,位次居中的变量值。 用于描述偏态分布资料或分布状态不明的资料、变量值中有个别过小或过大值、分布一端或两端无确定数据的资料平均水平。直接法直接法 先将变量值按从小到大的顺序排列。当n为奇数时,位置居中的变量值即为中位数。 当n为偶数时,位置居中的两个变

15、量值的均数即为中位数。 中位数中位数n n为偶数为偶数n n为奇数为奇数有有7 7个人的血压(收缩压)测定值个人的血压(收缩压)测定值(mmHgmmHg)为:)为:120120、123123、125125、127127、128128、130130、132132, 求中位数。求中位数。 某病患者某病患者8 8人的潜伏期(天)分别为人的潜伏期(天)分别为5 5,6 6,8 8,9 9,1111,1111,1313,1616。求中位数。求中位数。 8 8人的平均潜伏期为人的平均潜伏期为1010天,即天,即MM1010(天)(天)7人血压的中位数为M=127(mmHg)频数表法频数表法 先将变量值按从

16、小到大的顺序列出频数表,先将变量值按从小到大的顺序列出频数表,并分别计算累计频数和累计频率,然后找出中并分别计算累计频数和累计频率,然后找出中位数所在组段,代入下列公式求中位数。位数所在组段,代入下列公式求中位数。式中式中L为中位数所在组段下限,为中位数所在组段下限,i为该组段组为该组段组距,距, 为该组段的频数,为该组段的频数, 为小于为小于L的各组的各组段累计频数。段累计频数。上限值上限值Ui; fm中位数中位数Md下限值下限值L百分位数百分位数是一种位置指标,以 表示。理论上有x比 小,有(100 x)比 大。百分位数计算公式如下: 表表2-1 120名名8岁健康男孩身高(岁健康男孩身高(cm)资料频数分布)资料频数分布组段组段频数f频率(%)累计频数累计频率(%)112 2 1.7 2 1.7114 7 5.8 9 7.5116 9 7.5 18 15.01181411.7 32 26.71201512.5 47 39.21241815.0 86 71.71261512.5101 84.212810 8.3111 92.5130 5 4.2116 96.7132 3 2.511

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号