医学统计学第二章计量资料的统计描述1课件

上传人:鲁** 文档编号:567592169 上传时间:2024-07-21 格式:PPT 页数:53 大小:705.50KB
返回 下载 相关 举报
医学统计学第二章计量资料的统计描述1课件_第1页
第1页 / 共53页
医学统计学第二章计量资料的统计描述1课件_第2页
第2页 / 共53页
医学统计学第二章计量资料的统计描述1课件_第3页
第3页 / 共53页
医学统计学第二章计量资料的统计描述1课件_第4页
第4页 / 共53页
医学统计学第二章计量资料的统计描述1课件_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《医学统计学第二章计量资料的统计描述1课件》由会员分享,可在线阅读,更多相关《医学统计学第二章计量资料的统计描述1课件(53页珍藏版)》请在金锄头文库上搜索。

1、欢迎来到医学课堂 第一篇第一篇 基本统计方法基本统计方法 第二章第二章 计量资料的统计描述计量资料的统计描述 第二军医大学卫生统计学教研室第二军医大学卫生统计学教研室 孟孟 虹虹 本章的内容和重点本章的内容和重点第一节第一节 频数分布频数分布第二节第二节 集中趋势的描述集中趋势的描述第三节第三节 离散趋势的描述离散趋势的描述第四节第四节 正态分布正态分布第五节第五节 医学参考值的制定医学参考值的制定重点重点: 掌握概念、方法的用途和适用条件掌握概念、方法的用途和适用条件 熟悉统计符号和公式熟悉统计符号和公式 统计描述的意义统计描述的意义 社会活动看似杂乱无章,对个体来说社会活动看似杂乱无章,对

2、个体来说有很多不确定性,但总体上都是服从一些有很多不确定性,但总体上都是服从一些统计规律的。统计规律的。 医学工作有很多数据,统计学描述就医学工作有很多数据,统计学描述就是对这些数据进行加工和提炼,找出规律、是对这些数据进行加工和提炼,找出规律、预测未知。预测未知。 统计描述是最简洁有力的语言。统计描述是最简洁有力的语言。概念:即用少量几个统计指标刻画出原始数概念:即用少量几个统计指标刻画出原始数据的特征称为据的特征称为统计描述统计描述。计量资料的统计描述计量资料的统计描述方法方法: (单变量单变量) 1. 通过频数表描述数据特征通过频数表描述数据特征 2.用统计指标用统计指标 定量描述数据的

3、特征。定量描述数据的特征。 表表 100例高血压患者治疗后临床记录例高血压患者治疗后临床记录编号编号编号编号 年龄年龄年龄年龄 性别性别性别性别 治疗组治疗组治疗组治疗组 舒张压舒张压舒张压舒张压 体温体温体温体温 疗效疗效疗效疗效 X1 X1 X1 X1 X2X2X2X2 X3 X3 X3 X3 X4 X5X4 X5X4 X5X4 X5 X6X6X6X6 1 37 1 37 男男男男 A 11.27 37.5 A 11.27 37.5 显效显效显效显效 2 45 2 45 女女女女 B 12.53 37.0 B 12.53 37.0 有效有效有效有效 3 43 3 43 男男男男 A 10.

4、93 36.5 A 10.93 36.5 有效有效有效有效 4 59 4 59 女女女女 B 14.67 37.8 B 14.67 37.8 无效无效无效无效 100 54 100 54 男男男男 B 16.80 37.6 B 16.80 37.6 无效无效无效无效 一一 、频数分布表、频数分布表频数分布表:将变量值分为不同数量的频数分布表:将变量值分为不同数量的组段,清点各组段的例数。组段,清点各组段的例数。意义:概括了解变量值在各组段的意义:概括了解变量值在各组段的分布分布和规律和规律。例: 表2-1 例例2-1 从某单位从某单位1999年的职工体检资料中获得年的职工体检资料中获得101名

5、正常成年女子的血清总胆固醇(名正常成年女子的血清总胆固醇(mmol/L )的测量结果)的测量结果 2.352.354.214.213.323.325.355.354.174.174.134.132.782.784.264.263.583.584.344.344.844.844.414.414.784.783.953.953.923.923.583.583.663.664.284.283.263.263.53.52.72.74.614.614.754.752.912.913.913.914.594.594.194.192.682.684.524.524.914.913.183.183.683.6

6、84.834.833.873.873.953.953.913.914.154.154.554.554.84.83.413.414.124.123.953.955.085.084.534.533.923.923.583.585.355.353.843.843.63.63.513.514.064.063.073.073.553.554.234.233.573.574.834.833.523.523.843.844.54.53.963.964.54.53.273.274.524.523.193.194.594.593.753.753.983.984.134.134.264.263.633.633.8

7、73.875.715.713.33.34.734.734.174.175.135.133.783.784.574.573.83.83.933.933.783.783.993.994.484.484.284.284.064.065.265.265.255.253.983.985.035.033.513.513.863.863.023.023.73.74.334.333.293.293.253.254.154.154.364.364.954.953.003.003.263.26例例2-1数据数据 1.确定全距(确定全距(R)=最大值最大值 最小值最小值2.定组数(定组数(8-15组)和组距:组)和

8、组距:例例: 3.36/10=0.3360.33.写出组段的下限:第写出组段的下限:第1组段值小于或等于最组段值小于或等于最小变量值,并以整数(小变量值,并以整数(0,5或或2,4,6,8)较好。如)较好。如2.34.划计并计数:变量(划计并计数:变量(x)归为)归为L xU(见(见表表2-1)组距(组距(i)=全距(全距(R)/组数组数表表2-1 101名正常成年女性血清总胆固醇频数表名正常成年女性血清总胆固醇频数表 组段组段组段组段 频数(频数(频数(频数(f f) f f(%) 2.3- 1 1.02.3- 1 1.0 2.6- 3 3.0 2.6- 3 3.0 2.9- 6 6.0 2

9、.9- 6 6.0 3.2- 8 8.0 3.2- 8 8.0 3.5- 17 17.0 3.5- 17 17.0 3.8- 20 20.0 3.8- 20 20.0 4.1- 17 17.0 4.1- 17 17.0 4.4- 12 12.0 4.4- 12 12.0 4.7- 9 9.0 4.7- 9 9.0 5.0- 5 5.0 5.0- 5 5.0 5.3- 2 2.0 5.3- 2 2.0 5.6- 5.9 1 1.0 5.6- 5.9 1 1.0 合计合计合计合计 101 100.0101 100.0二二 频数表及分布图的用途频数表及分布图的用途1. 通过通过频数表了解频数表了解数

10、据的分布特征数据的分布特征。 X值分布情况:偏态或正态分布值分布情况:偏态或正态分布 取值情况:变量值取值范围取值情况:变量值取值范围 集中趋势:变量值集中位置。集中趋势:变量值集中位置。2.便于发现资料中的可疑值。便于发现资料中的可疑值。3.组段的频率作为概率的估计。组段的频率作为概率的估计。例:例:表表2-1资料频数分布图资料频数分布图直方图直方图图图2-1 101名正常成年女性血清总胆固醇频数分布名正常成年女性血清总胆固醇频数分布频频数数血清总血清总胆固醇胆固醇正态分布正态分布图图2-2 59名链球菌咽喉炎患者潜伏期名链球菌咽喉炎患者潜伏期正偏态正偏态分布分布讲义表讲义表2-4数据数据图

11、图2-3 负偏态分布负偏态分布例例:某院出院患者住院天数的频数表某院出院患者住院天数的频数表组段(天)组段(天) 频数(频数(f) 0- 6 5- 2110- 1415- 1320- 625- 230- 335- 140及以上及以上 13合计合计 79第二节第二节 集中趋势的描述集中趋势的描述平均数指标的概念和作用平均数指标的概念和作用概念:平均数表示一组同质计量数据概念:平均数表示一组同质计量数据集中趋势集中趋势的位置的位置和和平均水平平均水平。作用:是一组计量数据平均水平的代表值;可作用:是一组计量数据平均水平的代表值;可作为不同组间的比较值作为不同组间的比较值。医学中常用的平均数指标有:

12、医学中常用的平均数指标有:算数均数、几何均数、中位数算数均数、几何均数、中位数一、算术均数一、算术均数( mean)简称均数,用 表示. 公式适用频数公式适用频数为正态或近似为正态或近似正态分布的计正态分布的计量资料量资料.基本公式(基本公式(2-1,2-2)加权法公式(例数多)加权法公式(例数多)适用条件适用条件表表2-1 101名正常成年女性血清总胆固醇频数表名正常成年女性血清总胆固醇频数表 组段组段 频数(频数(f) 组中值组中值X fX 2.3- 1 2.45 2.3- 1 2.45 2.452.45 2.6- 3 2.75 8.25 2.6- 3 2.75 8.25 2.9- 6 3

13、.05 18.30 2.9- 6 3.05 18.30 3.2- 8 3.35 3.2- 8 3.35 3.5- 17 3.65 3.5- 17 3.65 3.8- 20 3.95 3.8- 20 3.95 4.1- 17 4.25 4.1- 17 4.25 4.4- 12 4.55 4.4- 12 4.55 4.7- 9 4.85 4.7- 9 4.85 5.0- 5 5.15 5.0- 5 5.15 5.3- 2 5.45 5.3- 2 5.45 5.6- 5.9 1 5.75 5.6- 5.9 1 5.75 合计合计合计合计 101 409.7101 409.7加权法公式计算加权法公式计

14、算频数(频数(f)作作为为X值的权数值的权数二、几何均数二、几何均数 (Geometric mean)(Geometric mean) 适用条件适用条件:X值呈倍数增长或部分数据偏离值呈倍数增长或部分数据偏离过大偏态分布(正偏态)资料过大偏态分布(正偏态)资料。计算公式:计算公式:直接法,例数直接法,例数较少用(较少用(2-3)加权法,加权法,(2-4)或或 例例2-4 某某地地5例例微微丝丝蚴蚴血血症症患患者者治治疗疗7年年后后用用间间接接荧荧光光抗抗体体试试验验测测得得其其抗抗体体滴滴度度分分别别为为1/10,1/20,1/40,1/80,1/160,求几何均数,求几何均数。结论:平均抗体

15、滴度为结论:平均抗体滴度为1:34(几何均数法)(几何均数法)表表2-5 69例例RA患者血清患者血清EBV-lgG抗体测定结果抗体测定结果滴度倒数滴度倒数滴度倒数滴度倒数 X X 人数人数人数人数 f f lgXlgX flgXflgX10104 41.00001.00004.00004.000020203 31.30101.30103.90303.9030404010101.60211.602116.021016.0210808010101.90311.903119.031019.031016016011112.20412.204124.245124.245132032015152.505

16、12.505137.576537.576564064014142.80622.806239.286839.28681280 1280 2 23.1072 3.1072 6.21446.2144合计合计合计合计6969150.2778150.2778几何均数计算几何均数计算例例2-5 :例数合计:例数合计 结论:结论:69例例RA患者血清患者血清EBV-lgG抗体平均滴抗体平均滴度为度为1:150.6三、中位数三、中位数和百分位数和百分位数(一)中位数(一)中位数( MedianMedian, M):适用于描述适用于描述偏态分布资料的平均水平偏态分布资料的平均水平。如潜伏期、病潜伏期、病程资料。

17、程资料。计算定义:计算定义: 将一组变量值由小到大依次排列,居以将一组变量值由小到大依次排列,居以中间位次的观察值即为中位数,为这组数中间位次的观察值即为中位数,为这组数据的平均数。据的平均数。 X X: 5 5, 5 5, 6 6, 7 7, 2020(d d) 位次位次 1 2 3 4 51 2 3 4 5中位数的计算中位数的计算1.例数较少(公式例数较少(公式2-5,2-6)n为偶数为偶数n为奇数为奇数中位数优点:不受数据中极大或极小值的中位数优点:不受数据中极大或极小值的影响,取决于中间位置的数。影响,取决于中间位置的数。(二)百分位数(二)百分位数百分位数(百分位数(percenti

18、le)是一种位置指标,用是一种位置指标,用 表示。例表示。例 计算定义:将一组变量值由小到大依次排列,计算定义:将一组变量值由小到大依次排列, 为第为第x百分位数的秩次,百分位数的秩次, 其对应的其对应的变量值(变量值(x)为第为第x百分位数,记为百分位数,记为Px。X: 1 5 8 10 48. 105秩次秩次 1 2 3 4 50 100 x% 1% 2% 3% 4% 50% 100%一组数据一组数据(n=100),由小到大排列由小到大排列例:百分位数计算方法1.直接法(不要求)直接法(不要求)将样本值由小到大排队,用将样本值由小到大排队,用 确定确定Px的的位次和位次和PX。当当 为带有

19、小数位时用式为带有小数位时用式2.7: 当当 为整数时为整数时 用式用式2.8trunc(a)表示对数字取其整数。表示对数字取其整数。 式式2.8式式2.7例:例:8位患者某病的住院天数:位患者某病的住院天数: 2 2 2 3 3 4 5 6求求50%位数和位数和80%位数。位数。解:解:第第50%位次:位次:nX%=80.5=4,用式用式用式用式2.82.8 中位数中位数=P50=3(天)天)第第80%位次:位次:nX%=80.8=6.4,用公式用公式2.72.频数表法(例数较多)频数表法(例数较多)Lx :第第X%位数位数所在组段所在组段的下限值的下限值ix :第第X%位数位数所在组段所在

20、组段的组距的组距fx :第第X%位数位数所在组段所在组段的频数的频数 : 第第X%位数位数所在组段所在组段上个组段的上个组段的累计频数累计频数式中式中:(2-9)表2-5 118名链球菌咽喉炎患者的潜伏期天数天数天数天数人数人数人数人数累计频数累计频数累计频数累计频数累计频数累计频数累计频数累计频数%12124 41-41-43.43.4242417175-215-2117.817.83636323222-5322-5344.944.94848242454-7754-7765.365.360601818959580.580.57272121210710790.790.784845 511211

21、294.994.996964 411611698.398.3108-108-2 2118118100.0100.0中位数所中位数所在组段在组段计算频数表资料计算频数表资料P25、P50和和P951.计算计算x=25%和和50%的位次的位次2.按公式按公式2-9计算计算 Px百分位数计算结果的应用1.常计算常计算P25、P50 、P75、和和P95,为临床治为临床治疗提供依据。疗提供依据。例例2-9:120名细菌性痢疾治愈的住院天数名细菌性痢疾治愈的住院天数 P5=3.5(天),即只有(天),即只有5%的人住院的人住院低于低于3.5天。天。 P95=15(天)(天)2.确定医学指标的参考值确定医

22、学指标的参考值如如P25=39.2天天P50=51天(中位数)天(中位数)118名链球菌咽喉炎患者的潜伏期名链球菌咽喉炎患者的潜伏期第三节、离散趋势的描述第三节、离散趋势的描述 描述计量资料数据间离散(变描述计量资料数据间离散(变异)程度的指标异)程度的指标 变异指标变异指标例例2-11 三组同龄男孩的身高(三组同龄男孩的身高(cm) R R 甲组甲组甲组甲组 90 95 100 105 110 100 20 90 95 100 105 110 100 20 乙组乙组乙组乙组 96 98 100 102 104 100 8 96 98 100 102 104 100 8 丙组丙组丙组丙组 96

23、 99 100 101 104 100 896 99 100 101 104 100 8 三组男孩身高值的变异一样吗?三组男孩身高值的变异一样吗?三个指标测定值分布变异不同三个指标测定值分布变异不同 几个常用的变异指标几个常用的变异指标一、极差(极差(Range):用():用(R)表示)表示 即即 R=最大值最大值 最小值最小值意义:意义: R值越大,表示该组数据的变异越大。值越大,表示该组数据的变异越大。缺点:缺点: 数据利用不全,部分信息损失数据利用不全,部分信息损失,在例数少时在例数少时结果不稳定。结果不稳定。二、四分位数间距二、四分位数间距(quartile range) 四分位数间距

24、:常用四分位数间距:常用QR表示表示 常计算:常计算: QR=P75%-P25% 作为变异指标比极差稳定。常用于表示作为变异指标比极差稳定。常用于表示偏偏态分布态分布资料的变异。资料的变异。例:例:QR= P75%-P25% =67.739.2=28.5天天表示方法:表示方法:Md(QR) M=51天,(天,(QR=28.5天)天)三、三、标准差和方差标准差和方差(Standard deviation and variance)公式公式总体方差总体方差(2)(2-11)(2-12)总体标准差总体标准差()样本标准样本标准差差(s)(2-13)标准差的简化计算公式: (2-14)例数较少例数较少

25、(2-15)频数表资料频数表资料例例例例2-11 2-11 甲组甲组甲组甲组5 5名同龄名同龄名同龄名同龄男孩的身高值(男孩的身高值(男孩的身高值(男孩的身高值(cmcm) X X2 90 8100 95 9025 100 10000 105 11025 110 12100n n 标准差的计算标准差的计算表表2-1 101名正常女子血清胆固醇值名正常女子血清胆固醇值组段组段组段组段(X X) 频数频数频数频数(f)(f) fXfX fxfx 2 22.302.302.452.45 1 12.452.45 6.006.002.602.602.752.75 3 38.258.25 22.6922.

26、692.902.903.053.05 6 618.3018.30 55.8255.823.203.203.353.35 8 8 .3.503.503.653.65 17173.803.803.953.95 20204.104.104.254.25 17174.404.404.554.55 12124.704.704.854.85 9 95.005.005.155.15 5 5 5.305.305.455.45 2 2 5.6 5.6 5.755.75 1 1409.75 1705.09 合计合计101n n统计描述:某地统计描述:某地101名正常女子血清胆固醇值平名正常女子血清胆固醇值平均为均

27、为4.06(mmol/L),),标准差为标准差为0.654 (mmol/L)例例2-10 三组同龄男孩的身高值(三组同龄男孩的身高值(cm) R S甲组甲组甲组甲组 90 95 100 105 110 100 20 7.9190 95 100 105 110 100 20 7.91乙组乙组乙组乙组 96 98 100 102 104 100 8 3.1696 98 100 102 104 100 8 3.16丙组丙组丙组丙组 96 99 100 101 104 100 8 2.9296 99 100 101 104 100 8 2.92标准差的意义:标准差的意义: 反映一组变量值变异程度,反映

28、一组变量值变异程度,组间单位相同组间单位相同时,时,S越小,表示数据的变异程度越小。越小,表示数据的变异程度越小。四、变异系数四、变异系数(CV)应用应用:1.组间单位不同组间单位不同时变异程度的比较时变异程度的比较。 2.比较组单位相同比较组单位相同,但但均数相差悬均数相差悬殊殊 的组的组 间变异程度间变异程度.意义:意义:CV越大,表示数据变异越大。越大,表示数据变异越大。常用于衡量方法、仪器的精密度。常用于衡量方法、仪器的精密度。公式:公式:(2-16)1.单位不同时组间变异程度的比较。单位不同时组间变异程度的比较。 某地某地7岁年龄组男童身高与体重岁年龄组男童身高与体重 指标指标 S

29、CV(%)身高身高(cm) 123.10 4.71 3.83体重体重(kg) 22.29 2.26 10.14结论: 7岁年龄组男童身高与体重值指标比较,岁年龄组男童身高与体重值指标比较,体重指标的变异大于身高指标。体重指标的变异大于身高指标。 某地不同年龄组男童身高(某地不同年龄组男童身高(cm)年龄组年龄组 S CV%1-2月月 56.3 2.1 3.735-6月月 66.5 2.2 3.313-3.5岁岁 96.1 3.1 3.225-5.5岁岁 107.8 3.3 3.06结论:随着年龄增加,身高的变异变小。结论:随着年龄增加,身高的变异变小。 2.比较组单位相同比较组单位相同,但均数

30、相差悬殊的但均数相差悬殊的组间变异程度比较组间变异程度比较计量数据的统计描述小结计量数据的统计描述小结 1. 在医学杂志中正态或近似正态的资料,常以在医学杂志中正态或近似正态的资料,常以 的形式表达,的形式表达,描述和比较描述和比较数据的平均水平和离数据的平均水平和离散程度。散程度。 两组患者年龄(岁)的比较两组患者年龄(岁)的比较组别组别 n 范围值范围值试验组试验组 12 45.9 3.7 35-57对照组对照组 10 50.5 13.0 18-83两组患者基线情况的比较两组患者基线情况的比较2.偏态分布或特定资料(生存时间、病程、偏态分布或特定资料(生存时间、病程、潜伏期时间等)潜伏期时

31、间等)1)用中位数和四分位间距描述。)用中位数和四分位间距描述。表达形式:表达形式:M,四分位数间距(四分位数间距(QR)例例2-9 :118名链球菌咽喉炎患者的中位潜名链球菌咽喉炎患者的中位潜伏期为伏期为51天,天,QR为为28.5天。天。2)用百分位数的)用百分位数的P25%、P50%、P75%描述描述分布位置。分布位置。3.等比数据和正偏态数据可用几何均等比数据和正偏态数据可用几何均数和几何标准差描述数和几何标准差描述表达形式:表达形式:GSGn nSHIFT SHIFT 第二功能键第二功能键第二功能键第二功能键n nMODE MODE 计算模式选择键计算模式选择键计算模式选择键计算模式

32、选择键n nLR LR 计算相关回归选择键计算相关回归选择键计算相关回归选择键计算相关回归选择键n nSD SD 统计功能选择键统计功能选择键统计功能选择键统计功能选择键n nMin Min 单独数据储存键单独数据储存键单独数据储存键单独数据储存键n nMR MR 取出储存数据键取出储存数据键取出储存数据键取出储存数据键n nKinKin(1-61-6)单独数据储存键单独数据储存键单独数据储存键单独数据储存键n nKoutKout(1-61-6)取出储存数据键取出储存数据键取出储存数据键取出储存数据键n nX X2 2 数据平方键数据平方键数据平方键数据平方键n n1/1/X X 倒数键倒数键

33、倒数键倒数键n nLog Log 以以以以Log Log 1010 的对数键的对数键的对数键的对数键n n1010x x 反对数键反对数键反对数键反对数键n n+/- +/- 数据的正负符号键数据的正负符号键数据的正负符号键数据的正负符号键CASIOfx3600计算器计算器常用键常用键盘功能盘功能说明说明CASIO fx-3600计算器统计功能用法计算器统计功能用法步骤步骤步骤步骤 键盘键盘键盘键盘 说明说明说明说明1. MOOD 2 1. MOOD 2 进入进入进入进入SDSD统计功能统计功能统计功能统计功能2. SHIFT AC 2. SHIFT AC 清除数据清除数据清除数据清除数据3.

34、 5 RUN 3. 5 RUN 输入数据输入数据输入数据输入数据 8 RUN8 RUN 10 RUN 10 RUN 4. SHIFT 4. SHIFT 1 1 (数字键)(数字键)(数字键)(数字键) 显示计算的显示计算的显示计算的显示计算的5. 5. SHIFT SHIFT 3 3 (数字键)数字键)数字键)数字键) 显示计算的显示计算的显示计算的显示计算的 S S6. 6. KoutKout 3 3 (数字键)数字键)数字键)数字键) 显示计算的显示计算的显示计算的显示计算的 n n7. 7. KoutKout 2 2 (数字键)数字键)数字键)数字键) 显示计算的显示计算的显示计算的显示计算的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 药学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号