医学统计学第二讲计量资料的统计描述

上传人:pu****.1 文档编号:571815605 上传时间:2024-08-12 格式:PPT 页数:49 大小:419.50KB
返回 下载 相关 举报
医学统计学第二讲计量资料的统计描述_第1页
第1页 / 共49页
医学统计学第二讲计量资料的统计描述_第2页
第2页 / 共49页
医学统计学第二讲计量资料的统计描述_第3页
第3页 / 共49页
医学统计学第二讲计量资料的统计描述_第4页
第4页 / 共49页
医学统计学第二讲计量资料的统计描述_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《医学统计学第二讲计量资料的统计描述》由会员分享,可在线阅读,更多相关《医学统计学第二讲计量资料的统计描述(49页珍藏版)》请在金锄头文库上搜索。

1、第二章第二章统计工作基本步骤:统计工作基本步骤: 设计设计收集收集整理整理分析分析(按资料类型按资料类型) 整理资料整理资料-制作频数表制作频数表 分析资料分析资料 统计描述:统计描述: 指标、图表指标、图表 统计推断:参数估计、假设检验统计推断:参数估计、假设检验1第二章第二章计量资料的统计描述(指标)计量资料的统计描述(指标)2第二章第二章主要内容主要内容第一节 频数分布表和频数分布图(整理)第二节 集中趋势第三节 离散趋势第四节 正态分布第五节 医学正常值范围的估计分析应用3表2.1 某年某地区434名15-64岁少数民族已婚妇女现有子女数的频数分布4 例例2.1 某地用随机抽样方法检查

2、了某地用随机抽样方法检查了140名成年名成年男子的红细胞数,检测结果如表所示:男子的红细胞数,检测结果如表所示: 5一、频数表一、频数表 (Frequency Table) 同时列出观察指标的可能取值区间及其同时列出观察指标的可能取值区间及其在各区间内出现的频数。在各区间内出现的频数。 1.求全距求全距:R= 5.95-5.95-3.82=2.033.82=2.03 2.确定组数确定组数k:通常选择在:通常选择在815之间之间 3.确定组距:确定组距: 参考组距为参考组距为R/k , R为全距为全距 4.确定组段确定组段: 包含下限不包含上限包含下限不包含上限 5.对各组段计数:对各组段计数:

3、 划记划记,汇总汇总.6 某地某地140名正常男子红细胞数的频数表名正常男子红细胞数的频数表 7二、直方图(二、直方图(HistogramHistogram) 直观、形象地表示频数分布的直观、形象地表示频数分布的形形态和特征和特征。140名正常男子红细胞计数的直方图名正常男子红细胞计数的直方图8频数表的用途频数表的用途 1.作为陈述资料的形式作为陈述资料的形式 2.便于观察数据的分布类型便于观察数据的分布类型 3.便于发现资料中含有的异常值便于发现资料中含有的异常值 4.便于进行统计指标的计算和进一步的分析便于进行统计指标的计算和进一步的分析. 91. 频数表的编制步骤频数表的编制步骤表2.2

4、 某市120名5岁女孩身高频数分布101. 频数表的编制步骤频数表的编制步骤第二节 集中趋势的描述 为了进一步揭示数据分布的规律,尚需要用统计指标为了进一步揭示数据分布的规律,尚需要用统计指标来较为准确地描述数据的分布特征:集中趋势和离散趋势来较为准确地描述数据的分布特征:集中趋势和离散趋势 平均数(平均数(average)是一组反映资料集中趋势()是一组反映资料集中趋势( central tendency )的指标。常用的有:)的指标。常用的有:1. 算术均数算术均数(arithmetic mean),简称均数,简称均数 (mean)2. 几何均数几何均数(geometric mean)3.

5、 中位数中位数 (median)4. 众数(众数(mode)11一、算术平均数(一、算术平均数( The Arithmetic mean) 简称均数(简称均数(Mean)或均值,定义为所有变量值之)或均值,定义为所有变量值之和除以变量值个数(即,样本含量和除以变量值个数(即,样本含量Sample Size)。)。反映一组呈对称分布的变量值在数量上的平均水平。反映一组呈对称分布的变量值在数量上的平均水平。12(1)直接计算法)直接计算法 公式公式 :例例1:试计算:试计算1,3,7,9的均数?的均数?例例2:试计算:试计算1,3,3,7,7,9,9,9的均数?的均数?13(2)加权法 为求和符号

6、,读成sigma14151. 频数表的编制步骤频数表的编制步骤意义:一组性质相同的观察值在数量上的平均水平。表示 : (总体) X(样本)计算:直接法、间接法、计算机特征: (X- X)=0 。 (X- X)2 (X- a)2(其中a X) 易受到极端值的影响。应用:正态分布或近似正态分布;可以作为样本的代表值与其他样本进行比较。注意:合理分组,才能求均数,否则没有意义。算术均数小结16在数量上的平均水平。在数量上的平均水平。例 一组血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求均数。此例的算术均数为此例的算术均数为22222,显然不能代表滴度的,显然不能

7、代表滴度的平均水平。平均水平。直观看,其平均水平应为直观看,其平均水平应为1000,如何求得这一如何求得这一数据呢?数据呢?17在数量上的平均水平。在数量上的平均水平。可用于反映一组经对数转换后呈对称分布或正态分布可用于反映一组经对数转换后呈对称分布或正态分布的变量值在数量上的平均水平。的变量值在数量上的平均水平。二、几何均数(二、几何均数(geometric mean)18(1)(1)直接法直接法几何均数几何均数:变量变量对数值的对数值的算术均算术均数数的反对数的反对数。 其他对数(如自然对数)变换也可获得相同的几何均数19例例3.6 测测定定10名名伤伤寒寒病病人人血血清清 抗抗体体滴滴度

8、度分分别别为为1:4, 1:4, 1:4,1:4,1:4,1:16, 1:16,1:16,1:64, 1:128,求其平均抗体滴度。,求其平均抗体滴度。以其滴度的倒数为原变量值,代入公式有:以其滴度的倒数为原变量值,代入公式有:平均抗体滴度为:平均抗体滴度为: 1:1120(2)加权法)加权法公式:公式:21例例2.52.5 7575名儿童的平均抗体滴度计算名儿童的平均抗体滴度计算22几何均数小结意义:N个数值的乘积开N次方即为这N 个数的几何均数。表示:G计算:直接法、间接法应用:原始数据分布不对称,经对数转换后呈对称分布的资料。例如抗体滴度。等比资料注意观察值不能同时有正负或有零,若全是负

9、值,则计算时可先去掉负号,得出结果后再加上负号。同一资料,几何均数60,60变量排序变量排序 2, 3, 4, 7, 9, 10, 13, 15, 50,60,60秩次秩次 1 2 3 4 5 6 7 8 9 10 11 24(一)(一) 中位数计算方法中位数计算方法 1.直接法直接法:适用于样本量较小的计量资料。当n为奇数时 当n为偶数时251. 频数表的编制步骤频数表的编制步骤例例 9名中学生甲型肝炎的潜伏期分别为名中学生甲型肝炎的潜伏期分别为12,13,14, 14, 15, 15, 15, 17, 19天,天,求其中位数。求其中位数。261. 频数表的编制步骤频数表的编制步骤2.2.频

10、数表法(百分位数法):频数表法(百分位数法):适用于样本量较大的计量资料,如频数表资料。 M : 中位数所在组段下限i: 组距 fM : 中位数所在组段频数f:中位数所在组段前一组的累计频数27频数表资料的中位数频数表资料的中位数下限值下限值L100cm上限值上限值U120cmi; fm中位数中位数M28中位数100+20x(1503x50%448)/520111.67(分)291. 频数表的编制步骤频数表的编制步骤中位数小结中位数小结1.计算时只利用了计算时只利用了位置居中的测量值位置居中的测量值 优点:对极值不敏感优点:对极值不敏感 缺点:并非考虑到每个观测值缺点:并非考虑到每个观测值2.

11、适用于各种分布类型的资料,特别适合于:适用于各种分布类型的资料,特别适合于:大样本偏态分布资料大样本偏态分布资料或者一端或两端无确切数值的资料或者一端或两端无确切数值的资料或分布不清的资料或分布不清的资料对于正态分布资料,中位数等于均数,对于对数正态对于正态分布资料,中位数等于均数,对于对数正态分布资料,中位数等于几何均数分布资料,中位数等于几何均数301. 频数表的编制步骤频数表的编制步骤第三节、离散趋势的描述第三节、离散趋势的描述变异(变异(variation)指标:反映数据的离散度)指标:反映数据的离散度( Dispersion )。即个体观察值的变异程)。即个体观察值的变异程度。常用的

12、指标有:度。常用的指标有: 1. 极差极差(Range) (全距全距) 2. 百分位数与四分位数间距百分位数与四分位数间距 Percentile and Quartile range 3. 方差方差 Variance 4. 标准差标准差Standard Deviation 5. 变异系数变异系数 Coefficient of Variation311. 频数表的编制步骤频数表的编制步骤 例例:设设甲甲、乙乙、丙丙三三人人,采采每每人人的的耳耳垂垂血血,然然后后红红细细胞胞计计数数,每每人人数数5个个计计数数盘盘,得得结结果果如如下(万下(万/mm3)甲乙丙321. 频数表的编制步骤频数表的编制

13、步骤1.1.极差极差(Range(Range) ( (全距全距) )优点:简便缺点:只利用了两个极端值;n大,R也会大,不稳定。应用:用于描述单峰对称分布小样本资料;初步了解资料的变异程度。1204020max - Xmin332.2.百分位数与四分位数间距百分位数与四分位数间距 Percentile and quartile range Percentile and quartile range百分位数百分位数 :数据从小到大:数据从小到大 排列排列;在百分尺度下,在百分尺度下,所占百分比对应的值。记为所占百分比对应的值。记为Px。 34 PX X% (100-X)%XminXmaxP100

14、变量值从小到大排列P0百分位数示意图百分位数示意图35百分位数的计算百分位数的计算直接法:略频数表法:公式36P2580+20x(1503x25%0)/44896.77(分)P75120+20x(1503x75%968)/226134.09(分)37四分位间距四分位间距:QP75 P25Q越大,表示资料的离散程度越高,反之亦然。与越大,表示资料的离散程度越高,反之亦然。与中位数的应用条件相同可以看作是一对指标。中位数的应用条件相同可以看作是一对指标。0 P25 P50 P75 100%383.3.方差方差 方差方差 (variance)也称)也称均方差均方差(mean square devia

15、tion),样本观察值的离均差平方),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。和的均值。表示一组数据的平均离散情况。平均偏差=离均差平方和(SS)=离均差=39总体方差 方差性质:方差越大说明数据的变异越大 n为自由度(degree of freedom,简记为DF)指随机变量能自由取值的个数40样本方差为什么要除以(样本方差为什么要除以(n n1 1)与自由度(degrees of freedom)有关。 自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(nk)个自由度了。计算标准差时, n个

16、变量值本身有n个自由度。但受到样本均数的限制,任何一个“离均差”均可以用另外的(n1)个“离均差”表示,所以只有(n1)个独立的“离均差”。因此只有(n1)个自由度。 41例题:求某市城区例题:求某市城区1111名岁女孩身高的样本名岁女孩身高的样本方差,已知方差,已知107.39107.39。2 =(112.9-107.39)2+(99.5-107.39)+(116.5-107.39)/(11-1) =48.75(cm)2方差的计算方差的计算424.4.标准差标准差 标准差标准差 (standard deviation)即方差)即方差的正平方根;其单位与原变量的正平方根;其单位与原变量X的单位

17、相同。的单位相同。计算公式:计算公式:43标准差(standard deviation)样本标准差样本标准差为样本方差的平方根;为样本方差的平方根; 总体标准差总体标准差为总体方差的平方根。为总体方差的平方根。44频数表标准差计算公式频数表标准差计算公式 451. 频数表的编制步骤频数表的编制步骤表2.2 某市120名5岁女孩身高频数分布465. 变异系数变异系数变异系数变异系数(coefficient of variation,CV)适用条件适用条件:观察指标单位不同,如身高、体重观察指标单位不同,如身高、体重 同单位资料,但均数相差悬殊同单位资料,但均数相差悬殊47变异系数应用举例变异系数应用举例:48变异指标小结变异指标小结1极差较粗,适合于任何分布极差较粗,适合于任何分布2标准差标准差与均数的单位相同,最常用,适合于近似正态分布与均数的单位相同,最常用,适合于近似正态分布3变异系数主要用于单位不同或均数相差悬殊资料变异系数主要用于单位不同或均数相差悬殊资料4平均指标和变异指标分别反映资料的不同特征,平均指标和变异指标分别反映资料的不同特征, 常配套使用常配套使用 如如 正态分布正态分布:均数、标准差;:均数、标准差; 偏态分布偏态分布:中位数、四分位间距:中位数、四分位间距49

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号