医学第二章第三章 定量资料描述课件

上传人:bin****86 文档编号:55832920 上传时间:2018-10-07 格式:PPT 页数:86 大小:977.50KB
返回 下载 相关 举报
医学第二章第三章  定量资料描述课件_第1页
第1页 / 共86页
医学第二章第三章  定量资料描述课件_第2页
第2页 / 共86页
医学第二章第三章  定量资料描述课件_第3页
第3页 / 共86页
医学第二章第三章  定量资料描述课件_第4页
第4页 / 共86页
医学第二章第三章  定量资料描述课件_第5页
第5页 / 共86页
点击查看更多>>
资源描述

《医学第二章第三章 定量资料描述课件》由会员分享,可在线阅读,更多相关《医学第二章第三章 定量资料描述课件(86页珍藏版)》请在金锄头文库上搜索。

1、(计量资料的统计描述) 第二章 集中趋势的统计描述 第三章 变异程度的统计描述,内容: 1、频数分布表的编制 2、计量资料集中趋势的统计描述,问题: 何为计量资料? 何为统计描述(statistical description)?,统计描述:用统计表、或统计图、或统计指标(描述统计量)概括和揭示资料(data)的数量信息和特征。目的使资料简洁、明了,便于人们了解资料的规律性。,一、变量的频数分布,1、离散型定量变量的频数分布例2-1 1998年某山区96名孕妇产前检查次数资料如下:0,3,2,0,1,5,6,3,2,4,1,0,6,5,4,7。,表2-1 1998年某地96名妇女产前检查次数频

2、数分布,频数(frequency):重复某随机试验,某随机事件出现的次数,称为频数。频数分布表(frequency distribution table)简称频数表(frequency table):含有组段与频数的统计表,称频数表。直方图(histogram):为直观反映频数表,利用直角坐标系绘制频数图,横轴表示变量的“各种情形”,纵轴表示频数、或频率、或频率密度。,2、连续型定量变量的频数分布问题:1)何为连续型定量变量?2)其与离散型定量变量有何区别?3)连续型定量变量的频数分布表该如何绘制?,例2.1某地用随机抽样方法检查了140名成年男子的红细胞数,检测结果如表2-1所示:,表2-2

3、 某地140名成年男性红细胞数(1012/L),表2-3 某地140名成年男性红细胞数的频数表,找出观察值中的最大值和最小值,并求出极差。 最大值与最小值之差称为极差(range),记为RR= 5.95- 3.82=2.13最大值与最小值反映了观察值的分布范围,极差反映了观察值分布的跨度。,按极差大小决定组段数和组距 频数表一般设815个组段,视观察单位数的多少而定,其原则是要充分反映数据的分布特征。 组距即各组的跨度,是每一组内的范围,常采用等距分组。,为了计算方便取0.2为组距 各组段应界限分明,上下衔接,互不交叉,第一组段要包括最小值,最后一组段要包括最大值。 每一组的起点称下限,终点称

4、上限。,3.8,4.2,4.6,5.0,5.4,5.8,0,5,15,25,35,人 数,4.0,4.4,4.8,5.2,5.6,6.0,图2-2 140名正常男子红细胞计数的直方图,表2-4 187例某种沙门氏菌食物中毒潜伏期分布,图2-3 187例某种沙门氏菌食物中毒潜伏期频数直方图,变量频数分布的类型: 1)对称分布 2)偏态分布: 正偏峰(positive skew )分布 负偏峰 (negative skew) 分布,变量频数分布的两个特征 1)集中趋势(central tendency) 2)离散趋势 (tendency of dispersion),二、计量资料集中趋势(平均水平

5、)的描述指标,1、描述集中趋势的统计指标(平均数 average) 1)算术均数(arithmetic mean),简称均数 2)几何均数(geometric mean, G) 3)中位数(median, M),加权法 根据频数表计算均数的一种方法。,例:求名成年男子红细胞数平均水平,加权法:,加权法与直接法结果为什么有不同?,表2-5 某单位工资情况,求该单位平均工职? =1575,几何均数(geometric mean),对于频数表资料,例2.2,测的10个人的血清滴度的倒数分别为2,2,4,4,8,8,8,8,32,32,求平均滴度。 如果计算均数,其值为X=10.8 现计算几何均数显然

6、在这里均数不能代表其平均水平,选择几何均数则比较合适,故10份血清滴度的平均水平1:7,例:100名受试者接种某疫苗三周后,抗体测定结果如下表,试计算平均抗体滴度。,100名受试者平均抗体滴度为1:32.2。,计算几何均数时注意: 变量值中不能有0; 同一组变量值不能同时存在正负值; 若变量值全为负值,可在计算时将负号除去,算出结果后再冠以负号。 医学工作中常用于处理:抗体滴度水平等成倍数增长的数据(等比级数资料),中位数例,9例正常人的发汞值:1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 M=4.8 9例正常人的发汞值:1.1, 1.8 3.5 4.2 4.8

7、5.6 5.9 7.1 16 M=4.8 10例正常人的发汞值:1.1, 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16M=(4.8+5.6)/2=5.2,频数表法: 当观察例数较多时,可先编制频数表,再计算中位数。 计算公式:,式中LM表示中位数M所在组段的下限;i和fM分别 表示中位数M所在组段的组距和频数;fL表示小于LM 的各组段的累计频数。,确定中位数所在组段的方法: 累计频数恰好第一次大于n/2的组段为中位数所在组段。 或累计频率恰好第一次大于50%的组段,例:某种传染病的潜伏期(天)见下表,试求平均潜伏期。,4组段累计频数(f =74)恰好第一个大于n/2

8、(110/2=55),故中位数位于4组段。,平均潜伏期为5.21天。,百分位数,位置指标,以 表示; 理论上有X%的观察值比 小,有(100-X)%的观察值比 大; 百分位数是一个界值,是分布数列的一百等份分割值;即是中位数。 百分位数常用于描述一组观察值在某百分位置上的水平,多个百分位数结合使用可全面地描述资料的分布特征。,百分位数的计算方法,计算公式:,式中LX表示第X百分位数PX所在组段的下限;i和fX分别表示第X百分位数PX所在组段的组距和频数fL表示小于LX的各组段的累计频数。 确定第X百分位数PX所在组段的方法:累计频数恰好第一次大于nX%的组段为第X百分位数PX所在组段。,例:某

9、种传染病的潜伏期(天)见下表,试求平均潜伏期。,某传染病的潜伏期资料为例,试计算P2.5, P25, P75。 由确定PX所在组段方法可判定P2.5,P25,P75分别在2,4,6三个组段内。,中位数和百分位数的应用,对资料的分布没有特殊要求; 中位数只受位置居中的变量值影响,抗极端值,具有较好的稳定性,但不如均数精确,不便于统计运算; 当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。 百分位数常结合使用说明某一特定问题。,思考题:算术平均数与中位数的异同点,问题:考核甲、乙两中药店服务员的技术水平,令每人每次从盒中取10克某种中药,各取5次进行称量,结果如下(g): 甲:9.6

10、10.5 10.0 9.5 10.4 乙:9.9 10.1 9.9 10.2 9.9,2、描述离散趋势(变异)的统计指标 1)极差(range, R) 2)四分位数间距(quartile range,QR) 3)方差(variance) 4)标准差(standard deviation) 5)变异系数(coefficient of variation ),1)极差:R= 最大值 最小值A: 26 28 30 32 34 B: 24 27 30 33 36 C: 26 29 30 31 34,极差:计算方便;只考虑两个极值;与n有关,用于比较是需注意。,2)四分位数间距:QR = P75 P25

11、,四分位数间距:包抱总体中数值居中的50%的个体; 计算是没用到每个个体的数值; 其值越大,说明变量变异越大。,3)方差,又称均方差(mean square deviation),29,4)标准差:方差的算术平方根,即为标准差。,标准差与方差的含义类似,值越大,说明变量的变异越大,都适合用来表达对称分布的离散趋势。两者不同的是量纲不一样。,5)变异系数:标准差与均数之比,即为变异系数。用于描述对称分布资料的变异程度。,变异系数无量纲,其值大,说明相对均数而言的相对变异较大。 可用于量纲相同、或不同的变量变异程度大小的比较。,例:某地7岁男孩身高的均数为123.10 cm,标准差为4.71cm;

12、体重均数为22.29kg,标准差为2.26kg, 比较其变异度?,n1=3 5 10 15 均数=10元 标准差=5元n2=395 100 105 均数=100元 标准差=5元,下列两组数据(量纲相同)何者变异较大?甲: 1 2 4 8 16 乙:10 20 40 80 160,问题:均数、方差(标准差)常用来描述对称分布资料,为什么?,描述统计量的一般应用总结表,正态分布,正态分布的概念 120名13岁女孩身高频率密度直方图,当n大时,频率密度曲线可估计概率密度曲线。医学中的许多变量,其概率密度曲线类似正态曲线。故可用正态曲线的特点来描述这些变量的统计规律。,正态曲线(normal curv

13、e ):是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟型曲线。其概率密度函数为:,-X+,正态分布图示,x,0,.1,.2,.3,.4,f(x),-3 -2 - + +2 +3,正态分布有两个参数: 位置参数: 变异度参数:2正态分布的表示方法:X N(, 2),正态分布的性质,正态分布只有一个高峰,高峰位置在均数处(说明什么?); 正态分布以均数为中心,左右对称; 正态分布的两个参数和决定了分布的位置和形状; 正态分布曲线下的面积分布是有规律的。,正态曲线下面积的分布规律 1)由频率密度直方图的含义,我们不难理解频率(概率)密度曲线下面积的含义。 2)正态曲线可作为

14、很多医学变量概率密度曲线的近似。 3)当知道了密度函数f(x)时,频率(概率)密度曲线下的面积可通过对密度函数求定积分的方法获得。 4)定积分的方法求正态曲线下的面积过于复杂,我们可用简便的查表法解决这一问题。,若变量 u N(0, 1),我们称u为标准正态变量,其 密度曲线称为标准正态曲线,其概率密度函数为:,- u +,标准正态分布是正态分布的一种特例。 正态曲线下的面积规律与标准正态曲线下的 面积规律有什么关系呢?,由积分知识可证明:,式中,分别,是正态分布和标准正态分布的概率密度函数,,分别是它们的分布函数。,标准正态分布,正态分布 X N(170, 62),(-1.667)=0.04

15、75,统计学家编制了标准正态分布函数表(附表1), 故求正态曲线下的面积可通过查附表1获得。 因为正态分布的对称性,为节省篇幅,附表1只给出 Z取负值的情况。,例:已知健康成年男性身高(厘米)X N(170, 62),求成年男性中身位于165厘米至175厘米的人占整个成年男性的比例。例:对于35至44岁的男性,如果舒张压是在90-100mmHg这间,我们称为轻度高血压;设这一人群的舒张压呈正态分布且均值为80,方差为144。随机从这一人群中抽一人,此人恰好是患轻度高血压的概率是多少?,例:基于临床症状而诊断中风是因难的。在临床中一个标准的诊断检查实验是做病人的血管造影。这种检查对病人有些危险,

16、几种没有伤害性的技术已经发展起来,希望能与血管造影同样有效。一种方法是使用大脑血流图测量血流(CBF),因为中风病人趋向于有较低水平的CBF值。假设在一般人口中CBF呈正态分布,均数值75,标准差为17。如果某人的CBF低于40,则认为有中风危险。试问:一个正常(无中风)的人被错误诊断为中风的概率是多少?,例:表光眼是一种眼病,表征为高的眼内部血压。已知这种眼内压在正常人群中近似呈正态分布,均值为16mmHg,标准差为3mmHg。如果眼内压的正常范围是12到20之间,则正常人落入这个范围的比例是多少?例:公共汽车车门的高度是按男子与车门顶碰头机会在1%以下来设计的。设男子身高(厘米) X N(170, 62),问车门高度应如何确定?,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > 其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号