医学统计定量描述规培

上传人:g**** 文档编号:49250349 上传时间:2018-07-26 格式:PPT 页数:57 大小:9.45MB
返回 下载 相关 举报
医学统计定量描述规培_第1页
第1页 / 共57页
医学统计定量描述规培_第2页
第2页 / 共57页
医学统计定量描述规培_第3页
第3页 / 共57页
医学统计定量描述规培_第4页
第4页 / 共57页
医学统计定量描述规培_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《医学统计定量描述规培》由会员分享,可在线阅读,更多相关《医学统计定量描述规培(57页珍藏版)》请在金锄头文库上搜索。

1、第二章 计量资料的统计描述卫生统计学教研室任艳峰Qualitative data analysis (ranked) Quantitative data analysisStatistical descriptionStatistical InferenceStatistical InferenceStatistical descriptionCollection of data Statistical analysisSorting dataDesign Design Collection of data Sorting dataStatistical analysisStatistical

2、 analysisStatistical descriptionStatistical descriptionStatistical InferenceStatistical InferenceParameter EstimationHypothesis Test 熟悉频数表的划记步骤,频数表的用途。 掌握集中趋势指标的定义、适用范围和计算。 掌握离散趋势指标的定义、适用范围和计算。学习目标定量资料进行描述时,如果样本量较大,需要对原始资料进行整理,列出频 数分布表,通过频数表以显示资料的分 布类型。第一节 频数分布表与频数分布图 频数(frequency)某数值在数据中出现的次数。 相对频数

3、(frequency)也叫频率,数值在总观察例数中所占的比例。 频数表(frequency table)将所有“互相排斥的情形”的频数毫无遗漏地排列在一起。由频数与组段组成。 如1998年某山区96名孕妇产前检查次数资料: 0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7。 这是什么类型的资料?一、离散型定量资料的频数分布检查次数 (1)频 数(2)频率(%) (3)0 4 4.2 1 7 7.3 21111.5 31313.5 42627.1 52324.051212.5 合计96 100.01998年某地96名孕妇产前检查次数分布图中横坐标表示产前检查次数,纵坐标

4、表示各检查次数的 孕妇例数占总孕妇数的频率(比例)。从直条高度和分布 情况看出,产前检查次数分布呈负偏态分布。二、连续型定量资料的频数分布1.找出最大值 和最小值(一)频数分布表的编制方法2.计算全距 (range,R)也叫极差(1)根据数据多少,组段数一般515个左右(10);(2)根据(R/预计组段数)估计组距大小 (22.22/10=2.22);(3)确定组段数和组距;两端的组段包含最大值和最小值;尽量取整数作为组段的端点;组距尽量取相等为宜。3.确定组段数和组距(class interval)4.列表:根据下限X上限的原则确定每一例数据所归属的组段。组组 段划记记频频 数 6/1 8/

5、3 10/, /6 12/, /8 14/, /, /12 16/, /, /, /20 18/, /, /, /, /, /27 20/, /, /, /18 22/, /, /12 24/, /8 26/42830/1 合 计计120最小值最大值标 题组组 段 (1)频频 数 (2)频频率() (3)累计频计频 数 (4)累计频计频 率( ) (5)频频率密度( ) (3) 组组距 610.8310.830.42 832.5043.331.25 1065.00108.332.50 1286.671815.003.34 141210.003025.005.00 162016.675041.6

6、78.34 182722.507764.1711.25 201815.009579.177.50 221210.0010789.175.00 2486.6711595.833.34 2643.3311999.171.67283010.83120100.000.42 合 计计120100.00120名正常成年男子血清铁含量(mol/L)频数表1.揭示资料的分布特征; (1)集中趋势:大部分数据向中间集中,中间数据居多。 (2)离散趋势:从中央到两侧,频数分布逐渐减少。2 .揭示资料的分布类型;正态分布:中间高两侧低、左右对称的单峰分布。偏态分布:集中位置偏向一侧,分布不对称。3.便于发现某些特大

7、或特小的可疑值;4.便于计算指标和统计分析。(二)、频数分布表的用途正偏态正态分布负偏态120例健康成年男子血清铁含量分布频数分布图120例健康成年男子血清铁含量分布频数分布图频率密度 =频率/组距第二节 集中趋势的描述集中趋势指某计量资料大多数观察值所在的中心位置。常用指标有:1.算术均数(arithmetic mean),简称均数(mean)2.几何均数(geometric mean)3.中位数 (median)算术均数(mean)1.定义:算术平均数是由所有数据之和除以数据个数所得的商数。反映一组同质的观察值在数量上的平均水平。总体均数用希腊字母,样本均数用 表示。2. 适用范围:(1)

8、描述对称分布资料的集中趋势;(2)描述正态分布资料的集中趋势。3.均数的计算公式 :(1)直接法:(2)加权法 f 为组段的频数X0为组段的组中值X0=(上限+下限)/2例:测得8只正常大鼠的血清中酸性磷酸酶(TACP) 含量(U/L)为4.20,6.43,2.08,3.45,2.26, 4.04,5.42,3.38。试计算算数均数。几何均数(geometric mean)1. 定义:n个观察值的连乘积的n次方根,几何均数用G表示 。2. 适用范围:(1)成倍数关系或等比关系的资料(2)对数正态分布资料3. 计算公式:(1)直接法:(2) 加权法:例:7名慢性迁延性肝炎患者的HBsAg滴度资料

9、为:1 :16,1:32,1:32,1:64,1:64,1:128,1: 512。试计算其几何均数。4.几何均数的特点:(1) 观察值不能同时存在大于和小于0的数据,不能有等于0的数据。 (2)同一组资料所得几何均数小于等于均数。中位数(median)1.中位数:将一组观察值按照从小到大,或者大到小的顺序排列,位次居中的观察值水平。中位数用M表示。百分位数(percentile):一个位置指标,用Px表示。描述观察值序列在某百分位置的水平。 XminXmaxP25P50P75PX(1)理论上适用于任何分布类型 ;(2)尤其偏态分布资料;(3)开口资料;(4)分布类型不清的资料;2.中位数的适用

10、范围:(1)直接法3. 计算公式:(2) 加权法:Px Px :百分位数:百分位数 L : PL : Px x所在组段的下限值所在组段的下限值i : i : 组距组距 f fx x: : P Px x所在所在组段的频数组段的频数 n : n : 样本例数样本例数 f f L L: : 该组段之前的累计频数该组段之前的累计频数例: 某药厂观察9只小鼠口服山红景醇提物(RSAE) 后在缺乏氧条件下的生存时间(分钟)如下:49.1, 60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。试 求其中位数。中位数实例 10例正常人的发汞值:1.1, 1.8 3.5 4.2 4.

11、8 5.6 5.9 7.1 10.5 16.3M=(4.8+5.6)/2=5.2 对于某项风险较高的新手术术后的生存时间 进行跟踪,共调查了7人, 6人死亡之前分 别生存了5天、6天、10天、16天、25天、29 天,还有一人术后30天随访时仍存活。 本资料属于“开口”资料。 本例数据已经按从小到大的升序排列,n=7 ,为奇数,其中位数为16天。例:试对下表资料求其中位数M。120名正常成年男子血清铁含量(mol/L)组段频数f累计频数f累计频率% 6110.83 8343.33 106108.33 1281815.00 14123025.00 16205041.67 18277764.17

12、20189579.17 221210789.17 24811595.83 26411999.17 28301120100.00 合计12050%M = P50描述离散趋势的指标第三节、离散趋势的描述离散程度指某计量资料的所有观察值与中心位置 的发散程度。变异度极差(Range)四分位数间距(interquartile range)方差(Variance)标准差(Standard Deviation)变异系数( coefficient of variation )描述离散趋势的指标极差(range)1. 极差(range,R):又称全距,一组观察值中最大值和最小值的差。2. 计算公式:3. 特点

13、(1)简单明了,计算简单,应用广泛。(2)只能反映最大值和最小值的变异,不能反映所有数据的变异。(3)样本含量n变大时,R也会变大。(4)样本含量不变时,R抽样误差也较大,不稳定。4. 适用范围:任何分布类型资料,资料做粗略分析。四分位间距2. 计算公式:XminXmaxP25P50P751.四分位数(quartile):是特定的百分位数,下四分位数P25,记作QL;上四分位数P75,记作QU。上四分位数P75,与下四分位数P25之差即是四分位间距。(1)避免了极差受极端值的影响;(2)样本含量n变大时,Q比R稳定;(3)只能反映中间50%的数据的变异,不能反映所有数据的变异;(4)去头弃尾,

14、丢失大量的信息。3. 特点(1) 偏态分布资料;开口资料;分布类型不清的资料(2) Q与M一起使用,描述偏态分布资料的集中趋势和离散趋势。4. 适用范围方差 (variance)1.方差 (variance,2/S2):总体(样本)内所有个体观察值与总体(样本)均值的离均差平方和(sum of square)的均值。2. 计算公式:自由度:df/ 表示随机变量能“自由”取值的个数例如有一四个数据的样本,受到均数为5的条件的限 制,在自由确定4、2、5三个数据后,第四个数据只 能是9,=3任何统计量自由度的个数为=n-限制条件的个数。(1) 能够反映所有观察值之间的离散程度(2) 考虑到每一个观

15、察值,信息利用充分(3) 对数据的变化反应灵敏3. 特点4. 适用范围: 正态分布资料或近似正态分布资料.标准差 (standard deviation)1.标准差 (standard deviation,S ) :即方差的正平方根;其单位与原变量X的单位相同。总体标准差:样本标准差:S2. 计算公式:(1) 能够反映所有观察值之间的离散程度(2) 考虑到每一个观察值,信息利用充分(3)对数据的变化反应灵敏3. 特点(1) 正态分布资料或近似正态分布资料(2) 标准差和均数相结合,描述正态分布资料的集中趋势和离散趋势4. 适用范围变异系数 (coefficient of variation)1.变异系数 (coefficient of variation,CV ):标准差与相应均数的比值;其意义是标准差为均数的多少倍,常用百分比表示。2. 计算公式:3. 适用范围(1) 比较度量衡单位不同的多组资料变异度(2) 比较均数相差悬殊的多组资料的变异度均数差别较

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号