基础医学卫生统计学第一节绪论

资源描述

《基础医学卫生统计学第一节绪论》由会员分享，可在线阅读，更多相关《基础医学卫生统计学第一节绪论（170页珍藏版）》请在金锄头文库上搜索。

1、卫生统计学,第一节绪论一、统计学的研究对象及定义 1.研究对象：有变化的事物或现象.如人体身高、气候、水质,2.定义统计学(statistics)是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。卫生统计学(health statistics)就是运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 3.卫生统计学主要包括三方面的内容： 1）卫生统计学的基本原理和方法；2）健康统计； 3）卫生服务统计。,二、统计学的若干概念一、变量观察单位的某项特征称为变量(variable)。变量的观察

2、结果（测得值）称为变量值(value of variable)。变量可分为以下类型：（一）定量变量(quantitative variable) 也称为数值变量，其变量值是定量的，所获资料为计量资料。即对每一个观察对象用定量的方法测定某项指标量的大小。有度量衡单位。,定量变量分为： 1. 连续型变量(continuous variable)：即连续变化的变量，其取值是数轴上某一区间内的一切数值，理论上它们是无限可分的。如身高、体重 2. 离散型变量(discrete variable) ：其取值是0，1，2等不连续的量，是数轴上有限或无限的可数的值，两个数之间没有小数。如年新生儿数、月手

3、术病人数,1. 分类变量(categorical variable)：也称为计数资料，将观察单位按某种属性或类别分组，然后清点数目所得各组的观察单位数。可分为：,2. 有序变量(ordinal variable)：也称为等级资料，将观察单位按某种属性的不同程度分组，然后清点各组数目，但所分各组之间有等级顺序。,二项分类：两类观察结果互相对立。多项分类：观察结果表现为互不相容的多个属性或类别。,（二）定性变量,血红蛋白量（计量资料）,变量间的转化：,二、同质与变异同质(homogeneity)是针对被研究指标来讲，其影响因素相同。简单地理解同质就是指对研究指标影响较大的，可以控制的主

4、要因素应尽可能相同。如研究方法相同，观察时间相等，以及民族、地区、年龄、性别等客观条件一致。,统计学研究的任务：就是在同质分组的基础上，通过对个体变异的研究，透过偶然现象，反映同质事物的本质特征和规律。,同质基础上的个体差异称为变异(variation)。如一组同年龄、同性别、同民族、同地区儿童的身高值各不相同。,三、总体与样本(参数与统计量) 总体(population)：就是根据研究目的确定的同质观察单位的全体，确切的说，是同质的所有观察单位某种变量值的集合。总体指标称参数样本(sample)：就是从总体中随机抽取部分观察单位，其实测值的集合。样本指标称统计量,总体银川市12岁健

5、康男生身高,样本 n=120,概率(probability)：是描述随机事件发生的可能性大小的数值，用P表示。在一定条件下，肯定发生的事件称为必然事件，肯定不发生的事件称为不可能事件，可能发生也可能不发生的事件称为随机事件或偶然事件，必然事件的概率为1，不可能事件的概率为0，随机事件的概率介于0和1之间。 P0.05或P0.01称为“小概率事件”，表明在一次观察或实验中该事件发生的可能性很小，可以看作很可能不发生。如出车祸、中大奖（彩票）。,四、概率,五、参数与统计量参数(parameter)：是根据总体分布的特征而计算的总体统计指标（用希腊字母代表），如总体均数，总体率，总体标准差等。

6、统计量(statistic)：由总体中随机抽取样本而计算的相应样本指标称为（用拉丁字母代表），如样本均数，样本率p，样本标准S等。统计学研究的目的就是要用样本统计量来估计总体参数-统计推断。,同一总体的个体彼此之间的差异有一定的规律性。通常用变量取值的分布来全面反映这种规律性。为了便于处理实际问题，统计学中常用若干典型的分布模式来近似的描写实际资料，如正态分布、二项分布和泊松分布等，常称为统计模型。利用统计模型进行统计分析可以简化运算。,六、设计与分析,一）设计(design) 设计的内容包括搜集资料、整理资料和分析资料全过程总的设想和安排。例如，首先应确定研究目的和内容；确定观察对象

7、和观察单位；需要搜集哪些原始资料；用什么方式和方法获得这些原始资料；怎样对获得的原始资料做进一步的整理汇总和计算统计指标；如何控制误差；预期会得到什么结果；需要多少经费等等。,二）搜集资料(collection of data) 任务：按研究设计的要求，及时取得准确、完整的原始数据。医学统计资料的来源主要有三个方面： 1）统计报表：如传染病报表、职业病报表、医院工作年报表等等，报表应做到完整、准确、及时。 2）经常性工作记录：如医院的病历，各种化验单，检测单，出生、死亡登记卡。,3）专题调查：实验研究，调查研究等。,三）整理资料(sorting data) 任务：按研究设计的要求，使原始

8、数据系统化、条理化，便于进一步计算统计指标和进行统计分析。资料整理的过程： 1. 检查和核对搜集到的数据和资料 3. 按照分组要求设计整理表，进行汇总,四）分析资料(analysis of data) 任务:按研究设计的要求，计算有关指标，阐明事物的内在关系和规律。,第一节频数与频数分布,频数(frequency)：对一个随机变量做重复观察，其中某变量值出现的次数。频数分布表(frequency distribution table)：将各变量值及其相应的频数列成表格的形式。例2-2 抽样调查某地120名18岁35岁健康男性居民血清铁含量(mol/L)见P12，试编制频数分布表。,频数

9、表的编制：,一、连续型定量变量的频数分布,步骤：（1）求全距：（极差）R=29.64-7.42=22.22 （2）定组段数与组距： 815个组段，组距i=全距/组段数（3）划组段：以一个稍小于或等于最小值的整数作为第一个组段的起点数据。下限：每个组段的起点(最小值) 。上限：每个组段的终点(近似最大值）。注：最后一个组段应同时写出上限和下限来。（4）绘制整理表 “下限x上限” 注：各组段的频数之和应等于总的观察例数。,两端的组段应分别包含最小值或最大值；尽量取较整齐的数值作为组段的端点，便于对数据进行表述；组距以相等为宜。,表2 120名正常成年男子血清铁含量的频数分布

10、表,一上正一正上正正丅正正正正正正正正正丅正正正上正正丅正上止一,1 3 6 8 12 20 27 18 12 8 4 1,组段,划记,频数,120,二、离散型定量变量的频数分布,离散型变量的频数分布图直条图横坐标为产前检查次数；纵坐标为频率，即产前检查K次的妇女在被统计妇女中所占的比例%。图中等宽矩形长条的高度与相应检查次数的频率呈正比。,频率：各组的频数除以总例数 n 所得的比值。频率描述了各组频数在全体中所占的比重，各组频率之和等于100%。累计频数：本组段的频数与以前各组段的频数相加；累计频率：每组段的累计频数除以总例数。,连续变量的频数分布图连续

11、型变量的频数分布图，以直方的面积大小表示频率的多少。等距分组以横轴表示被观察变量，纵轴表示频率密度，以各矩形（宽度为组距）的面积代表各组段的频率。,直方图,图中横轴为血清铁含量，纵轴为频率密度，直条面积等于相应组段的频率。,？,三、频数分布的两个特征,集中趋势：血清铁含量向中央部分集中，即中等含量者居多，集中在18 这个组段，这种现象为集中趋势。,离散趋势：从中央部分到两侧的频数分布逐渐减少，而且血清铁含量的值参差不齐，最低的接近6 ，最高的接近30 ，这种现象称为离散趋势。,由于同质性，所有实测值趋向同一数值的趋势称为集中趋势。,离散趋势或变异程度是指观察值之间参差不齐的程度。

12、,频数分布,四、频数分布的类型,对称分布型：指集中位置在正中，左右两侧频数分布大体对称。,偏态分布型：指集中位置偏向一侧，频数分布不对称。,偏态分布型,正偏态分布：集中位置偏向数值小的一侧。,负偏态分布：集中位置偏向数值大的一侧。,频数表的用途 1. 揭示频数分布的分布特征和分布类型。文献中常将频数表作为陈述资料的形式。 2. 便于进一步计算统计指标和进行统计分析处理。 3. 便于发现某些特大或特小的可疑值。,1 3 9 9 15 18 21 14 10 4 3 2 1,110名7岁男童身高（cm）的频数分布,第二节定量变量的特征数,总体中的某些个体总是具有某些同质性，同一地区、同一年度

13、、同一民族、同一年龄段、相同的性别与类似的健康状况，这些共同点使得该人群的血清铁含量应趋向同一数值，即集中趋势。不同总体间比较的方式之一就是对他们的集中趋势进行比较。另一方面，同一总体中的个体之间又普遍存在着各种差别，也就是说由于遗传、营养、行为、发育、心理的各种因素在个体之间都不会完全相同，即个体间存在差异，因此导致某地18-35岁健康男性居民血清铁含量不会完全相同，而是呈现或大或小的离散趋势。,平均数：描述一组同质计量资料的集中趋势；反映一组观察值的平均水平。常用的平均数有算术均数，几何均数和中位数。（一）算术均数(mean)：简称均数，总体均数用希腊字母表示，样本均数用拉丁字母表示

14、。 1. 计算方法 1）直接法：适用于样本例数n较少的资料。其中X1，X2Xn为各变量值，n为样本例数。,一、描述集中趋势的统计指标,2）加权法：适用于变量值较多的资料。 f1，f2fn分别为各组段的频数，X1，X2X0 为各组段的组中值, 组中值=(本组段下限+下组段下限)/2。,权,即频数多，权数大，作用也大，频数小，权数小，作用也小。,例2-3 测得8只正常大白鼠总酸性磷酸酶（TACP）含量（U/L）为4.20，6.43，2.08， 3.45，2.26，4.04，5.42，3.38。试求其算术均数。,求例2-2中某地120名正常成年男子的血清铁含量的均数。,120名成年男子血清铁

15、含量均数、标准差计算表（加权法）,1 3 6 8 12 20 27 12 10 8 4 1,7 27 66 104 180 340 513 378 276 200 108 29,7 9 11 13 15 17 19 21 23 25 27 29,49 243 726 1352 2700 5780 9747 7938 6348 5000 2916 841,2. 均数的两个重要特性 1). 各离均差的总和等于0。(总体中各变量值X与均数之差称为离均差) 2). 离均差的平方和小于各观察值X与任何数a之差的平方和。( ) 即设:a ，则a= d，d0,由于,3. 均数的应用但它最适用于对称分布资料，尤其是正态分布资料。因为这时均数位于分布的中心，最能反映资料的集中趋势。,（二）几何均数(geometric mean)：（几何均数也称为倍数均数，用G表示） 1. 几何均数的计算方法 1）直接法：适用于样本例数n较少的资料。将n个观察值X1，X2，X3Xn的乘积开n次方对数形式：G=lg-1(lgX1+lgX2+lgX3+lgXn)/n =lg-1(lgX/n),例2-5 7名慢性迁延性肝炎患者的HBsAg滴度资料为1：16，1：32，1：32，1：64，1：64，1：128，1：512。求其平均效价。,7份HBsAg的平均滴度为1：64,2）加权法：

展开阅读全文