阮开祥(第二章)医院卫生统计学

上传人:cl****1 文档编号:507382693 上传时间:2023-07-01 格式:DOC 页数:22 大小:165KB
返回 下载 相关 举报
阮开祥(第二章)医院卫生统计学_第1页
第1页 / 共22页
阮开祥(第二章)医院卫生统计学_第2页
第2页 / 共22页
阮开祥(第二章)医院卫生统计学_第3页
第3页 / 共22页
阮开祥(第二章)医院卫生统计学_第4页
第4页 / 共22页
阮开祥(第二章)医院卫生统计学_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《阮开祥(第二章)医院卫生统计学》由会员分享,可在线阅读,更多相关《阮开祥(第二章)医院卫生统计学(22页珍藏版)》请在金锄头文库上搜索。

1、文档供参考,可复制、编制,期待您的好评与关注! 第二章 卫生统计学第一节 概 述一、卫生统计学的内容和定义卫生统计学是把统计理论与方法应用于居民健康状况、医疗卫生工作实践和医学科学研究的一门学科。卫生统计学的主要内容包括三个方面:卫生统计学的基本原理和方法,包括研究设计和数据处理中的统计理论和方法。健康统计,包括医学人口统计、疾病统计和生长发育统计等。卫生服务统计,包括卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理等中的统计问题。卫生统计学的任务是借助统计方法,从有限的观察中,从表现为偶然的数据中,把所研究的事物或现象的本质特征、整体情况和其他事物或现象间的关系揭示出来。学习卫生统计学

2、首先要培养统计学的思维方式,训练用统计学理论解释和解决实际问题的能力,而非拘泥于统计公式的死记硬背或数学推导。二、卫生统计工作的步骤卫生统计工作包括统计设计、搜集资料、整理资料和分析资料四个基本步骤。这四个步骤是相互联系、不可分割的。 (一)设计设计是后三个步骤的依据,因此是统计工作中最关键的一步。根据设计中是否对研究对象施加处理因素,医学科研设计有调查设计和实验设计之分。调查设计一般包括专业设计和统计设计。统计设计应包括资料搜集、整理与分析全过程的统计设想和科学安排。实验设计是实验研究中极其重要的一个环节,应遵循对照、重复(即样本例数)和随机化的原则。医学实验的基本要素包括研究对象、实验因素

3、和实验效应三部分。(二)资料的搜集按设计的要求及时取得准确、完整的原始数据。医学统计资料主要来自四个方面:1统计报表 如疫情报表、医院工作报表等是根据国家规定的报告制度,由医疗卫生机构定期逐级上报。统计报表提供了较全面的居民健康状况和医疗卫生机构的主要数据,是总结、检查和制订卫生工作计划的重要依据。2报告卡(单) 如传染病和职业病发病报告卡、肿瘤发病及肿瘤死亡报告卡、出生报告单及死亡报告单等。要做到及时填卡(单),防止漏报。例如,出生后不久即死亡的新生儿,要同时填写出生报告单和死亡报告单。3日常医疗卫生工作记录 如门诊病历、住院病历、健康检查记录、卫生监测记录等。要做到登记完整、准确。4专题调

4、查或实验 一般统计报表和医院病历资料的内容都有局限性,要进一步深入分析时,常采用专题调查或实验研究。(三)资料的整理资料整理的目的是把杂乱无章的原始资料系统化、条理化,便于进标和分析。传统的资料整理的过程如下:1在资料整理之前先将收集到的数据和各种资料进行检查和核对。2设计分组,分组有两种:步计算统计指(1)质量分组:即将观察单位按其属性或类别(如性别、职业、疾病分类、婚姻状况等)归类分组。(2)数量分组:即将观察单位按数值大小(如年龄大小、血压高低等)分组。两种分组往往结合使用,一般是在质量分组基础上进行数量分组。如先按性别分组,再按身高的数值大小分组。3,按分组要求设计整理表,进行手工汇总

5、(划记法或分卡法)或用计算机汇总。现在由于计算机的普及应用,分组整理资料工作全部由数据管理软件或统计软件完成,所以要求将原始资料输入计算机,而不应先手工分组整理后再输入计算机。(四)资料的分析按设计的要求,根据研究目的和资料的类型,对整理出的基础数据作进一步的计算分析和统计处理,并用适当的统计图表表达出来,最后结合专业作出结论。 三、卫生统计中的几个基本概念l、观察单位 是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国家等。2、变异 是指客观事物的多样性和不确定性。统计学是研究变异性的科学。没有变异就没有统计学。3、变量 观察单位的某项特征,称为变量。如人的

6、性别、年龄、职业、身高等。变量的观察结果称为变量值,变量值可以是定量的,也可以是定性的。变量可分为以下类型:(1)数值变量(又称定量变量):其变量值是定量的,表现为数值的大小,通常有度量衡单位。如人的身高(cm)、体重(kg)、血压(mmHg)、肺活量(L)等皆为数值变量。(2)分类变量(又称定性变量或字符变量):其变量值是定性凶,表现为互不相容的类别或属性。根据类别之间是否有程度上的差别,又分为无序分类和有序分类变量。无序分类的各类别之间无程度上的差别,如人的性别分男与女两类,血型分A型、B型、AB型、O型;有序分类的各类别之间有程度差别,如临床上观察某药治疗某病病人的疗效,疗效结果通常分为

7、治愈、显效、好转、无效四级,有程度上的差别。(3)两者可以相互转化。四、总体与样本1总体 根据研究目的所确定的同质研究对象的全体。确切地说是性质相同的所有观察单位的某种变量值的集合。如某年研究某地10岁男童的身高发育,则研究对象为该地该年的10岁男童,观察单位是每个人,变量是身高,变量值就是身高的测量值,该地该年全部10岁男童的身高值构成一个总体,它的同质基础是同一年份、同一地区、同一年龄、同一性别。在理解这一概念时应注意总体是由研究目的确定的,不同的研究目的就会有不同的总体,构成总体的每一个观察单位具有相同的性质,这样其观察值才有统计分析的意义。2样本 从总体中随机抽取部分观察单位,其变量值

8、就构成样本,通过样本信息来推断总体特征。保证样本对总体的代表性应注意:遵循随机抽样原则;保证足够的观察单位数,即样本含量。抽取样本时必须遵循随机化原则。由样本信息推断总体特征的方法都是建立在随机抽样基础上的,如果不是随机样本,则无法利用统计分布的原理来估计误差,也就不能用样本统计量来推断总体指标了。五、概率与频率概率是事件发生的可能性大小的量度,通常以符号户表示,当某实际事件肯定发生时称为必然事件,其概率户“当某事件不可能发生时称为不可能事件,其概率Po;当某事件在一定条件下可能发生也不可能发生时称为随机事件,其概率为oPl。统计研究的是随机事件,在大量观察中找出随机事件发生规律是统计研究的目

9、的之一。 然而,在实际工作中当概率不易求得时,只要观察单位数充分多,可以将频率作为概率的估计值。值得注意的是,在观察单位数较少时,频率的波动性是很大的,用于估计概率是不可靠的。六、误差误差是指测量值与真值之差或样本指标与总体指标之差,从误差的性质来看,可以分为两大类,即随机误差和系统误差。1随机误差 包括抽样误差和随机测量误差。抽样误差是指样本统计量与总体参数之差。由于总体内各观察单位存在变异,使得样本指标一般不会刚好等于总体指标,但是当不断增加样本含量时,可以缩小抽样误差。随机测量误差是指由随机测量变异引起的误差,在对总体单位观察的过程中不可避免会产生随机测量误差,但是改善测量手段和条件,随

10、机测量误差可以控制在比较小的范围内(一般是指可以允许的范围内)。2系统误差 是指由确定的原因引起的观察值与真值之间或样本指标与总体指标之间的偏差。产生系统误差的原因很多,其中常见的是由于观察条件不同引起的偏差,如试验仪器、试剂、操作方法、疗效判断标准不同等,由此而造成的系统误差在观察过程中发生,表现为观察值偏离真值。系统误差一般发生在观察过程中,但也可以发生在统计设计和资料分析时,此时从观察单位所获得的观察值可以是正确的,误差表现为结论偏离真实情况。如调查某地青年吸烟情况,以大中专学生为观察单位,调查结果吸烟率必然比真实吸烟率为低。还有一类误差是由于过失造成的,它也具有系统误差的性质,但它是一

11、种非技术性的、责任性的错误。第二节 数值资料的统计描述一、频数分布类型频数分布就是观察值在其所取值的范围内分布的情况。从编制的频数表可以看到,频数分布的两个重要特征有集中趋势和离散趋势。数值资料常见的频数分布类型有3种: 1、正态分布型频数 分布的高峰位于中央,图形左右对称。正态分布属于此类型。2、正偏态分布型频数 分布的高峰偏左,图形左右不对称,即观察值较小的一端集中了较多的频数。3负偏态分布型频数 分布的高峰偏右,图形左右不对称,即观察值较大的一端集中了较多的频数。二、集中趋势指标集中趋势指观察值的集中位置或平均水平,是观察值的典型水平或代表值。常用的集中趋势指标有算术平均数(均数)、几何

12、均数和中位数等。计算集中趋势指标时,首先应搞清楚它们的应用条件,现把各指标的应用条件归纳如表2l。表21 各平均指标的应用条件指标适用条件计算公式算术平均数几何均数中位数常用于描述对称型分布,尤其是正态分布资料的集中趋势常用于描述对数正态分布资料和观察值呈等比数列资料的集中趋势常用于描述偏态分布资料、一端或两端无界的资料、频数分布类型不清楚的集中趋势=G=lg-1()G=lg-1()M=X 当n为奇数时M=当n为偶数时M=L+(- n)频数表公式三、离散趋势指标趋势指标有极差、标准差和变异系数等。现将离散趋势指标、计算公式及主要优缺点归纳如表22。表22 离散程度指标比较表指标计算公式主要优缺

13、点极差离均差平方和方差标准差变异系数R=Xmax-XminSS=(X-)2S2=S=CV=100%计算简单,易于理解;但只反映了一组观察值的最大值与最小值的差异,不稳定,受样本量影响很大反映了各变量值之间的变异情况,但单位是原观察值单位的平方,不易理解,同时又受观察值个数的影响,不利于比较反映了各变量值之间的变异情况,不受观察值个数的影响,但单位是原观察值单位的平方,不易理解反映了各变量值之间的变异情况,不受观察值个数的影响,单位与原观察单位相同,是最常用的离散程度指标之一,但在两组和多组资料比较时,常受到计量单位不同和均数相差很大的影响而不能比较和不便于比较反映了各变量值之间的变异情况,不受

14、观察值个数的影响,没有单位,用于比较度量衡单位不同或均数相差悬殊的多组资料的变异度。四、正态分布曲线的特征及规律正态分布曲线是一条高峰位于中央(即均数所在处),两侧逐渐下降并完全对称,两端永远不与横轴相交的钟形曲线。正态曲线的特征是整个曲线都在横轴的上方,均数处最高,以均数为中心,左右对称。正态分布曲线有两个重要参数,即总体均数和总体标准差,决定曲线的位置,决定曲线的形状。 (一)正态分布曲线下面积分布规律 1一般正态分布 范围内的面积占总面积的68.27 土1.96范围内的面积占总面积的95.00 土2.58范围内的面积占总面积的99.00 2标准正态分布(标准正态分布0,1) -l1(01

15、)之间的面积占总面积的68.27-1.961.96(01.96)之间的面积占总面积的95.00 -2.582.58(0i2.58)之间的面积占总面积的99.00 (二)正态分布的应用 l医学参考值范围 如土1.96s计算95的医学参考值范围。 2质量控制。 3正态分布是其他一些理论分布的极限形式。第三节 总体均数的估计和t检验 一、均数的抽样误差 由抽样引起的样本均数与总体均数之差,称为均数的抽样误差。均数的抽样误差大小用标准误来描述,符号为x,x/。一般不知道总体标准差口,可用样本标准差5代替,均数标准误的估计公式为勘5石。 二、t 分布 一般正态分布转化为标准正态分布就是将变量X变换为标准正态变量Z值,变换公式为z,z值的分布就是标准正态分布。 如果样本量足够大,则样本均数的分布为正态分布,可以通过标准化变换将其转化为标准正态分布,变换公式为Z=

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号