最新医学统计学精品教学汕头大学终身模块统计学概念步骤幻灯片

上传人:人*** 文档编号:570727737 上传时间:2024-08-06 格式:PPT 页数:82 大小:1.15MB
返回 下载 相关 举报
最新医学统计学精品教学汕头大学终身模块统计学概念步骤幻灯片_第1页
第1页 / 共82页
最新医学统计学精品教学汕头大学终身模块统计学概念步骤幻灯片_第2页
第2页 / 共82页
最新医学统计学精品教学汕头大学终身模块统计学概念步骤幻灯片_第3页
第3页 / 共82页
最新医学统计学精品教学汕头大学终身模块统计学概念步骤幻灯片_第4页
第4页 / 共82页
最新医学统计学精品教学汕头大学终身模块统计学概念步骤幻灯片_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《最新医学统计学精品教学汕头大学终身模块统计学概念步骤幻灯片》由会员分享,可在线阅读,更多相关《最新医学统计学精品教学汕头大学终身模块统计学概念步骤幻灯片(82页珍藏版)》请在金锄头文库上搜索。

1、医学统计学精品教学(汕头大医学统计学精品教学(汕头大学)终身模块学)终身模块- -统计学统计学- -概念概念- -步骤步骤第一节第一节绪论绪论 北京某医院某大夫使用“乌贝散” (乌贼骨(乌贼骨3钱,白芨钱,白芨3钱,川贝钱,川贝3钱钱, 甘草甘草3钱钱,共研细末过共研细末过120目筛,冲服)目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为94.4% 别的医院,其他大夫使用别的医院,其他大夫使用“乌贝散乌贝散”来治疗胃来治疗胃溃疡病出血,其有效率也一定是溃疡病出血,其有效率也一定是94.4%94.4%吗?吗?求求 置信区间置信区间现象间的关系:相关现象间的关系:相关-因果?因果?现象

2、之间的数量关系:回归现象之间的数量关系:回归 Y=-17.3618+0.2219X (直线回归方程)直线回归方程) Y: 体重(体重(g);X:大白鼠进食量(:大白鼠进食量(g)统计结论取决于:统计结论取决于:实验设计,资料搜集,数据管理实验设计,资料搜集,数据管理等等; 统计学的应用意义统计学的应用意义(Application)(Application):统计学发展迅速统计学发展迅速计算工具的进步:计算工具的进步:算盘,手摇式计算器算盘,手摇式计算器,电子计算器电子计算器,计算机的发展,计算机的发展,软件的发展;软件的发展;例如:例如:SPSS(Statistics Package for

3、Social Science)- Statistical Product and Service Solutions, SAS, Stata, PEMS(Package for Encyclopedia of Medical Statistics)二、统计学研究的对象二、统计学研究的对象objects1、有变异(、有变异(variation)的事物的事物l变异来源各种各样;变异是客观存在的;统计必变异来源各种各样;变异是客观存在的;统计必须在一定数量的观察基础上进行。须在一定数量的观察基础上进行。l随机事件(随机事件(Random event):一次试验结果不确一次试验结果不确定定,在一定数量

4、重复条件下呈现出规律性。在一定数量重复条件下呈现出规律性。l 统计研究重在:由少数推出多数;统计研究重在:由少数推出多数; 即:样本即:样本sample-总体总体population2、同质(、同质(homogeneity)的事物的事物 性质基本相同;性质基本相同;3 mules+2 donkeys=? l1、总体(、总体(population)是根据)是根据研究目的研究目的确定的、确定的、同质的全部研究对象同质的全部研究对象中所有观察单位中所有观察单位某种变量值某种变量值的集合。的集合。l同质基础:时间、空间、条件等同质基础:时间、空间、条件等l(1)有限总体)有限总体(finite pop

5、ulation)l(2)无限总体)无限总体(infinite population)三、几个基本概念三、几个基本概念basicconceptsl如研究某地如研究某地2003年健康成年男性的身高(年健康成年男性的身高(cm),),则该地则该地2003年全部健康成年男子的身高构成一个年全部健康成年男子的身高构成一个总体。总体。该总体只包括有限个观察单位,称为该总体只包括有限个观察单位,称为有限有限总体总体。l有时总体是有时总体是设想的设想的,是抽象的。,是抽象的。l例如例如研究用某药治疗冠心病患者的疗效研究用某药治疗冠心病患者的疗效。l2、样本、样本l根据随机化原则从总体中抽取的一定数量根据随机化

6、原则从总体中抽取的一定数量(sample size)的个体,称为样本(的个体,称为样本(sample)。)。l从总体中抽取部分个体的过程称为抽样从总体中抽取部分个体的过程称为抽样(sampling)。l代表性:样本能代表总体。代表性:样本能代表总体。l随机性:总体中每一个体有同等的机会被抽取。随机性:总体中每一个体有同等的机会被抽取。l可靠性:结果可重复,足够数量。可靠性:结果可重复,足够数量。l可比性:样本间比较。可比性:样本间比较。l必要性:总体的数量庞大。必要性:总体的数量庞大。l3、同质、同质l同质(同质(homogeneity)是指影响被研究指标的非)是指影响被研究指标的非实验因素相

7、同。实验因素相同。l影响被研究指标较大的、可以控制的主要因素尽影响被研究指标较大的、可以控制的主要因素尽可能相同。可能相同。l如研究儿童的身高,则要求影响身高这一指标较如研究儿童的身高,则要求影响身高这一指标较大的、易控制的因素如性别、年龄、民族、地区大的、易控制的因素如性别、年龄、民族、地区要相同,而不能控制的因素,如遗传、营养等影要相同,而不能控制的因素,如遗传、营养等影响因素可以略去。响因素可以略去。l相对的同质相对的同质l4、变异(、变异(variation, variablility )l同质基础上个体之间的差异为变异。同质基础上个体之间的差异为变异。l如同性别、同年龄、同民族、同地

8、区儿童的身高如同性别、同年龄、同民族、同地区儿童的身高有高有低,称为身高的变异。有高有低,称为身高的变异。l统计学是研究变异的科学。没有变异就不需要统统计学是研究变异的科学。没有变异就不需要统计学。计学。l规律性规律性隐藏在变异背后。隐藏在变异背后。l5、参数(、参数(parameter)和统计量(和统计量(statistic)l总体的统计指标称为参数。总体的统计指标称为参数。l总体均数(总体均数(),总体发病率,总体死亡率,等,总体发病率,总体死亡率,等,l样本的统计指标称为统计量样本的统计指标称为统计量l样本均数样本均数(x),样本发病率,样本死亡率,等,样本发病率,样本死亡率,等,l统计

9、学上用不同的符号表示他们:统计学上用不同的符号表示他们:l6、误差(、误差(error) l观察值与实际值的差异,成为误差。观察值与实际值的差异,成为误差。l分为:过失误差;系统误差;随机测量误差;分为:过失误差;系统误差;随机测量误差;随随机抽样误差机抽样误差;(1)过失误差过失误差(mistaken error):过失所致的误差:过失所致的误差(不认真,错误判断,记录等原因);(不认真,错误判断,记录等原因);(2)系统误差系统误差(systematic error):仪器未校准:仪器未校准所致的误差(统一偏高,或偏低);所致的误差(统一偏高,或偏低);l这两类误差可以避免。这两类误差可以

10、避免。(3)随机测量误差随机测量误差(random measurement error):不同不同观察者或同一观察者多次观察值的不相同。这种误差不观察者或同一观察者多次观察值的不相同。这种误差不可避免。可避免。(4)抽样误差抽样误差(sampling error):由于个体变异,抽样研由于个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),表现为本均数(或率)往往不等于总体均数(或率),表现为多次抽样的样本均数或率不同。多次抽样的样本均数或率不同。这种由抽样引起的差异这种由抽样引起的差异称为抽

11、样误差称为抽样误差。 抽样误差愈小,用样本推断总体的精确度愈高;反之,抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。抽样误差是其精确度愈低。抽样误差是不可避免不可避免的,但抽样误差有的,但抽样误差有一定的一定的规律性规律性。l7、概率(、概率(probability)几率,或然率)几率,或然率 l概率是反映某一事件发生的可能性大小的量。概率是反映某一事件发生的可能性大小的量。l用用P表示,范围在表示,范围在0与与1之间。之间。l习惯上把习惯上把P0.05或或0.01的事件称为小概率事件,的事件称为小概率事件,表示某事件发生的可能性很小。表示某事件发生的可能性很小。l“小概率事件

12、一次抽样不可能发生小概率事件一次抽样不可能发生” 小概率事件定理小概率事件定理l8、变量及变量值、变量及变量值l变量(变量(variable):观察对象的特征或指标。对变观察对象的特征或指标。对变量进行取值所采用的工具或标准成为测量尺度量进行取值所采用的工具或标准成为测量尺度(scale)。l变量值:测量的结果。变量值:测量的结果。l如健康成年男性的血压值:某人是观察单位,血如健康成年男性的血压值:某人是观察单位,血压是变量,千帕是测量尺度,千帕数值为观察值,压是变量,千帕是测量尺度,千帕数值为观察值,l定性变量:性别,职业,等定性变量:性别,职业,等l9、随机化(、随机化(randomiza

13、tion)l使总体中的每个个体有均等的机会成为样本观察使总体中的每个个体有均等的机会成为样本观察单位的过程,称为随机化。单位的过程,称为随机化。l为使样本代表总体,必须缩小抽样误差。随机抽为使样本代表总体,必须缩小抽样误差。随机抽样旨在样旨在避免人的主观性,让机遇起作用避免人的主观性,让机遇起作用,以反映,以反映总体的客观情况。总体的客观情况。l随机不是随便随机不是随便(free and easy, casual)或随意或随意 (ad libitum)。l抽签法,随机数目表法,计算器随机数法抽签法,随机数目表法,计算器随机数法单纯随机抽样(简单随机抽样)最简单、最基本的抽样方法最简单、最基本的

14、抽样方法从总体从总体N N个对象中,利用抽签或其他随机方法抽取个对象中,利用抽签或其他随机方法抽取n n个个总体中每个对象被抽到的概率相等总体中每个对象被抽到的概率相等 Simple random sampling系统抽样(机械抽样) 按按照照一一定定顺顺序序,机机械械地地每每隔隔若若干干单单位位抽抽取取一一个个单单位位的的抽样方法。抽样方法。将总体各个个体单位按某种标志排列、连续编号将总体各个个体单位按某种标志排列、连续编号根据总体数根据总体数N和确定的样本数和确定的样本数n,计算抽样距离(,计算抽样距离(N/n)用单纯随机方法在第一组中确定一个起始号用单纯随机方法在第一组中确定一个起始号从

15、从此此起起始始点点开开始始,每每隔隔K(K=N/n)个个单单位位抽抽取取一一个个作作为研究对象为研究对象 Systemic sampling系统抽样示意图系统抽样示意图分层抽样 将将总总体体单单位位按按某某种种特特征征分分为为若若干干次次级级(层层),然然后后从从每每一一层层内内单纯随机抽样组成一个样本。单纯随机抽样组成一个样本。分类按比例分配按比例分配(proportional allocation)分层随机抽样分层随机抽样 各层内抽样比例相同各层内抽样比例相同最优分配最优分配(optimum allocation) 分层随机抽样分层随机抽样 各各层层抽抽样样比比例例不不同同,内内部部变变异

16、异小小的的层层抽抽样样比比例例小小,内内部变异大的层抽样比例大部变异大的层抽样比例大 Stratified sampling整群抽样 将将总总体体分分成成若若干干群群组组,抽抽取取其其中中部部分分群群组组作作为为观观察察单位组成样本单位组成样本分类单纯整群抽样单纯整群抽样(Simple cluster sampling) 被抽到的群组中的全部个体均作为调查对象被抽到的群组中的全部个体均作为调查对象二阶段抽样二阶段抽样(Two stages sampling) 通过再次抽样后调查部分个体通过再次抽样后调查部分个体 Cluster samplingSample100SamplingParamete

17、rs Statistics Population50000With relatively same features(homogeneity) but still varied among all(variation)ObservedunitwithProbabilityRepresentative(random,size)Inference四、正确运用统计学的观点与方法四、正确运用统计学的观点与方法l1、统计学是工具:、统计学是工具:l杜绝统计无用,统计万能论点杜绝统计无用,统计万能论点。拓宽医学研究思路拓宽医学研究思路l统计学知识统计学知识-指导课题设计指导课题设计-资料分析资料分析l单因

18、素单因素-多因素多因素-探讨病因探讨病因-预后预后l单纯比较均数单纯比较均数-相关、回归相关、回归l2、科研设计科学合理,提高效率、科研设计科学合理,提高效率l运用实验设计的原则,从动物选择、分组、指标测定、运用实验设计的原则,从动物选择、分组、指标测定、结果分析等方面达到最优化。结果分析等方面达到最优化。l统计不能创造规律。只能在一定的限度内,弥补实验设统计不能创造规律。只能在一定的限度内,弥补实验设计的不足。计的不足。l3、采集准确可靠的资料,对资料合理使用、采集准确可靠的资料,对资料合理使用l尤其对多因素影响的疾病。尤其对多因素影响的疾病。l4、选择合适的统计方法进行分析,正确解释分、选

19、择合适的统计方法进行分析,正确解释分析结果。析结果。l统计结论是概率性的,在给出统计结论后,恰当统计结论是概率性的,在给出统计结论后,恰当地指出专业意义。地指出专业意义。l避免使用:避免使用:证明(或类似语气)证明(或类似语气);一般采用:;一般采用:提提示,可以认为示,可以认为等等 较为客观。较为客观。五、几点注意事项五、几点注意事项l1、着重理解医学统计学的、着重理解医学统计学的基本原理与基本概念基本原理与基本概念,掌握搜集、整理与分析资料的基本知识与技能,掌握搜集、整理与分析资料的基本知识与技能,常用统计指标与基本统计方法的正确应用常用统计指标与基本统计方法的正确应用。重视。重视原始资料

20、的完整性与可靠性,对数据的处理应持原始资料的完整性与可靠性,对数据的处理应持严肃、认真和实事求是的科学态度,严肃、认真和实事求是的科学态度,反对伪造和反对伪造和篡改统计数字篡改统计数字。l2、注意培养科学的统计思维方法。、注意培养科学的统计思维方法。l统计工作步骤间的内在联系;统计工作步骤间的内在联系;l抽样误差不可避免;抽样误差不可避免;l不能仅从数字表面大小看问题;不能仅从数字表面大小看问题;l统计结论具有概率性的思想;统计结论具有概率性的思想;l统计检验的基本思想;统计检验的基本思想;l3、必须联系实际,结合专业,才能学好和用好、必须联系实际,结合专业,才能学好和用好医学统计学。医学统计

21、学。l如:多联系医学文献和医学科研工作,评价其如:多联系医学文献和医学科研工作,评价其统计设计与分析的优缺点。统计设计与分析的优缺点。l4、对数理统计公式,要理解其意义、用途和应、对数理统计公式,要理解其意义、用途和应用条件,不必深究其数学推导。用条件,不必深究其数学推导。l统计资料的类型统计资料的类型l统计工作的基本步骤统计工作的基本步骤统计资料的收集和整理统计资料的收集和整理datacollectionandsorting一、资料的类型一、资料的类型dataclassificationl1、根据是否定量划分:、根据是否定量划分:l(1)计量资料()计量资料(measurement data

22、)l用用定量方法测量定量方法测量每个观察单位的某项指标。每个观察单位的某项指标。l一般有度量衡单位。一般有度量衡单位。l如如7岁男童的身高(岁男童的身高(cm)、体重()、体重(kg)和血压)和血压(kPa);l空气中空气中CO2浓度(浓度(mg/L);l常用:常用:平均数,标准差,平均数,标准差,t检验,方差分析,相检验,方差分析,相关与回归关与回归 等分析等分析。例例-配对配对t检验检验pairedt-testl为研究体位对高血压患者收缩为研究体位对高血压患者收缩压的影响,随机抽取了压的影响,随机抽取了10名高名高血压患者,分别在其坐位血压患者,分别在其坐位10分分钟后和卧位钟后和卧位10

23、分钟后测量其收分钟后测量其收缩压,结果见表,试问这两种缩压,结果见表,试问这两种体位对患者的收缩压是否有影体位对患者的收缩压是否有影响?响? l(2)计数资料)计数资料(enumeration data)l将观察单位按某种将观察单位按某种属性或类别分组属性或类别分组,然后清点各,然后清点各组的观察单位数,为计数资料(分类变量资料,组的观察单位数,为计数资料(分类变量资料,无序分类资料)。无序分类资料)。l如血型,按如血型,按A、B、O、AB型分组得各血型的人型分组得各血型的人数为计数资料。数为计数资料。l分属于各组的观察单位间有质的差别,不同质的分属于各组的观察单位间有质的差别,不同质的观察单

24、位不能归在同一个组内。观察单位不能归在同一个组内。l常用:常用:率、构成比、卡方检验率、构成比、卡方检验等。等。例例-行列表资料的分析(多个样本率的比较)行列表资料的分析(多个样本率的比较)l用某新药治疗不同类型关节炎的疗效,问该药用某新药治疗不同类型关节炎的疗效,问该药治疗不同类型关节炎的疗效是否有差别?治疗不同类型关节炎的疗效是否有差别?l(3)等级资料)等级资料 (ranked data) 将观察单位按某种将观察单位按某种属性的不同程度分组属性的不同程度分组,所得各,所得各组的观察单位数为等级资料,亦称有序分类资料。组的观察单位数为等级资料,亦称有序分类资料。如临床疗效按控制、显效、好转

25、和无效分组所得各如临床疗效按控制、显效、好转和无效分组所得各组人数。组人数。常用:常用:率、构成比、秩和检验率、构成比、秩和检验等。等。与计数资料不同:属性的分组有程度差别,各组大与计数资料不同:属性的分组有程度差别,各组大小顺序排列;小顺序排列;与计量资料不同:每个观察单位未确切定量,称为与计量资料不同:每个观察单位未确切定量,称为半定量资料。半定量资料。等级资料介于计量资料与计数资料之间。等级资料介于计量资料与计数资料之间。根据分析的需要,三类资料可以转化。根据分析的需要,三类资料可以转化。血红蛋白含量(计量资料);血红蛋白含量(计量资料);按正常与异常分组得到各组人数(计数资料);按正常

26、与异常分组得到各组人数(计数资料);按血红蛋白多少分五个等级:按血红蛋白多少分五个等级:16(血红蛋白增高)(血红蛋白增高)例例-等级资料的秩和检验等级资料的秩和检验l某医院用中草药治疗两种不同类型小儿肺炎的疗效,某医院用中草药治疗两种不同类型小儿肺炎的疗效,问:该药对两种类型肺炎患者的疗效是否不同。问:该药对两种类型肺炎患者的疗效是否不同。l2、根据测量的整数之间有无小数划分、根据测量的整数之间有无小数划分l(1)连续性资料()连续性资料(continuous data):l测定的整数之间有无限多位小数。测定的整数之间有无限多位小数。l体重,身高,等大多数计量资料。体重,身高,等大多数计量资

27、料。l(2)非连续性资料()非连续性资料(discrete data):l整数间无任何小数。病人数,细胞数,动物死亡整数间无任何小数。病人数,细胞数,动物死亡数,数,l不同的数据类型间可以根据需要相互转换;不同的数据类型间可以根据需要相互转换;l类型不同,统计分析方法不同。类型不同,统计分析方法不同。l二、统计工作的基本步骤二、统计工作的基本步骤l即设计即设计(design)、搜集资料、搜集资料(data collection)、整理、整理资料资料(data sorting)、分析资料、分析资料(data analysis)。是。是相互联系,不可分割的。相互联系,不可分割的。 l1、设计(、设

28、计(design):):l制定周密的医学研究计划,是关键的一步。制定周密的医学研究计划,是关键的一步。l有有调查设计调查设计和和实验设计实验设计之分。之分。(1)调查设计()调查设计(survey design)l应用人群调查的方法,发现某些特定的医学问题。应用人群调查的方法,发现某些特定的医学问题。l调查设计一般包括调查设计一般包括专业设计和统计设计专业设计和统计设计。专业设。专业设计:指调查要达到的专业目的和要求,解决专业计:指调查要达到的专业目的和要求,解决专业问题。统计设计包括资料搜集、整理与分析过程问题。统计设计包括资料搜集、整理与分析过程中的中的统计设想和科学安排统计设想和科学安排

29、。l关于搜集资料的调查计划,在整个设计中占主要关于搜集资料的调查计划,在整个设计中占主要地位,应解决的问题是:地位,应解决的问题是:lA: 明确调查目的和指标明确调查目的和指标 :l了解参数(即总体的统计指标数值),用以了解参数(即总体的统计指标数值),用以说明说明总体特征总体特征,如某地居民某病患病率、环境中某有,如某地居民某病患病率、环境中某有害物质的平均浓度;害物质的平均浓度;l研究现象间的相关联系,以研究现象间的相关联系,以探索病因探索病因,如环境污,如环境污染与健康的关系。染与健康的关系。l要把调查目的具体到指标。要把调查目的具体到指标。l癌症死亡率:年龄别,地区别,等癌症死亡率:年

30、龄别,地区别,等l指标灵敏度、特异度高。如:细胞学,指标灵敏度、特异度高。如:细胞学,x光对食光对食管癌。管癌。lB确定调查对象和观察单位确定调查对象和观察单位 :l调查对象是根据调查目的和指标确定的调查总体调查对象是根据调查目的和指标确定的调查总体的同质范围;观察单位是要调查的总体中的个体,的同质范围;观察单位是要调查的总体中的个体,可以是:一个人,一个病例,一个家庭,一个集可以是:一个人,一个病例,一个家庭,一个集体单位,人次,采样点,体单位,人次,采样点,lC调查方法调查方法 :l可分为可分为普查(普查(census)和和非全面调查非全面调查。l普查是将组成总体全部观察单位加以调查。普查

31、是将组成总体全部观察单位加以调查。l非全面调查包括非全面调查包括典型调查和抽样调查典型调查和抽样调查两种。典型两种。典型调查是有意识的选择好的、中间的或坏的典型来调查是有意识的选择好的、中间的或坏的典型来调查,一般多用于社会调查或检查卫生工作等;调查,一般多用于社会调查或检查卫生工作等;抽样调查是通过随机抽样来推测总体特征,在实抽样调查是通过随机抽样来推测总体特征,在实际工作中应用最多。际工作中应用最多。l此外:病例对照研究(此外:病例对照研究(case-control study),定,定群研究群研究(cohort study),lD调查方式调查方式 :包括直接观察、采访、填表和通:包括直接

32、观察、采访、填表和通信四种方式。信四种方式。l前两种调查资料由参加研究的人员直接记录,质前两种调查资料由参加研究的人员直接记录,质量可靠。后两种则由被调查者自己填写,误差较量可靠。后两种则由被调查者自己填写,误差较大,只有在必要时才应用。大,只有在必要时才应用。lE调查项目和调查表设计:调查项目和调查表设计:l 把调查项目列成调查表,要精简明了,必需的把调查项目列成调查表,要精简明了,必需的项目不要遗漏,无关项目不要列入表内,便于填项目不要遗漏,无关项目不要列入表内,便于填表人理解和正确填写。拟订调查表应注意以下事表人理解和正确填写。拟订调查表应注意以下事项:项:l只包括能解决调查任务所必需的

33、问题;只包括能解决调查任务所必需的问题;l只包括那些能得到答复的问题;只包括那些能得到答复的问题;l避免引起被调查者的疑虑;避免引起被调查者的疑虑;l问题答案定义要明确。问题答案定义要明确。lF样本含量的估计:样本含量的估计:l 根据研究目的要求、研究对象特点和抽样方法根据研究目的要求、研究对象特点和抽样方法决定样本大小。详细的估计,要根据预试和容许决定样本大小。详细的估计,要根据预试和容许误差通过公式计算。误差通过公式计算。l(2) 实验设计实验设计(experiment design)l实验设计是实验研究极其重要的一个环节。实验设计是实验研究极其重要的一个环节。l医学实验医学实验的基本要素

34、包括的基本要素包括处理因素处理因素、受试对象受试对象和和实验效应实验效应三部分。三部分。l如:用某种铁制剂治疗缺铁性贫血患者,观察血如:用某种铁制剂治疗缺铁性贫血患者,观察血红蛋白升高情况,该红蛋白升高情况,该铁制剂铁制剂即处理因素,缺铁性即处理因素,缺铁性贫血患者贫血患者即受试对象,即受试对象,血红蛋白血红蛋白的测量值即实验的测量值即实验效应。效应。l实验设计应遵循实验设计应遵循对照、随机、重复对照、随机、重复(即样本例数)(即样本例数)的原则的原则 。lA、对照:首要原则。、对照:首要原则。“齐同对比齐同对比”,除了要观察,除了要观察研究的因素外,实验组与对照组一切条件应尽量研究的因素外,

35、实验组与对照组一切条件应尽量相同,要有完全的可比性,才能排除其他影响因相同,要有完全的可比性,才能排除其他影响因素。素。l空白对照,试验对照,安慰剂对照,配对对照,空白对照,试验对照,安慰剂对照,配对对照,组间对照,组间对照,lB、随机化(、随机化(randomization)l如前所述。如前所述。lC、重复(、重复(replication)l实验样本必须够大,在一次试验中有充分的重复;实验样本必须够大,在一次试验中有充分的重复;l如果一批实验结果可靠,应经得起重复试验的考如果一批实验结果可靠,应经得起重复试验的考验。验。l决定(重复性)样本数的因素:处理效果;实验决定(重复性)样本数的因素:

36、处理效果;实验误差;抽样误差;资料性质;显著性检验要求的误差;抽样误差;资料性质;显著性检验要求的水平;实验结果的可能性;实验设计的类型;水平;实验结果的可能性;实验设计的类型;l动物实验:大动物:动物实验:大动物:5-15,中等动物:,中等动物:10-20,小,小动物:动物:15-30常用实验设计类型常用实验设计类型l完全随机设计完全随机设计(completely random design)l配对设计配对设计(paired design)l配伍设计配伍设计(randomized block design)l2、资料搜集(、资料搜集(datacollection)l按设计的要求及时取得准确、

37、完整的原始数据。按设计的要求及时取得准确、完整的原始数据。l(1)资料来源:资料来源:(A 统计报表统计报表 B 报告卡(单)报告卡(单) C 日常医疗卫生工作记录日常医疗卫生工作记录 D 专题调查或实验专题调查或实验 (试验)(试验))lA 统计报表统计报表l如疫情报表、医院工作报表等,这些都是根据如疫情报表、医院工作报表等,这些都是根据国家规定的报告制度,由医疗卫生机构定期逐级国家规定的报告制度,由医疗卫生机构定期逐级上报的。这些报表提供了较全面的居民健康状况上报的。这些报表提供了较全面的居民健康状况和医疗卫生机构的主要数据,是总结、检查和制和医疗卫生机构的主要数据,是总结、检查和制订卫生

38、工作计划的重要依据。订卫生工作计划的重要依据。 l对统计报表的检查:对统计报表的检查:l数字检查:纵、横的合计是否吻合。数字检查:纵、横的合计是否吻合。l专业逻辑检查:专业逻辑检查: 年龄组、性别组等。年龄组、性别组等。l确信数据的来源及正确性。应有专业人员填写。确信数据的来源及正确性。应有专业人员填写。B 报告卡(单)报告卡(单) l如传染病和职业病发病报告卡、肿瘤发病及肿瘤如传染病和职业病发病报告卡、肿瘤发病及肿瘤死亡报告卡、出生报告单及死亡报告单等。要做死亡报告卡、出生报告单及死亡报告单等。要做到及时填卡(单),防止漏报。到及时填卡(单),防止漏报。l例如,出生后不久即死亡的新生儿要同时

39、填写出例如,出生后不久即死亡的新生儿要同时填写出生报告单和死亡报告单。生报告单和死亡报告单。 l对报告卡的检查:常有漏报,重报等。对报告卡的检查:常有漏报,重报等。l报告卡上应有病例、报告人详细的联系方法,如报告卡上应有病例、报告人详细的联系方法,如电话等。电话等。C 日常医疗卫生工作记录日常医疗卫生工作记录l如门诊病历、住院病历、健康检查记录、卫生监如门诊病历、住院病历、健康检查记录、卫生监测记录等。要做到登记完整、准确。测记录等。要做到登记完整、准确。l注意事项:注意事项:l不能计算发病率,患病率;不能计算发病率,患病率;l不同医院的记录,比较时要慎重。不同医院的记录,比较时要慎重。l医院

40、病人病种的比例,不能很好代表居民中病种医院病人病种的比例,不能很好代表居民中病种比例。比例。l同科室不同时期病人病情会不同。同科室不同时期病人病情会不同。l注意标准的一致性。对病情的诊断标准,注意标准的一致性。对病情的诊断标准,.D 专题调查或实验专题调查或实验 (试验)(试验)l一般统计报表和医院病历资料的内容都有局限性,一般统计报表和医院病历资料的内容都有局限性,要做到深入分析往往感到资料不全。经常采用专要做到深入分析往往感到资料不全。经常采用专题调查或实验(试验)研究。题调查或实验(试验)研究。l这些资料的质量高,是理想的统计资料。这些资料的质量高,是理想的统计资料。(2)资料的记录资料

41、的记录 recording 和贮存和贮存 storagel调查表中项目的记录(自学)。调查表中项目的记录(自学)。(3)记录表的目视检查()记录表的目视检查(checking)(自学)(自学)l3、资料整理(、资料整理(datesorting)l资料整理的目的是把杂乱无章的原始资料系统资料整理的目的是把杂乱无章的原始资料系统化、条理化,便于进一步计算统计指标和分析。化、条理化,便于进一步计算统计指标和分析。l资料整理的过程如下:资料整理的过程如下:(1)在资料整理之前将收集到的数据和各种资料)在资料整理之前将收集到的数据和各种资料进行检查和核对。补充或剔除,进行检查和核对。补充或剔除,需要很大

42、的耐心需要很大的耐心。(2)设计分组,分组有两种:)设计分组,分组有两种:A质量分组:质量分组: 即将观察单位按其属性或类别(如即将观察单位按其属性或类别(如性别、职业、疾病分类、婚姻状况等)归类分组;性别、职业、疾病分类、婚姻状况等)归类分组;B数量分组:数量分组: 即将观察单位数值大小(如年龄大即将观察单位数值大小(如年龄大小、血压高低等)分组。小、血压高低等)分组。两种分组往往结合使用,一般是在质量分组基础上两种分组往往结合使用,一般是在质量分组基础上进行数量分组。如先按性别分组,再按身高的数进行数量分组。如先按性别分组,再按身高的数值大上分组。值大上分组。 按分组要求设计整理表,进行手

43、工汇总(划记法或按分组要求设计整理表,进行手工汇总(划记法或分卡法)或用计算机汇总。分卡法)或用计算机汇总。 l频数表的绘制频数表的绘制l频数分布表(频数分布表(frequency distribution table)l对资料中各变量值的频数汇总而成的表格对资料中各变量值的频数汇总而成的表格,用来,用来反映各变量值与其频数间的关系,可以观察该资反映各变量值与其频数间的关系,可以观察该资料的分布类型。料的分布类型。是最基础的统计描述是最基础的统计描述。l例:某市例:某市1995年年110名名7岁男童的身高岁男童的身高(cm)。)。某市某市1995年年110名名7岁男童的身高岁男童的身高(cm)

44、资料如下,)资料如下, l(1)计算极差:找出观察值中最大值与最小值,)计算极差:找出观察值中最大值与最小值,二者之差称为极差(全距二者之差称为极差(全距Range)。R 表示。表示。l本例本例134.5-110.2=24.3。l(2)决定组数()决定组数(class number)、组段、组段(class)、组距组距(class interval):l组数组数:原始数据能够被划分为不同范围的个数。:原始数据能够被划分为不同范围的个数。根据研究目的及观察例数确定。不宜过多或过少。根据研究目的及观察例数确定。不宜过多或过少。l组段组段:变量值的范围。有上限,下限。:变量值的范围。有上限,下限。l

45、组距组距:相邻两组段下限值之差称为组距,一般取:相邻两组段下限值之差称为组距,一般取等距,等距,R/组数之商。组距应便于分组。组数之商。组距应便于分组。l本例:预分为本例:预分为10组组,组距:,组距:24.3/10=2.43,取取2l所有组段自上而下、从小到大排列。第一组段包所有组段自上而下、从小到大排列。第一组段包括最小值,最后组段包括最大值。括最小值,最后组段包括最大值。某市某市1995年年110名名7岁男童的身高岁男童的身高(cm)l(3)列表划记:将原始数据用划记法(或计算)列表划记:将原始数据用划记法(或计算机)做出频数表,得出各组段的频数、频率、累机)做出频数表,得出各组段的频数

46、、频率、累计频率。计频率。l注意事项:注意事项:lA: 除最后组段除外,组段无上限。除最后组段除外,组段无上限。lB: 尽量做到等组距。特殊情况特殊对待。如年尽量做到等组距。特殊情况特殊对待。如年龄,数值差异很大;龄,数值差异很大;lC:要有频数、频率、累计频率标记。要有频数、频率、累计频率标记。某市某市1995年年110名名7岁男童的身高岁男童的身高(cm)频数表)频数表l频数表的用途:频数表的用途:(1)揭示频数的分布特征:两个重要特征:)揭示频数的分布特征:两个重要特征:l集中趋势集中趋势(central tendency):数值高低不等,但数值高低不等,但中等水平的人数最多。中等水平的

47、人数最多。l离散趋势离散趋势(tendency of dispersion):是指一组数是指一组数据背离分布中心值的特征,反映各变量值远离其据背离分布中心值的特征,反映各变量值远离其中心值的程度中心值的程度 。l频数图频数图(frequency diagram):更明显地揭示:更明显地揭示两种趋势。两种趋势。l频数高峰在中央,两边对称(或基本对称)地频数高峰在中央,两边对称(或基本对称)地逐渐减少,称为正态分布(或近似正态分布)。逐渐减少,称为正态分布(或近似正态分布)。l高峰位于左侧,正偏态分布;位于右侧,负偏高峰位于左侧,正偏态分布;位于右侧,负偏态分布。医学资料多为正偏态。态分布。医学资

48、料多为正偏态。l均数均数-中位数中位数0,正偏态;均数正偏态;均数-中位数中位数0,负偏态;负偏态; 身高身高(cm)某市某市1995年年110名名7岁男童的身高岁男童的身高分布直方图分布直方图(2)便于发现某些特大或特小的可疑值。如在频)便于发现某些特大或特小的可疑值。如在频数表的两端,出现连续几个组段的频数为数表的两端,出现连续几个组段的频数为0后,后,尚有一特大或特小值,使人怀疑是否有测定上的尚有一特大或特小值,使人怀疑是否有测定上的差错(可疑值)。差错(可疑值)。(3)样本含量足够大时,以频率作为概率的估计)样本含量足够大时,以频率作为概率的估计值。值。(4)作为陈述资料的形式。)作为

49、陈述资料的形式。某市某市1995年年110名名7岁男童的身高岁男童的身高(cm)频数表)频数表l4、资料分析(、资料分析(dataanalysis)l按设计的要求,根据研究目的和资料的类型,对按设计的要求,根据研究目的和资料的类型,对整理出的基础数据作进一步的计算分析和统计处整理出的基础数据作进一步的计算分析和统计处理,并用适当的理,并用适当的统计图、表统计图、表表达表达(presentation)出出来,最后结合专业作出结论。来,最后结合专业作出结论。l统计描述:计算统计指标,平均值,发病率统计描述:计算统计指标,平均值,发病率l统计推断:推断总体的特征统计推断:推断总体的特征谢谢谢谢结束语结束语谢谢大家聆听!谢谢大家聆听!82

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号