《医学统计学》完整课件

上传人:壹****1 文档编号:568899070 上传时间:2024-07-27 格式:PPT 页数:666 大小:10.99MB
返回 下载 相关 举报
《医学统计学》完整课件_第1页
第1页 / 共666页
《医学统计学》完整课件_第2页
第2页 / 共666页
《医学统计学》完整课件_第3页
第3页 / 共666页
《医学统计学》完整课件_第4页
第4页 / 共666页
《医学统计学》完整课件_第5页
第5页 / 共666页
点击查看更多>>
资源描述

《《医学统计学》完整课件》由会员分享,可在线阅读,更多相关《《医学统计学》完整课件(666页珍藏版)》请在金锄头文库上搜索。

1、C.CHENG结束结束返回章目录返回总目录医学本科生用医学本科生用医医 学学 统统 计计 学学主讲 程 琮泰山医学院预防医学教研室泰山医学院预防医学教研室2021/3/111第1章绪论C.CHENG结束结束返回章目录返回总目录The teaching planfor medical studentsProfessorChengCongDept. of Preventive Medicine Taishan Medical College2021/3/112第1章绪论C.CHENG结束结束返回章目录返回总目录 预防医学教授,硕士生导师。男,预防医学教授,硕士生导师。男,19591959年年6 6

2、月出生。汉族,无党派。月出生。汉族,无党派。19821982年年1212月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。月,山东医学院公共卫生专业五年本科毕业,获医学学士学位。19941994年年7 7月,上海医科大学公共卫生学院研究生毕业,获医学硕士学位。月,上海医科大学公共卫生学院研究生毕业,获医学硕士学位。20032003年年1212月晋升教授。现任预防医学教研室副主任。主要从事月晋升教授。现任预防医学教研室副主任。主要从事医学统医学统计学计学、预防医学预防医学,医学人口统计学医学人口统计学等课程的教学及科研工作,等课程的教学及科研工作,每年听课学生每年听课学生500-80050

3、0-800人。自人。自20002000年起连续六年,为硕士研究生开设年起连续六年,为硕士研究生开设医医学统计学学统计学、SPSSSPSS统计分析简明教程统计分析简明教程、卫生经济学卫生经济学等课程,同等课程,同时指导研究生的科研设计、开题报告及科研资料的统计处理与分析。发时指导研究生的科研设计、开题报告及科研资料的统计处理与分析。发表医学统计学及预防医学的科研论文表医学统计学及预防医学的科研论文3030多篇。代表作有多篇。代表作有“锌对乳癌细胞锌对乳癌细胞生长、增殖与基因表达的影响生长、增殖与基因表达的影响”,“行列相关的测度行列相关的测度” 等。主编、副等。主编、副主编各类教材及专著主编各类

4、教材及专著8 8部,代表作有部,代表作有医学统计学医学统计学、SPSSSPSS统计分析简统计分析简明教程明教程获得院级科研论文及科技进步奖获得院级科研论文及科技进步奖8 8项,院第四届教学能手比赛二项,院第四届教学能手比赛二等奖一项,院教学评建先进工作者一项。获等奖一项,院教学评建先进工作者一项。获20042004年泰山医学院首届十大年泰山医学院首届十大教学名师奖。教学名师奖。 程琮教授简介程琮教授简介2021/3/113第1章绪论C.CHENG结束结束返回章目录返回总目录医学统计学总目录医学统计学总目录q第第1章绪论章绪论q第第2章定量资料统计描述章定量资料统计描述q第第3章总体均数的区间估

5、计和假设检验章总体均数的区间估计和假设检验q第第4章方差分析章方差分析q第第5章定性资料的统计描述章定性资料的统计描述q第第6章总体率的区间估计和假设检验章总体率的区间估计和假设检验q第第7章二项分布与泊松分布章二项分布与泊松分布q第第8章秩和检验章秩和检验q第第9章直线相关与回归章直线相关与回归q第第10章实验设计章实验设计q第第11章调查设计章调查设计q第第12章统计表与统计图章统计表与统计图2021/3/114第1章绪论C.CHENG结束结束返回章目录返回总目录第第1章绪论章绪论目录目录q第五节第五节学习统计学应注意的几个问题学习统计学应注意的几个问题q第二节第二节统计工作的基本步骤统计

6、工作的基本步骤q第三节第三节统计资料的类型统计资料的类型q第四节第四节统计学中的几个基本概念统计学中的几个基本概念q 第一节第一节 医学医学统计学的定义和内容统计学的定义和内容2021/3/115第1章绪论C.CHENG结束结束返回章目录返回总目录第一章第一章 绪论绪论第一节第一节 医学统计学的定义和内容医学统计学的定义和内容 医学统计学医学统计学(medical statistics)(medical statistics) - -是以是以医学理论为指导,运用数理统计学的原理和方医学理论为指导,运用数理统计学的原理和方法研究医学资料的搜集、整理与分析,从而掌法研究医学资料的搜集、整理与分析,

7、从而掌握事物内在客观规律的一门学科。握事物内在客观规律的一门学科。 2021/3/116第1章绪论C.CHENG结束结束返回章目录返回总目录医学研究的对象医学研究的对象-主要是人以及与其健康有关的各主要是人以及与其健康有关的各种影响因素。种影响因素。医学统计学的主要内容医学统计学的主要内容 : :1 1. .统统计计设设计计 包包括括实实验验设设计计和和调调查查设设计计,它它可可以以合合理理地地、科科学学地地安安排排实实验验和和调调查查工工作作,使使之之能能较较少少地地花花费费人人力力、物力和时间,取得较满意和可靠的结果。物力和时间,取得较满意和可靠的结果。2.2.资资料料的的统统计计描描述述

8、和和总总体体指指标标的的估估计计 通通过过计计算算各各种种统统计计指指标标和和统统计计图图表表来来描描述述资资料料的的集集中中趋趋势势、离离散散趋趋势势和和分分布布特特征征况况(如如正正态态分分布布或或偏偏态态分分布布);利利用用样样本本指标来估计总体指标的大小。指标来估计总体指标的大小。 2021/3/117第1章绪论C.CHENG结束结束返回章目录返回总目录3.3.假假设设检检验验 是是通通过过统统计计检检验验方方法法(如如t t检检验验、u u检检验验、F F检检验验、卡卡方方检检验验、秩秩和和检检验验等等)来来推推断断两两组组或或多多组组统统计计指指标标的的差差异异是是抽抽样样误误差差

9、造造成成的还是有本质的差别。的还是有本质的差别。4.4.相相关关与与回回归归 医医学学中中存存在在许许多多相相互互联联系系、相相互互制制约约的的现现象象。如如儿儿童童的的身身高高与与体体重重、胸胸围围与与肺肺活活量量、血血糖糖与与尿尿糖糖等等,都都需需要要利利用用相相关关与与回回归归来分析。来分析。2021/3/118第1章绪论C.CHENG结束结束返回章目录返回总目录 5.5.多多因因素素分分析析 如如多多元元回回归归、判判别别分分析析、聚聚类类分分析析、正正交交设设计计分分析析、主主成成分分分分析析、因因子子分分析析、logisticlogistic回回归归、CoxCox比比例例风风险险回

10、回归归等等,都都是是分分析析医医学学中中多多因因素素有有效效的的方方法法(本本书书不不涉涉及及,请请参参考考有有关关统统计计书书籍籍)。这这些些方方法法计计算算复复杂杂,大大部分需借助计算机来完成。部分需借助计算机来完成。 6.6.健康统计健康统计 研究人群健康的指标与统计方法,研究人群健康的指标与统计方法,除了用上述的某些方法外,他还有其特有的方除了用上述的某些方法外,他还有其特有的方法,如寿命表、生存分析、死因分析、人口预法,如寿命表、生存分析、死因分析、人口预测等方法测等方法2021/3/119第1章绪论C.CHENG结束结束返回章目录返回总目录医学统计工作可分为四个步骤:医学统计工作可

11、分为四个步骤:统计设计、搜集资料、整理资料和分析资料。统计设计、搜集资料、整理资料和分析资料。这这四四个个步步骤骤密密切切联联系系,缺缺一一不不可可,任任何何一一个个步步骤的缺陷和失误,都会影响统计结果的正确性。骤的缺陷和失误,都会影响统计结果的正确性。第二节第二节 统计工作的基本步骤统计工作的基本步骤 2021/3/1110第1章绪论C.CHENG结束结束返回章目录返回总目录设计(设计(designdesign)是统计工作的第一步,也是关是统计工作的第一步,也是关键的一步,是对统计工作全过程的设想和计划键的一步,是对统计工作全过程的设想和计划安排。安排。 统计设计统计设计就是根据研究目的确定

12、试验因就是根据研究目的确定试验因素、受试对象和观察指标,并在现有的客观条素、受试对象和观察指标,并在现有的客观条件下决定用什么方式和方法来获取原始资料,件下决定用什么方式和方法来获取原始资料,并对原始资料如何进行整理,以及整理后的资并对原始资料如何进行整理,以及整理后的资料应该计算什么统计指标和统计分析的预期结料应该计算什么统计指标和统计分析的预期结果如何等。果如何等。 一、统计设计一、统计设计 2021/3/1111第1章绪论C.CHENG结束结束返回章目录返回总目录搜集资料搜集资料(collectionofdate)是根据设计是根据设计的要求,获取准确可靠的原始资料,是统计分的要求,获取准

13、确可靠的原始资料,是统计分析结果可靠的重要保证。析结果可靠的重要保证。医学统计资料的来源主要有以下三个方面:医学统计资料的来源主要有以下三个方面:1.统计报表统计报表统计报表是医疗卫生机构根据国家统计报表是医疗卫生机构根据国家规定的报告制度,定期逐级上报的有关报表。规定的报告制度,定期逐级上报的有关报表。如法定传染病报表、出生死亡报表、医院工作如法定传染病报表、出生死亡报表、医院工作报表等,报表要完整、准确、及时。报表等,报表要完整、准确、及时。二、搜集资料二、搜集资料2021/3/1112第1章绪论C.CHENG结束结束返回章目录返回总目录2.2.医疗卫生工作记录医疗卫生工作记录 如病历、医

14、学检查如病历、医学检查记录、卫生监测记录等。记录、卫生监测记录等。 3.3.专题调查或实验研究专题调查或实验研究 它是根据研究目它是根据研究目的选定的专题调查或实验研究,搜集资的选定的专题调查或实验研究,搜集资料有明确的目的与针对性。它是医学科料有明确的目的与针对性。它是医学科研资料的主要来源。研资料的主要来源。2021/3/1113第1章绪论C.CHENG结束结束返回章目录返回总目录整整理理资资料料(sortingdata)的的目目的的就就是是将将搜搜集集到到的的原原始始资资料料进进行行反反复复核核对对和和认认真真检检查查,纠纠正正错错误误,分分类类汇汇总总,使使其其系系统统化化、条条理理化

15、化,便便于于进进一一步步的的计计算算和和分分析析。整整理理资资料料的的过程如下:过程如下:1.审核:认真检查核对,保证资料的准确性和完整性。审核:认真检查核对,保证资料的准确性和完整性。2.分组:归纳分组,分组方法有两种:分组:归纳分组,分组方法有两种:质质量量分分组组,即即将将观观察察单单位位按按其其类类别别或或属属性性分分组组,如如按按性性别别、职业、阳性和阴性等分组。职业、阳性和阴性等分组。数数量量分分组组,即即将将观观察察单单位位按按其其数数值值的的大大小小分分组组,如如按按年年龄龄的大小、药物剂量的大小等分组。的大小、药物剂量的大小等分组。三、整理资料三、整理资料2021/3/111

16、4第1章绪论C.CHENG结束结束返回章目录返回总目录3.汇总汇总:分组后的资料要按照设计的要求进行分组后的资料要按照设计的要求进行汇总,整理成统计表。原始资料较少时用手工汇汇总,整理成统计表。原始资料较少时用手工汇总,当原始资料较多时,可使用计算机汇总。总,当原始资料较多时,可使用计算机汇总。四、分析资料四、分析资料分析资料分析资料(analysisofdata)是根据设计的是根据设计的要求,对整理后的数据进行统计学分析,结合要求,对整理后的数据进行统计学分析,结合专业知识,作出科学合理的解释。专业知识,作出科学合理的解释。2021/3/1115第1章绪论C.CHENG结束结束返回章目录返回

17、总目录1.1.统统计计描描述述(descriptive (descriptive statistics)statistics) 将将计计算算出出的的统统计计指指标标与与统统计计表表、统统计计图图相相结结合合,全全面面描描述述资料的数量特征及分布规律。资料的数量特征及分布规律。 2.2.统计推断统计推断(inferential statistics)(inferential statistics) 使使用样本信息推断总体特征。通过样本统计量进行用样本信息推断总体特征。通过样本统计量进行总体参数的估计和假设检验,以达到了解总体的总体参数的估计和假设检验,以达到了解总体的数量特征及其分布规律,才是最

18、终的研究目的。数量特征及其分布规律,才是最终的研究目的。 统计分析包括以下两大内容:统计分析包括以下两大内容: 2021/3/1116第1章绪论C.CHENG结束结束返回章目录返回总目录v医学统计资料按研究指标的性质一般分为定量资料、医学统计资料按研究指标的性质一般分为定量资料、定性资料和等级资料三大类。定性资料和等级资料三大类。一、一、定量资料定量资料v定量资料(定量资料(quantitativedata)亦称计量资料亦称计量资料(measurementdata),是用定量的方法测定观察单),是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量位(个体)某项指标数值的大小,

19、所得的资料称定量资料。如身高()、体重()、脉搏(次资料。如身高()、体重()、脉搏(次/分)、分)、血压(血压(kPa)等为数值变量,其组成的资料为定量资)等为数值变量,其组成的资料为定量资料。料。第三节第三节 统计资料的类型统计资料的类型 2021/3/1117第1章绪论C.CHENG结束结束返回章目录返回总目录v 定定性性资资料料(qualitative qualitative datadata) 亦亦称称计计数数资资料料(enumeration enumeration datadata)或或分分类类资资料料(categorical categorical datadata),是是将将观

20、观察察单单位位按按某某种种属属性性或或类类别别分分组组,清清点点各组的观察单位数,所得的资料称定性资料。各组的观察单位数,所得的资料称定性资料。v 定定性性资资料料的的观观察察指指标标为为分分类类变变量量(categorical categorical variablevariable)。如如人人的的性性别别按按男男、女女分分组组;化化验验结结果果按按阳阳性性、阴阴性性分分组组;动动物物实实验验按按生生存存、死死亡亡分分组组;调调查查某某人人群群的的血血型型按按A A、B B、O O、ABAB分分组组等等,观观察察单单位位出出现现的的结结果果为为分分类类变变量量,分分类类变变量量没没有有量量的

21、的差差别别,只只有有质质的的不同,其组成的资料为定性资料。不同,其组成的资料为定性资料。二、定性资料二、定性资料 2021/3/1118第1章绪论C.CHENG结束结束返回章目录返回总目录三、等级资料三、等级资料v等级资料(等级资料(ranked dataranked data)亦称有序分类亦称有序分类资料(资料(ordinal categorical dataordinal categorical data),是),是将观察单位按属性的等级分组,清点各组将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。的观察单位数,所得的资料为等级资料。v如治疗结果分为治愈、显效、好转

22、、无效如治疗结果分为治愈、显效、好转、无效四个等级。四个等级。 2021/3/1119第1章绪论C.CHENG结束结束返回章目录返回总目录v 根据需要,根据需要,各类变量可以互相转化各类变量可以互相转化。若。若按贫血的诊断标准将血红蛋白分为四个等按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。有时亦可将定性常,可按等级资料处理。有时亦可将定性资料或等级资料数量化,如将等级资料的资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用治疗结果赋以分值,分别用0 0、1 1、2 2等表等表示,则可按定量资料处理。

23、示,则可按定量资料处理。v 如调查某人群的尿糖的情况,以人为观如调查某人群的尿糖的情况,以人为观察单位,结果可分察单位,结果可分、五个等级。五个等级。 2021/3/1120第1章绪论C.CHENG结束结束返回章目录返回总目录同质(同质(homogeneity)是指观察单位或研究个是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相体间被研究指标的主要影响因素相同或基本相同。如研究儿童的生长发育,同性别、同年龄、同。如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。同地区、同民族、健康的儿童即为同质儿童。变异变异(variation)由于生物个体的各种指标由

24、于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。如同质的儿标存在差异,这种差异称为变异。如同质的儿童身高、体重、血压、脉搏等指标会有一定的童身高、体重、血压、脉搏等指标会有一定的差别。差别。第四节第四节 统计学中的几个基本概念统计学中的几个基本概念一、同质与变异一、同质与变异2021/3/1121第1章绪论C.CHENG结束结束返回章目录返回总目录二、总体与样本二、总体与样本样本(样本(sample):是从总体中随机抽取的部分是从总体中随机抽取的部分观察单位变量值的集合。样本的例数称为样本观察单位变量值的集合。样

25、本的例数称为样本含量含量(samplesize)。注意:注意:1。总体是相对的,总体的大小是根据研究目。总体是相对的,总体的大小是根据研究目的而确定的。的而确定的。2。样本应有代表性,即应该随机抽样并有足。样本应有代表性,即应该随机抽样并有足够的样本含量。够的样本含量。2021/3/1122第1章绪论C.CHENG结束结束返回章目录返回总目录图示:总体与样本图示:总体与样本populationpopulationsample2sample2sample1sample1sample3sample3sample4sample4sample5sample52021/3/1123第1章绪论C.CHEN

26、G结束结束返回章目录返回总目录三、参数与统计量三、参数与统计量参数(参数(parameterparameter): :由总体计算或得到的统计由总体计算或得到的统计指标称为参数。总体参数具有很重要的参考价指标称为参数。总体参数具有很重要的参考价值。如总体均数值。如总体均数,总体标准差,总体标准差等。等。统计量(统计量(statisticstatistic): :由样本计算的指标称为由样本计算的指标称为统计量。如样本均数,样本标准差统计量。如样本均数,样本标准差s s等。等。注意:注意:一般不容易得到参数,而容易获得样本一般不容易得到参数,而容易获得样本统计量。统计量。2021/3/1124第1章

27、绪论C.CHENG结束结束返回章目录返回总目录四、抽样误差四、抽样误差v抽样误差(抽样误差(sampleerror):由于随机抽样所由于随机抽样所引起的引起的样本统计量与总体参数之间的差异样本统计量与总体参数之间的差异以及以及样本统计量之间的差别称为抽样误差。如样本样本统计量之间的差别称为抽样误差。如样本均数与总体均数之间的差别,样本率与总体率均数与总体均数之间的差别,样本率与总体率的差别等。的差别等。v注意:注意:抽样误差是抽样误差是不可避免的不可避免的。无论抽样抽得。无论抽样抽得多么好,也会存在抽样误差。多么好,也会存在抽样误差。2021/3/1125第1章绪论C.CHENG结束结束返回章

28、目录返回总目录五、概率五、概率概率(概率(probability):是描述随机事件发生可能是描述随机事件发生可能性大小的量值。用英文大写字母性大小的量值。用英文大写字母P来表示。概来表示。概率的取值范围在率的取值范围在01之间。当之间。当P0时,称为不时,称为不可能事件;当可能事件;当P1时,称为必然事件。时,称为必然事件。小概率事件:小概率事件:统计学上一般把统计学上一般把P0.05或或P0.01的事件称为小概率事件。的事件称为小概率事件。小概率原理:小概率原理:小概率事件在一次试验中几乎不小概率事件在一次试验中几乎不可能发生。利用该原理可对科研资料进行假设可能发生。利用该原理可对科研资料进

29、行假设检验。检验。2021/3/1126第1章绪论C.CHENG结束结束返回章目录返回总目录第五节第五节 学习医学统计学应注意的问题学习医学统计学应注意的问题 v1.1.重点掌握医学统计学的基本知识、基本技能、重点掌握医学统计学的基本知识、基本技能、基本概念和基本方法,掌握使用范围和注意事基本概念和基本方法,掌握使用范围和注意事项。项。v2.2.要培养科学的统计思维方法,提高分析问题、要培养科学的统计思维方法,提高分析问题、解决问题的能力。解决问题的能力。 v3.3.掌握调查设计和实验设计的原则,培养搜集、掌握调查设计和实验设计的原则,培养搜集、整理、分析统计资料的系统工作能力。整理、分析统计

30、资料的系统工作能力。 2021/3/1127第1章绪论C.CHENG结束结束返回章目录返回总目录课后作业课后作业列举出计量资料、分类资料、等级资料列举出计量资料、分类资料、等级资料各各10个实例。个实例。列举出可能事件、必然事件、不可能事列举出可能事件、必然事件、不可能事件及小概率事件各件及小概率事件各10个。个。认真复习本章已学过的基本概念认真复习本章已学过的基本概念23遍。遍。2021/3/1128第1章绪论C.CHENG结束结束返回章目录返回总目录BestWishestoAllofYou!ThankYouforListening!2021/3/1129第1章绪论END返回章目录C.CHE

31、NG返回总目录共666页医学本科生用医学本科生用主讲主讲 程程 琮琮泰山医学院预防医学教研室医学统计学医学统计学2021/3/1130第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页The teaching planfor medical studentsProfessorChengCongDept. of Preventive Medicine Taishan Medical College2021/3/1131第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页第第2 2章定量资料的统计描述章定量资料的统计描述 目录目录q第二节第二节集中趋势的描

32、述集中趋势的描述q第三节第三节离散趋势的描述离散趋势的描述q第四节第四节正态分布正态分布q 第一节第一节 频数分布表频数分布表2021/3/1132第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页统计描述:统计描述:是是用统计图表、统计指标来描述资用统计图表、统计指标来描述资料的分布规律及其数量特征。料的分布规律及其数量特征。频数分布表频数分布表(frequencydistributiontable):主要由组段和频数两部分组成表格。主要由组段和频数两部分组成表格。第一节第一节频数分布表频数分布表第二章第二章 定量资料的统计描定量资料的统计描述述2021/3/1133第

33、2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页二、频数分布表的编制 编制步骤 :1. 计算全距 (range): 一组变量值最大值和最小值之差称为全距(range),亦称极差,常用R表示。 2. 确定组距(class interval): 组距用i表示; 3. 划分组段: 每个组段的起点称组下限,终点称组上限。一般分为815组。 ;4. 统计频数: 将所有变量值通过划记逐个归入相应组段 ;5.频率与累计频率: 将各组的频数除以n所得的比值被称为频率。累计频率等于累计频数除以总例数。 2021/3/1134第2章定量资料统计描述END返回章目录C.CHENG返回总目录共6

34、66页表2-2 某年某市120名12岁健康男孩身高(cm)的频数分布 身高组段 (1) 频数 (2)频率(%) (3)累计频数 (4)累 计 频 率 (%) (5)12510.83 10.8312943.33 54.17133108.34 1512.50合计120100.002021/3/1135第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页2021/3/1136第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页二、频数分布表的用途二、频数分布表的用途 1.1.揭示资料的分布类型揭示资料的分布类型 2.2.观察资料的集中趋势和离散趋势观察资料的集

35、中趋势和离散趋势 3.3.便于发现某些特大或特小的可疑值便于发现某些特大或特小的可疑值 4.4.便于进一步计算统计指标和作统计处理便于进一步计算统计指标和作统计处理 2021/3/1137第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页2021/3/1138第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页第二节第二节 集中趋势的描述集中趋势的描述 v集中趋势集中趋势 :代表一组同质变量值的集中趋势:代表一组同质变量值的集中趋势 或平均水平。或平均水平。 v常用的平均数有算术均数、几何均数和中位数。常用的平均数有算术均数、几何均数和中位数。v另外不

36、常用的有:众数,调和平均数和调整均另外不常用的有:众数,调和平均数和调整均数等。数等。2021/3/1139第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页一、算术均数一、算术均数算术均数算术均数 (arithmetic mean)(arithmetic mean): 简称均数。简称均数。适用条件:适用条件:对称分布或近似对称分布的资料。对称分布或近似对称分布的资料。 习惯上以希腊字母习惯上以希腊字母表示总体均数表示总体均数(population (population mean)mean),以英文字母表示样本均数,以英文字母表示样本均数(sample mean)(sa

37、mple mean)2021/3/1140第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页1. 1. 直接法:用于观察值个数不多时直接法:用于观察值个数不多时 计算方法计算方法2021/3/1141第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页2.2.加权法加权法(weighting method)(weighting method):用于变量值个数:用于变量值个数 较多时。较多时。 注意:权数即频数f,为权重权衡之意。2021/3/1142第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页 身高 (1) 组中值X (2)

38、 频数f (3) fX(4)=(2)(3) fX2(5)=(2)(4) 125127112716129129131452468644133135101350182250合计 120 17168 2460040 表表2-4120名名12岁健康男孩身高岁健康男孩身高(cm)均数和标准差加权法计算表均数和标准差加权法计算表2021/3/1143第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页2021/3/1144第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页120名名12岁健康男孩身高均数为岁健康男孩身高均数为143.07cm。计算结果计算结果202

39、1/3/1145第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页几何均数几何均数(geometric mean(geometric mean,简记为,简记为) ): :表示表示其平均水平。其平均水平。 适用条件:适用条件:对于变量值呈倍数关系或呈对数正对于变量值呈倍数关系或呈对数正态分布态分布( (正偏态分布正偏态分布) ),如抗体效价及抗体滴度,如抗体效价及抗体滴度,某些传染病的潜伏期,细菌计数等。某些传染病的潜伏期,细菌计数等。计算公式:计算公式:有直接法和加权法。有直接法和加权法。 二、几何均数二、几何均数 2021/3/1146第2章定量资料统计描述END返回章

40、目录C.CHENG返回总目录共666页1.1.直接法:直接法: 用于用于变量值的个数变量值的个数n n较少时较少时 2021/3/1147第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页直接法计算实例直接法计算实例2021/3/1148第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页2.2.加权法加权法 : 用于资料中相同变量值的个数用于资料中相同变量值的个数f f(即频数)较多时。(即频数)较多时。 2021/3/1149第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页 抗体滴度 (1)频数f (2)滴度倒数X (3)

41、lgX (4) flgX (5)=(2)(4) 1:4240.60201.20401:8680.90315.41861:167161.20418.4287合计 50 89.1045 表表2-550名儿童麻疹疫苗接种后血凝抑制抗体滴度几何均数计算表名儿童麻疹疫苗接种后血凝抑制抗体滴度几何均数计算表2021/3/1150第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页2021/3/1151第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页50名儿童麻疹疫苗接种后平均血凝抑制抗体滴度为1:60.55。 计算结果:将有关已知数据代入公式有2021/3/11

42、52第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页变量值中不能有变量值中不能有0 0;不能同时有正值和负值;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出若全是负值,计算时可先把负号去掉,得出结果后再加上负号。结果后再加上负号。计算几何均数注意事项:计算几何均数注意事项:2021/3/1153第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页中位数中位数v 定定义义:将将一一组组变变量量值值从从小小到到大大按按顺顺序序排排列列,位位次次居中的变量值称为中位数居中的变量值称为中位数( (medianmedian,简记为,简记为M M)

43、 )。v适适用用条条件件:变变量量值值中中出出现现个个别别特特小小或或特特大大的的数数值值;资资料料的的分分布布呈呈明明显显偏偏态态,即即大大部部分分的的变变量量值值偏偏向向一一侧侧;变变量量值值分分布布一一端端或或两两端端无无确确定定数数值值,只有小于或大于某个数值只有小于或大于某个数值;资料的分布不清。资料的分布不清。 三、中位数及百分位数三、中位数及百分位数 2021/3/1154第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页定义:定义:百分位数百分位数( (percentilepercentile) )是一种位置是一种位置指标,以指标,以P Px x表示。百分

44、位数是将频数等分表示。百分位数是将频数等分为一百的分位数。一组观察值从小到大按为一百的分位数。一组观察值从小到大按顺序排列,理论上有顺序排列,理论上有x%x%的变量值比的变量值比P Px x小,小,有有(100-(100-x x)%)%的变量值比的变量值比P Px x大。故大。故P P5050分位数分位数也就是中位数,即也就是中位数,即P P5050=M=M 。 百分位数百分位数 2021/3/1155第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页v描述一组资料在某百分位置上的水平;描述一组资料在某百分位置上的水平;v用于确定正常值范围;用于确定正常值范围;v计算四分

45、位数间距。计算四分位数间距。百分位数的应用条件:百分位数的应用条件:2021/3/1156第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页计算方法:有直接法和加权法计算方法:有直接法和加权法1.1.直接法:用于例数较少时直接法:用于例数较少时 n为奇数时 n为偶数时 2021/3/1157第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页2.2.频数表法:频数表法: 用于例数较多时用于例数较多时 中位数百分位数2021/3/1158第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页 潜伏期(小时) (1)频数f (2)累计频数

46、 (3) 累计频率() (4) 0171711.76 466343.412 3810169.9合计 145 表表2-6145例食物中毒病人潜伏期分布表例食物中毒病人潜伏期分布表2021/3/1159第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页2021/3/1160第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页1.1.先找到包含先找到包含PxPx的最小累计频率;的最小累计频率;2.2.该累计频率同行左边的组段值为该累计频率同行左边的组段值为L L;3.3.L L同行右边的频数为同行右边的频数为fx(fx(或或fm)fm);4.4.L L前一行

47、的累计频数为前一行的累计频数为fLfL;5.5.将上述已知条件代入公式计算将上述已知条件代入公式计算PxPx或或P50 P50 。计算中位数及百分位数的步骤:计算中位数及百分位数的步骤:2021/3/1161第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页计算结果:计算结果:2021/3/1162第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页定义:定义:用来说明变量值的离散程度或变异程度。用来说明变量值的离散程度或变异程度。注意:注意:仅用集中趋势尚不能完全反映一组数据的仅用集中趋势尚不能完全反映一组数据的特征。故应将集中趋势和离散趋势结合起来

48、才能特征。故应将集中趋势和离散趋势结合起来才能更好地反映一组数据的特征。更好地反映一组数据的特征。常用离散指标有:常用离散指标有:极差、四分位数间距、标准差、极差、四分位数间距、标准差、方差、变异系数。方差、变异系数。第三节第三节 离散趋势的描述离散趋势的描述 2021/3/1163第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页甲组:甲组: 184 186 188 190 192184 186 188 190 192乙组:乙组: 180 184 188 192 196180 184 188 192 196两组球员的平均身高都是两组球员的平均身高都是188188cmcm

49、,但甲组球员,但甲组球员身高比较集中,乙组球员身高比较分散。为了身高比较集中,乙组球员身高比较分散。为了说明离散趋势,就要用离散指标。说明离散趋势,就要用离散指标。 实例分析实例分析2021/3/1164第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页极差极差v 极差极差(range,(range,简记为简记为R)R)亦称全距亦称全距,即一组变,即一组变量值中最大值与最小值之差量值中最大值与最小值之差 。v特点:特点:计算简单,不稳定,不全面,易变化;计算简单,不稳定,不全面,易变化;可用于各种分布的资料。可用于各种分布的资料。一、极差和四分位数间距一、极差和四分位数间

50、距 2021/3/1165第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页四分位数间距四分位数间距 公式公式:Q= P75P25特点特点:比极差稳定,只反映中间两端值的差异。比极差稳定,只反映中间两端值的差异。计算不太方便。可用于各种分布的资料。计算不太方便。可用于各种分布的资料。2021/3/1166第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页二、方差和标准差二、方差和标准差 方差(方差(variancevariance) 总体方差总体方差 样本方差样本方差 2021/3/1167第2章定量资料统计描述END返回章目录C.CHENG返回总目

51、录共666页自由度自由度(degree of freedom)(degree of freedom)的概念的概念vn-1n-1是自由度是自由度,用希腊小写字母,用希腊小写字母表示,读作表示,读作nju:nju:。v定义:在定义:在N N维或维或N N度空间中能够自由选择的维数度空间中能够自由选择的维数或度数。或度数。v例:例:A AB BC C,共有,共有n=3n=3个元素,其中只能任选个元素,其中只能任选2 2个元素的值,故自由度个元素的值,故自由度n-1=3-1=2n-1=3-1=2。 2021/3/1168第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页方差的特点

52、方差的特点1.充分反映每个数据间的离散状况,意义深刻;充分反映每个数据间的离散状况,意义深刻;2.指标稳定,应用广泛,但计算较为复杂,不指标稳定,应用广泛,但计算较为复杂,不易理解;易理解;3.方差的单位与原数据不同,有时使用时不太方差的单位与原数据不同,有时使用时不太方便;方便;4.在方差分析中应用甚广而极为重要。在方差分析中应用甚广而极为重要。2021/3/1169第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页(二)标准差(二)标准差(standard deviation) (standard deviation) 总体标准差总体标准差 样本标准差样本标准差 20

53、21/3/1170第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页牢记:离均差平方和展开式:牢记:离均差平方和展开式: 2021/3/1171第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页标准差的特点:标准差的特点:1.意义同方差,是方差的开平方;意义同方差,是方差的开平方;2.标准差的单位与原数据相同,使用方便,标准差的单位与原数据相同,使用方便,意义深刻,应用广泛;故一般已作为医意义深刻,应用广泛;故一般已作为医学生物学领域中反映变异的标准,故称学生物学领域中反映变异的标准,故称标准差。标准差。2021/3/1172第2章定量资料统计描述E

54、ND返回章目录C.CHENG返回总目录共666页标准差的计算方法:可分为直接法和加权法。标准差的计算方法:可分为直接法和加权法。1.直接法直接法2.加权法加权法2021/3/1173第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页直接法:标准差计算实例:直接法:标准差计算实例:例例2.12例例2.2中中7名名正正常常男男子子红红细细胞胞数数(1012/L)如如下下:4.67,4.74,4.77,4.88,4.76,4.72,4.92,计计算算其标准差。其标准差。vx=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46vx2=4.672+4.

55、742+4.772+4.882+4.762+4.722+4.922=159.992021/3/1174第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页计算结果:计算结果:2021/3/1175第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页例例2.13对表对表2-4资料用加权法计算资料用加权法计算120名名12岁健岁健康男孩身高值的标准差。康男孩身高值的标准差。加权法:标准差计算实例:加权法:标准差计算实例:在表在表2-42-4中已算得中已算得fx=17168,fxfx=17168,fx2 2 =2460040, =2460040, 代入公式代入

56、公式 2021/3/1176第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页变异系数变异系数(coefficientofvariation):简记为简记为CV;特征:特征:变异系数为无量纲单位,可以比较变异系数为无量纲单位,可以比较不同单位指标间的变异度;不同单位指标间的变异度;变异系数消除变异系数消除了均数的大小对标准差的影响,所以可以比了均数的大小对标准差的影响,所以可以比较两均数相差较大时指标间的变异度。较两均数相差较大时指标间的变异度。三、变异系数三、变异系数2021/3/1177第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页例例2.1

57、4 2.14 某地某地2020岁男子岁男子160160人,身高均数为人,身高均数为166.06166.06cmcm,标准差为,标准差为4.954.95cmcm; ; 体重均数为体重均数为53.7253.72kgkg, , 标准差为标准差为4.964.96kgkg。试比较身高与体重的。试比较身高与体重的变异程度。变异程度。变异系数变异系数计算实例计算实例2021/3/1178第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页身高身高 体重变异系数变异系数计算结果计算结果2021/3/1179第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页第四节第四节

58、 正态分布正态分布一、正态分布的概念和特征一、正态分布的概念和特征v 正态分布(正态分布(normal distributionnormal distribution):):也也称高斯分布,是医学和生物学最常见的连续性称高斯分布,是医学和生物学最常见的连续性分布。如身高、体重、红细胞数、血红蛋白等。分布。如身高、体重、红细胞数、血红蛋白等。 2021/3/1180第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页图图2-1120名名12岁健康男孩身高的频数分布岁健康男孩身高的频数分布2021/3/1181第2章定量资料统计描述END返回章目录C.CHENG返回总目录共66

59、6页 正态分布的函数和图形正态分布的函数和图形正态分布的密度函数,即正态曲线的方程为:正态分布的密度函数,即正态曲线的方程为:2021/3/1182第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页图图2-2 2-2 频数分布逐渐接近正态分布示意频数分布逐渐接近正态分布示意 2021/3/1183第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页为了应用方便,常按公式(为了应用方便,常按公式(2.192.19)作变量变换)作变量变换 u u值称为标准正态变量或标准正态离差,有的值称为标准正态变量或标准正态离差,有的参考书也将参考书也将u u值称为值称

60、为z z值。值。 2021/3/1184第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页这样将正态分布变换为标准正态分布这样将正态分布变换为标准正态分布(standard normal distributionstandard normal distribution) 2021/3/1185第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页图图2-3正态分布的面积与纵高正态分布的面积与纵高2021/3/1186第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页正态分布的特征正态分布的特征 1.集中性集中性正态曲线的高峰位于正中

61、央,正态曲线的高峰位于正中央,即均数所在的位置。即均数所在的位置。2.对称性对称性正态曲线以均数为中心,左右对正态曲线以均数为中心,左右对称,称,3.正态分布有两个参数正态分布有两个参数,即均数和标准差。,即均数和标准差。4.正态曲线下面积正态曲线下面积有一定的分布规律有一定的分布规律2021/3/1187第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页图图2-4 2-4 不同标准差的正态分布示意不同标准差的正态分布示意 2021/3/1188第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页二、正态曲线下面积的分布规律二、正态曲线下面积的分布规律

62、 2021/3/1189第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页标准正态分布表(标准正态分布表(u值表)值表)v 标准正态分布曲线下的面积,由此表可查出标准正态分布曲线下的面积,由此表可查出曲线下某区间的面积。查表时应注意:曲线下某区间的面积。查表时应注意:表中曲线下面积为表中曲线下面积为-到到u u 的下侧累计面积;的下侧累计面积;当已知当已知、和、和X X时,先按公式(时,先按公式(2.192.19)求得)求得u u值,再查表;当和未知时,并且样本例数在值,再查表;当和未知时,并且样本例数在100100例以上,常用样本均数和标准差例以上,常用样本均数和标准差

63、S S分别代替分别代替和和 ,按公式(,按公式(2.192.19)求得)求得u u值;值;曲线下横轴上的总面积为曲线下横轴上的总面积为100%100%或或1 1 2021/3/1190第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页 例例2.162.16 前例前例2.12.1中,某年某市中,某年某市120120名名1212岁健康男孩身岁健康男孩身高,已知均数高,已知均数=143.07cm=143.07cm,标准差,标准差S S=5.70cm,=5.70cm,估计该地估计该地1212岁健康男孩身高在岁健康男孩身高在135cm135cm以下者占该地以下者占该地1212岁男孩

64、总数的百分数;岁男孩总数的百分数;估计身高界于估计身高界于135cm135cm150cm150cm范围内范围内1212岁男孩的比例;岁男孩的比例;分别求出均数分别求出均数11S S、均数、均数1.961.96S S、均数、均数2.582.58S S范围范围内内1212岁男孩人数占该岁男孩人数占该120120名男孩总数的实际百分数,说名男孩总数的实际百分数,说明与理论百分数是否接近。明与理论百分数是否接近。2021/3/1191第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页根据题意,按公式(根据题意,按公式(2.192.19)作)作u u变换变换 2021/3/1192

65、第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页身高范围所占面积身高范围所占面积v故估计该地故估计该地12男孩身高在男孩身高在135cm以下者约占以下者约占7.78;v身高界于身高界于135cm150cm范围内者范围内者约占约占81.10。2021/3/1193第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页三、正态分布的应用三、正态分布的应用 制定医学参考值范围制定医学参考值范围参考值范围也称为正常值范围。医学上常把绝大数正参考值范围也称为正常值范围。医学上常把绝大数正常人的某指标范围称为该指标的正常值范围。这里的常人的某指标范围称为该指标的正

66、常值范围。这里的“绝大绝大多数多数”可以是可以是90、95、99,最常用的是,最常用的是95。质量控制质量控制常以均数常以均数2S作为上、下警戒值,以均数作为上、下警戒值,以均数3S作为上、下作为上、下控制值。控制值。正态分布是很多统计方法的理论基础正态分布是很多统计方法的理论基础2021/3/1194第2章定量资料统计描述END返回章目录C.CHENG返回总目录共666页THE END THANKYOUFORLISTENING2021/3/1195第2章定量资料统计描述共666页返回目录END返回总目录C.CHENG本科生用本科生用医学统计学教案医学统计学教案主讲主讲 程程 琮琮泰山医学院预

67、防医学教研室Z2021/3/1196第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENGThe teaching planfor medical studentsProfessorChengCongDept. of Preventive Medicine Taishan Medical College2021/3/1197第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG第第3 3章总体均数的区间估计和假设检验章总体均数的区间估计和假设检验 目录目录q第五节第五节均数的均数的u检验检验q第二节第二节t分布分布q第三节第三节总体均数的

68、区间估计总体均数的区间估计q第四节第四节假设检验的意义和基本步骤假设检验的意义和基本步骤q 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误q第六节第六节均数的均数的t检验检验q第七节两个方差的齐性检验和第七节两个方差的齐性检验和t检验检验q第八节第八节型错误和型错误和型错误型错误q第九节第九节应用假设检验应注意的问题应用假设检验应注意的问题2021/3/1198第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG图示:总体与样本图示:总体与样本PopulationPopulationsample2sample2sample1sample1sample3

69、sample3sample4sample4sample5sample52021/3/1199第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG一、标准误的意义及其计算一、标准误的意义及其计算统计推断统计推断( (statisticalinference) ) :根据样本信根据样本信息来推论总体特征。息来推论总体特征。均数的抽样误差均数的抽样误差 :由抽样引起的样本均数与总体:由抽样引起的样本均数与总体均数的差异称为均数的抽样误差。均数的差异称为均数的抽样误差。 标准误标准误(standard error)(standard error):反映均数抽样误差大:反映

70、均数抽样误差大小的指标。小的指标。 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误2021/3/11100第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG已知:已知:标准误计算公式标准误计算公式未知:2021/3/11101第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG 实例:如某年某市120名12岁健康男孩,已求得 均数为143.07cm,标准差为5.70cm,按公式计算,则标准误为:2021/3/11102第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG1.表示抽样误差的大小

71、 ;2.进行总体均数的区间估计; 3.进行均数的假设检验等 。二、标准误的应用 2021/3/11103第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG正正态态变变量量X采采用用u u( (X)/)/变变换换,则则一一般般的的正正态态分分布布N N (,)(,)即即变变换换为为标标准准正正态态分分布布N N (0,1)(0,1)。又因从正态总体抽取的样本均数服从正态分布又因从正态总体抽取的样本均数服从正态分布 N N(, ),(, ),同样可作正态变量的同样可作正态变量的u u变换变换, ,即即第二节第二节 t t 分布分布 一、一、t t 分布的概念分布的概

72、念 2021/3/11104第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENGv 实际工作中由于理论的标准误往往未知,实际工作中由于理论的标准误往往未知,而用样本的标准误作为的估计值,而用样本的标准误作为的估计值, 此时就不此时就不是是u u变换而是变换而是t t变换了,即下式:变换了,即下式: 2021/3/11105第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENGt t分布于分布于19081908年由英国统计学家年由英国统计学家W.S.GossetW.S.Gosset以以“StudentStudent”笔名发笔名发表,故又称

73、表,故又称Student Student t t 分布分布(Students(Students t t-distribution)-distribution)。 2021/3/11106第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG二、二、t t分布曲线的特征分布曲线的特征 vt t分布曲线是单峰分布,以分布曲线是单峰分布,以0 0为中心,左右两侧对称,为中心,左右两侧对称,v曲线的中间比标准正态曲线(曲线的中间比标准正态曲线(u u分布曲线)低,两侧翘得分布曲线)低,两侧翘得比标准正态曲线略高。比标准正态曲线略高。vt t分布曲线随自由度分布曲线随自由度而

74、变化,当样本含量越小(严格地而变化,当样本含量越小(严格地说是自由度说是自由度 =n-1 =n-1越小),越小),t t分布与分布与u u分布差别越大;当分布差别越大;当逐渐增大时,逐渐增大时,t t分布逐渐逼近于分布逐渐逼近于u u分布,当分布,当 = =时,时,t t分分布就完全成正态分布布就完全成正态分布 。vt t分布曲线是一簇曲线,而不是一条曲线。分布曲线是一簇曲线,而不是一条曲线。vt t分布下面积分布规律:查分布下面积分布规律:查t t分布表。分布表。2021/3/11107第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENGt分布示意图分布示意图2

75、021/3/11108第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENGt t分布曲线下双侧或单侧尾部合计面积分布曲线下双侧或单侧尾部合计面积我我们们常常把把自自由由度度为为的的t t分分布布曲曲线线下下双双侧侧尾尾部部合合计计面面积积或或单单侧侧尾尾部部面面积积为为指指定定值值时时,则则横横轴轴上上相相应应的的t t界界值值记记为为t t,。如如当当 =20=20, =0.05=0.05时时,记记为为t t0.05, 0.05, 2020;当当 =22=22, =0.01=0.01时时,记记为为t t0.01, 0.01, 2222。对对于于t t, , 值值

76、,可可根根据据和和值,查附表值,查附表2 2,t t界值表。界值表。2021/3/11109第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENGvt t分分布布是是t t检检验验的的理理论论基基础础。由由公公式式(3.43.4)可可知知,t t值值与与样样本本均均数数和和总总体体均均数数之之差差成成正正比比,与与标准误成反比标准误成反比 。v在在t t分分布布中中t t值值越越大大,其其两两侧侧或或单单侧侧以以外外的的面面积积所所占占曲曲线线下下总总面面积积的的比比重重就就越越小小 ,说说明明在在抽抽样样中中获获得得此此t t值值以以及及更更大大t t值值的的机机

77、会会就越小,这种机会的大小是用概率就越小,这种机会的大小是用概率P P来表示的。来表示的。vt t值值越越大大,则则P P值值越越小小;反反之之,t t值值越越小小,P P值值越越大大。根根据据上上述述的的意意义义,在在同同一一自自由由度度下下,t t t t ,则则P P ; 反反之之,t tt t,则,则P P。2021/3/11110第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG第三节第三节 总体均数的区间估计总体均数的区间估计 参数估计参数估计: :用样本指标(统计量)估计总用样本指标(统计量)估计总体指标(参数)称为体指标(参数)称为参数估计参数估

78、计。估计总体均数的方法有两种,即:估计总体均数的方法有两种,即:点值估计点值估计(point estimation point estimation )区间估计区间估计(interval estimationinterval estimation)。)。2021/3/11111第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG一、点值估计一、点值估计 点值估计:点值估计:是直接用样本均数作为是直接用样本均数作为总体均数的估计值。总体均数的估计值。此法计算简便,但由于存在抽样误此法计算简便,但由于存在抽样误差,通过样本均数不可能准确地估差,通过样本均数不可能准确地

79、估计出总体均数大小,也无法确知总计出总体均数大小,也无法确知总体均数的可靠程度体均数的可靠程度 。2021/3/11112第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG二、区间估计二、区间估计 区区间间估估计计是是按按一一定定的的概概率率(1-1-)估估计计包包含含总总体体均均数数可可能能的的范范围围,该该范范围围亦亦称称总总体体均均数数的的可可信区间(信区间(confidence intervalconfidence interval,缩写为,缩写为CI)。)。1-1-称称为为可可信信度度,常常取取1-1-为为0.950.95和和0.990.99,即即总体

80、均数的总体均数的95%95%可信区间和可信区间和99%99%可信区间。可信区间。1-1-(如如9595)可可信信区区间间的的含含义义是是:总总体体均均数数被被包包含含在在该该区区间间内内的的可可能能性性是是1-1-,即即(9595),没有被包含的可能性为,没有被包含的可能性为,即(,即(5 5)。)。2021/3/11113第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG总体均数的可信区间的计算 1.1.未知未知且且n n较小较小( (n n100) 100100), ,可用可用u u检验。不同的统计检验方法,可得到不同的统检验。不同的统计检验方法,可得到不同

81、的统计量,如计量,如t t 值和值和u u值。值。2021/3/11124第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG4.4.确定概率确定概率P P值值 P P值是指在值是指在H H0 0所规定的总体中所规定的总体中作随机抽样,获得等于及大于(或小于)现有作随机抽样,获得等于及大于(或小于)现有统计量的概率。统计量的概率。t t t t, , ,则则P P ;t t 。 2021/3/11125第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG5.5.作出推断结论作出推断结论 当当P P时时,表表示示在在H H0 0成成立立

82、的的条条件件下下,出出现现等等于于及及大大于于现现有有统统计计量量的的概概率率是是小小概概率率,根根据据小小概概率率事事件件原原理理,现现有有样样本本信信息息不不支支持持H H0 0,因因而而拒拒绝绝H H0 0,结结论论为为按按所所取取检检验验水水准准拒拒绝绝H H0 0,接接受受H H1 1,即即差差异异有有统统计学意义,如例计学意义,如例3.3 3.3 可认为两总体脉搏均数有差别;可认为两总体脉搏均数有差别;当当P P时时,表表示示在在H H0 0成成立立的的条条件件下下,出出现现等等于于及及大大于于现现有有统统计计量量的的概概率率不不是是小小概概率率,现现有有样样本本信信息息还还不不能

83、能拒拒绝绝H H0 0,结结论论为为按按所所取取检检验验水水准准不不拒拒绝绝H H0 0,即即差差异异无无统统计计意意义义,如如例例3.3 3.3 尚尚不不能能认认为为两两总总体体脉脉搏均数有差别。搏均数有差别。2021/3/11126第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG下结论时的注意点:下结论时的注意点:P P ,拒绝,拒绝H H0 0,不能认为,不能认为H H0 0肯定不成立,因肯定不成立,因为虽然在为虽然在H H0 0成立的条件下出现等于及大于现有成立的条件下出现等于及大于现有统计量的概率虽小,但仍有可能出现;统计量的概率虽小,但仍有可能出现

84、;同理,同理,P P ,不拒绝,不拒绝H H0 0,更不能认为,更不能认为H H0 0肯定肯定成立。由此可见,假设检验的结论是成立。由此可见,假设检验的结论是具有概率具有概率性的性的,无论拒绝,无论拒绝H H0 0或不拒绝或不拒绝H H0 0,都有可能发生,都有可能发生错误,即错误,即第一类错误第一类错误或或第二类错误第二类错误 2021/3/11127第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG第五节第五节 均数的均数的u u检验检验v国外统计书籍及统计软件亦称为单样本国外统计书籍及统计软件亦称为单样本u u检验检验(one sample one sam

85、ple u u-test-test)。)。v样本均数与总体均数比较的样本均数与总体均数比较的u u检验适用于:检验适用于:v总体标准差总体标准差已知的情况;已知的情况;v样样本本含含量量较较大大时时,比比如如n n100100时时。对对于于后后者者,是是因因为为n n较较大大,也也较较大大,则则t t分分布布很很接接近近u u分分布的缘故。布的缘故。 一、样本均数与总体均数比较的一、样本均数与总体均数比较的u u检验检验2021/3/11128第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENGu u 值的计算公式为:值的计算公式为:总体标准差总体标准差已知已知时

86、,不管时,不管n n的大小。的大小。总体标准差总体标准差未知未知时,但时,但n100n100时。时。2021/3/11129第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG例例3.43.4 某托儿所三年来测得某托儿所三年来测得21212424月龄的月龄的4747名名男婴平均体重男婴平均体重11kg11kg。查得近期全国九城市城区大。查得近期全国九城市城区大量调查的同龄男婴平均体重量调查的同龄男婴平均体重11.18kg11.18kg,标准差为,标准差为1.23kg1.23kg。问问该托儿所男婴的体重发育状况与全国该托儿所男婴的体重发育状况与全国九城市的同期水平九

87、城市的同期水平有无不同有无不同?(全国九城市的调?(全国九城市的调查结果可作为总体指标)查结果可作为总体指标) 实实 例例2021/3/11130第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG(1 1)建立检验假设)建立检验假设 H H0 0: 0 0 ,即即该该托托儿儿所所男男婴婴的的体体重重发发育育状状况况与与全全国国九九城城市市的的同同期期水水平平相相同同, 0.050.05( (双侧双侧) )H H1 1: 0 0 ,即即该该托托儿儿所所男男婴婴的的体体重重发发育育状状况与全国九城市的同期水平不同。况与全国九城市的同期水平不同。(2 2)计计算算u

88、u值值 本本例例因因总总体体标标准准差差已已知知,故故可用可用u u检验。检验。本本例例n n=47, =47, 样样本本均均数数=11, =11, 总总体体均均数数=11.18,=11.18,总总体标准差体标准差=1.23, =1.23, 代入公式(代入公式(3.73.7)2021/3/11131第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG(3 3)确定)确定P P值,作出推断结论值,作出推断结论 查查u u界值界值表(附表表(附表2,2,t t界值表中为界值表中为一行),得一行),得u u0.050.05=1.96=1.96,u=1.003u=1.00

89、3 0.050.05。按。按=0.05=0.05水准,不拒绝水准,不拒绝H H0 0,差,差异无统计学意义。异无统计学意义。结论:结论:可认为该托儿所男婴的体重发育可认为该托儿所男婴的体重发育状况与全国九城市的同期水平相同。状况与全国九城市的同期水平相同。 2021/3/11132第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG二、两样本均数比较的二、两样本均数比较的u u检验检验该该检检验验也也称称为为独独立立样样本本u u检检验验(independent (independent sample sample u u-test),-test),适适用用于于两

90、两样样本本含含量量较较大大(如如n n1 15050且且n n2 25050)时,)时,u u值可按下式计算:值可按下式计算:2021/3/11133第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG 例例3.53.5 测得某地测得某地20202424岁健康女子岁健康女子100100人收缩压均数为人收缩压均数为15.27kPa15.27kPa,标准差为,标准差为1.16kPa1.16kPa;又测得该地;又测得该地20202424岁健康男子岁健康男子100100人收缩压均数为人收缩压均数为16.11kPa16.11kPa,标准差为,标准差为1.41kPa1.41k

91、Pa。问该地。问该地20202424岁健康女子和男岁健康女子和男子之间收缩压均数有无差别?子之间收缩压均数有无差别? 实实例例2021/3/11134第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG(1)1)建立检验假设建立检验假设 H H0 0:1 1 2 2 ,即该地,即该地20202424岁健康女子和岁健康女子和男子之间收缩压均数相同;男子之间收缩压均数相同; H H1 1: : 1 12 2 ,即该地,即该地20202424岁健康女子和男岁健康女子和男子之间收缩压均数不同。子之间收缩压均数不同。 0.050.05(双侧)(双侧)(2 2)计算)计算u

92、u值值 本例本例 n n1 1=100, =100, 均数均数1=15.27, 1=15.27, S S1 1=1.16=1.16 n n2 2=100, =100, 均数均数2=16.11, 2=16.11, S S2 2=1.41=1.412021/3/11135第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG(3 3)确定)确定P P值,作出推断结论值,作出推断结论 查查u u界值表界值表(附表(附表2,2,t t界值表中为界值表中为一行),得一行),得u u0.050.05=1.96=1.96,现,现u u u u0.050.05=1.96,=1.96

93、,故故PP0.050.05。按水准。按水准 =0.05 =0.05,拒绝,拒绝H H0 0,接受,接受H H1 1, ,差异有统计学意义。差异有统计学意义。结论结论:可认为该地:可认为该地20202424岁健康人的收缩压均岁健康人的收缩压均数男性高于女性。数男性高于女性。 2021/3/11136第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG第六节第六节 均数的均数的 t t 检验检验 v当样本含量较小(如当样本含量较小(如n50n50)时,)时,t t分布和分布和u u分布有较大的出入,所以小样本的样本分布有较大的出入,所以小样本的样本均数与总体均数的比较

94、以及两个样本均均数与总体均数的比较以及两个样本均数的比较要用数的比较要用t t检验。检验。vt t检验的检验的适用条件适用条件:样本来自正态总体样本来自正态总体或近似正态总体;或近似正态总体;两样本总体方差相两样本总体方差相等。等。 2021/3/11137第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG一、样本均数与总体均数比较的一、样本均数与总体均数比较的t t检验检验 亦称为亦称为单样本单样本t t检验(检验(one sample one sample t t-test-test)。即样本。即样本均数代表的未知总体均数与已知的总体均数(一般为均数代表的未

95、知总体均数与已知的总体均数(一般为理论值、标准值或经过大量观察所得的稳定值等)进理论值、标准值或经过大量观察所得的稳定值等)进行比较。这时检验统计量行比较。这时检验统计量t t值的计算在值的计算在H H0 0成立的前提条成立的前提条件下由公式(件下由公式(3.43.4)变为:)变为: 2021/3/11138第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG例例3.6 3.6 对例对例3.33.3资料进行资料进行t t检验。检验。 (1 1)建立检验假设)建立检验假设 H H0 0: 0 0 ,即即该该山山区区健健康康成成年年男男子子脉脉搏搏均均数数与与一一般健

96、康成年男子脉搏均数相同;般健康成年男子脉搏均数相同; H H1 1:0 0 ,即即该该山山区区健健康康成成年年男男子子脉脉搏搏均均数数与与一一般般健康成年男子脉搏均数不同。健康成年男子脉搏均数不同。 0.050.05(双侧)(双侧) (2 2)计计算算t t值值 本本例例n n = = 25 25 , , s s = = 6.5 6.5 , , 样样本本均均数数=74.2 ,=74.2 ,总体均数总体均数 =72 , =72 , 代入公式(代入公式(3.103.10)2021/3/11139第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG(3 3)确定)确定P

97、 P值值, , 作出推断结论作出推断结论 本本例例 =25=251=241=24,查查附附表表2 2,t t界界值值表表,得得t t0.05,240.05,24=2.064=2.064,现现t=1.692 t=1.6920.050.05。按按 =0.05=0.05的的水水准准,不不拒拒绝绝H H0 0,差差异无统计学意义。异无统计学意义。 结论:结论:即根据本资料还不能认为此山区健康成即根据本资料还不能认为此山区健康成年男子脉搏数与一般健康成年男子不同。年男子脉搏数与一般健康成年男子不同。 2021/3/11140第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHEN

98、G二、配对资料的二、配对资料的t t检验检验 医学科研中配对资料的三种主要类型:医学科研中配对资料的三种主要类型:同一批受试对象治疗前后某些生理、生化指标同一批受试对象治疗前后某些生理、生化指标的比较;的比较;同一种样品,采用两种不同的方法进行测定,同一种样品,采用两种不同的方法进行测定,来比较两种方法有无不同;来比较两种方法有无不同;配对动物试验,各对动物试验结果的比较等。配对动物试验,各对动物试验结果的比较等。配对实验设计得到的资料称为配对资料。配对实验设计得到的资料称为配对资料。 2021/3/11141第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENGv

99、 先求出各对子的差值先求出各对子的差值d d的均值的均值, , 若两种处理的效应无若两种处理的效应无差别,理论上差值差别,理论上差值d d 的总体均数应为的总体均数应为0 0。所以这类资料的比较可看作是样本均数与总体均数为所以这类资料的比较可看作是样本均数与总体均数为0 0的比较。的比较。要求差值的总体分布为正态分布。要求差值的总体分布为正态分布。v t t检验的公式为:检验的公式为:配对资料的配对资料的 t t 检验检验(paired samples t-test)(paired samples t-test)2021/3/11142第3章总体均数的区间估计和假设检验共666页返回目录END

100、返回总目录C.CHENG例例3.73.7 设有设有1212名志愿受试者服用某减肥药,服名志愿受试者服用某减肥药,服药前和服药后一个疗程各测量一次体重药前和服药后一个疗程各测量一次体重(kg)(kg),数,数据如表据如表3-43-4所示。问此减肥药是否有效?所示。问此减肥药是否有效? (1 1)建立检验假设)建立检验假设 H H0 0:d d=0, =0, 即该减肥药无效;即该减肥药无效; H H1 1:d d0 0 ,即该减肥药有效。,即该减肥药有效。 单侧单侧=0.05 =0.05 2021/3/11143第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG表表

101、3-4 3-4 某减肥药研究的体重某减肥药研究的体重( (kgkg) )观察值观察值 2021/3/11144第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG(2 2)计算)计算t t值值本例本例n n = 12, = 12, d d = -16= -16,dd2 2 = 710= 710,差值的均数差值的均数= =d /n d /n = -16/12 = -1.33(= -16/12 = -1.33(kgkg ) )2021/3/11145第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG(3 3)确确定定P P值值,作作出出

102、推推断断结结论论 自自由由度度= =n n- -1=12-1=111=12-1=11,查查附附表表2 2,t t界界值值表表,得得单单侧侧t t0.050.05, 1111=2.201,=2.201,现现t t=0.58 =0.58 0.050.05。按按=0.05=0.05水水准准,不不拒拒绝绝H H0 0, , 差异无统计学意义。差异无统计学意义。结论:结论:故尚不能认为该减肥药有减肥效果。故尚不能认为该减肥药有减肥效果。2021/3/11146第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG例例3.83.8 某单位研究饮食中缺乏维生素某单位研究饮食中缺乏

103、维生素E E与肝中维生与肝中维生素素A A含量的关系,将同种属的大白鼠按性别相同,年含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近配成龄、体重相近配成8 8对,并将每对中的两头动物随机对,并将每对中的两头动物随机分到正常饲料组和维生素分到正常饲料组和维生素E E缺乏组,然后定期将大白缺乏组,然后定期将大白鼠杀死,测得其肝中维生素鼠杀死,测得其肝中维生素A A的含量如表的含量如表3-53-5。问不同饲料组的大白鼠肝中维生素问不同饲料组的大白鼠肝中维生素A A含量有无差别?含量有无差别? (自学内容)(自学内容) 2021/3/11147第3章总体均数的区间估计和假设检验共666页返回目录

104、END返回总目录C.CHENG三、两样本均数比较的三、两样本均数比较的t t检验检验两本均数比较的两本均数比较的t t检验亦称为成组检验亦称为成组t t检验,又称为检验,又称为独立独立样本样本t t检验检验(independent samples t-testindependent samples t-test)。)。适用于比较按完全随机设计而得到的两组资料,比较适用于比较按完全随机设计而得到的两组资料,比较的目的是推断它们各自所代表的总体均数和是否相等。的目的是推断它们各自所代表的总体均数和是否相等。 2021/3/11148第3章总体均数的区间估计和假设检验共666页返回目录END返回总目

105、录C.CHENG样本估计值为样本估计值为 :总体方差已知:总体方差已知:标准误的计算公式标准误的计算公式2021/3/11149第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG若若n n1 1=n=n2 2时:时:已知已知S S1 1和和S S2 2时:时:2021/3/11150第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG例例3.93.9 测得测得1414名慢性支气管炎病人与名慢性支气管炎病人与1111名健康人的尿中名健康人的尿中1717酮类固醇(酮类固醇(mol/mol/2424h h)排出量如下,试比较两组人的尿)排

106、出量如下,试比较两组人的尿中中1717酮类固醇的排出量有无不同。酮类固醇的排出量有无不同。 原始调查数据如下:原始调查数据如下:病病 人人X X1 1:n=14; 10.05 18.75 18.99 15.94 13.96 n=14; 10.05 18.75 18.99 15.94 13.96 17.67 20.51 17.22 14.69 15.10 9.42 8.21 17.67 20.51 17.22 14.69 15.10 9.42 8.21 7.24 24.607.24 24.60健康人健康人X X2 2:n=11; 17.95 30.46 10.88 22.38 n=11; 17.

107、95 30.46 10.88 22.38 12.89 23.01 13.89 19.40 15.83 26.72 17.29 12.89 23.01 13.89 19.40 15.83 26.72 17.29 2021/3/11151第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG(1 1)建立检验假设)建立检验假设 H H0 0:1 1 2 2 ,即病人与健康人的,即病人与健康人的尿中尿中1717酮类固醇的排出量相同酮类固醇的排出量相同H H1 1: 1 1 2 2 ,即病人与健康人,即病人与健康人的尿中的尿中1717酮类固醇的排出量不同酮类固醇的排出量不同

108、 0.050.05 2021/3/11152第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG(2 2)计算)计算t t值值 本例本例n n1 1=14, =14, XX1 1=212.35, =212.35, XX1 12 2=3549.0919=3549.0919 n n2 2=11, =11, XX2 2=210.70, =210.70, XX2 22 2=4397.64 =4397.64 2021/3/11153第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG(3 3)确确定定P P值值 作作出出推推断断结结论论 =14

109、+11-2=23=14+11-2=23,查查t t界界值值表表,得得t t0.05,230.05,23=2.069,=2.069,现现t=1.8035t=1.8035P0.050.05。按按=0.05=0.05水水准准,不不拒拒绝绝H H0 0,差差异异无无统统计计学学意意义义。结结论论:尚尚不不能能认认为为慢慢性性支支气气管管炎炎病病人人与与健健康康人人的的尿尿中中1717酮类固醇的排出量不同。酮类固醇的排出量不同。2021/3/11154第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG四、两样本几何均数四、两样本几何均数t t检验检验v比较两样本几何均数的

110、目的是推断它们各自代表的总比较两样本几何均数的目的是推断它们各自代表的总体几何均数有无差异。体几何均数有无差异。v适用于:适用于:v观察值呈等比关系,如血清滴度;观察值呈等比关系,如血清滴度;v观察值呈对数正态分布,如人体血铅含量等。观察值呈对数正态分布,如人体血铅含量等。v两样本几何均数比较的两样本几何均数比较的t t检验公式与两样本均数比较的检验公式与两样本均数比较的t t检验公式相同。检验公式相同。v只需将观察只需将观察X X用用lglgX X来代替就行了来代替就行了 2021/3/11155第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG例例3.10

111、3.10 将将2020名钩端螺旋体病人的血清随机分为两组,分名钩端螺旋体病人的血清随机分为两组,分别用标准株和水生株作凝溶试验,抗体滴度的倒数(即稀别用标准株和水生株作凝溶试验,抗体滴度的倒数(即稀释度)结果如下。问两组抗体的平均效价有无差别?释度)结果如下。问两组抗体的平均效价有无差别? 标准株标准株(11(11人人) ):100 200 400 400 400 400 800 1600 1600 100 200 400 400 400 400 800 1600 1600 1600 3200 1600 3200水生株水生株(9(9人人) ): 100 100 100 200 200 200

112、200 400 1600100 100 100 200 200 200 200 400 1600将两组数据分别取对数,记为将两组数据分别取对数,记为x1,x2。x1:2.0002.3012.6022.6022.6022.6022.9033.2043.2043.2043.505x2:2.0002.0002.0002.3012.3012.3012.3012.6023.2042021/3/11156第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG一、两样本方差的齐性检验一、两样本方差的齐性检验 用较大的样本方差用较大的样本方差S S2 2比较小的样本方差比较小的样本

113、方差S S2 2 第七节第七节 两总体方差的齐性检验和两总体方差的齐性检验和t t检验检验 1 1为分子自由度,为分子自由度,2 2为分母自由度为分母自由度 2021/3/11157第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENGv注意注意:v方差齐性检验本为双侧检验,但由于方差齐性检验本为双侧检验,但由于公式(公式(3.183.18)规定以较大的方差作分子,)规定以较大的方差作分子,F F值必然大于值必然大于1 1,故附表,故附表3 3单侧单侧0.0250.025的界的界值,实对应双侧检验值,实对应双侧检验P P=0.05=0.05;v当样本含量较大时(当样

114、本含量较大时(如如n n1 1和和n n2 2均大于均大于5050),可不必作方差齐性检验。),可不必作方差齐性检验。 2021/3/11158第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG深深层层水水:n n1 1=8, =8, 样样本本均均数数=1.781(=1.781(mgmg/ /L L), ), S S1 1=1.899 =1.899 ( (mgmg/ /L L) )表表 层层 水水 :n n2 2=10,=10,样样 本本 均均 数数 =0.247(=0.247(mgmg/ /L L), ), S S2 2=0.210 =0.210 ( (mgm

115、g/ /L L) )例例3.113.11 某研究所为了了解水体中汞含量的垂直变化,对某研究所为了了解水体中汞含量的垂直变化,对某氯碱厂附近一河流的表层水和深层水作了汞含量的测定,某氯碱厂附近一河流的表层水和深层水作了汞含量的测定,结果如下。试检验两个方差是否齐性。结果如下。试检验两个方差是否齐性。2021/3/11159第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG 确确定定P P值值 作作出出推推断断结结论论 本本例例1 18-1=7 8-1=7 , 2 210-1=9 10-1=9 ,查查附附表表3 3,F F界界值值表表(方方差齐性检验用),差齐性检验

116、用), 得得 F F0.05,7,90.05,7,9=4.20, =4.20, 本本 例例 F F 80.97 80.97 F F 0.05,7,90.05,7,9=4.20; =4.20; 故故P P0.05, 0.05, 按按=0.05 =0.05 水水准准,拒绝拒绝H H0 0, , 接受接受H H1 1,结论:结论:故可认为两总体方差不齐。故可认为两总体方差不齐。2021/3/11160第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG方方差差不不齐齐时时,两两小小样样本本均均数数的的比比较较,可可选选用以下方法:用以下方法:采采用用适适当当的的变变量量

117、变变换换,使使达达到到方方差差齐齐的的要求;要求;采用秩和检验;采用秩和检验;采用近似法采用近似法tt 检验。检验。二、二、t t 检验检验2021/3/11161第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG计算统计量t 值 2021/3/11162第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG例例3.12 3.12 由由例例3.113.11已已知知表表层层水水和和深深层层水水含含汞汞量量方方差差不不齐齐,试试比比较较其其均均数有无差别?数有无差别?自学内容自学内容2021/3/11163第3章总体均数的区间估计和假设检

118、验共666页返回目录END返回总目录C.CHENG假设检验中作出的推断结论可能发生两种错误假设检验中作出的推断结论可能发生两种错误:拒绝了实际上是成立的拒绝了实际上是成立的H H0 0,这叫,这叫型错误型错误(typeerror)(typeerror)或第一类错误,也称为或第一类错误,也称为错误。错误。 不拒绝实际上是不成立的不拒绝实际上是不成立的H H0 0,这叫,这叫型错误型错误(typeerror)(typeerror)或第二类错误,也称为或第二类错误,也称为错误。错误。 第八节第八节 型错误和型错误和型错误型错误2021/3/11164第3章总体均数的区间估计和假设检验共666页返回目

119、录END返回总目录C.CHENG表表3-6 3-6 可能发生的两类错误可能发生的两类错误2021/3/11165第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG2021/3/11166第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG联系联系:一般:一般增大,则增大,则减小;减小;减小,则减小,则增增大;大;区别区别:(1)一般)一般为已知,可取单侧或双侧,如为已知,可取单侧或双侧,如0.05,或或0.01。(2)一般)一般为未知,只取单侧,如取为未知,只取单侧,如取0.1或或0.2。1(把握度把握度) 0.75。两类错误的联系

120、与区别两类错误的联系与区别2021/3/11167第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG1-称为检验效能(power of test)或把握度,其意义是两总体确有差别,按水准能发现它们有差别的能力。 与的大小应根据实际情况适当取值。 2021/3/11168第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENG1.1.资料要来自严密的抽样研究设计资料要来自严密的抽样研究设计2.2.选用假设检验的方法应符合其应用条件选用假设检验的方法应符合其应用条件 3.3.正确理解差别有无显著性的统计涵义正确理解差别有无显著性的统计涵义

121、正确理解差别有统计学意义正确理解差别有统计学意义 及临床上的差及临床上的差别的统计学意义。别的统计学意义。4.4.假设检验的推断结论不能绝对化假设检验的推断结论不能绝对化 5.5.要根据资料的性质事先确定采用双侧检验或要根据资料的性质事先确定采用双侧检验或单侧检验单侧检验 第九节第九节 应用假设检验的注意问题应用假设检验的注意问题2021/3/11169第3章总体均数的区间估计和假设检验共666页返回目录END返回总目录C.CHENGTHANKYOUFORLISTENING2021/3/11170第3章总体均数的区间估计和假设检验 共666页END返回章目录返回总目录C.CHENG医学本科生用

122、泰山医学院 预防医学教研室Email: 主 讲 程 琮医学统计学2021/3/11171第4章方差分析 共666页END返回章目录返回总目录C.CHENGTeaching Plan for Medical StudentsMedicalStatisticsProfessor Cheng CongDept.ofPreventiveMedicineTaishanMedicalCollege2021/3/11172第4章方差分析 共666页END返回章目录返回总目录C.CHENG第第4章章方差分析方差分析目录目录q 第五节第五节 多个方差的齐性检验多个方差的齐性检验q 第二节第二节 单因素方差分析单

123、因素方差分析q 第三节第三节 双因素方差分析双因素方差分析q 第四节第四节 多个样本均数间的两两比较多个样本均数间的两两比较q 第一节第一节 方差分析的基本思想方差分析的基本思想q 第六节第六节 变量变换变量变换2021/3/11173第4章方差分析 共666页END返回章目录返回总目录C.CHENG第四章 方差分析 学习要求:1。掌握方差分析的基本思想;2。掌握单因素、双因素方差分析的应用条件、意义及计 算方法;3。熟悉多个均数间两两比较的意义及方法;4。了解方差齐性检验和t检验的意义及方法;5。熟悉变量变换的意义和方法。2021/3/11174第4章方差分析 共666页END返回章目录返回

124、总目录C.CHENG第一节第一节 方差分析的基本思想方差分析的基本思想一、方差分析的用途及应用条件一、方差分析的用途及应用条件方差分析(方差分析(analysis of varianceanalysis of variance,缩写为,缩写为ANOVAANOVA)是是常常用用的的统统计计分分析析方方法法之之一一。其其应应用用广广泛泛,分分析析效效率率高高, ,节节省省样样本本含含量。量。主要用途有:主要用途有:进行两个或两个以上样本均数的比较;进行两个或两个以上样本均数的比较;可以同时分析一个、两个或多个因素对试验结果的作用和影响;可以同时分析一个、两个或多个因素对试验结果的作用和影响;分析多

125、个因素的独立作用及多个因素之间的交互作用;分析多个因素的独立作用及多个因素之间的交互作用;进行两个或多个样本的方差齐性检验等。进行两个或多个样本的方差齐性检验等。方方差差分分析析对对分分析析数数据据的的要要求求及及条条件件比比较较严严格格,即即要要求求各各样样本本为为随随机机样本,各样本来自正态总体,各样本所代表的总体方差齐性或相等。样本,各样本来自正态总体,各样本所代表的总体方差齐性或相等。2021/3/11175第4章方差分析 共666页END返回章目录返回总目录C.CHENGv 二、方差分析的基本思想二、方差分析的基本思想v 处处理理因因素素可可分分为为若若干干个个等等级级或或不不同同类

126、类型型,通通常常称称为为水水平平。在在不不同同的的水水平平下下进进行行若若干干次次试试验验并并取取得得多多个个数数据据,可可以以将将在在每每个个水水平平下下取取得得的的这这些些数数据据看看作作一一个个样样本本。若若某某个个因因素素有有四四个个水水平平,每每个个水水平平的的数数据据代代表表一一个个样样本本,则则获获得四个样本的数据。得四个样本的数据。 v设设有有k k个个相相互互独独立立的的样样本本,分分别别来来自自k k个个正正态态总总体体X X1 1,X X2 2,X Xk k,且方差相等,且方差相等,v即要求检验假设为即要求检验假设为 此假设的意义为,在某处理因素的不同水平下,各样本此假设

127、的意义为,在某处理因素的不同水平下,各样本的总体均数相等。的总体均数相等。 2021/3/11176第4章方差分析 共666页END返回章目录返回总目录C.CHENG1 1。设某因素有多个水平,即试验数据产生多个样本。由。设某因素有多个水平,即试验数据产生多个样本。由多个样本的全部数据可以计算出总变异,称为总的离均多个样本的全部数据可以计算出总变异,称为总的离均差平方和。即差平方和。即SSSS总总。2 2。数理统计证明,。数理统计证明,SSSS总总可以由几个部分构成。单因素方可以由几个部分构成。单因素方差分析中,差分析中, SSSS总总由组间变异和组内变异构成。由组间变异和组内变异构成。 SS

128、SS总总SSSS组间组间SSSS组内组内。3 3。组间变异主要受到。组间变异主要受到处理因素处理因素和和个体误差个体误差两方面影响,两方面影响,组内变异主要受组内变异主要受个体误差个体误差的影响。当的影响。当H H0 0 为真时,由于处为真时,由于处理因素不起作用,组间变异只受理因素不起作用,组间变异只受个体误差个体误差的影响。此时,的影响。此时,组间变异与组内变异相差不能太大。组间变异与组内变异相差不能太大。2021/3/11177第4章方差分析 共666页END返回章目录返回总目录C.CHENG表表4 42 PCNA2 PCNA在三种不同胃组织中的表达结果在三种不同胃组织中的表达结果标本X

129、j不同胃组织XiABC156302124637143392027Xj553221100874 (X)ni109827 ( N)均数55.3024.5612.532.37(总均值)Xj2312916273167239236( X2)2021/3/11178第4章方差分析 共666页END返回章目录返回总目录C.CHENG4 4。各种变异除以相应的自由度,称为均方,用。各种变异除以相应的自由度,称为均方,用MSMS表示,表示,也就是方差。当也就是方差。当H H0 0为真时,组间均方与组内均方相差不为真时,组间均方与组内均方相差不大,两者比值大,两者比值F F值约接近于值约接近于1 1。 即即 F

130、F组间均方组内均方组间均方组内均方1 1。5 5。当。当H H0 0不成立时,处理因素产生了作用,使得组间均方不成立时,处理因素产生了作用,使得组间均方增大,此时,增大,此时,F F1 1,当大于等于,当大于等于F F临界值时,则临界值时,则P0.05P0.05。可认为可认为H H0 0不成立,各样本均数不全相等。不成立,各样本均数不全相等。2021/3/11179第4章方差分析 共666页END返回章目录返回总目录C.CHENG三、方差分析的类型三、方差分析的类型1 1。单因素方差分析(单因素方差分析(one-way ANOVAone-way ANOVA) 也称为完全随机也称为完全随机设计设

131、计(completely random design)(completely random design)的方差分析。该设计的方差分析。该设计只能分析一个因素下多个水平对试验结果的影响。只能分析一个因素下多个水平对试验结果的影响。2 2。双因素方差分析(双因素方差分析(two-way ANOVAtwo-way ANOVA) 称为随机区组称为随机区组设计(设计(randomized block designrandomized block design)的方差分析。该设计)的方差分析。该设计可以分析两个因素。一个为处理因素,也称为列因素;可以分析两个因素。一个为处理因素,也称为列因素;一个为区组

132、因素,也称为行因素。一个为区组因素,也称为行因素。 2021/3/11180第4章方差分析 共666页END返回章目录返回总目录C.CHENG3 3。三因素方差分析三因素方差分析 也称为拉丁方设计(也称为拉丁方设计(Latin square Latin square designdesign)的方差分析。该设计特点是,可以同时分析三的方差分析。该设计特点是,可以同时分析三个因素对试验结果的作用,且三个因素之间相互独立,个因素对试验结果的作用,且三个因素之间相互独立,不能有交互作用。不能有交互作用。4 4。析析因因设设计计(factorial factorial designdesign)的的方

133、方差差分分析析 当当两两个个因因素素或或多多个个因因素素之之间间存存在在相相互互影影响响或或交交互互作作用用时时,可可用用该该设设计计来来进进行行分分析析。该该设设计计不不仅仅可可以以分分析析多多个个因因素素的的独独立立作作用用,也也可可以以分分析析多多个个因因素素间间的的交交互互作作用用,是是一一种种高高效效率的方差分析方法。率的方差分析方法。2021/3/11181第4章方差分析 共666页END返回章目录返回总目录C.CHENG5 5。正交试验设计的方差分析正交试验设计的方差分析 如果要分析的如果要分析的因素有三个或三个以上,可进行正交试验因素有三个或三个以上,可进行正交试验设计设计(o

134、rthogonal experimental orthogonal experimental designdesign)的方差分析。当分析因素较多时,的方差分析。当分析因素较多时,试验次数会急剧增加,用此设计进行分析试验次数会急剧增加,用此设计进行分析则更能体现出其优越性。该设计利用正交则更能体现出其优越性。该设计利用正交表来安排各次试验,以最少的试验次数,表来安排各次试验,以最少的试验次数,得到更多的分析结果。得到更多的分析结果。 2021/3/11182第4章方差分析 共666页END返回章目录返回总目录C.CHENG四、方差分析的基本步骤四、方差分析的基本步骤1 1。计算总变异:指所有试

135、验数据的离均差平方和。计算总变异:指所有试验数据的离均差平方和。 2 2。计算各部分变异。计算各部分变异 :单因素方差分析中,可以分出单因素方差分析中,可以分出组间变异组间变异(SS组间组间)和和组内变异组内变异(SS组内组内);双因素方差;双因素方差分析中,可以分出分析中,可以分出处理组变异处理组变异(SS处理处理),),区组变异区组变异(SS区组区组)或称为或称为配伍组变异配伍组变异(SS配伍配伍)及误差变异及误差变异(SS误差误差)。 2021/3/11183第4章方差分析 共666页END返回章目录返回总目录C.CHENG3 3。计算各部分变异的均方计算各部分变异的均方 在方差分析中,

136、方差也称在方差分析中,方差也称为均方,是各部分的离均差平方和除以其相应的自由度,为均方,是各部分的离均差平方和除以其相应的自由度,用用MSMS表示。基本公式为:表示。基本公式为:MSMSSSSS。 4 4。计算统计量。计算统计量F F值值 F F值是指两个均方之比。一般是用较值是指两个均方之比。一般是用较大的均方除以较小的均方。故大的均方除以较小的均方。故F F值一般不会小于值一般不会小于1 1。5 5。确定确定P P值,推断结论值,推断结论 根据分子根据分子1 1,分母,分母2 2,查,查F F界界值表(方差分析用),得到值表(方差分析用),得到F F值的临界值(值的临界值(critical

137、 critical valuevalue),即:如果),即:如果F FFF界值,则界值,则P P0.050.05,在,在=0.05=0.05水水准上拒绝准上拒绝H H0 0, ,接受接受H H1 1。可以认为各样本所代表的总体均数。可以认为各样本所代表的总体均数不全相等。如果想要了解哪两个样本均数之间有差异,不全相等。如果想要了解哪两个样本均数之间有差异,可以继续进行各样本均数的两两比较。可以继续进行各样本均数的两两比较。 2021/3/11184第4章方差分析 共666页END返回章目录返回总目录C.CHENG第二节第二节 单因素方差分析单因素方差分析1 1 。特特点点 单单因因素素方方差差

138、分分析析是是按按照照完完全全随随机机设设计计的的原原则则将将处处理理因因素素分分为为若若干干个个不不同同的的水水平平,每每个个水水平平代代表表一一个个样样本本,只只能能分分析析一一个个因因素素对对试试验验结结果果的的影影响响及及作作用用。其其设设计计简简单单,计计算算方方便便,应应用用广广泛泛,是是一一种种常常用用的的分分析析方方法法,但但其其效效率率相对较低。该设计中的总变异可以分出两个部分,相对较低。该设计中的总变异可以分出两个部分, 即即SSSS总总SSSS组间组间SSSS组内组内。2 2。常用符号及其意义。常用符号及其意义(1 1)Xij意意义义为为第第i组组的的第第j个个数数据据。其

139、其中中下下标标 i 表表示示列列,j 表示行。表示行。 (2 2) 意义为将第意义为将第i组的全部组的全部j个数据合计。个数据合计。2021/3/11185第4章方差分析 共666页END返回章目录返回总目录C.CHENG (3 3) 将第将第i i组的组的j j个数据合计后平方,个数据合计后平方, 再将所有各再将所有各i i组的平方值合计。组的平方值合计。 (4 4)变变异异来来源源 SSSS总总:表表示示变变异异由由处处理理因因素素及及随随机机误误差差共共同同所所致致; SSSS组组间间:表表示示变变异异来来自自处处理理因因素素的的作作用用或或影影响响;SSSS组组内内:表表示示变变异异由

140、由个个体体差差异异和和测测量量误误差差等等随机因素所致。随机因素所致。2021/3/11186第4章方差分析 共666页END返回章目录返回总目录C.CHENG计算公式计算公式2021/3/11187第4章方差分析 共666页END返回章目录返回总目录C.CHENG三。计算实例三。计算实例例例4.14.1 科科研研人人员员研研究究细细胞胞增增殖殖核核抗抗原原(PCNAPCNA)在在胃胃癌癌组组织织(A A组组),胃胃癌癌旁旁组组织织(B B组组)及及正正常常胃胃粘粘膜膜组组织织(C C组组)中的表达状况。检测结果用表达指数来表示。中的表达状况。检测结果用表达指数来表示。数数据据见见表表4 42

141、 2。试试分分析析PCNAPCNA在在三三种种胃胃组组织织中中的的表表达达有有无无差差异。异。2021/3/11188第4章方差分析 共666页END返回章目录返回总目录C.CHENG表表4 42 PCNA2 PCNA在三种不同胃组织中的表达结果在三种不同胃组织中的表达结果标本Xj不同胃组织XiABC156302124637143392027Xj553221100874 (X)ni109827 ( N)均数55.3024.5612.532.37(总均值)Xj2312916273167239236( X2)2021/3/11189第4章方差分析 共666页END返回章目录返回总目录C.CHENG

142、检验步骤及方法检验步骤及方法建立检验假设建立检验假设H H0 0:PCNAPCNA在三种组织中的表达指数相同,在三种组织中的表达指数相同,1 12 23 3;H H1 1:PCNAPCNA在三种组织中的表达指数不全相同。在三种组织中的表达指数不全相同。0.05,0.05,计算检验统计量计算检验统计量F F值值 由表由表4-24-2的数据计算有:的数据计算有: 校正系数校正系数 C C(X X)2 2N N(874874)2 2272728291.7028291.70 SSSS总总X X2 2C C39236-28291.70=10944.339236-28291.70=10944.3总总N N

143、1=27-1=261=27-1=262021/3/11190第4章方差分析 共666页END返回章目录返回总目录C.CHENG组间组间k k-1=3-1=2-1=3-1=2SSSS组内组内SSSS总总SSSS组间组间10944.3-8965.98=1978.3210944.3-8965.98=1978.322021/3/11191第4章方差分析 共666页END返回章目录返回总目录C.CHENG(3) (3) 列方差分析表列方差分析表 见表见表4-34-3。(4(4)确确定定P P值值 根根据据0.050.05,1 1组组间间2 2,2 2组组内内2424,查查附附表表4 4,F F界界值值表

144、表,得得F F界界值值: F F0.01(2,24)0.01(2,24)=5.61=5.61。本例本例F F54.3954.39,大于界值,大于界值F F0.01(2,24)0.01(2,24)=5.61=5.61,则,则P P0.010.01。(5 5)推推断断结结论论 由由于于P P0.010.01,在在0.050.05水水准准上上拒拒绝绝H H0 0,接接受受H H1 1,差差异异有有统统计计学学意意义义。可可以以认认为为PCNAPCNA在在三三种种不不同同胃组织中的表达指数不全相同。胃组织中的表达指数不全相同。该该结结论论的的意意义义为为,至至少少有有两两种种组组织织的的PCNAPCN

145、A表表达达指指数数不不同同。如如果果想想确确切切了了解解哪哪两两个个组组织织的的PCNAPCNA表表达达指指数数有有差差异异,可可进一步作多个样本均数的两两比较。进一步作多个样本均数的两两比较。2021/3/11192第4章方差分析 共666页END返回章目录返回总目录C.CHENG表表43方差分析表方差分析表变异来源SS自由度均方F值F0.05F0.01P值(1)(2)(3)(4)(5)(6)(7)(8)SS总10944.3026SS组间8965.9824482.9954.393.405.610.01SS组内1978.322482.432021/3/11193第4章方差分析 共666页END

146、返回章目录返回总目录C.CHENG第三节第三节 双因素方差分析双因素方差分析一、特点及意义一、特点及意义1.1.特特点点 按按照照随随机机区区组组设设计计的的原原则则来来分分析析两两个个因因素素对对试试验验结结果果的的影影响响及及作作用用。其其中中一一个个因因素素称称为为处处理理因因素素,一一般般作作为为列列因因素素;另另一一个个因因素素称称为为区区组组因因素素或或配配伍伍组组因因素素,一一般般作作为为行行因因素素。两两个个因因素素相相互互独独立立,且且无无交交互互影影响响。双双因因素素方方差差分分析析使使用用的的样样本本例例数数较较少少,分分析析效效率率高高,是是一种经常使用的分析方法。一种

147、经常使用的分析方法。但但双双因因素素方方差差分分析析的的设设计计对对选选择择受受试试对对象象及及试试验验条条件件等等方方面面要要求求较较为为严严格格,应应用用该该设设计计方方法法时时要要十十分分注注意意。该该设设计方法中,总变异可以分出三个部分:计方法中,总变异可以分出三个部分:SSSS总总SSSS处理处理SSSS区组区组SSSS误差误差2021/3/11194第4章方差分析 共666页END返回章目录返回总目录C.CHENG2.常用符号及其意义: 将第i个处理组的j个数据合计后平方,再将所 有i个处理组的平方值合计。: 将第j个区组的i个数据合计后平方,再将所有j 个区组的平方值合计。 各种

148、变异来源 SS总:总变异, 由处理因素、区组因素及随机误差的综合作用而形成。 SS处理:各处理组之间的变异,可由处理因素的作用所致。 SS区组或SS配伍:各区组之间的变异,可由区组因素的作用所致。 SS误差:从总变异中去除SS处理及SS区组后剩余的变异。此变异由个体差异和测量误差等随机因素所致。2021/3/11195第4章方差分析 共666页END返回章目录返回总目录C.CHENG计算公式2021/3/11196第4章方差分析 共666页END返回章目录返回总目录C.CHENG三、计算实例三、计算实例例例4.2 4.2 某医院研究五种消毒液对四种细菌某医院研究五种消毒液对四种细菌的抑制效果。

149、抑制效果用抑菌圈直径的抑制效果。抑制效果用抑菌圈直径(mmmm)表示。数据见表)表示。数据见表4-54-5。试分析五种消。试分析五种消毒液对细菌有无抑制作用,对四种细菌的毒液对细菌有无抑制作用,对四种细菌的抑制效果有无差异。抑制效果有无差异。 2021/3/11197第4章方差分析 共666页END返回章目录返回总目录C.CHENG表表45消毒液对不同细菌的抑制效果消毒液对不同细菌的抑制效果 2021/3/11198第4章方差分析 共666页END返回章目录返回总目录C.CHENG检验步骤及方法检验步骤及方法(1 1)建立检验假设)建立检验假设1)1)对处理因素作用的检验假设对处理因素作用的检

150、验假设 H H0 0:五五种种消消毒毒液液的的消消毒毒效效果果相相同同,1 12 23 34 45 5;H H1 1:五种消毒液的消毒效果不全相同。:五种消毒液的消毒效果不全相同。 0.050.052)2)对区组因素作用的检验假设对区组因素作用的检验假设H H0 0:四种细菌的抑菌圈直径相同,:四种细菌的抑菌圈直径相同,1 12 23 34 4;H H1 1:四种细菌的抑菌圈直径不全相同。:四种细菌的抑菌圈直径不全相同。 0.050.052021/3/11199第4章方差分析 共666页END返回章目录返回总目录C.CHENG(2 2)计算统计量)计算统计量F F值值 由表由表4 45 5数据

151、计算,有:数据计算,有:校正系数校正系数 C=C=( (XX) )2 2/N/N=(348)=(348)2 2/20=6055.2/20=6055.2SSSS总总X X2 2C C671667166055.26055.2660.8660.8总总N N1 120201 11919处理处理k k1 15 51 14 42021/3/11200第4章方差分析 共666页END返回章目录返回总目录C.CHENG区组区组b b1 14 41 13 3SSSS误差误差SSSS总总SSSS处理处理SSSS区组区组 660.8660.8 31.3 31.3 566 =63.5566 =63.5误差误差( (k

152、-1)k-1)( (b-1b-1) )(5 51 1)()(4 41 1)12122021/3/11201第4章方差分析 共666页END返回章目录返回总目录C.CHENG误差误差总总处理处理区组区组(4 41 1)()(5 51 1)1212MSMS处理处理SSSS处理处理 处理处理 (31.331.3)4 47.8257.825 MSMS区组区组SSSS区组区组 区组区组(566566)3 3188.667188.667MSMS误差误差SSSS误差误差 误差误差(63.563.5)12125.2925.292F F处理处理MSMS处理处理MSMS误差误差 7.8257.8255.292=1

153、.47965.292=1.4796F F区组区组MSMS区组区组MSMS误差误差 188.667188.6675.292=35.655.292=35.652021/3/11202第4章方差分析 共666页END返回章目录返回总目录C.CHENG表表4-6双因素方差分析表双因素方差分析表2021/3/11203第4章方差分析 共666页END返回章目录返回总目录C.CHENG4 4)确确定定P P值值 根根据据 0.050.05, 1 1处处理理4 4, 2 2误误差差1212,查查附附表表4 4,F F界界值值表表,得得F F0.05(4,12)0.05(4,12) 3.26 3.26 ,F

154、F0.01(4,12)0.01(4,12) 5.41 5.41 ,再再由由 1 1区区组组3 3, 2 2误误差差1212,查查F F界界值值表表,得得F F0.05(3,12)0.05(3,12) 3.49 3.49 ,F F0.01(3,12)0.01(3,12) 5.95 5.95 。本例。本例F F处理处理35.65, 35.65, P P0.010.05P0.05,在在0.050.05水水准准上上不不拒拒绝绝H H0 0,差差异异无统计学意义。可以认为五种消毒液之间的消毒效果相同。无统计学意义。可以认为五种消毒液之间的消毒效果相同。 区区组组间间P P0.050.05,在在0.050

155、.05水水准准上上拒拒绝绝H H0 0,接接受受H H1 1,差差异异无无统统计计学学意意义义。可可认认为为不不同同细细菌菌的的抑抑菌菌圈圈直直径径不不全全相相同同,即消毒液对不同细菌类型的抑菌效果不全相同。即消毒液对不同细菌类型的抑菌效果不全相同。2021/3/11204第4章方差分析 共666页END返回章目录返回总目录C.CHENG第四节第四节 多个样本均数间的两两比较多个样本均数间的两两比较一、均数两两比较的特点和意义一、均数两两比较的特点和意义 1 1。当分析结果为当分析结果为P P,拒绝,拒绝H H0 0时,得出的结论只是指各总体均数不时,得出的结论只是指各总体均数不全相等。如果想

156、要确切了解哪两个样本均数之间的差异有统计学意全相等。如果想要确切了解哪两个样本均数之间的差异有统计学意义(总体均数不等),哪两个样本均数之间的差异无统计学意义义(总体均数不等),哪两个样本均数之间的差异无统计学意义(总体均数相等),可以进行多个样本均数的两两比较。(总体均数相等),可以进行多个样本均数的两两比较。2 2。当有三个及三个以上样本均数比较时,如果仍使用一般的当有三个及三个以上样本均数比较时,如果仍使用一般的t t检验检验对样本均数两两组合后进行比较,会使检验水平对样本均数两两组合后进行比较,会使检验水平值增大,即增大值增大,即增大第一类错误的概率,这样,就可能把本来无差别的两个总体

157、均数判第一类错误的概率,这样,就可能把本来无差别的两个总体均数判为有差别。例如,有为有差别。例如,有4 4个样本均数进行两两比较,如用一般的个样本均数进行两两比较,如用一般的t t检验,检验,则可以比较则可以比较 2021/3/11205第4章方差分析 共666页END返回章目录返回总目录C.CHENG例如,有例如,有4 4个样本均数进行两两比较,如用一般的个样本均数进行两两比较,如用一般的t t检验,检验,则可以比较则可以比较 6 6次,即可有次,即可有6 6个对比组。若每次比较的检验水准个对比组。若每次比较的检验水准0.050.05,则每次比较不犯第一类错误的概率为(,则每次比较不犯第一类

158、错误的概率为(1 10.050.05)=0.95=0.95。那么根据概率的乘法法则,比较。那么根据概率的乘法法则,比较6 6次均不次均不犯第一类错误的概率为(犯第一类错误的概率为(1-0.051-0.05)6 60.73510.7351。此时,总。此时,总的显著性水平变为:的显著性水平变为:1 10.73510.73510.26490.2649。此值已远。此值已远远大于规定的检验性水平远大于规定的检验性水平0.050.05。 2021/3/11206第4章方差分析 共666页END返回章目录返回总目录C.CHENG二、二、SNKSNKq q 检验法检验法(一)特点及意义(一)特点及意义SNKS

159、NKq q检检验验法法,全全称称为为Student-Newman-Keuls Student-Newman-Keuls q q检检验验法法,也也简简称称为为SNKSNK法法。这这是是国国内内外外常常用用而而较较为为经经典典的的检检验验方方法法。可可以以对对所所有有对对照照组组及及处处理理组组的的样样本本均均数数进进行行两两两两比比较较。式式中中:q q 为为检检验验统统计计量量, 及及 为为任任意意比比较较的的两样本均数,两样本均数, 为两样本均数差值的标准误。为两样本均数差值的标准误。 2021/3/11207第4章方差分析 共666页END返回章目录返回总目录C.CHENG 当两样本当两样

160、本n n相等时相等时自由度自由度误差误差 当两样本当两样本n n不相等时不相等时上式中上式中MSMS误差误差在单因素在单因素方差分析中即为方差分析中即为MSMS组内组内。 2021/3/11208第4章方差分析 共666页END返回章目录返回总目录C.CHENG(三)计算步骤及方法(三)计算步骤及方法1.1.首先将多个样本均数由大到小顺序排列。首先将多个样本均数由大到小顺序排列。2.2.按按照照两两均均数数组组合合原原则则,计计算算出出每每两两个个样样本本均均数数比比较较的的统统计量计量q q 值。值。3.3.根据误差的自由度和两样本间隔组数根据误差的自由度和两样本间隔组数a a,查,查q q

161、界值表得界值表得q q界值。界值。注意:组数注意:组数a a的计算方法的计算方法:由于各样本均数已由大:由于各样本均数已由大到小顺序排列,因此,相邻两样本均数比较时,组数到小顺序排列,因此,相邻两样本均数比较时,组数a a=2=2,中间间隔一个样本均数时,组数,中间间隔一个样本均数时,组数a a=3=3,间隔两个样本均,间隔两个样本均数时,组数数时,组数a a=4=4,余类推。,余类推。 2021/3/11209第4章方差分析 共666页END返回章目录返回总目录C.CHENG(四)计算实例(四)计算实例例例4.3 4.3 仍仍以以例例4.14.1为为计计算算实实例例说说明明计计算算方方法法。

162、例例4.14.1的的数数据据经经单单因因素素方方差差分分析析,P P0.010.01,拒拒绝绝H H0 0,接接受受H H1 1。可可以以认认为为三三种种胃胃组组织织的的PCNAPCNA表表达达指指数数不不全全相相等等。进进一一步步作作样样本均数的两两比较。本均数的两两比较。(1 1)建立检验假设)建立检验假设H H0 0:任意两样本的总体均数相等,:任意两样本的总体均数相等, A A B BH H1 1:任意两样本的总体均数不相等,:任意两样本的总体均数不相等, A A B B 0.050.05(2 2)计算统计量)计算统计量q q值值1 1)将三个样本均数由大到小顺序排列,见表)将三个样本

163、均数由大到小顺序排列,见表4-74-7。2021/3/11210第4章方差分析 共666页END返回章目录返回总目录C.CHENG表表4-7 4-7 三个样本均数顺序排列结果三个样本均数顺序排列结果 顺序顺序1 12 23 3均数均数55.3055.3024.5624.5612.5012.50组别组别A AB BC C2021/3/11211第4章方差分析 共666页END返回章目录返回总目录C.CHENG表表4-8 4-8 样本均数两两比较样本均数两两比较q q检验表检验表 比较组比较组A与与B两均数两均数之差之差组数组数a标准误标准误q值值q0.05q0.01P值值(1)(2)(3)(4)

164、(5)(6)(7)(8)1与与230.7422.9510.422.923.960.011与与342.8033.0514.033.534.540.012与与312.0623.123.872.923.960.052021/3/11212第4章方差分析 共666页END返回章目录返回总目录C.CHENG推断结论推断结论在在=0.05水准上水准上拒绝拒绝H H0 0,接受,接受H H1 1,各样本均数,各样本均数的两两比较的差异均有统计学意义。可以认为,胃癌组织,的两两比较的差异均有统计学意义。可以认为,胃癌组织,胃癌旁组织及正常胃粘膜组织的胃癌旁组织及正常胃粘膜组织的PCNA表达指数各不相同。表达指

165、数各不相同。计计算算统统计计量量q q值值。应应用用第第(2 2)栏栏数数据据除除以以第第(4 4)栏栏数数据即得据即得q q值。例如,值。例如,1 1与与2 2组比较有:组比较有:2021/3/11213第4章方差分析 共666页END返回章目录返回总目录C.CHENG(一)特点及意义(一)特点及意义 LSDLSD英英文文全全称称为为least-significant-differenceleast-significant-difference,译译为为最最小小显显著著差差异异法法或或最最小小有有意意义义差差异异法法,也也可可简简称称为为LSDLSD法法。LSDLSD法法实实际际上上是是一一

166、种种t t检检验验法法,但但它它与与以以前前描描述述的的一一般般t t检检验验法法有有所所不不同同。两两种种t t检检验验法法的的主主要要区区别别在在于于计计算算标标准准误误中中的的合合并并方方差及自由度的不同。差及自由度的不同。LSDLSD法法在在计计算算标标准准误误时时,用用MSMS组组内内或或MSMS误误差差取取代代一一般般 t t 检检验验标标准准误误中中的的 ,自自由由度度则则用用MSMS误误差差的的自自由由度度误误差差N NK K或或误误差差(k-k-1 1)( (b-b-1)1)取取代代一一般般t t检检验验法法中中的的自自由由度度 n n1 1+ +n n2 22 2。根根据据

167、及及 ,查查一一般般的的t t值值表表得得t t界界值值,与与LSDLSD计计算算的的统统计计量量t t值值的的大大小小进进行行比比较较,并并确确定定P P值值。据据此此作作出出判判断断和结论。和结论。三、三、LSDLSDt t检验法检验法2021/3/11214第4章方差分析 共666页END返回章目录返回总目录C.CHENG(二)计算公式(二)计算公式 自由度自由度误差误差 2021/3/11215第4章方差分析 共666页END返回章目录返回总目录C.CHENG(三)计算步骤及方法(三)计算步骤及方法LSDLSDt t检检验验法法在在查查t t值值表表确确定定t t界界值值时时,不不需需

168、要要组组数数a a,故故各各样样本本均均数数也也不不需需要要按按大大小小顺顺序序排排列列。各各样样本本均均数数两两两两比比较较时时,仍仍需需要要进进行行组组合合。组组合合计计算算公公式式及及方方法法与与q q检检验验法相同。其它计算步骤与一般法相同。其它计算步骤与一般t t检验法相同。检验法相同。2021/3/11216第4章方差分析 共666页END返回章目录返回总目录C.CHENG(四)计算实例例4.4 仍用例4.1为计算实例,说明LSD法的计算过程。(1)建立检验假设H0: 任意两样本的总体均数相等,ABH1: 任意两样本的总体均数不相等,AB双侧0.05(2)计算统计量t值列出样本均数

169、两两比较t检验表,见表4-9。2021/3/11217第4章方差分析 共666页END返回章目录返回总目录C.CHENG表表4-9 4-9 样本均数两两比较样本均数两两比较t t检验表检验表比较组比较组A A与与B B两均数两均数之差之差标准误标准误 t t值值t t 0.050.05t t 0.010.01P P值值(1)(1)(2)(2)(3)(3)(4)(4)(5)(5)(6)(6)(7)(7)1 1与与2 230.7430.744.174.177.377.372.0642.0642.7972.7970.010.011 1与与3 342.8042.804.314.319.939.932.

170、0642.0642.7972.7970.010.012 2与与3 312.0612.064.414.412.732.732.0642.0642.7972.7970.050.052021/3/11218第4章方差分析 共666页END返回章目录返回总目录C.CHENG(2 2)计算标准误和)计算标准误和t t值;值;(3)(3)推断结论推断结论 在在=0.05=0.05水准上拒绝水准上拒绝H H0 0,接受,接受H H1 1,各样本,各样本均数的两两比较的差异均有统计学意义。此结论与均数的两两比较的差异均有统计学意义。此结论与q q检验检验法的结论完全相同。法的结论完全相同。 2021/3/11

171、219第4章方差分析 共666页END返回章目录返回总目录C.CHENG(一)特点及意义(一)特点及意义在进行科研时,经常需要设立一个对照组和若干个实验组在进行科研时,经常需要设立一个对照组和若干个实验组或处理组。按照研究目的和设计要求,有时只需要将各或处理组。按照研究目的和设计要求,有时只需要将各个处理组的试验结果与一个对照组进行比较,而各处理个处理组的试验结果与一个对照组进行比较,而各处理组之间并不需要比较。此时,仍可应用前述组之间并不需要比较。此时,仍可应用前述SNKq检验检验法或法或LSDt检验法处理资料。因为前两种检验方法均包检验法处理资料。因为前两种检验方法均包括所有各组之间的比较

172、。但处理此类资料也有非常常用括所有各组之间的比较。但处理此类资料也有非常常用而经典的方法,称为而经典的方法,称为Dunnettt检验法。该法在大型统检验法。该法在大型统计软件中的应用非常广泛。计软件中的应用非常广泛。四、多个处理组与一个对照组均数间的两两比较四、多个处理组与一个对照组均数间的两两比较2021/3/11220第4章方差分析 共666页END返回章目录返回总目录C.CHENG(二)计算公式(二)计算公式Dunnett-Dunnett-t t检验计算公式为:检验计算公式为: 当比较组两样本含当比较组两样本含量量n ni i相等时相等时 当比较组两样本含量当比较组两样本含量n ni i

173、不相等时不相等时 2021/3/11221第4章方差分析 共666页END返回章目录返回总目录C.CHENG(四)计算实例(四)计算实例例例4.5 4.5 以例以例4.24.2为计算实例,说明该方法的计算过程。为计算实例,说明该方法的计算过程。 顺序1234均数2617.214.611.80组别葡萄球菌痢疾杆菌大肠杆菌绿脓杆菌表4-10 各组均数排列顺序 2021/3/11222第4章方差分析 共666页END返回章目录返回总目录C.CHENG表表4-11 Dunnett4-11 Dunnettt t检验表检验表比较比较组组A与与B两均两均数之数之差差组数组数a标准标准误误t值值t0.05t0

174、.01P值值(1)(2)(3)(4)(5)(6)(7)(8)1与与311.431.457.862.503.390.010.050.054与与32.821.451.932.183.050.050.052021/3/11223第4章方差分析 共666页END返回章目录返回总目录C.CHENG计算均数差值的标准误计算均数差值的标准误: : 计算计算1 1与与3 3比较组的标准误。比较组的标准误。(3 3)推断结论)推断结论 本例只有本例只有1 1与与3 3比较组比较组P P0.010.01,故在,故在0.050.05水准上拒绝水准上拒绝H H0 0,接受,接受H H1 1,差异有统计学意义。,差异有

175、统计学意义。可以认为消毒液对大肠杆菌和葡萄球菌的抑制效果不可以认为消毒液对大肠杆菌和葡萄球菌的抑制效果不相同;其它各对比组的相同;其它各对比组的P P0.050.05,不拒绝,不拒绝H H0 0,差异无,差异无统计学意义。则可认为消毒液对大肠杆菌,绿脓杆菌统计学意义。则可认为消毒液对大肠杆菌,绿脓杆菌和痢疾杆菌的抑制效果相同。和痢疾杆菌的抑制效果相同。 2021/3/11224第4章方差分析 共666页END返回章目录返回总目录C.CHENG第五节第五节 多个方差的齐性检验多个方差的齐性检验 一、概念及意义一、概念及意义 Bartlett Bartlett 检检验验法法的的基基本本思思想想是是

176、,设设各各总总体体方方差差相相等等,均均等等于于其其合合并并方方差差。则则各各样样本本方方差差与与合合并并方方差差相相差差不不会会很很大大。如如果果相相差差很很大大,则则计计算算的的样样本本的的 值值较较大大,当当超超过过X X2 2界界值值时时,则则P P。可可以以认认为为各样本所代表的总体方差不全相等。各样本所代表的总体方差不全相等。注注意意:统统计计软软件件中中,最最常常用用的的是是LeveneLevene方方差差齐齐性性检检验验 。可可用用于于正正态态分布及非正态分布的资料。分布及非正态分布的资料。Bartlett Bartlett 检检验验法法:主主要要用用于于正正态态分分布布的的资

177、资料料,对对于于非非正正态态分分布布的的资资料不适用。料不适用。具体内容自学。具体内容自学。2021/3/11225第4章方差分析 共666页END返回章目录返回总目录C.CHENG第六节第六节 变量变换变量变换一、概念及意义一、概念及意义 (一)概念(一)概念变变量量变变换换(data data transformationtransformation)也也称称为为变变量量代代换换,是是指指将将原原始始数数据据X X经经过过某某种种数数学学方方法法转转换换为为其其它它的的数数据据形形式式,使使其其达达到到统统计计学学上上的的某某种种要要求求,以以利利于于对对资资料料进进行行统统计计处处理理。

178、如如对对变变量量X X取取对对数数lgXlgX或或取取平平方方根根等等。常常用用的的变变量量变变换换方方法法有有:对对数数变变换换,平平方方根根变变换换,倒倒数数变变换换,平平方方根反正弦变换,概率单位变换,根反正弦变换,概率单位变换,logitlogit变换,乘方变换等。变换,乘方变换等。2021/3/11226第4章方差分析 共666页END返回章目录返回总目录C.CHENG( (二二) )意义意义原始数据经变量变换后主要应该达到下列原始数据经变量变换后主要应该达到下列几个目的几个目的: :1.1.使非正态分布的原始数据达到正态分布或近似正态分布。使非正态分布的原始数据达到正态分布或近似正

179、态分布。2.2.使各样本方差不齐的数据达到方差齐性。使各样本方差不齐的数据达到方差齐性。3.3.作曲线回归方程时,使之直线化。作曲线回归方程时,使之直线化。4.4.按照统计学要求,经变量变换后简化运算过程。按照统计学要求,经变量变换后简化运算过程。2021/3/11227第4章方差分析 共666页END返回章目录返回总目录C.CHENG(一)对数变换(一)对数变换对对数数变变换换(logarithm logarithm transformationtransformation)是是将将原原始始数数据据X X取取对对数数,并并以以对对数数值值作作为为统统计计分分析析的的新新数数据据,一一般般对对

180、原原始数据取常用对数。始数据取常用对数。对对数数变变换换常常用用于于: 正正偏偏态态分分布布的的资资料料,尤尤其其是是数数据据呈呈等等比比关关系系的的资资料料,使使之之成成为为正正态态分分布布或或近近似似正正态态分分布布。这这类类资资料料也也称称为为对对数数正正态态分分布布资资料料。 各各样样本本方方差差不不齐齐。 各样本方差与均数呈正比关系。各样本方差与均数呈正比关系。 公式为公式为 Y=lgXY=lgX 当原始数据有小值或零值时当原始数据有小值或零值时 Y=lg(X+1) Y=lg(X+1) , Y=lg(X+k) Y=lg(X+k) , Y=lg(X-k) Y=lg(X-k) 二、常用变

181、量变换二、常用变量变换2021/3/11228第4章方差分析 共666页END返回章目录返回总目录C.CHENG平平方方根根变变换换(square square root root transformationtransformation)是是将将原原始始数数据据X X开平方,以平方根值作为统计分析新的变量值。开平方,以平方根值作为统计分析新的变量值。平平方方根根变变换换的的用用途途: 可可以以将将泊泊松松分分布布的的数数据据转转化化为为正正态态分分布布或或近近似似正正态态分分布布; 轻轻度度正正偏偏态态分分布布的的资资料料转转化化为为近近似似正正态态分分布布; 各各样样本本方方差差不不齐齐或

182、或样样本本方方差差与与均均数数之之间间呈呈正正比比关关系系时时,可可以以达达到到方方差差齐齐性性,消消除除或或削削弱弱样样本本方方差差与与均均数的正比关系。数的正比关系。(二)平方根变换(二)平方根变换2021/3/11229第4章方差分析 共666页END返回章目录返回总目录C.CHENG平方根反正弦变换平方根反正弦变换(square root arcsine square root arcsine transformationtransformation)是将原始数据取平方根后,再计算反)是将原始数据取平方根后,再计算反正弦函数值,得到转换后的新变量值。正弦函数值,得到转换后的新变量值。

183、当当P0%时用下式时用下式 当当P P100%100%时用下式时用下式(三)平方根反正弦变换(三)平方根反正弦变换2021/3/11230第4章方差分析 共666页END返回章目录返回总目录C.CHENG主要用于百分率的转换主要用于百分率的转换。百百分分率率服服从从二二项项分分布布,如如各各种种疾疾病病的的患患病病率率、发发病病率率、死死亡亡率率以以及及各各种种百百分分率率等等相相对对数数。尤尤其其是是当当百百分分率率偏偏离离5050较较远远如如大大于于7070或或小小于于3030时时,二二项项分分布布偏偏离离正正态态分分布布较较远远。经经过过将将百百分分率率转转换换后后,可可使使新新变变量量

184、值值接接近近正正态态分分布布,且且往往往往达达到到方方差差齐齐性性。据据此此,可可对对百百分分率率p p的的均均数数进行进行t t检验或方差分析。检验或方差分析。例题:自学内容。例题:自学内容。平方根反正弦变换的用途:平方根反正弦变换的用途:2021/3/11231第4章方差分析 共666页END返回章目录返回总目录C.CHENGTHANKYOUFORLISTENING2021/3/11232第4章方差分析共666页END返回章目录返回总目录C.CHENG医学统计学 主讲主讲 程程 琮琮泰山医学院预防医学教研室泰山医学院预防医学教研室本科生用中文教案本科生用中文教案2021/3/11233第5

185、章定性资料的统计描述共666页END返回章目录返回总目录C.CHENGChinese Teaching Plan for Medical StudentsMedical StatisticsProfessor Cheng CongDept.ofPreventiveMedicineTaishanMedicalCollege2021/3/11234第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG 第第5 5章定性资料的统计描述章定性资料的统计描述 目录目录q第五节第五节常用的相对数指标常用的相对数指标q第二节第二节应用相对数应注意的问题应用相对数应注意的问题q第三节第三节

186、率的标准化法率的标准化法q第四节第四节动态数列及其分析指标动态数列及其分析指标q 第一节第一节 常用相对数常用相对数2021/3/11235第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG第五章第五章 定性资料的统计描述定性资料的统计描述 第一节第一节 常用相对数常用相对数绝对数绝对数调查或实验研究中清点定性资料得到的实调查或实验研究中清点定性资料得到的实际数据被称为绝对数。际数据被称为绝对数。相对数相对数:两个有联系指标之比。:两个有联系指标之比。医学上常用的相对数有率、构成比相对比等统计指标。医学上常用的相对数有率、构成比相对比等统计指标。 2021/3/1123

187、6第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG一、率一、率 率(率(raterate)又称频率指标,是某现象实际发生的观察)又称频率指标,是某现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。计算公式为:说明某现象发生的频率或强度。计算公式为: 式中:式中:K为比例基数,常以百分率(为比例基数,常以百分率(%)、千分率()、千分率()、)、万分率(万分率(1/万)、十万分率(万)、十万分率(1/10万)表示,原则上使计算万)表示,原则上使计算结果至少保留结果至少保留12位整数。

188、但在医学资料中某些指标的比位整数。但在医学资料中某些指标的比例基数是固定的。例基数是固定的。2021/3/11237第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG常见率的指标如下:常见率的指标如下:v 粗粗死死亡亡率率、出出生生率率、人人口口自自然然增增长长率率、婴婴儿儿死死亡亡率率、新生儿死亡率等人口学指标常用的比例基数是新生儿死亡率等人口学指标常用的比例基数是10001000。v 2.2.恶恶性性肿肿瘤瘤的的死死亡亡率率、发发病病率率、患患病病率率通通用用比比例例基基数是数是100000/10100000/10万。万。v 3.3.生存率、病死率通用的比例基数是生

189、存率、病死率通用的比例基数是100%100%。2021/3/11238第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG二、构成比二、构成比 构成比(构成比(proportionproportion)又称构成指标,说明某一事物)又称构成指标,说明某一事物内部各组成部分所占的比重或分布。内部各组成部分所占的比重或分布。常用来表示疾病或死亡的顺位、位次或所占比重。由常用来表示疾病或死亡的顺位、位次或所占比重。由于构成比之和为于构成比之和为100%100%,一部分变化会影响其它部分的,一部分变化会影响其它部分的也发生变化。也发生变化。2021/3/11239第5章定性资料的统

190、计描述共666页END返回章目录返回总目录C.CHENG率和构成比的区别(补充)率和构成比的区别(补充) 构成比构成比率率1 1。各部分可直接相加。各部分可直接相加各率不可直接相加。各率不可直接相加。2 2。各部分之和等于。各部分之和等于100100。 总率不一定等于各率之总率不一定等于各率之和。和。3 3。某部分变化,其它部。某部分变化,其它部分随之变化。分随之变化。某率的变化,不影响其它某率的变化,不影响其它各率。各率。2021/3/11240第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG三、比(三、比(相对比)相对比)比比(ratioratio)又又称称相相对

191、对比比,是是A A、B B两两个个有有关关指指标标之之比比,说说明明A A是是B B的的若若干干倍倍或或百百分分之之几几,通通常常用用倍倍数数或或分分数数表表示。计算公式为:示。计算公式为:(或(或100%)2021/3/11241第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENGv 常用相对比指标常用相对比指标1.1.对比指标对比指标:指两个同类事物某种指标(绝对数、两:指两个同类事物某种指标(绝对数、两个率或其它同类指标)的比。个率或其它同类指标)的比。 2.2.关系指标关系指标:指两个有关的、但非同类事物的数量的:指两个有关的、但非同类事物的数量的比。比。 3.3

192、.计划完成指标计划完成指标:说明计划完成的程度,常用实际数:说明计划完成的程度,常用实际数达到计划数的百分之几或几倍表示。达到计划数的百分之几或几倍表示。 2021/3/11242第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG表表5-1 19935-1 199319981998年某地损伤与中毒病死率(年某地损伤与中毒病死率(% %)与构成比()与构成比(% %) 年度年度发病人数发病人数 病死人数病死人数 病死率病死率构成比构成比相对比相对比(1 1)(2 2)(3 3)(4 4)(5 5)(6 6)199319935845848 81.371.378.88.819

193、94199457157110101.751.7511.011.01.281.281995199571471412121.681.6813.213.21.231.231996199674874816162.142.1417.617.61.561.561997199794294221212.232.2323.023.01.631.63199819981095109524242.192.1926.426.41.601.60合计合计4654465491911.961.96100.0100.02021/3/11243第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG第二节第二节

194、应用相对数应注意的问题应用相对数应注意的问题 v1.1.计算相对数时分母一般不宜过小计算相对数时分母一般不宜过小 ,一般不能小于,一般不能小于3030例。例。v2.2.分析时不能以构成比代替率分析时不能以构成比代替率 。v3.3.对观察单位数不等的几个率,不能直接相加求其总率。对观察单位数不等的几个率,不能直接相加求其总率。 v4.4.应当注意不能用构成比的动态分析代替率的动态分析。应当注意不能用构成比的动态分析代替率的动态分析。 v5.5.在比较相对数时应注意可比性。在比较相对数时应注意可比性。v6.6.对样本率(或构成比)的比较应随机抽样,并做假设检对样本率(或构成比)的比较应随机抽样,并

195、做假设检验。验。 2021/3/11244第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG第三节第三节 率的标准化法率的标准化法 一、标准化法的意义和基本思想一、标准化法的意义和基本思想 率的标准化率的标准化不同时间或不同地区的几组率比较时,不同时间或不同地区的几组率比较时,为了消除资料在为了消除资料在年龄、性别年龄、性别或其它有关指标的构成的或其它有关指标的构成的不同,而选用某一标准人口构成加以校正,称为率的不同,而选用某一标准人口构成加以校正,称为率的标准化。标准化。不同地区,不同时间的两个或多个率直接进行比较是不同地区,不同时间的两个或多个率直接进行比较是不太合

196、适的。会造成错误的结论。不太合适的。会造成错误的结论。2021/3/11245第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG表表5-4 5-4 甲、乙两地各年龄组人口数及死亡率(甲、乙两地各年龄组人口数及死亡率() 年龄组年龄组 甲甲 地地 乙乙 地地 人口数人口数死亡人死亡人数数死亡率死亡率人口数人口数死亡人死亡人数数死亡率死亡率 0 093009300532532 57.2 57.24800480034934972.972.9 5 512200122004444 3.6 3.66600660030304.64.6 20 201900019000101101 5.

197、3 5.335300353002542547.27.2 40 40760076009292 12.1 12.128002800393914.214.2 60 60190019007676 40.0 40.0500500232346.046.0 合计合计5000050000845845 16.916.9500005000069569513.9013.902021/3/11246第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG二、标准化率的计算二、标准化率的计算 标准化率标准化率(standardized ratestandardized rate)亦称调整率)亦称调整率

198、(adjusted rateadjusted rate)。)。常用的计算方法按已知条件有:常用的计算方法按已知条件有:1.1.直接法:间接法:不讲。反推法:不讲。直接法:间接法:不讲。反推法:不讲。2 2。选择标准人口的方法:。选择标准人口的方法:1 1)选择两地数据之一的人口数或构成比;)选择两地数据之一的人口数或构成比;2 2)选择两地数据之和的人口数或构成比;)选择两地数据之和的人口数或构成比;3 3)选择当地或全国的人口数或构成比;)选择当地或全国的人口数或构成比;4 4)国际间比较选用世界通用标准。)国际间比较选用世界通用标准。2021/3/11247第5章定性资料的统计描述共666

199、页END返回章目录返回总目录C.CHENG表表5-6 5-6 按公式(按公式(5.45.4)用直接法计算标准化死亡率()用直接法计算标准化死亡率() 年龄组年龄组标准人口数标准人口数 甲甲 地地 乙乙 地地 (岁)(岁)(N Ni i)原死亡率原死亡率p pi i预期死亡数预期死亡数NpNpi i原死亡率原死亡率p pi i预期死亡数预期死亡数NpNpi i(1 1)(2 2)(3 3)(4 4)= =(2 2)()(3 3)(5 5)(6 6)= =(2 2)(5 5)0 0141001410057.257.2 807 80772.972.9 1028 10285 518800188003.

200、63.6 68 684.64.6 86 86202054300543005.35.3 288 2887.27.2 391 3914040104001040012.112.1 126 12614.214.2 148 1486060 2400 240040.040.0 96 9646.046.0 110 110合计合计100000(100000(N N) )16.1916.191385(1385(NNi ip pi i) )13.9013.9017631763(NNi ip pi i) ) 2021/3/11248第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG标化结果标

201、化结果甲甲地地标标准准化化死死亡率亡率乙地标准化死乙地标准化死亡率亡率 2021/3/11249第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG表表5-7 5-7 按公式(按公式(5.55.5)用直接法计算标准化死亡率()用直接法计算标准化死亡率() 年龄组年龄组标准人口构成标准人口构成比比 甲甲 地地 乙乙 地地 (岁)(岁)(N Ni i/ /N N)原死亡率原死亡率p pi i分配死亡率分配死亡率(Ni/NNi/N)pipi原死亡率原死亡率p pi i分配死亡率分配死亡率(NiNi/ /N N)pipi(1 1) (2 2)(3 3)(4 4)= =(2 2)(

202、)(3 3)(5 5)(6 6)= =(2 2)()(5 5)0 0 0.1410.14157.257.28.078.0772.972.910.2810.28 5 5 0.1880.1883.63.60.680.684.64.60.860.862020 0.5430.5435.35.32.882.887.27.23.913.91 40 40 0.1040.10412.112.11.261.2614.214.21.481.486060 0.0240.02440.040.00.960.9646.046.01.101.10合计合计 1.0001.00016.1916.1913.85(13.85(P

203、P) )13.9013.9017.63(17.63(P P) )2021/3/11250第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG三、标准化法使用注意事项三、标准化法使用注意事项 1.1.标准化法是采用统一标准人口年龄构成;标准化法是采用统一标准人口年龄构成;2.2.标准化后的率并不表示某地实际水平,只能表明相标准化后的率并不表示某地实际水平,只能表明相对水平对水平 ;3.3.如不计算标准化率,而分别比较各组的率,也可得如不计算标准化率,而分别比较各组的率,也可得出正确结论,但不能比较总率的大小。出正确结论,但不能比较总率的大小。4.4.两样本标准化率是样本值,

204、存在抽样误差,应作假两样本标准化率是样本值,存在抽样误差,应作假设检验。检验方法比较麻烦。一般参考书上也没有。设检验。检验方法比较麻烦。一般参考书上也没有。 2021/3/11251第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG第四节第四节 动态数列及其分析指标动态数列及其分析指标 v动动态态数数列列(dynamic dynamic seriesseries)是是一一系系列列按按时时间间顺顺序序排排列列起起来来的的统统计计指指标标,包包括括绝绝对对数数、相相对对数数或或平平均均数数,用以说明事物在时间上的变化和发展趋势。用以说明事物在时间上的变化和发展趋势。1.1.

205、时间动态数列时间动态数列 各个指标在时点上的数据;各个指标在时点上的数据;2.2.时期动态数列时期动态数列 各个指标在一定的时间间隔内陆续各个指标在一定的时间间隔内陆续发生并积累的数据发生并积累的数据 。 2021/3/11252第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENGv常用动态数列有:常用动态数列有:1.1.绝对增长量绝对增长量 说明事物在一定时期所增长的绝对值。说明事物在一定时期所增长的绝对值。 2.2.发展速度和增长速度:发展速度和增长速度:定基比定基比 ;环比。环比。3.3.平平均均发发展展速速度度和和平平均均增增长长速速度度 用用于于概概括括某某一一

206、时时期期的的速速度度变变化化,即即该该时时期期环环比比的的几几何何均均数数,其其计计算算公公式式为为: :2021/3/11253第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG表表5-9 5-9 某地某地1990199019981998年床位发展动态年床位发展动态 年份年份指标指标符号符号年末年末床位数床位数绝对增长量绝对增长量 发展速度发展速度% % 增长速度增长速度% % 累计累计逐年逐年定基定基环比环比定基定基环比环比(1 1)(2 2) (3 3) (4 4) (5 5) (6 6) (7 7) (8 8) (9 9) 19901990a a0 054205

207、42019911991a a1 156085608 188 188188188103.4103.4103.4103.43.43.43.43.419921992a a2 257665766 346 346158158106.4106.4102.9102.96.46.42.92.919931993a a3 358865886 466 466120120108.6108.6102.1102.18.68.62.12.119941994a a4 459915991 571 571105105110.5110.5101.7101.710.510.51.71.71998 1998 a a8 8 7352 7

208、352 1932193219321932135.6135.6135.6135.6135.6135.6135.6135.62021/3/11254第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG例例5.4 5.4 对表对表5-95-9第(第(1 1)、()、(3 3)栏资料作动态分析)栏资料作动态分析 2021/3/11255第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG例例 根据表根据表5-95-9数据,预测数据,预测20032003年床位数年床位数 2021/3/11256第5章定性资料的统计描述共666页END返回章目录返回总目录C.C

209、HENG第五节第五节 常用的相对数指标常用的相对数指标1.1.发发病病率率(incidence incidence raterate) 指指一一定定时时期期内内,可可能能发发生某病的一定人群中新发生的某病病例数的频率。生某病的一定人群中新发生的某病病例数的频率。 比比例例基基数数K K可可为为:100100,1000,1000,10000/,10000/万万,1000001000001010万万。注注意意:分分子子为为新新发发生生病病例例数数,分分母母为为可可能能发发生生病例数。一定时期常指一年。计算公式为:病例数。一定时期常指一年。计算公式为:2021/3/11257第5章定性资料的统计描述

210、共666页END返回章目录返回总目录C.CHENG2.2.患患病病率率(prevalence prevalence raterate) 又又称称现现患患率率,指指在在某时点上受检人数中现患某种疾病的人数所占比例。某时点上受检人数中现患某种疾病的人数所占比例。注注意意:病病人人可可以以是是新新老老病病人人。时时点点:常常指指几几天天,一一周周或二周等。或二周等。2021/3/11258第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG3.3.死死 亡亡 率率 ( mortality mortality raterate) 亦亦 称称 粗粗 死死 亡亡 率率(crude c

211、rude death death artearte),是是指指某某人人群群在在一一定定期期间间内内死死于于所所有有原原因因的的人人数数在在该该人人群群中中所所占占的的比比例例。时时期期常常为为一一年年。我我国国总总死死亡亡率率稳稳定定在在7 7左左右右;按按1313亿亿人人估估计计:每年正常死亡者约每年正常死亡者约910910万人。万人。2021/3/11259第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG4 4。婴婴儿儿死死亡亡率率(infant infant mortality mortality raterate) 指指某某年年内内不不满一岁的婴儿死亡人数与全

212、年活产数的比值。满一岁的婴儿死亡人数与全年活产数的比值。我我国国19491949年年以以前前:该该率率为为200200;现现在在:城城市市为为1414;农农村村为:为:3434 ;印度:;印度:50508080 ;非洲:;非洲:120120。 西西方方发发达达国国家家:8 81212 。该该率率变变化化反反映映经经济济水水平平和和生生活活水平。不受人口构成影响,各国可直接比较。水平。不受人口构成影响,各国可直接比较。2021/3/11260第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG5.5.新新生生儿儿死死亡亡率率(neonatal neonatal mortal

213、ity mortality raterate) 指指某某年年内内出出生生之之不不满满2828天天的的死死亡人数与全年活产数的比值。产科指标。亡人数与全年活产数的比值。产科指标。2021/3/11261第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG6. 6. 围围产产儿儿死死亡亡率率(prenatal prenatal mortality mortality raterate) 孕孕期期满满2828周周至至生生后后7 7天天以以内内的的死死亡,称为围产儿死亡。亡,称为围产儿死亡。产科指标。产科指标。2021/3/11262第5章定性资料的统计描述共666页END返回章

214、目录返回总目录C.CHENG7. 7. 出生率(出生率(birth ratebirth rate) 亦称粗出生亦称粗出生率,指一年内每千人口中的出生数。我国率,指一年内每千人口中的出生数。我国总出生率为总出生率为1717 ;每年出生约;每年出生约22102210万。去万。去除正常死亡的除正常死亡的910910万,净增长万,净增长13001300万。增长万。增长率为率为1010 。2021/3/11263第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG8.8.人人口口自自然然增增长长率率(natural natural increase increase raterat

215、e) 指指出出生生率率与与死死亡亡率率之之差差。我我国国已已控控制制在在1010以以下下。这这是是我我国国的的基基本本目目标标。北北京京,上上海海为为负负增增长长,泰泰安安也也为为负负增增长长。法法国国、德德国国:为为负负增增长长;非非洲洲约约:3535左右。左右。人口自然增长率人口自然增长率= =出生率死亡率出生率死亡率 2021/3/11264第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG9.9.某病病死率(某病病死率(case fatalitycase fatality)表示一)表示一定期间内,某病患者中死于该病的频率。定期间内,某病患者中死于该病的频率。反映

216、疾病严重程度。也可评价医院医疗反映疾病严重程度。也可评价医院医疗水平。注意:各医院比较时,要有可比水平。注意:各医院比较时,要有可比性。一般不同级别的医院不能直接比较。性。一般不同级别的医院不能直接比较。 2021/3/11265第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENGv 生存率常用于评价某些慢性病如癌症、心血管等生存率常用于评价某些慢性病如癌症、心血管等的远期疗效。可以计算的远期疗效。可以计算3 3年、年、5 5年或年或1010年生存率。年生存率。 10.10.生生存存率率(survival survival raterate) 是是指指患患某某种种疾疾病病

217、的的人人(或或接接受受某某种种治治疗疗的的某某病病病病人人)经经n n年年的的随随访访,到到随随访访结结束束时仍存活的病例数所占的比例。时仍存活的病例数所占的比例。2021/3/11266第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENGBestwishestoyou.Thankyouforlistening2021/3/11267第5章定性资料的统计描述共666页END返回章目录返回总目录C.CHENG主讲主讲 程程 琮琮泰山医学院预防医学教研室泰山医学院预防医学教研室本科生用教案本科生用教案医学统计学医学统计学 2021/3/11268第6章总体率的区间估计和假设检

218、验共666页END返回章目录返回总目录C.CHENGChinese Teaching PlanChinese Teaching Plan for Medical Studentsfor Medical StudentsMedicalStatisticsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege2021/3/11269第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENG第第6 6章总体率的区间估计和假设检验章总体率的区间估计和假设检验 目录目录q第二节第二节率的率的u检验检验q第三

219、节第三节卡方检验卡方检验q第四节第四节四格表的确切概率法四格表的确切概率法q 第一节第一节 率的抽样误差与总体率的率的抽样误差与总体率的 区间估计区间估计2021/3/11270第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENG第六章第六章 总体率的区间估计和假设检验总体率的区间估计和假设检验第一节 率的抽样误差与总体率的区间估计(1)一。率的抽样误差一。率的抽样误差:在同一总体中按一定的样本含量:在同一总体中按一定的样本含量n n抽样抽样, ,样本率和总体率或样本率之间也存在着差异,样本率和总体率或样本率之间也存在着差异,这种差异称为率的抽样误差。这种差异称为

220、率的抽样误差。率的抽样误差的大小是用率的抽样误差的大小是用率的标准误率的标准误来表示的。来表示的。 2021/3/11271第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENGForexample例例6.1检检查查居居民民800人人粪粪便便中中蛔蛔虫虫阳阳性性200人人,阳性率为阳性率为25%,试求阳性率的标准误。,试求阳性率的标准误。本例:本例:n=800,p=0.25,1-p=0.75,2021/3/11272第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENG二、总体率的区间估计二、总体率的区间估计正态分布法正态分布法 样本含量

221、样本含量n n足够大,足够大, npnp与与n(1-p)n(1-p)均均5 5时时 , ,第一节第一节 率的抽样误差与总体率率的抽样误差与总体率 的区间估计的区间估计2021/3/11273第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENGForexample例例6.26.2 求求例例6.16.1当当地地居居民民粪粪便便蛔蛔虫虫阳阳性性率率的的95%95%可信区间和可信区间和99%99%的可信区间。的可信区间。95%95%的的可可信信区区间间为为:25%1.961.53% 25%1.961.53% 即即(22.00%22.00%,28.00%28.00%) 99

222、%99%的可信区间为的可信区间为:25%2.581.53% 25%2.581.53% 即即(21.05%21.05%,28.95%28.95%) 2021/3/11274第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENGv 查表法查表法 v当样本含量较小(如当样本含量较小(如n n5050),),npnp或或n n(1(1p p)5) uu=3.58 u0.050.05=1. 64=1. 64(单侧)(单侧), P0.05, Pu0.05=1.96,故,故p X20.05,13.84,两组差别有统两组差别有统计学意义。与前面的结论相同。计学意义。与前面的结论相同

223、。2021/3/11291第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENG四格表值的校正 条件:条件:(1 1)任一格的)任一格的11T T5 5,且,且n n4040时,需计算校正值。时,需计算校正值。(2 2)任一格的)任一格的T T1 1或或n n4040时,用确切概率计算法。时,用确切概率计算法。基本公式基本公式专用公式专用公式2021/3/11292第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENG例例6.86.8 某医师用甲、乙两疗法治疗小儿单纯性消某医师用甲、乙两疗法治疗小儿单纯性消化不良,治疗结果如表化不良,治疗

224、结果如表6-46-4,问两疗法的治愈率是,问两疗法的治愈率是否相等?否相等? 表表6-4 6-4 甲、乙两疗法治疗小儿单纯性消化不良的治愈率比较甲、乙两疗法治疗小儿单纯性消化不良的治愈率比较 组组 别别 发病人数发病人数 未发病人数未发病人数合计合计用药组用药组 26( 26(28.828.8) ) 7(7(4.24.2) ) 3333对照组对照组 36( 36(33.233.2) ) 2( 2(4.84.8) ) 3838合合 计计 62 62 9 971712021/3/11293第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENG计算结果及判断计算结果及判断

225、本例:本例:X X2 22.71 X2.71 X2 2 0.05,10.05,1=3.84=3.84本例若对本例若对X X2 2值不校正,值不校正,=4.06=4.06,得,得P P0.050.05,结论正好,结论正好相反。相反。 2021/3/11294第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENG二、配对四格表资料的检验 1。用于配对定性资料差异性的假设检验。用于配对定性资料差异性的假设检验。若若b b+ +c c4040,需计算,需计算X X2 2校正值校正值 若若b b+ +c c4040,公式为:,公式为:2021/3/11295第6章总体率的区间

226、估计和假设检验共666页END返回章目录返回总目录C.CHENG例例6.96.9 有有2828份白喉病人的咽喉涂抹标本,把每份标本分份白喉病人的咽喉涂抹标本,把每份标本分别接种在甲、乙两种白喉杆菌培养基上,观察两种白喉别接种在甲、乙两种白喉杆菌培养基上,观察两种白喉杆菌生长情况,杆菌生长情况,“+ +”号表示生长,号表示生长,“- -”号表示不生长,号表示不生长,结果如表结果如表6-56-5。问两种白喉杆菌培养基的效果有无差别?。问两种白喉杆菌培养基的效果有无差别?表表6-5 6-5 甲、乙两种白喉杆菌培养基的培养结果甲、乙两种白喉杆菌培养基的培养结果 甲种甲种乙种乙种合计合计11(a)9(b

227、)201(c)7(d)8合计合计1216282021/3/11296第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENG本例检验步骤如下:本例检验步骤如下:(1)建立检验假设)建立检验假设 H0:总体:总体B=C,即两种白喉杆菌培养基的效果相同,即两种白喉杆菌培养基的效果相同 H1:总体:总体BC,即两种白喉杆菌培养基的效果不同,即两种白喉杆菌培养基的效果不同=0.05(2)计算值)计算值本例本例b=9,c=1,b+c X53.18 X2 2=9.49=9.49,P0.05P0.050.05合合 计计 471471848188481848889488899.639

228、.63一般市区一般市区+ +农农村村 471471848188481848889488899.639.63重污染区重污染区 114114327832783392339233.6133.61164.78164.781 10.0050.005合合 计计 5855855169651696522815228111.1911.19167.49167.492 22021/3/11309第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENG第四节* 四格表的确切概率法(Fisher(Fishers exact test)s exact test) 前前已已述述及及,四四格格表表若

229、若有有理理论论频频数数T T小小于于1 1,或或n n4040时时,尤尤其其是是用用其其他他检检验验方方法法所所得得概概率率接接近近检检验验水水准准时时,宜宜用用四四格格表表的的确确切切概概率率法法(exact (exact probabilities probabilities in in 22 22 table)table),即即四四格格表表概概率率的的直直接接计算法。计算法。本法的本法的基本思想基本思想是:在四格表周边合计不变的情况下,获得某个是:在四格表周边合计不变的情况下,获得某个四格表的概率为四格表的概率为 : :2021/3/11310第6章总体率的区间估计和假设检验共666页E

230、ND返回章目录返回总目录C.CHENG 例例6.14 6.14 抽查两批食品的卫生状况,作大肠杆菌检查,抽查两批食品的卫生状况,作大肠杆菌检查,检查结果见表检查结果见表6-106-10。问两批食品的卫生状况有无差别?。问两批食品的卫生状况有无差别?表表6-10甲乙两批食品大肠杆菌检查结果甲乙两批食品大肠杆菌检查结果组组 别别阳性数阳性数 阴性数阴性数合计合计阳性率阳性率()()甲批甲批 26(26(28.828.8) ) 7(7(4.24.2) ) 333341.6741.67乙批乙批 36(36(33.233.2) ) 2( 2(4.84.8) ) 383810.0010.00合合 计计 6

231、2 62 9 9717127.2727.272021/3/11311第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENG计算计算 P P 值值 表表6-106-10中中甲甲批批食食品品阳阳性性率率P P1 1=0.4167=0.4167,乙乙批批食食品品阳阳性性率率P P2 2=0.1000=0.1000,两两者者之之差差| | p p1 1p p2 2 |=0.3167|=0.3167。在在周周边边合合计计数数不不变变的的条条件件下下,可可能能还还有有其其它它组组合合的的四四格格表表,其其阳阳性性率率之之差差0.31670.3167,所所有有这这些些比比当当前前

232、四四格格表表更更极极端端的的情情况况都都应应考考虑虑进进去去,因因为为这这些些极极端端情情况况在在H H0 0条件下都有可能发生。条件下都有可能发生。 2021/3/11312第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENGv 表表6-116-11中中| | p p1 1p p2 2 |0.3167|0.3167的四格表为序的四格表为序号(号(0 0)、()、(1 1)、()、(5 5)、()、(6 6)的情形,按公)的情形,按公式(式(6.166.16)求得序号()求得序号(1 1)的概率为)的概率为2021/3/11313第6章总体率的区间估计和假设检验共

233、666页END返回章目录返回总目录C.CHENG表表6-11 6-11 确切概率计算表(四格表周边合计数不变)确切概率计算表(四格表周边合计数不变) 2021/3/11314第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENGv余仿此余仿此, ,P P(0)(0)=0.0124, =0.0124, P P(5)(5)=0.0405, =0.0405, P P(6)(6)=0.0028, =0.0028, 因此所求概率为:因此所求概率为: v 推断结论推断结论 按按=0.05=0.05的水准,不拒绝的水准,不拒绝H H0 0,差异无,差异无统计学意义。还不能认为两批

234、食品卫生状况有差统计学意义。还不能认为两批食品卫生状况有差别。别。P =PP =P(0)(0)+P+P(1)(1)+P+P(5)(5)+P+P(6)(6)=0.0124+0.1061 =0.0124+0.1061 +0.0405+0.0028=0.1618 +0.0405+0.0028=0.16182021/3/11315第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENGTHANK YOU FOR LISTENINGTHE ENDTHE END2021/3/11316第6章总体率的区间估计和假设检验共666页END返回章目录返回总目录C.CHENG泰山医学院预防

235、医学教研室泰山医学院预防医学教研室主讲 程 琮医学本科生用医学本科生用医学统计学医学统计学2021/3/11317第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENGTeachingPlanForMedicalStudentsMedicalStatisticsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege2021/3/11318第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG第第7 7章二项分布与泊松分布章二项分布与泊松分布 目录目录q第二节第二节Poisson分布

236、及其应用分布及其应用q第三节第三节二项分布与二项分布与Poisson分分布布的拟合优度检验的拟合优度检验q 第一节第一节 二项分布及其应用二项分布及其应用2021/3/11319第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG第七章第七章 二项分布与二项分布与PoissonPoisson分布分布第一节第一节 二项分布及其应用二项分布及其应用 一、二项分布的概念及应用条件一、二项分布的概念及应用条件 v 二项分布(二项分布(binominal distributionbinominal distribution) 是一种重要的离散型分布,在医学上常遇到属于两分是一种重要

237、的离散型分布,在医学上常遇到属于两分类的资料,每一观察单位只具有相互独立的一种结果,类的资料,每一观察单位只具有相互独立的一种结果,如检查结果的阳性或阴性,动物试验的生存或死亡,如检查结果的阳性或阴性,动物试验的生存或死亡,对病人治疗的有效或无效等。对病人治疗的有效或无效等。 2021/3/11320第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG 如果已知发生某一结果(如阳性)的概率为如果已知发生某一结果(如阳性)的概率为,其对立,其对立结果(阴性)的概率为(结果(阴性)的概率为(1-1-),且各观察单位的观察),且各观察单位的观察结果相互独立,互不影响,则从该总体

238、中随机抽取结果相互独立,互不影响,则从该总体中随机抽取n n例,例,其中出现阳性数为其中出现阳性数为X X ( (X X=0,1,2,3,=0,1,2,3,,n n) )的概率服从二的概率服从二项分布。项分布。v 二项分布二项分布 也称为贝努里分布(也称为贝努里分布(Bernoulli distributionBernoulli distribution)或贝努)或贝努里模型,是由法国数学家里模型,是由法国数学家J.BernoulliJ.Bernoulli于于17131713年首先阐年首先阐述的概率分布。述的概率分布。 2021/3/11321第7章二项分布与泊松分布共666页END返回章目录

239、返回总目录C.CHENG贝努里模型应具备下列三个基本条件。贝努里模型应具备下列三个基本条件。 试验结果只出现对立事件试验结果只出现对立事件A A或,两者只能出现其中之或,两者只能出现其中之一。这种事件也称为互斥事件。一。这种事件也称为互斥事件。 试验结果是相互独立,互不影响的。例如,一个妇试验结果是相互独立,互不影响的。例如,一个妇女生育男孩或女孩,并不影响另一个妇女生育男孩或女生育男孩或女孩,并不影响另一个妇女生育男孩或女孩等。女孩等。 每次试验中,出现事件每次试验中,出现事件A A的概率为,而出现对立事件的概率为,而出现对立事件的概率为的概率为- -。则有总概率。则有总概率+ +(1-1-

240、)=1=1。2021/3/11322第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG二、二、 二项分布的概率函数二项分布的概率函数 v根根据据贝贝努努里里模模型型进进行行试试验验的的三三个个基基本本条条件件,可可以以求求出出在在n次次独独立立试试验验下下,事事件件A出出现现的的次次数数X的的概概率率分分布布。X为离散型随机变量,其可以取值为为离散型随机变量,其可以取值为0,1,2,n。则则X的概率函数为:的概率函数为:X X=0,1,2,=0,1,2, ,n n (7.1)(7.1) 式中:式中:0101, 为组合数,公式(为组合数,公式(7.17.1)称随机变量)称

241、随机变量X X服从参数为服从参数为n n,的二项分布,则记为的二项分布,则记为X XB(n,)B(n,)。2021/3/11323第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG三、三、 二项分布的性质二项分布的性质 二二项项分分布布是是概概率率分分布布,因因此此它它就就具具备备概概率率分分布布的的各各种性质。种性质。1. 1. 二二项项分分布布的的每每种种组组合合的的概概率率符符合合二二项项展展开开式式,其其总总概概率等于率等于1 1 (7.27.2) 2021/3/11324第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG由公式(由公式(

242、7.27.2)可看出二项展开式有以下特点:)可看出二项展开式有以下特点: (1)展开式的项数为)展开式的项数为n+1。(2)展开式每项和()展开式每项和(1-)指数之和为)指数之和为n。(3)展开式每项的指数从)展开式每项的指数从0到到n;(;(1-)的指数从)的指数从n到到0。2.二项分布的累积概率二项分布的累积概率设设m1Xm2(m1m2),则则X在在m1至至m2区间的累积概率有:区间的累积概率有:(7.3) (7.3) 2021/3/11325第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENGv 至多有至多有x x例阳性的概率为:例阳性的概率为: v 至少有至少有

243、x x例阳性的概率为:例阳性的概率为: X=0,1,2,x(7.4)X=x,x+1,n(7.5)公式(公式(7.47.4)为下侧累计概率,公式()为下侧累计概率,公式(7.57.5)为上侧累计概率。)为上侧累计概率。 2021/3/11326第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG3.3.二项分布的概率分布图形二项分布的概率分布图形v 以以X X为为横横坐坐标标,P P(X X)为为纵纵坐坐标标,在在坐坐标标纸纸上上可可绘绘出出二二项项分分布布的的图图形形, , 由由于于X X为为离离散散型型随随机机变变量量,二二项项分分布布图图形形由由横横坐标上孤立点的垂直

244、线条组成。坐标上孤立点的垂直线条组成。v 二二项项分分布布的的图图形形取取决决于于与与n n的的大大小小。当当n n充充分分大大时时,二二项项分布趋向对称,可以证明其趋向正态分布。分布趋向对称,可以证明其趋向正态分布。v 一一般般地地,如如果果n n乘乘以以即即n n之之积积大大于于5 5时时,分分布布接接近近正正态态分分布布;当当n n55时时,图图形形呈呈偏偏态态分分布布。当当 =0.5=0.5时时,图图形形分分布布对对称称,近近似似正正态态。如如果果0.50.5或或距距0.50.5较较远远时时,分分布布呈偏态。见图呈偏态。见图7-17-1。2021/3/11327第7章二项分布与泊松分布

245、共666页END返回章目录返回总目录C.CHENG图图7-1 7-1 二项分布示意图二项分布示意图 2021/3/11328第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG4.4.二项分布的数字特征二项分布的数字特征 这里的数字特征主要指总这里的数字特征主要指总体均数、方差、标准差等参数。体均数、方差、标准差等参数。 (1)随机变量随机变量X的数学期望的数学期望E(X),即指总体均数:,即指总体均数:n(7.6);(1)随机变量随机变量X的方差的方差D(X)2为:为:(3)随机变量随机变量X的标准差为的标准差为:(7.7)(7.8)2021/3/11329第7章二项分

246、布与泊松分布共666页END返回章目录返回总目录C.CHENG(7.97.9) (7.107.10) 若若X X的总体均数和标准差用率来表示,则将公式的总体均数和标准差用率来表示,则将公式(7.67.6)和公式()和公式(7.87.8)分别除以)分别除以n n , ,得:得: 2021/3/11330第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG四、二项分布展开式各项的系数四、二项分布展开式各项的系数 v二项分布展开式的各项之前均有一个系数,用组合公二项分布展开式的各项之前均有一个系数,用组合公式来表示。计算公式为:式来表示。计算公式为:2021/3/11331第7

247、章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG该该系数系数也可用杨辉三角来表示,见也可用杨辉三角来表示,见图图7-27-2。国外参考书习惯称之为。国外参考书习惯称之为巴斯巴斯噶三角。噶三角。当试验次数当试验次数n n较小时,可直较小时,可直接利用杨辉三角将二项分布展开式接利用杨辉三角将二项分布展开式各项的系数写出来,应用十分方便。各项的系数写出来,应用十分方便。 2021/3/11332第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG图图7-2杨辉三角模式图杨辉三角模式图2021/3/11333第7章二项分布与泊松分布共666页END返回章目录

248、返回总目录C.CHENG杨辉三角的意义:杨辉三角的意义:杨辉三角中每行有几个数字,表示展开式有杨辉三角中每行有几个数字,表示展开式有几项。当试验次数为几项。当试验次数为n n 时,有时,有n n+1+1项。项。杨辉三角中每行中的数字表示展开式中每项杨辉三角中每行中的数字表示展开式中每项的系数大小。的系数大小。杨辉三角中的各数字项及其数字的排列很有杨辉三角中的各数字项及其数字的排列很有规律。可依照规律继续写下去。第一行的第一、规律。可依照规律继续写下去。第一行的第一、第二项均为数字,以后每下一行的首项及末第二项均为数字,以后每下一行的首项及末项均为,中间各项为上一行相邻两项数字之项均为,中间各项

249、为上一行相邻两项数字之和。和。 2021/3/11334第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG五、二项分布的应用五、二项分布的应用二项分布在生物学及医学领域中,主要二项分布在生物学及医学领域中,主要应用在下列几个方面:应用在下列几个方面:总体率的可信区间估计,总体率的可信区间估计,率的率的u u检验,检验,样本率与总体率比较的直接计算概率样本率与总体率比较的直接计算概率法。法。 2021/3/11335第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG(一)应用二项分布计算概率(一)应用二项分布计算概率例例7.17.1 如如出出生生男

250、男孩孩的的概概率率=0.5=0.5,出出生生女女孩孩的的概概率率为为(1-1-)=0.5=0.5。在在一一个个妇妇产产医医院院里里有有3 3名名产产妇妇分分娩娩3 3名名新新生生儿儿,其其中中男男孩孩为为X=0,1,2,3X=0,1,2,3的的概概率率按按公公式式(7.17.1)计计算算的的结结果果列列于于表表7-17-1的的第第(3 3)栏栏中。中。分析分析:根据题意,已知生育男孩为事件:根据题意,已知生育男孩为事件A A,其概,其概率率P P( (A A)=0.5)=0.5(即(即=0.5=0.5);生育女孩为事件,其);生育女孩为事件,其概率为概率为P P()=1-()=1-P P( (

251、A A)=1-0.5)=1-0.50.50.5(即(即1-1- =0.5=0.5)。)。 2021/3/11336第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENGv三个妇女生育一个男孩,两个女孩的概率为:三个妇女生育一个男孩,两个女孩的概率为:v三个妇女生育均为女孩(即无男孩)的概率三个妇女生育均为女孩(即无男孩)的概率为:为:余类推余类推,见表,见表7-17-1第(第(3 3)栏。表)栏。表7-17-1第(第(5 5)栏为至少生育)栏为至少生育X X个男孩的累积概率。个男孩的累积概率。2021/3/11337第7章二项分布与泊松分布共666页END返回章目录返回总目

252、录C.CHENG( (二二) )样本率与总体率的比较的直接概率法样本率与总体率的比较的直接概率法 v 此法适用此法适用n n和和n n(1-)(1-)均小于均小于5 5的情形。的情形。v 应注意:应注意:v 当样本率大于总体率时,应计算大当样本率大于总体率时,应计算大于等于阳性人数的累积概率。于等于阳性人数的累积概率。v 当样本率小于总体率时,应计算小当样本率小于总体率时,应计算小于等于阳性人数的累积概率。于等于阳性人数的累积概率。2021/3/11338第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG 例例7.27.2 A A药药治治疗疗某某病病的的有有效效率率为为

253、8080。对对A A药药进进行行改改进进后后,用用改改进进型型A A药药继继续续治治疗疗病病人人,观观察察疗疗效效。如如果果用用改改进进型型A A药药治治疗疗2020例例病病人人,1919例例有有效效。如如果果用用改改进进型型A A药药治治疗疗3030例例病病人人,2929例例有有效效。试试分分析析上上述述二二种种情情形形下,改进型下,改进型A A药是否疗效更好。药是否疗效更好。 分分析析: : A A药药有有效效率率为为8080,可可以以作作为为总总体体率率,即即0 00.8 0.8 。治治疗疗2020例例病病人人的的样样本本有有效效率率为为(19192020)1001009595;治治疗疗

254、3030例例病病人人的的样样本本有有效效率率为为(29293030)10010096.6796.67。两两个个样样本本率率均均大大于于总总体体率率8080,故故应应计计算算大大于于等等于于有有效效例例数数的的单单侧侧累累积积概概率。率。2021/3/11339第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG情形一情形一:治疗:治疗20例病人的疗效分析例病人的疗效分析(1)建立检验假设)建立检验假设H0:改改 进进 型型 A药药 的的 疗疗 效效 与与 原原 A药药 相相 同同 , 0 0.80H1:改进型改进型A药的疗效高于原药的疗效高于原A药,药,00.80单侧单侧

255、0.05(2)计算概率值)计算概率值根据二项分布有:根据二项分布有:= 0.0548+0.0115=0.0663 = 0.0548+0.0115=0.0663 2021/3/11340第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG情形二情形二:治疗:治疗3030例病人的疗效分析例病人的疗效分析(1 1)检验假设同情形一。)检验假设同情形一。(2 2)计算单侧累积概率有:)计算单侧累积概率有: (3)推断结论推断结论本例本例P0.0663,在在0.05水准上水准上,不拒绝不拒绝H0。尚不能认为改进型。尚不能认为改进型A药的疗效优于原药的疗效优于原A药。药。=0.008

256、975+0.001238=0.0102 =0.008975+0.001238=0.0102 2021/3/11341第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG(3 3)推断结论推断结论 本例本例P P0.0102,0.0102,在在0.050.05水准上水准上, ,拒绝拒绝H H0 0, ,接受接受H H1 1。可以认为改进型。可以认为改进型A A药的疗效优于原药的疗效优于原A A药。药。 v 注意注意:治疗:治疗2020例病人的有效率为例病人的有效率为9595,治疗,治疗3030例病人的有效率为例病人的有效率为96.6796.67,两个样本有效,两个样本有效率

257、很接近。但最终得出的结论却不相同。一般率很接近。但最终得出的结论却不相同。一般地,临床上观察疗效,样本含量不能太小。随地,临床上观察疗效,样本含量不能太小。随着观察例数的增加,疗效的稳定性及可靠性也着观察例数的增加,疗效的稳定性及可靠性也相应增加,受到偶然因素影响的机会也变得较相应增加,受到偶然因素影响的机会也变得较小。小。 2021/3/11342第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG分析分析: : 本例总体率本例总体率1 1。调查人群样本反应率。调查人群样本反应率为(为(1 1300300)1001000.330.33。由于样本率小于。由于样本率小于总体

258、率,故应计算小于等于阳性人数的累积概率。总体率,故应计算小于等于阳性人数的累积概率。 例例7.37.3 一般人群对一般人群对B B药的副作用反应率为药的副作用反应率为1 1。调查使用调查使用B B药者药者300300人,其中只有人,其中只有1 1人出现副作人出现副作用。问该调查人群对用。问该调查人群对B B药的副作用反应率是否药的副作用反应率是否低于一般人群。低于一般人群。 2021/3/11343第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG(1)建立检验假设建立检验假设H0:调调查查人人群群反反应应率率与与一一般般人人群群相相同同,00.01H1:调查人群反应率

259、低于一般人群,调查人群反应率低于一般人群,00.01单侧单侧0.05(2)计算单侧累积概率计算单侧累积概率:(3 3)推断结论推断结论 本例本例 P P0.1976,0.1976,在在0.050.05水准上水准上, ,不拒绝不拒绝H H0 0。尚不能认为调查人群的。尚不能认为调查人群的B B药副作用反应率低于药副作用反应率低于一般人群。一般人群。 2021/3/11344第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG第二节第二节 PoissonPoisson分布及其应用分布及其应用一、一、PoissonPoisson分布的概念及应用条件分布的概念及应用条件 ( (一

260、一)Poisson)Poisson分布的概念分布的概念PoissonPoisson分布由法国数学家分布由法国数学家S.D.PoissonS.D.Poisson在在18371837年提出。该分布也称为年提出。该分布也称为稀有事件模型稀有事件模型,或,或空间空间散布点子模型。散布点子模型。在生物学及医学领域中,某些在生物学及医学领域中,某些现象或事件出现的机会或概率很小,这种事件现象或事件出现的机会或概率很小,这种事件称为稀有事件或罕见事件。稀有事件出现的概称为稀有事件或罕见事件。稀有事件出现的概率分布服从率分布服从PoissonPoisson分布。分布。 2021/3/11345第7章二项分布与

261、泊松分布共666页END返回章目录返回总目录C.CHENGvPoisson分布的直观描述分布的直观描述:如果稀有事件:如果稀有事件A在每个单元在每个单元(设想为(设想为n次试验)内平均出现次试验)内平均出现次,那么在一个单元次,那么在一个单元(n次)的试验中,稀有事件次)的试验中,稀有事件A出现次数出现次数X的概率分布的概率分布服从服从Poisson分布。分布。vPoisson分分布布属属于于离离散散型型分分布布。在在Poisson分分布布中中,一一个个单单元元可可以以定定义义为为是是单单位位时时间间,单单位位面面积积,单单位位体体积积或或单单位位容容积积等等。如如每每天天8小小时时的的工工作

262、作时时间间,一一个个足足球球场场的的面面积积,一一个个立立方方米米的的空空气气体体积积,1升升或或1毫毫升升的的液液体体体体积积,培培养养细细菌菌的的一一个个平平皿皿,一一瓶瓶矿矿泉泉水水等等都都可可以以认认为为是是一一个个单单元元。一一个个单单元元的的大大小小往往往往是是根根据据实实际际情情况况或或经经验而确定的。若干个小单元亦可以合并为一个大单元。验而确定的。若干个小单元亦可以合并为一个大单元。2021/3/11346第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG( (二二) )常见常见PoissonPoisson分布的资料分布的资料在实际工作及科研中,判定一个

263、变量是否服从在实际工作及科研中,判定一个变量是否服从PoissonPoisson分布仍然分布仍然主要依靠经验以及以往累积的资料主要依靠经验以及以往累积的资料。以下是常见的以下是常见的PoissonPoisson分布的资料:分布的资料:1.1.产品抽样中极坏品出现的次数;产品抽样中极坏品出现的次数;2.2.枪打飞机击中的次数;枪打飞机击中的次数;3.3.患病率较低的非传染性疾病在人群中的分布;患病率较低的非传染性疾病在人群中的分布;4.4.奶中或饮料中的病菌个数;奶中或饮料中的病菌个数;5.5.自来水中的细菌个数;自来水中的细菌个数;6.6.空气中的细菌个数及真菌饱子数;空气中的细菌个数及真菌饱

264、子数;7.7.自然环境下放射的粒子个数;自然环境下放射的粒子个数;2021/3/11347第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG8.8.布朗颗粒数;布朗颗粒数;9.9.三胞胎出生次数;三胞胎出生次数;10.10.正式印刷品中错误符号的个数;正式印刷品中错误符号的个数;11.11.通讯中错误符号的个数;通讯中错误符号的个数;12.12.人的自然死亡数;人的自然死亡数;13.13.环境污染中畸形生物的出现情况;环境污染中畸形生物的出现情况;14.14.连体婴儿的出现次数;连体婴儿的出现次数;15.15.野外单位面积某些昆虫的随机分布;野外单位面积某些昆虫的随机分

265、布;16.16.单位容积内细胞的个数;单位容积内细胞的个数;17.17.单位空气中的灰尘个数;单位空气中的灰尘个数;18.18.平皿中培养的细菌菌落数等。平皿中培养的细菌菌落数等。2021/3/11348第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG二、二、PoisonPoison分布的概率函数及性质分布的概率函数及性质 定义定义若变量若变量X的概率函数为的概率函数为其中其中0 0,则称,则称X X服从参数服从参数为的为的PoissonPoisson分布。分布。记为记为X XP P()()。式中:。式中:为总体均数,为总体均数,n n或或=np=np;X X为稀有事

266、件发生次数;为稀有事件发生次数;e e为自然底数,即为自然底数,即e e =2.71828 =2.71828 。 (X=0,1,2,)2021/3/11349第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG亦可用下列公式计算亦可用下列公式计算 P(0)=e2021/3/11350第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG( (二二) ) 性质性质1.所有概率函数值(无穷多个)之和等于所有概率函数值(无穷多个)之和等于1,即,即2.2.分布函数分布函数 (X X=0,1,2,=0,1,2,x x) 2021/3/11351第7章二项分布与

267、泊松分布共666页END返回章目录返回总目录C.CHENG(00x x1 1x x2 2) 3.累积概率累积概率4.4.其它性质其它性质总体均数总体均数:方差:方差:标准差:标准差:n(或或np)22021/3/11352第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG(三)(三)PoissonPoisson分布的图形分布的图形一般地,一般地,PoissonPoisson分布的图形取决于分布的图形取决于值的大值的大小。小。值愈小,分布愈偏;值愈小,分布愈偏;值愈大,分布愈值愈大,分布愈趋于对称。趋于对称。当当2020时时,分布接近正态分布分布接近正态分布。此时可按正态

268、分布处理资料。此时可按正态分布处理资料。当当5050时,分时,分布呈正态分布。布呈正态分布。见图见图7-37-3。这里通过计算一个。这里通过计算一个具体实例来观察具体实例来观察PoissonPoisson分布的概率分布趋势。分布的概率分布趋势。 2021/3/11353第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG图图7-3 Poisson7-3 Poisson分布的概率分布图分布的概率分布图 2021/3/11354第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG例例7.4计算计算Poisson分布分布XP(3.5)的概率。的概率。202

269、1/3/11355第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG余类推。经计算得到一系列数据,见表余类推。经计算得到一系列数据,见表7-27-2。 表表7-2 X7-2 XP P(3.53.5)的)的 PoissonPoisson分布分布 2021/3/11356第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG(四)(四)PoissonPoisson分布的可加性分布的可加性从同一个服从从同一个服从PoissonPoisson分布的总体中抽取若干分布的总体中抽取若干个样本或观察单元,分别取得样本计数值个样本或观察单元,分别取得样本计数值X X

270、1 1,X X2 2,X X3 3,X Xn n,则,则Xi仍然服从仍然服从PoissonPoisson分布分布。根据此性质,若抽样时的样本计数根据此性质,若抽样时的样本计数X X值较小时,值较小时,可以多抽取几个观察单元,取得计数可以多抽取几个观察单元,取得计数X Xi i, ,将其将其合并以增大合并以增大X X计数值。计数值。 2021/3/11357第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG三、三、PoissonPoisson分布与二项分布的比较分布与二项分布的比较 vPoisson分布也是以贝努里模型为基础的。实际上,分布也是以贝努里模型为基础的。实际上

271、,Poisson分布是二项分布的一种特殊情形,即稀有事例分布是二项分布的一种特殊情形,即稀有事例A出现的概率很小,而试验次数出现的概率很小,而试验次数n很大,也可将试验次很大,也可将试验次数数n看作是一个单元。此时,看作是一个单元。此时, n或或np=为一个常数,为一个常数,二项分布就非常近似二项分布就非常近似Poisson分布。或分布。或p愈小,愈小,n愈大,愈大,近似程度愈好。近似程度愈好。v设设1。当当n=100,=0.01时时,及及n=1000,=0.001时时,按按照照二二项项分分布布及及Poisson分分布布计计算算概概率率P(X)。计计算算结结果果见表见表7-3。2021/3/1

272、1358第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG表表7 73 3 二项分布与二项分布与PoissonPoisson分布计算的概率值比较分布计算的概率值比较 2021/3/11359第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG余类推。余类推。 1.按二项分布计算按二项分布计算已知:已知:n=100,=0.01,1=0.99,代入公式有:,代入公式有:2021/3/11360第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG2.2.按按PoissonPoisson分布计算分布计算 代入公式有:代入公式有: 余类

273、推。余类推。 2021/3/11361第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG四、四、PoissonPoisson分布的应用分布的应用 PoissonPoisson分布有分布有多种用途多种用途。 主要包括总体均数可信区间的估计,主要包括总体均数可信区间的估计, 样本均数与总体均数的比较,样本均数与总体均数的比较, 两样本均数的比较等。两样本均数的比较等。 应应用用PoissonPoisson分分布布处处理理医医学学资资料料时时,一一定定要要注注意意所所处处理理资资料料的的特特点点和和性性质质,资资料料是是否否服服从从PoissonPoisson分布。分布。20

274、21/3/11362第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG(一)总体均数的估计(一)总体均数的估计 总体均数的估计包括总体均数的估计包括点估计和区间估计。点估计和区间估计。 点点估估计计是是指指由由样样本本获获得得的的稀稀有有事事件件A A出出现现的的次次数数X X值值,作作为为总总体体均均数数的的估估计计值值。该该法法的的优优点点是是计计算算简简便便,但但缺缺点点是是无无法法得得知知样样本本代代表表总总体体均均数数的的可可信信程程度。度。 区区间间估估计计可可以以确确切切获获知知总总体体均均数数落落入入一一个个区区域域的可信度,一般可信度取的可信度,一般可

275、信度取9595或或9999。2021/3/11363第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG 估估计计总总体体均均数数可可信信区区间间一一般般分分为为小小样样本本法法和和大大样样本本法法。小小样样本本一一般般指指样样本本均均数数或或样样本本计计数数值值X X5050的的情情形形,可可直直接接通通过过查查表表法法得得到到可可信信区区间间。当当样样本本均均数数X X5050时时,PoissonPoisson分分布布近似正态分布,可按正态分布处理资料。近似正态分布,可按正态分布处理资料。 1.1.小小样样本本法法 当当样样本本均均数数或或样样本本计计数数值值X X5

276、050时时,可可直直接接查查附附表表9 9,“PoissonPoisson分分布布的的可信区间可信区间”表,得到可信区间。表,得到可信区间。 2021/3/11364第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENGq 例例7.57.5 在在20ml20ml的当归浸液中含某种颗粒的当归浸液中含某种颗粒3030个。试分析该单元浸液中总体颗粒数的个。试分析该单元浸液中总体颗粒数的9595和和9999的可信区间。的可信区间。 分析:分析:将将20ml当归浸液看作一个单元,该单元的样本均当归浸液看作一个单元,该单元的样本均数数X30,小于,小于50。可查附表。可查附表9,求出总

277、体均数,求出总体均数的可信的可信区间。区间。查附表查附表9(205页页)得得:总体均数总体均数95的可信区间为的可信区间为(20.2,42.8)总体均数总体均数99的可信区间为的可信区间为(17.7,47.2)2021/3/11365第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG2.2.正态近似法正态近似法 当样本均数或计数当样本均数或计数X X5050时,可按时,可按正态分布法处理。正态分布法处理。 总体均数总体均数95的可信区间为的可信区间为总体均数总体均数99的可信区间为的可信区间为2021/3/11366第7章二项分布与泊松分布共666页END返回章目录返回

278、总目录C.CHENG例例7.67.6 某防疫站检测某天然水库中的细菌总数。平均每某防疫站检测某天然水库中的细菌总数。平均每毫升毫升288288个细菌菌落。求该水体每毫升个细菌菌落。求该水体每毫升9595和和9999的可信的可信区间。区间。 应用公式有:应用公式有:95的可信区间的可信区间=(255.74,320.26)99的可信区间的可信区间=(244.22,331.78)2021/3/11367第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG(1) (1) 发病人数的发病人数的9595可信区间为:可信区间为: 例例7.7调调查查1985年年某某市市某某区区30万万人

279、人,流流行行性性出出血血热热发发病病人人数数为为204人人。求求该该市市发发病病人人数数及及发发病病率率(110万万)95的可信区间。的可信区间。分析:已知样本均数分析:已知样本均数X为为204人,观察单元人,观察单元n30万人。万人。先计算出发病人数的可信区间,再按照发病率的要求先计算出发病人数的可信区间,再按照发病率的要求以以10万人作为观察单元,计算发病率可信区间的上下万人作为观察单元,计算发病率可信区间的上下限值。限值。= =(176176,232232) 2021/3/11368第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG(2) (2) 发病率的发病率的

280、9595可信区间为:可信区间为: 上限值:上限值:下限值:下限值:2021/3/11369第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG(二)样本均数与总体均数的比较(二)样本均数与总体均数的比较v 常用的方法有两种。常用的方法有两种。v 直直接接计计算算概概率率法法:与与二二项项分分布布的的计计算算思思路路基基本本相相同同。即即当当2020时时,按按PoissonPoisson分分布布直直接计算概率值。接计算概率值。v 正正态态近近似似法法:当当2020时时,PoissonPoisson分分布布接接近近正正态态分分布布。按按正正态态分分布布使使用用u u检检验验处

281、处理理资资料。料。2021/3/11370第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG1.1.直接计算概率法直接计算概率法 q例例7.8某某地地区区以以往往胃胃癌癌发发病病率率为为1万万。现现在在调调查查10万万人人,发发现现3例例胃胃癌癌病病人人。试试分分析析该该地区现在的胃癌发病率是否低于以往的发病率。地区现在的胃癌发病率是否低于以往的发病率。H0: 现现在在胃胃癌癌发发病病率率与与以以往往相相同同, 0 =0.0001H1:现在胃癌发病率低于以往,现在胃癌发病率低于以往,0单侧单侧0.052021/3/11371第7章二项分布与泊松分布共666页END返回章

282、目录返回总目录C.CHENG(2 2)计算概率值)计算概率值 q已知:已知:n=100000,=0.0001,n=1000000.0001=10。q根据题意,应计算小于等于根据题意,应计算小于等于3人发病的概率人发病的概率P(X3),),即:即:P(X3)P(0)P(1)+P(2)+P(3)q应用公式(应用公式(7.14)及()及(7.15)有:)有:2021/3/11372第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG(3 3)推断结论)推断结论 本例本例P P0.01030.0103,小于,小于P P0.050.05。在在0.050.05水准上拒绝水准上拒绝H

283、H0 0,接受,接受H H1 1。可以认为。可以认为现在该地区胃癌发病率低于以往发病率。现在该地区胃癌发病率低于以往发病率。 2021/3/11373第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG2 2正态近似法正态近似法 当当2020时,用时,用u u检验法。检验法。例例7.9根根据据医医院院消消毒毒卫卫生生标标准准,细细菌菌总总数数按按每每立立方方米米菌菌落落形形成成单单位位(CFUm3)表表示示。无无菌菌间间的的卫卫生生标标准准为为细细菌菌菌菌落落数数应应不不大大于于200(CFUm3)。某某医医院院引引进进三三氧氧消消毒毒机机,每每天天自自动动对对无无菌菌间

284、间进进行行2小小时时消消毒毒。对对无无菌菌间间抽抽样样调调查查显显示示,细细菌菌总总数数为为121CFUm3。试试问该医院无菌间的细菌总数低于国家卫生标准。问该医院无菌间的细菌总数低于国家卫生标准。2021/3/11374第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENGq(1)建立检验假设建立检验假设H0:无菌间的细菌总数符合国家卫生标准,无菌间的细菌总数符合国家卫生标准,=0=200H1:无菌间的细菌总数低于国家卫生标准,无菌间的细菌总数低于国家卫生标准, u u0.00050.0005, , 故故P P0.00050.0005。推断结论推断结论 因因P P0.00

285、05 u u0.0010.001, , 故故P P0.0010.001。推断结论推断结论 因因P P0.001,则,则P0.005。(6)推推断断结结论论在在0.05水水准准上上拒拒绝绝H0,接接受受H1,差差异异有有统统计计学学意意义义。可可以以认认为为三三个个病病房房的的细细菌菌总总数数不不全全相相同同,即即三三个个病病房的细菌污染状况不同。房的细菌污染状况不同。2021/3/11395第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG(五)应用(五)应用PoissonPoisson分布的注意事项分布的注意事项1.Poisson分分布布的的观观察察单单元元具具有有可

286、可加加性性。当当样样本本均均数数X或或样样本本计计数数值值20时时,可可通通过过增增加加或或合合并并观观察察单单元元以以增增大大样样本本均均数数或或样样本本计计数数值值。当当X20时时,Poisson分分布布近近似似正正态态分分布布,可可按按正正态态分分布布进进行行Poisson分布均数比较的分布均数比较的u检验。检验。2021/3/11396第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG2.Poisson分分布布的的观观察察单单元元可可以以由由大大缩缩小小,而而不不可可以以由由小小扩扩大大。例例如如,实实际际观观察察1个个平平皿皿中中的的细细菌菌菌菌落落数数为为3

287、4个个,不不能能据据此此将将其其扩扩大大而而认认为为10个个平平皿皿的的菌菌落落数数为为340个个。如如果果实实际际观观察察了了10个个平平皿皿的的菌菌落落数数为为340个个,可可以以将将其其缩缩小小而而认为认为2个平皿有个平皿有68个菌落数。个菌落数。3判判断断一一组组数数据据或或一一个个资资料料是是否否服服从从Poisson分分布布,主主要要是是依依靠靠以以往往积积累累的的经经验验或或专专业业知知识识。必必要要时时也也可可进进行行拟拟合合优优度度检检验验以以确确定定资资料料分分布布类型。类型。2021/3/11397第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENG

288、第三节第三节二项分布与二项分布与PoissonPoisson分布的分布的拟合优度检验拟合优度检验在实际工作中,科研人员经常需要了解取得的在实际工作中,科研人员经常需要了解取得的数据的分布特征。了解数据的分布特征一般有数据的分布特征。了解数据的分布特征一般有两种方法。一是根据以往积累的经验来判断,两种方法。一是根据以往积累的经验来判断,二是由公式进行检验。后者常用的方法为拟合二是由公式进行检验。后者常用的方法为拟合优度检验(优度检验(goodnessoffittest),也称为配合),也称为配合适度检验。其目的是检验数据的频数分布与一适度检验。其目的是检验数据的频数分布与一个已知分布是否相符合。

289、常用的拟合优度检验个已知分布是否相符合。常用的拟合优度检验为检验。为检验。其基本方法与步骤其基本方法与步骤:略。略。2021/3/11398第7章二项分布与泊松分布共666页END返回章目录返回总目录C.CHENGThankYouforListening2021/3/11399第7章二项分布与泊松分布END返回章目录C.CHENG返回总目录 共666页主讲主讲 程程 琮琮泰山医学院预防医学教研室泰山医学院预防医学教研室医学统计学医学统计学临床医学本科生用2021/3/11400第8章秩和检验END返回章目录C.CHENG返回总目录 共666页Chinese Teaching PlanChine

290、se Teaching Plan for Medical Studentsfor Medical StudentsMedical StatisticsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege2021/3/11401第8章秩和检验END返回章目录C.CHENG返回总目录 共666页第8章秩和检验 目录q 第五节第五节 多个样本间两两比较的秩和检验多个样本间两两比较的秩和检验q 第二节第二节 配对设计资料的秩和检验配对设计资料的秩和检验q 第三节第三节 两样本比较的秩和检验两样本比较的秩和检验q 第四节第四节

291、完全随机设计多个样本比较的秩完全随机设计多个样本比较的秩和检验和检验q 第一节第一节 非参数统计的概念非参数统计的概念q 第六节第六节 随机区组设计资料的秩和检验随机区组设计资料的秩和检验q 第七节随机区组设计资料的两两比较第七节随机区组设计资料的两两比较2021/3/11402第8章秩和检验END返回章目录C.CHENG返回总目录 共666页教学目的及要求教学目的及要求第八章第八章 秩和检验秩和检验掌握秩和检验的应用条件及其基本概念。掌握秩和检验的应用条件及其基本概念。掌握秩和检验的基本思想及分析方法。掌握秩和检验的基本思想及分析方法。掌握秩和检验编排秩次的基本方法。掌握秩和检验编排秩次的基

292、本方法。2021/3/11403第8章秩和检验END返回章目录C.CHENG返回总目录 共666页第一节第一节 非参数统计的概念非参数统计的概念 秩和检验(秩和检验(rank sum testrank sum test)属于非参数统计属于非参数统计(nonparametric statisticsnonparametric statistics)。它的假设检验是推)。它的假设检验是推断总体分布是否相同,而不是推断总体参数是否相等,断总体分布是否相同,而不是推断总体参数是否相等,故称为故称为非参数检验(非参数检验(nonparametric testnonparametric test)。非参数

293、。非参数检验有时也称为检验有时也称为任意分布检验(任意分布检验(freefree istributionistribution)。 参数统计:如参数统计:如t t检验、检验、F F检验统计推断的是两个或多个检验统计推断的是两个或多个总体均数(总体参数)是否相等,这类统计方法称为总体均数(总体参数)是否相等,这类统计方法称为参数统计(参数统计(parametric statisticsparametric statistics)。)。2021/3/11404第8章秩和检验END返回章目录C.CHENG返回总目录 共666页非参数检验适用于以下类型的资料: 1.1.等等级级资资料料(有有序序分分类

294、类资资料料)。如如疗疗效效按按治治愈愈、显显效效、有有效效、无无效效分分组组的的资资料料;临临床床化化验验结结果果按按“、+、+、+”分组的资料等。分组的资料等。2.2.偏偏态态分分布布资资料料。当当观观察察值值呈呈偏偏态态或或极极度度偏偏态态分分布布,而而又又未未经经变变量变换或虽经变换但仍未达到正态或近似正态分布。量变换或虽经变换但仍未达到正态或近似正态分布。3.3.分分布布不不明明的的资资料料。如如新新指指标标分分布布形形态态不不明明;小小样样本本,但但不不趋趋向向正态分布资料。正态分布资料。4.4.各组方差明显不齐,各组方差明显不齐,且不易变换达到齐性。且不易变换达到齐性。5.5.组组

295、内内个个别别观观察察值值偏偏离离过过大大的的资资料料。这这里里指指随随机机的的偏偏离离,而而不不是是“过失误差过失误差”。6.6.开开口口分分组组资资料料。数数据据分分组组某某一一端端或或两两端端无无明明确确数数值值的的资资料料,只只给给出出一一个个下下限限或或上上限限,而而没没有有具具体体数数值值,如如0.01g 0.01g 、6060岁岁等。等。2021/3/11405第8章秩和检验END返回章目录C.CHENG返回总目录 共666页非参数检验的特点非参数检验的特点非参数检验非参数检验特点特点:1。主要优点是不受总体分布的限制,适用范围广。主要优点是不受总体分布的限制,适用范围广。2。但但

296、对对适适宜宜用用参参数数统统计计检检验验的的资资料料,若若用用非非参参数数检检验验处处理理,常常损损失失部部分分信信息息,降降低低统统计计检检验验效效率率,即即犯犯第第二二类类错误的概率错误的概率比参数检验大。比参数检验大。3。对对于于适适合合参参数数统统计计检检验验条条件件的的资资料料或或经经变变量量变变换换后后适适合合于于参参数数统统计计检检验验,应应最最好好用用参参数数检检验验。当当资资料料不不具具备备用参数检验的条件时,非参数检验是很有效的分析方法。用参数检验的条件时,非参数检验是很有效的分析方法。2021/3/11406第8章秩和检验END返回章目录C.CHENG返回总目录 共666

297、页第二节第二节 配对设计资料的秩和检验配对设计资料的秩和检验(WilcoxonWilcoxon配对法)配对法) 例例8.112名宇航员航行前及返航后名宇航员航行前及返航后24小时的心率(次小时的心率(次/分)变化如表分)变化如表8-1。问航行对心率有无影响?。问航行对心率有无影响?(1)建立检验假设建立检验假设H0:宇航对心率无影响,即差值的总体中位数:宇航对心率无影响,即差值的总体中位数Md=0H1:宇航对心率有影响,即:宇航对心率有影响,即Md0=0.05(2)求差值求差值计算每对观察值的差值计算每对观察值的差值d,见表,见表8-1第第(4)栏。)栏。2021/3/11407第8章秩和检验

298、END返回章目录C.CHENG返回总目录 共666页表表8-1 8-1 宇航员航行前后的心率比较宇航员航行前后的心率比较 编号编号航前航前航后航后差值差值 秩次秩次(1 1)(2 2)(3 3)(4 4)(5 5)1 17676939317179 92 2717168683 31 13 3707065655 54 44 4616165654 43 35 58080939313138 81212636360603 32 2T T7 7,T T71712021/3/11408第8章秩和检验END返回章目录C.CHENG返回总目录 共666页(3)编秩次编秩次是关键。是关键。按差值的绝对值从小到大编

299、秩次,按差值的绝对值从小到大编秩次,即即1、2、3、n,并按差值的正负标上正负号,如,并按差值的正负标上正负号,如表表8-1第(第(5)栏。编秩次时应注意:)栏。编秩次时应注意:遇差值为遇差值为0时,时,弃去不计,对子数弃去不计,对子数n也随之减少;也随之减少;遇有差值相等,符遇有差值相等,符号相同时,按顺序编秩次并标上相应的正负号,如本例号相同时,按顺序编秩次并标上相应的正负号,如本例差值有两个差值有两个3,两个,两个-6,按顺序编为,按顺序编为1、2、-5、-6即可;即可;遇有差值相同遇有差值相同,但符号不同时,要取平均秩次并分别,但符号不同时,要取平均秩次并分别标上相应的正负号。标上相应

300、的正负号。2021/3/11409第8章秩和检验END返回章目录C.CHENG返回总目录 共666页(4)求秩和并确定检验统计量求秩和并确定检验统计量T值值分别求出正负秩次之分别求出正负秩次之和,和,正秩和以正秩和以T+表示表示,负秩和的绝对值以负秩和的绝对值以T表示表示。T+及及T之和等于之和等于n(n+1)/2,即,即1+2+3+n之和。此式可之和。此式可验算验算T+和和T计算是否正确。计算是否正确。本例本例T+=7,T=71,其和为,其和为78,而,而12(12+1)/2=78,可见可见T+,T计算无误。计算无误。任取任取T+(或(或T)作检验统计量)作检验统计量T,本例取,本例取T=7

301、。(5)确定确定P值和作出推断结论值和作出推断结论。2021/3/11410第8章秩和检验END返回章目录C.CHENG返回总目录 共666页2)2)正态近似法正态近似法 当当n n5050超出了附表超出了附表1010,T T界值表的范围,界值表的范围,可按公式(可按公式(8.18.1)计算)计算u u值。值。 因为当因为当n n逐渐增大时,逐渐增大时,T T值的分布将逐渐逼近值的分布将逐渐逼近于均数为于均数为n n ( (n n+4) /4 +4) /4 , , 标准差为的正态分标准差为的正态分布,故可按正态分布布,故可按正态分布进行进行u u检验并作出结论。检验并作出结论。有相同差数有相同

302、差数个数较多个数较多时,用校正公式:时,用校正公式: 2021/3/11411第8章秩和检验END返回章目录C.CHENG返回总目录 共666页第三节第三节 两样本比较的秩和检验两样本比较的秩和检验(两个独立样本比较的秩和检验)(两个独立样本比较的秩和检验) 1 1。两样本比较的秩和检验(。两样本比较的秩和检验(WilcoxonWilcoxon两样本比较法)两样本比较法)适用于完全随机设计两组定量资料和等级资料的比较。适用于完全随机设计两组定量资料和等级资料的比较。2 2。例例8.28.2 测得铅作业与非铅作业工人的血铅值测得铅作业与非铅作业工人的血铅值(mol/Lmol/L)如表)如表8-2

303、8-2第(第(1 1)、()、(2 2)栏,问两组工人的)栏,问两组工人的血铅值有无差别?血铅值有无差别?2021/3/11412第8章秩和检验END返回章目录C.CHENG返回总目录 共666页表8-2 两组工人血铅值的秩和检验 非铅作业组非铅作业组秩次秩次铅作业组铅作业组秩次秩次(1)(2)(3)(4)0.2410.8290.2420.8610.50.2930.96120.3441.20140.4351.63150.5862.06160.6272.1117n2=10T1=59.5n1=7T1=93.52021/3/11413第8章秩和检验END返回章目录C.CHENG返回总目录 共666页

304、检验步骤(1)(1)建立检验假设建立检验假设H0:两组工人血铅值的总体分布位置相同:两组工人血铅值的总体分布位置相同H1:铅作业工人血铅值高于非铅作业工人:铅作业工人血铅值高于非铅作业工人单侧单侧=0.05(2)编秩编秩将两组原始数据由小到大统一编秩,编秩时如遇同组将两组原始数据由小到大统一编秩,编秩时如遇同组相同数据按顺序编秩,如本例非铅作业组有相同数据按顺序编秩,如本例非铅作业组有2个个0.24,分别编秩,分别编秩次次1、2即可;如遇不同组相同数据取原秩次的平均秩次,如两组即可;如遇不同组相同数据取原秩次的平均秩次,如两组各有一个各有一个0.86,原秩次为,原秩次为10和和11,各取平均秩

305、次,各取平均秩次(10+11)/2=10.5。(3)求秩和并确定检验统计量求秩和并确定检验统计量T值值以以n1和和n2分别代表两样本含分别代表两样本含量,量,以样本含量小者为以样本含量小者为n1,其秩和其秩和T1为统计量为统计量T;若;若n1=n2,可取,可取任一组的秩和为任一组的秩和为T。本例。本例n1=7,n2=10,检验统计量,检验统计量T=93.5。2021/3/11414第8章秩和检验END返回章目录C.CHENG返回总目录 共666页(4)确定)确定P值和作出推断结论值和作出推断结论1)查表法查表法当当n110,n2n110时,查附表时,查附表11,T界值表。查表界值表。查表时,若

306、统计量时,若统计量T值在某一行的上、下值在某一行的上、下T界值范围内,其界值范围内,其P值大于表值大于表上方相应的概率水平,差异无统计学意义;若上方相应的概率水平,差异无统计学意义;若T值恰等于上、下值恰等于上、下界值或在界值的范围以外,则界值或在界值的范围以外,则P值等于或小于相应的概率水平,值等于或小于相应的概率水平,差异有统计学意义。差异有统计学意义。本例本例T93.5,以,以n1=7,n2n13,查附表,查附表11,T界值表,单侧界值表,单侧T0.005(7,3)为为3789,现,现T值在此范围以外,故值在此范围以外,故P0.005。按单侧。按单侧=0.05,拒绝,拒绝H0,接受,接受

307、H1,差异有统计学意义。故可认为铅作,差异有统计学意义。故可认为铅作业工人的血铅值高于非铅作业工人。业工人的血铅值高于非铅作业工人。检验步骤(2)2021/3/11415第8章秩和检验END返回章目录C.CHENG返回总目录 共666页公式法:当公式法:当n n1 1或或n n2 2n n1 1超出附表超出附表1111的范围,可按的范围,可按公式(公式(8.48.4)求统计量)求统计量u u值。值。 当相同的秩次较当相同的秩次较多时(超过多时(超过25%),应对),应对u值值进行校正,进行校正,u值经值经校正后略大,校正后略大,P值值相应减少。相应减少。2021/3/11416第8章秩和检验E

308、ND返回章目录C.CHENG返回总目录 共666页表8-3 某药对支气管炎两种病情疗效的秩和检验 2021/3/11417第8章秩和检验END返回章目录C.CHENG返回总目录 共666页例例8.38.3 用某药治疗不同病情的老年慢性支气管炎病人,疗效见表用某药治疗不同病情的老年慢性支气管炎病人,疗效见表8-8-3 3第(第(2 2)、()、(3 3)栏,问该药对两种病情的疗效有无差别?)栏,问该药对两种病情的疗效有无差别?疗效疗效单纯性单纯性合并性合并性合计合计秩次范围秩次范围平均平均秩次秩次单纯性单纯性秩和秩和合并性合并性秩和秩和(1)(2)(3)(4)(5)(6)(7)(8)控制控制65

309、4210711075435102268显效显效18624108131119.52151717有效有效30235313218415847403634无效无效131124185208196.52554.52161.5合计合计n2=126n1=82208T2=12955.5T1=8780.5表表8-3 8-3 某药对支气管炎两种病情疗效的秩和检验某药对支气管炎两种病情疗效的秩和检验 2021/3/11418第8章秩和检验END返回章目录C.CHENG返回总目录 共666页检验步骤(1)(1 1)建立检验假设)建立检验假设 H H0 0:两种病情病人的疗效总体分布位置相同:两种病情病人的疗效总体分布位

310、置相同H H1 1:两种病情病人的疗效总体分布位置不同:两种病情病人的疗效总体分布位置不同=0.05=0.05(2 2)编秩)编秩 本例为等级资料,先计算各等级的合计人数,见第本例为等级资料,先计算各等级的合计人数,见第(4 4)栏,再确定秩次范围。如疗效控制者)栏,再确定秩次范围。如疗效控制者107107例,其秩次范围例,其秩次范围1 1107107,平均秩次为(,平均秩次为(1+1071+107)/2=54/2=54,依此得第(,依此得第(6 6)栏。)栏。(3 3)求两组的秩和)求两组的秩和 将第(将第(6 6)栏分别乘以第()栏分别乘以第(2 2)、()、(3 3)栏,)栏,相加即得两

311、组各自的秩和,见第相加即得两组各自的秩和,见第(7)(7)、(8)(8)栏合计。用公式栏合计。用公式(8.38.3)检查:)检查:T T1 1+ + T T2 2=8780.5+12955.5=21736=8780.5+12955.5=21736,n n ( (n n+1)/2=208209/2=21736, +1)/2=208209/2=21736, 说明计算无误。说明计算无误。2021/3/11419第8章秩和检验END返回章目录C.CHENG返回总目录 共666页4)计算)计算u值值由于由于n1=82,超出了附表超出了附表11的范围,故需用的范围,故需用u检验。本检验。本例例n1=82,

312、T=8780.5,N=208,代入公式(代入公式(8.4)。相同秩次过多)。相同秩次过多时,时,则用校正公式。则用校正公式。检验步骤(2)2021/3/11420第8章秩和检验END返回章目录C.CHENG返回总目录 共666页5)确定)确定P值和得出推断结论值和得出推断结论查附表查附表2,t界值表(界值表(=一行),一行),u0.50=0.6745,现现uc0.50。按。按=0.05的的检验水准,接受检验水准,接受H0,差异无统计学意义。尚不能认为该差异无统计学意义。尚不能认为该药对两种病情的疗效有差别。药对两种病情的疗效有差别。两组疗效评价两组疗效评价:表:表8-3可见,按照从控制到无效顺

313、序排可见,按照从控制到无效顺序排列,疗效等级愈好,平均秩次愈小;疗效等级愈差,平列,疗效等级愈好,平均秩次愈小;疗效等级愈差,平均秩次愈大,所以平均秩和小的组疗效优于平均秩和大均秩次愈大,所以平均秩和小的组疗效优于平均秩和大的组。反之,如果按照从无效到控制顺序排列,疗效等的组。反之,如果按照从无效到控制顺序排列,疗效等级愈差,平均秩次愈小;疗效等级愈好,平均秩次愈大,级愈差,平均秩次愈小;疗效等级愈好,平均秩次愈大,这时平均秩和大的组疗效优于平均秩和小的组。这时平均秩和大的组疗效优于平均秩和小的组。检验步骤(3)2021/3/11421第8章秩和检验END返回章目录C.CHENG返回总目录 共

314、666页第四节第四节 完全随机设计完全随机设计多个样本比较的秩和检验多个样本比较的秩和检验1。此方法也称为。此方法也称为Kruskal-Wallis法,即法,即H检验。检验。2。主要适用于非正态分布,而不宜用方差分析检验的。主要适用于非正态分布,而不宜用方差分析检验的定量资料以及多组等级资料的比较。定量资料以及多组等级资料的比较。例例8.4某医生分别测定了某医生分别测定了10名正常人、单纯性肥胖和名正常人、单纯性肥胖和皮质醇增多症患者血浆中总皮质醇的含量见表皮质醇增多症患者血浆中总皮质醇的含量见表8-4。问。问三组人的血浆总皮质醇含量有无差别?三组人的血浆总皮质醇含量有无差别?2021/3/1

315、1422第8章秩和检验END返回章目录C.CHENG返回总目录 共666页检验步骤(1)(1)建立检验假设建立检验假设H0:三组人的血浆总皮质醇的总体分布位置相同:三组人的血浆总皮质醇的总体分布位置相同H1:三个总体分布位置不同或不全相同:三个总体分布位置不同或不全相同=0.05(2)编秩编秩每组内数值由小到大依次排队,三组统一每组内数值由小到大依次排队,三组统一编秩。数值相同而不同组的均编为平均秩次,如正常编秩。数值相同而不同组的均编为平均秩次,如正常人组和单纯肥胖组各有一个人组和单纯肥胖组各有一个3.1,均取原秩次,均取原秩次10及及11的的平均秩值次平均秩值次10.5;在同一组内的相同数

316、值直接编相应;在同一组内的相同数值直接编相应秩次即可。秩次即可。2021/3/11423第8章秩和检验END返回章目录C.CHENG返回总目录 共666页表8-4 三组人的血浆总皮质醇测定值(g/L) 2021/3/11424第8章秩和检验END返回章目录C.CHENG返回总目录 共666页表表8-4三组人的血浆总皮质醇测定值(三组人的血浆总皮质醇测定值(g/L)检验步骤(2)正常人正常人单纯性肥胖单纯性肥胖皮质醇增多症皮质醇增多症测定值测定值秩秩次次测定值测定值秩秩次次测定值测定值秩秩次次0.410.629.8201.941.2310.2212.262.0510.6222.582.4713.

317、0232.893.110.514.025Ri96.5117.5251ni1010102021/3/11425第8章秩和检验END返回章目录C.CHENG返回总目录 共666页(3)求秩和并计算统计量)求秩和并计算统计量H值值将各组的秩次相加即得各组的秩将各组的秩次相加即得各组的秩和(和(i为组别)为组别),并按公式(并按公式(8.6)计算统计量)计算统计量H值。值。检验步骤(3)2021/3/11426第8章秩和检验END返回章目录C.CHENG返回总目录 共666页(4 4)确定)确定P P值和作出推断结论值和作出推断结论 若组数若组数k k3 3,每组,每组例数例数n ni i55时,可查

318、附表时,可查附表1212,H H界值表。若界值表。若H HH ;反之,;反之,H H H H ,P P 。若组数若组数k k3 3,或每组例数或每组例数n ni i 5 5时,时,H H分布近似服从分布近似服从X X2 2分布,可查附分布,可查附表表8 8,X X2 2界值表,得界值表,得P P值。值。本例本例n ni i均为均为1010, =3 =31=21=2,查,查X X2 2界值表,界值表, X X2 2 0.05,20.05,2=5.99=5.99,现,现H H=18.12=18.12 X X2 2 0.05,20.05,2=5.99, =5.99, 故故P P0.050.05。按。

319、按 =0.05 =0.05的水准,拒绝的水准,拒绝H H0 0,接受,接受H H1 1,差异有,差异有统计学意义。三组人的血浆总皮质醇含量有差别。统计学意义。三组人的血浆总皮质醇含量有差别。检验步骤(检验步骤(4 4)2021/3/11427第8章秩和检验END返回章目录C.CHENG返回总目录 共666页当各样本的相同秩次较多时(如超过当各样本的相同秩次较多时(如超过25%),求校正求校正Hc值值:检验步骤(5)2021/3/11428第8章秩和检验END返回章目录C.CHENG返回总目录 共666页例例8.5五种病人阴道涂片按巴氏细胞学分级的检查结五种病人阴道涂片按巴氏细胞学分级的检查结果

320、,见表果,见表8-5第(第(1)()(6)栏,问五种病人的细胞学)栏,问五种病人的细胞学分级有无程度上的差别?分级有无程度上的差别?(1)建立检验假设)建立检验假设H0:五种病人细胞学分级的总体分布位置相同:五种病人细胞学分级的总体分布位置相同H1:五个总体的位置不同或不全相同,:五个总体的位置不同或不全相同,=0.05(2)编秩)编秩先计算各等级的合计,见表先计算各等级的合计,见表8-5第(第(7)栏。)栏。再确定秩次范围和计算平均秩次,见第(再确定秩次范围和计算平均秩次,见第(8)、()、(9)栏。栏。例8.5 检验步骤(1)2021/3/11429第8章秩和检验END返回章目录C.CHE

321、NG返回总目录 共666页表8-5 五种病人阴道涂片的细胞学分级比较 2021/3/11430第8章秩和检验END返回章目录C.CHENG返回总目录 共666页表表8-5五种病人阴道涂片的细胞学分级比较五种病人阴道涂片的细胞学分级比较巴氏分巴氏分级级慢性炎慢性炎症症轻度增轻度增生生重度增重度增生生原位癌原位癌浸润癌浸润癌合合计计秩次范围秩次范围平均秩平均秩次次(1)(2)(3)(4)(5)(6)(7)(8)(9)2119000401-4020.54441305241-9266.500611314893-140116.5023154262141-202171.5000217798203-3002

322、51.5ni25255050150300Ri696.5998.53940933530180平均平均Ri27.939.478.8187.6201.22021/3/11431第8章秩和检验END返回章目录C.CHENG返回总目录 共666页(3 3)求秩和)求秩和 如(如(2 2)栏的秩和)栏的秩和T T1 1是用(是用(2 2)栏各等级的频数与)栏各等级的频数与(9 9)栏平均秩次相乘再求和,即)栏平均秩次相乘再求和,即R R1 1=2120.5=2120.5466.5=696.5466.5=696.5,余仿此得各余仿此得各R Ri i值。值。例8.5 检验步骤(2)2021/3/11432第8

323、章秩和检验END返回章目录C.CHENG返回总目录 共666页5 5)确定确定P P值和作出推断结论值和作出推断结论 本例对比组数本例对比组数k k=5=5,按按=k k1 15 51 14 4,查界值表,查界值表,X X2 2 0.05,40.05,4=9.49=9.49,现,现X X2 2 =195.53 X =195.53 X2 2 0.05,40.05,4 =9.49, =9.49, 故故P P0.05100100),大致可),大致可按下列标准估计两变量相关的程度按下列标准估计两变量相关的程度 r r0.7 0.7 高度相关高度相关0.70.7r r0.4 0.4 中度相关中度相关 0

324、.40.4r r0.2 0.2 低度相关低度相关2021/3/11459第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页图9-1 相关系数示意 2021/3/11460第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页二、相关系数的计算二、相关系数的计算 相关系数相关系数r r的计算公式:的计算公式: 第一节第一节 直线相关直线相关式中式中l lXXXX与与l lYYYY分别为变量分别为变量X X与与Y Y的离均差平方和,的离均差平方和,l lXYXY为两为两变量变量X X 、Y Y的离均差积和。的离均差积和。 2021/3/11461第9章直线相

325、关与回归END返回章目录C.CHENG返回总目录 共666页计算公式为:计算公式为:2021/3/11462第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页例例9.19.1 某某研研究究者者测测量量1010名名2020岁岁男男青青年年身身高高与与前前臂臂长长。见见表表9-19-1。问身高与前臂长有无直线相关关系?。问身高与前臂长有无直线相关关系?计算步骤:计算步骤:(1 1)由原始数据绘制散点图)由原始数据绘制散点图9-29-2,本资料呈直线相关趋势。,本资料呈直线相关趋势。 2021/3/11463第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666

326、页表9-1 身高与前臂长数据与计算表 2021/3/11464第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页(2 2)根根据据表表9-19-1原原始始数数据据计计算算出出X X,Y Y,X X2 2,Y Y2 2,XYXY 。 本例本例X X17251725,Y Y454454,X X2 2298525298525,Y Y2 22069020690,XYXY7854178541。(3 3)计算)计算X X、Y Y的离均差平方和与离均差积和的离均差平方和与离均差积和2021/3/11465第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页(4 4)

327、求相关系数)求相关系数r r2021/3/11466第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页三、相关系数的检验假设三、相关系数的检验假设检验检验r r是否来自总体相关系数是否来自总体相关系数为零的总体。为零的总体。 2021/3/11467第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页1 1。t t 检验法检验法 t t检验的计算公式检验的计算公式2021/3/11468第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页例例9.29.2 对对例例9.19.1资资料料所所得得r r值值,检检验验2020岁岁男男青青年

328、年身身高高与与前前臂长是否有直线相关关系。臂长是否有直线相关关系。(1 1)建立检验假设)建立检验假设 H Ho o:0 ,0 ,两变量间无直线相关关系两变量间无直线相关关系 H H1 1:0 ,0 ,两变量间有直线相关关系两变量间有直线相关关系0.050.05(2 2)计计算算t t值值 本本例例n n=10=10, r r=0.8227 =0.8227 ,按按公公式式(9.59.5)和公式(和公式(9.69.6) 计算计算t t值值2021/3/11469第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页(3 3)确确定定P P值值,作作出出推推断断结结论论 按按n

329、n-2=8-2=8查查t t界界值值表表,得得 0.0020.002P P0.0050.005,按按 0.050.05水水准准,拒拒绝绝H Ho o,接接受受H H1 1,故故可可认认为为2020岁岁男男青青年年身身高高与与前前臂臂长长呈呈正正直直线线相相关关关关系。系。2.2.查查表表法法 查查附附表表14, 14, r r界界值值表表列列出出了了相相关关系系数数r r与与0 0差差别别显显著著性性的的判判断断界界值值,按按自自由由度度n-2n-2查查r r界界值值表表,当当r rrr,n-2,n-2时时,则则P P ;反反之之,r r r r,n-2,n-2 时时,则则P P 。本本例例r

330、 r0.82270.8227,大大于于r r0.05(8)0.05(8)0.738 0.738 ,故故P P0.05 t t0.005(8)0.005(8) ,故故P P0.0050.005。 按按=0.05=0.05的的水水准准,拒拒绝绝HoHo,接接受受H H1 1,可可认认为为2020岁岁男男青青年年身高与前臂长有直线回归关系。身高与前臂长有直线回归关系。2021/3/11480第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页五、直线回归方程的应用五、直线回归方程的应用(一)描述两变量间的依存关系(一)描述两变量间的依存关系可用直线回归来描述可用直线回归来描述 。

331、 (二)利用回归方程进行预测(二)利用回归方程进行预测 将将X X代入直线回归方程,可得到应变量代入直线回归方程,可得到应变量Y Y的估计值。的估计值。(三)利用回归方程进行统计控制(三)利用回归方程进行统计控制通过通过X X取值来控制取值来控制Y Y的变化。的变化。 2021/3/11481第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页1 1. .作作相相关关回回归归分分析析要要有有实实际际意意义义。不不要要把把毫毫无无联联系系的的两两种种现象作相关回归分析。现象作相关回归分析。2 2. .相关关系不一定是因果关系,也可能是伴随关系。相关关系不一定是因果关系,也可能

332、是伴随关系。 3 3. .在进行直线相关与回归分析之前,应先绘制散点图,当在进行直线相关与回归分析之前,应先绘制散点图,当观察到点的分布呈直线趋势时,方可进行分析,如散点观察到点的分布呈直线趋势时,方可进行分析,如散点图呈曲线趋势,应进行曲线回归分析。图呈曲线趋势,应进行曲线回归分析。 第三节第三节 进行直线相关与回归分析时进行直线相关与回归分析时应注意的问题应注意的问题2021/3/11482第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页4.4.直线相关与回归的区别直线相关与回归的区别 在在资资料料需需求求上上,相相关关分分析析要要求求两两变变量量X X与与Y Y均

333、均为为服服从从正正态态分分布布的的随随机机变变量量,即即两两者者都都不不能能预预先先指指定定;回回归归分分析析要要求求Y Y是是正正态态随随机机变变量量,而而X X可可以以不不是是正正态态随随机机变变量量而而是是一一确确定定值值,此此时时回回归归分分析析称称为为型型回回归归,X X也也可可以以是是正正态态随机变量,此时回归分析称为随机变量,此时回归分析称为型回归。型回归。在在意意义义上上,相相关关反反映映两两变变量量的的相相关关关关系系;回回归归反反映映两两变变量间的依存关系。量间的依存关系。在在应应用用上上,说说明明两两变变量量间间的的相相关关程程度度及及相相关关方方向向用用相相关关;说明两

334、变量间的依存变化的数量关系用回归。说明两变量间的依存变化的数量关系用回归。2021/3/11483第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页5. 5. 相关与回归的联系相关与回归的联系在同一组数据,相关系数在同一组数据,相关系数r r与回归系数与回归系数b b的符号一致。的符号一致。同同一一组组数数据据,r r与与b b的的假假设设检检验验是是等等价价的的,即即t tr r= =t tb b。因因r r的的假假设设检检验验可可直直接接查查表表,较较为为简简便便,故故可可代代替替b b的的假假设设检检验。验。6. 6. 回回归归方方程程一一般般只只适适用用于于自自变

335、变量量X X的的原原始始数数据据范范围围内内,不不能能任任意意外外延延。因因为为超超出出这这个个范范围围,X X与与Y Y就就不不一一定定仍仍然然呈呈线性关系。线性关系。2021/3/11484第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页7. 7. 同一组资料由同一组资料由X X推推Y Y和由和由Y Y推推X X的直线回归方程是不同的。的直线回归方程是不同的。由由X X推推Y Y: 回归系数回归系数 回归方程回归方程截截 距距2021/3/11485第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页 由由Y Y推推X X: 回归系数回归系数 8

336、. 8. 建立回归方程的条件(时间、地点、方法、测量仪建立回归方程的条件(时间、地点、方法、测量仪器等)一旦改变,原回归方程就不宜继续使用。器等)一旦改变,原回归方程就不宜继续使用。截截 距距回归方程回归方程2021/3/11486第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页第四节第四节 等级相关等级相关v当遇到有些资料并不呈正态分布,对于此类资料就不宜用当遇到有些资料并不呈正态分布,对于此类资料就不宜用上述所讲的直线相关与回归分析,而常用等级相关处理上述所讲的直线相关与回归分析,而常用等级相关处理资料。资料。v等级相关(等级相关(rank correlationr

337、ank correlation)亦称为亦称为秩相关秩相关,适用于分,适用于分布类型不明的资料、偏态分布资料和等级资料的相关分布类型不明的资料、偏态分布资料和等级资料的相关分析。本节主要介绍析。本节主要介绍SpearmanSpearman等级相关法。等级相关法。 2021/3/11487第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页其分析步骤如下:其分析步骤如下:1. 1. 先先将将 X X、Y Y 分分别别由由小小到到大大列列出出等等级级,即即编编秩秩次次,数数字字相同时需要求平均等级;相同时需要求平均等级;2. 2. 求出每一对求出每一对 X X、Y Y 的等级之差

338、的等级之差 d d 值;值;3. 3. 按下列公式计算等级相关系数按下列公式计算等级相关系数 r rs s式中式中 r rs s 为等级相关系数,为等级相关系数,d d2 2 为等级之差,为等级之差,n n 为样为样本含量。本含量。 2021/3/11488第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页4. 4. 根根据据n n查查附附表表1515,r rs s界界值值表表,确确定定P P值值。如如r rs s r r ,n n ,则则P P ,说说明明X X、Y Y两两变变量量相相关关有有统统计计学学意意义义;如如r rs s ,说说明明X X、Y Y两两变变量量相

339、相关关无无统统计计学学意意义。义。例例9.59.5在在肝肝癌癌病病因因研研究究中中,某某地地调调查查了了1010个个乡乡肝肝癌癌死死亡亡率率(1/101/10万万)与与某某种种食食物物中中黄黄曲曲霉霉毒毒素素相相对对含含量量,见见表表9-29-2。试试分分析析黄黄曲曲霉霉毒毒素素相相对对含含量量与与肝肝癌癌死死亡亡率率有有无无相相关关的的关关系。系。2021/3/11489第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页表表9-2 9-2 黄曲霉毒素相对含量与肝癌死亡率黄曲霉毒素相对含量与肝癌死亡率 2021/3/11490第9章直线相关与回归END返回章目录C.CHE

340、NG返回总目录 共666页分析步骤:分析步骤:(1 1)建立检验假设)建立检验假设H Ho o:s s=0 =0 ,即即黄黄曲曲霉霉毒毒素素相相对对含含量量与与肝肝癌癌死死亡亡率率无无相相关关关系关系H H1 1:s s00,即即黄黄曲曲霉霉毒毒素素相相对对含含量量与与肝肝癌癌死死亡亡率率有有相相关关关系关系 =0.05 =0.05(2 2)编编秩秩次次 先先将将X X值值由由小小到到大大依依序序排排列列,再再将将两两变变量量 X X、Y Y 的的数数值值分分别别由由小小到到大大编编秩秩次次,如如有有相相同同数数值值求求平平均均秩秩次,列于表第(次,列于表第(3 3)栏和第()栏和第(5 5)

341、栏。)栏。(3 3)求求秩秩次次之之差差d d 和和 d d2 2 列列于于表表第第(6 6)栏栏和和第第(7 7)栏。栏。(4 4)计计算算等等级级相相关关系系数数r rs s 将将表表9-29-2中中数数据据代代入入公公式式(9.149.14)有)有2021/3/11491第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页(5 5)确确定定P P值值 查查附附表表1515,r rs s 界界值值表表,n n =10=10,r r0.05,100.05,10=0.648=0.648,现,现r rs s0.7455 0.7455 r r0.05,10 0.05,10 =0

342、.648=0.648 ,故,故P P0.050.05。(6 6)推断结论)推断结论 在在=0.05=0.05水准上,拒绝水准上,拒绝 H Ho o,接受,接受H H1 1,可认为黄曲霉毒素相对含量与肝癌死亡率之间存在正相可认为黄曲霉毒素相对含量与肝癌死亡率之间存在正相关关系。关关系。 2021/3/11492第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页第五节第五节 曲线直线化(曲线直线化(1 1) 一、一、曲线直线化的概述曲线直线化的概述 在医学研究中,有时两种变量间不呈直线关系,而是呈曲在医学研究中,有时两种变量间不呈直线关系,而是呈曲线关系。需要把这些关系变动的

343、特征恰当地反映出来,线关系。需要把这些关系变动的特征恰当地反映出来,需要根据实测资料的曲线类型找到能反映变量关系的曲需要根据实测资料的曲线类型找到能反映变量关系的曲线回归方程,求曲线回归方程的过程及方法叫曲线拟合。线回归方程,求曲线回归方程的过程及方法叫曲线拟合。医学上常见的曲线类型有:医学上常见的曲线类型有:指数曲线、对数曲线、双曲指数曲线、对数曲线、双曲线、抛物线和线、抛物线和“S S”型曲线等。型曲线等。2021/3/11493第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页(一)曲线直线化的用途(一)曲线直线化的用途1.1.修修匀匀 由由于于抽抽样样误误差差的的

344、影影响响,实实测测资资料料存存在在一一定定的的波波动动,难难于于绘绘出出一一条条能能完完全全符符合合每每一一观观察察点点的的光光滑滑曲曲线线,但但得得到到的的该该回回归归曲曲线线却却能能比比较较恰恰当当的的显显示示原原资资料料中中两两变变量量间间的的回回归归关关系系。因因此此经经过过修修匀匀的的曲曲线线比比原原资资料料的的观观察察点点合合理而稳定。理而稳定。2.2.估估计计 即即由由较较易易测测得得的的自自变变量量 X X 推推算算较较难难测测得得的的应应变变量量Y Y的估计值。的估计值。2021/3/11494第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页3.3.求

345、求极极大大点点或或极极小小点点 这这是是拟拟合合抛抛物物线线的的特特有有用用途途,如如细细菌菌生生长长的的最最适适温温度度是是多多少少?人人体体发发育育在在哪哪个个年年龄龄最最快快等等,这这些些数数据据很很难难从从散散点点图图上上确确定定,只只有有拟拟合合成成曲曲线线后后,才才能能根根据据曲曲线线回回归归方方程程推推算算极极大大点点或或极极小小点的最可能数值。点的最可能数值。2021/3/11495第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页(二)曲线拟合步骤(二)曲线拟合步骤1.1.定定曲曲线线型型 对对实实测测数数据据选选择择何何种种曲曲线线类类型型,一一般般要

346、要根根据据以下三个方面:以下三个方面:根据专业知识及过去经验或文献资料;根据专业知识及过去经验或文献资料;根据全部观察点在普通坐标纸上所呈现的总趋势;根据全部观察点在普通坐标纸上所呈现的总趋势;根根据据观观察察点点在在某某种种变变换换值值的的坐坐标标纸纸上上是是不不是是呈呈现现直直线线趋趋势势。如如半半对对数数纸纸上上点点图图呈呈现现直直线线趋趋势势可可选选用用指指数数曲曲线线或或对对数数曲曲线线;如如在在双双对对数数纸纸上上呈呈直直线线趋趋势势可可选选用用双双曲曲线线;如在对数概率单位纸上呈直线趋势时,可选用如在对数概率单位纸上呈直线趋势时,可选用S S型曲线。型曲线。2021/3/1149

347、6第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页2.2.直直线线化化 对对呈呈曲曲线线关关系系的的变变量量进进行行适适当当变变换换,使使变变换换后后的的两两个个变变量量之之间间呈呈直直线线关关系系,称称为为直直线线化化。直直线线化化既既可可以以验验证证所所确确定定的的曲曲线线型型是是否否恰恰当当,更更便便于于用用求求直直线线方方程程的的方方法法得得到到曲曲线线方方程程。除除多多项项式式曲曲线线可可不不必必经经直直线线化化外外,其它几类曲线拟合大多经过直线化。其它几类曲线拟合大多经过直线化。3.3.求曲线回归方程求曲线回归方程4.4.求估计值求估计值5.5.作曲线图作曲

348、线图6.6.必要时作拟合优度检验。必要时作拟合优度检验。2021/3/11497第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页二、指数与对数曲线的拟合二、指数与对数曲线的拟合这这种种X X与与Y Y之之间间的的关关系系可可归归纳纳为为下下面面二二点点:二二者者关关系系始始终终是是正正比比例例或或始始终终是是反反比比例例;变变化化始始终终是是“加加速速度度”的的或或始始终终是是“减减速速度度”的的。具具有有这这种种性性质质的的资资料料一一般般均均可可拟和指数曲线或对数曲线。拟和指数曲线或对数曲线。2021/3/11498第9章直线相关与回归END返回章目录C.CHENG

349、返回总目录 共666页指数曲线方程的一般形式为(指数曲线方程的一般形式为(9.15)若若10a=A,10b=B,则公式可表示为(,则公式可表示为(9.16)公式(公式(9.159.15)两边取对数,得()两边取对数,得(9.179.17)公式(公式(9.169.16)两边取对数,得()两边取对数,得(9.189.18)2021/3/11499第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页令令lglgA=a A=a lg lgB B= =b b 则公式(则公式(9.189.18)也变成公)也变成公式(式(9.179.17)的形式。公式()的形式。公式(9.179.17)

350、是指数)是指数曲线方程的对数形式。如令曲线方程的对数形式。如令y y=lgY =lgY 则公式则公式(9.179.17)就变成了直线回归方程形式,可)就变成了直线回归方程形式,可按最小二乘法求知直线回归方程,得按最小二乘法求知直线回归方程,得a a和和b b值后,直接可写成(值后,直接可写成(9.159.15)的形式或经求)的形式或经求得得A A= =lglg-1-1a a,B B= =lglg-1-1b b后,写成公式(后,写成公式(9.169.16)的形式。指数曲线的形式可概括为四种类的形式。指数曲线的形式可概括为四种类型,见图型,见图9-39-3。 2021/3/11500第9章直线相关

351、与回归END返回章目录C.CHENG返回总目录 共666页图图9-3 9-3 四型指数曲线的模型四型指数曲线的模型第五节第五节 曲线直线化(曲线直线化(8 8) 2021/3/11501第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页例例9.69.6 某地大气中离污染源不同距离处氰化物浓度测定结某地大气中离污染源不同距离处氰化物浓度测定结果见表果见表9-39-3。试拟合曲线。试拟合曲线。 表表9-3 9-3 某地氰化物浓度与污染源距离的关系某地氰化物浓度与污染源距离的关系2021/3/11502第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页拟合

352、曲线的步骤如下拟合曲线的步骤如下:(1 1)定定曲曲线线型型 将将表表9-39-3第第(1 1)、(2 2)栏栏各各(X,YX,Y)点点绘绘于于普普通通坐坐标标纸纸上上,得得到到图图9-49-4,对对照照图图9-39-3各各型型,接接近近型指数曲线,即型指数曲线,即lglgY Y= =a a- -bXbX. .(2 2)直直线线化化 将将表表9-39-3第第(1 1)、(2 2)栏栏数数据据在在半半对对数数纸纸上上作作图图,置置Y Y于于对对数数轴轴,X X置置于于真真数数轴轴,得得观观察察点点连连线线,见见图图9-59-5,其其分分布布近近于于直直线线,说说明明直直线线化化效效果果较较好好。

353、故故取取y y= =lgYlgY, ,见表见表9-39-3(3 3)栏。)栏。(3 3)求直线方程)求直线方程 2021/3/11503第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页图图9-4污染源距离与氰化物浓度指数曲污染源距离与氰化物浓度指数曲线线图图9-5 9-5 曲线直线化曲线直线化 2021/3/11504第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页( (二二) ) 对数曲线的拟合对数曲线的拟合当当自自变变量量X X取取常常用用对对数数,而而应应变变量量Y Y取取原原测测定定值值,则则对对数数曲曲线方程为线方程为(9.19) (9

354、.19) 2021/3/11505第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页v对数曲线(亦有书通称指数曲线)的形状亦可概括为四型对数曲线(亦有书通称指数曲线)的形状亦可概括为四型见图见图9-69-6。图图9-6 9-6 四型对数曲线模型四型对数曲线模型 2021/3/11506第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页v对对数数曲曲线线四四型型的的形形状状与与相相应应的的指指数数曲曲线线形形状状类类似似,只只是是对对数数曲曲线线方方程程是是以以X X变变量量为为对对数数,故故渐渐近近线线与与Y Y轴轴平平行行。在在选选择择曲曲线线方方

355、程程时时应应注注意意这这一一点点。对对数数曲曲线线的的拟拟合合与与指指数数曲曲线线的的拟拟合合方方法法与与步步骤骤基基本本一一样样,只只是是将将X X值值置置于于对对数数轴轴上上,Y Y值值置置于于真真数数轴轴上上,进进行行直直线线化化。如如果果X X与与Y Y尚尚未未达达到到直直线线化化,可可取取X Xk k作校正,作校正,k k的数值需经尝试,以使观察点逐步逼近直线趋势。的数值需经尝试,以使观察点逐步逼近直线趋势。v例例9.79.7 某某研研究究室室以以不不同同浓浓度度的的免免疫疫球球蛋蛋白白lglgA A(g g% %)作作火火箭电泳,测得火箭的高度(箭电泳,测得火箭的高度(mmmm)如

356、表)如表9-49-4。试拟合曲线。试拟合曲线。2021/3/11507第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页拟合曲线的步骤如下:拟合曲线的步骤如下:(1 1)确确定定曲曲线线类类型型 将将表表9-49-4第第(1 1)、(3 3)栏栏各各(X,YX,Y)点点绘绘于于普普通通坐坐标标纸纸上上,得得图图9-79-7上上的的观观察察点点。对对照图照图9-69-6各型,接近各型,接近型对数曲线,即型对数曲线,即Y Y= =a+ba+blglgX X (2 2)直直线线化化 将将表表9-49-4第第(1 1)(3 3)栏栏数数据据在在半半对对数数纸纸上上作作图图,置置X

357、 X于于对对数数轴轴,Y Y于于真真数数轴轴,得得观观察察点点见见图图9-89-8。其其分分布布近近于于直直线线,说说明明直直线线化化效效果果较较好好。故故取取x x=lg=lgX X,见见表表9-49-4第(第(2 2)栏。)栏。2021/3/11508第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页表表9-4lgA浓度与火箭高度之间的关系浓度与火箭高度之间的关系2021/3/11509第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页图图9-7 Ig9-7 IgA A浓度与火箭高度的浓度与火箭高度的 对数拟合曲线对数拟合曲线 图图9-8 9-8

358、 对数曲线直线化对数曲线直线化 2021/3/11510第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页v则直线方程为则直线方程为 v求对数曲线方程求对数曲线方程 将将x xlglgX X代入直线方程得代入直线方程得 2021/3/11511第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页三、曲线方程的假设检验和拟合优度三、曲线方程的假设检验和拟合优度 v当当用用拟拟合合的的曲曲线线回回归归方方程程描描述述两两变变量量间间的的曲曲线线关关系系时时,经经常常需需要要回回答答两两个个问问题题:一一是是拟拟合合的的曲曲线线方方程程有有无无意意义义,即即

359、此此曲曲线线关关系系能能否否成成立立;二二是是拟拟合合的的效效果果如如何何。回回答答第第一一个个问问题题需需要要作作曲曲线线回回归归方方程程的的假假设设检检验验;回回答答第第二二个个问题可用相关系数的大小说明。问题可用相关系数的大小说明。v曲曲线线回回归归方方程程是是否否有有统统计计学学意意义义,可可以以用用方方差差分分析析来来检检验。其公式为:验。其公式为:2021/3/11512第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页v 计计算算出出F F值值后后,根根据据 1 1回回归归 , , 2 2 剩剩余余 ,查查附附表表4, 4, F F界值表,得出界值表,得出P

360、 P值,按所选择的检验水准作出结论。值,按所选择的检验水准作出结论。v 在曲线回归方程有统计学意义的前提下,曲线拟合得好在曲线回归方程有统计学意义的前提下,曲线拟合得好坏可以看坏可以看l l剩余剩余的大小。如果的大小。如果l l剩余剩余对对l l总总的比例愈小,说明实的比例愈小,说明实际观察值与估计愈接近,曲线拟合得愈好;反之愈差。际观察值与估计愈接近,曲线拟合得愈好;反之愈差。这种拟合度,可以用相关指数(这种拟合度,可以用相关指数(R R2 2)来表示。)来表示。R R2 2愈接近愈接近1 1,表示拟合得愈好。计算公式为:,表示拟合得愈好。计算公式为: 2021/3/11513第9章直线相关

361、与回归END返回章目录C.CHENG返回总目录 共666页例例9.8以例以例9.6已经拟合成指数曲线为例,对曲线方程进已经拟合成指数曲线为例,对曲线方程进行假设检验并判断拟合的情况。已经拟合的曲线方程为,行假设检验并判断拟合的情况。已经拟合的曲线方程为,按指数曲线方程计算其估计值,见表按指数曲线方程计算其估计值,见表9-5。指数曲线拟合的相关指数为:指数曲线拟合的相关指数为:说明指数曲线拟合较好。说明指数曲线拟合较好。2021/3/11514第9章直线相关与回归END返回章目录C.CHENG返回总目录 共666页THANGYOUFORLISTENING2021/3/11515第9章直线相关与回

362、归END返回章目录C.CHENG返回总目录 共666页医学统计学医学统计学 主 讲 程琮泰山医学院预防医学教研室泰山医学院预防医学教研室本科生用本科生用2021/3/11516第10章实验设计END返回章目录C.CHENG返回总目录 共666页TeachingPlanforMedicalStudentsMedicalStatisticsProfessorChengCongDept.ofPreventiveMedicineTaishanMedicalCollege2021/3/11517第10章实验设计END返回章目录C.CHENG返回总目录 共666页第第1010章实验设计章实验设计 目录目录

363、q第五节第五节常用实验设计方法常用实验设计方法q第二节第二节实验设计的基本要素实验设计的基本要素q第三节第三节实验设计的基本原则实验设计的基本原则q第四节第四节样本含量的估计样本含量的估计q 第一节第一节 实验研究实验研究2021/3/11518第10章实验设计END返回章目录C.CHENG返回总目录 共666页第十章第十章 实验设计实验设计 v1。掌握实验设计的基本概念及意义。掌握实验设计的基本概念及意义。v2。掌握实验设计的三个基本要素及四个基本原则。掌握实验设计的三个基本要素及四个基本原则。v3。了解样本含量估计的意义及常用方法。了解样本含量估计的意义及常用方法。v4。熟悉常用实验设计方

364、法。熟悉常用实验设计方法。2021/3/11519第10章实验设计END返回章目录C.CHENG返回总目录 共666页第一节第一节 实验研究实验研究一、实验设计的概念一、实验设计的概念 实验研究实验研究(experimental research )(experimental research )是使设计的实验是使设计的实验因素或处理因素在其它干扰因素被严格控制的条件下,因素或处理因素在其它干扰因素被严格控制的条件下,观察其对实验结果或实验效应的作用及影响。观察其对实验结果或实验效应的作用及影响。 实验设计实验设计(experiment design)(experiment design)是指

365、研究人员对实验因是指研究人员对实验因素作合理的、有效的安排,最大限度地减少实验误差,素作合理的、有效的安排,最大限度地减少实验误差,使实验研究达到高效、快速和经济的目的。使实验研究达到高效、快速和经济的目的。 2021/3/11520第10章实验设计END返回章目录C.CHENG返回总目录 共666页医学实验设计医学实验设计( (medical experimental design)medical experimental design)是将实是将实验设计的基本原理和方法应用于医学领域,主要包括验设计的基本原理和方法应用于医学领域,主要包括基础医学、临床医学和预防医学。其目的是研究如何基础医

366、学、临床医学和预防医学。其目的是研究如何科学地、合理地安排实验因素,研究并排除实验中所科学地、合理地安排实验因素,研究并排除实验中所有影响实验结果及效应的各种干扰因素的作用。有影响实验结果及效应的各种干扰因素的作用。干扰因素干扰因素也称为非处理因素或背景因素,它是指处理也称为非处理因素或背景因素,它是指处理因素以外的可以影响实验效应及实验结果的一切可能因素以外的可以影响实验效应及实验结果的一切可能的因素。的因素。 2021/3/11521第10章实验设计END返回章目录C.CHENG返回总目录 共666页非非处处理理因因素素 一一般般多多为为受受试试对对象象本本身身的的特特征征及及外外界界环环

367、境境因因素素,其其来来源源复复杂杂,范范围围广广,经经常常不不易易控控制制或或不不易易察觉。察觉。实实验验设设计计的的基基本本构构成成 包包括括三三个个基基本本要要素素及及四四个个基基本本原则。原则。三个基本要素是三个基本要素是:受试对象,处理因素和试验效应。:受试对象,处理因素和试验效应。四四个个基基本本原原则则是是:随随机机化化的的原原则则,对对照照的的原原则则,重重复复的原则及均衡的原则。的原则及均衡的原则。2021/3/11522第10章实验设计END返回章目录C.CHENG返回总目录 共666页实验设计的基本构成三个基本要素四个基本原则受试对象处理因素试验效应 随机化的原则对照的原则

368、重复的原则均衡的原则2021/3/11523第10章实验设计END返回章目录C.CHENG返回总目录 共666页实验研究主要具有实验研究主要具有三个基本特点:三个基本特点:第一第一,研究人员能够按照实验设计的目的及要求设置,研究人员能够按照实验设计的目的及要求设置处理因素。处理因素。第二第二,受试对象可以通过随机化原则随机地接受某种,受试对象可以通过随机化原则随机地接受某种处理因素或某种处理因素的不同水平。处理因素或某种处理因素的不同水平。第三第三,由于应用了随机化原则,使各比较组之间达到,由于应用了随机化原则,使各比较组之间达到了较好的均衡性,因而,最大限度地减少了非处理因了较好的均衡性,因

369、而,最大限度地减少了非处理因素对实验效应及结果的干扰和影响。素对实验效应及结果的干扰和影响。 二、实验研究的特点二、实验研究的特点2021/3/11524第10章实验设计END返回章目录C.CHENG返回总目录 共666页由于实验研究具备这三个特点,就使得实验研究中各由于实验研究具备这三个特点,就使得实验研究中各比较组之间具有较好的均衡性及可比性,大大减少了比较组之间具有较好的均衡性及可比性,大大减少了各种非处理因素或背景干扰因素对实验效应及结果的各种非处理因素或背景干扰因素对实验效应及结果的影响,可以更为有效地控制实验误差,提高了实验研影响,可以更为有效地控制实验误差,提高了实验研究的效率及

370、实验结果的可靠性。究的效率及实验结果的可靠性。 2021/3/11525第10章实验设计END返回章目录C.CHENG返回总目录 共666页实实验验研研究究有有多多种种分分类类方方法法,一一般般常常根根据据受受试试对对象象的的特特征分为三大类:征分为三大类:1.1.动动物物实实验验(animal (animal experiment)experiment) 是是指指用用人人工工饲饲养养繁繁殖殖的的动动物物进进行行实实验验研研究究。其其特特点点是是,容容易易控控制制处处理理因因素素及及背背景景干干扰扰因因素素,实实验验误误差差较较小小,实实验验成成本本较较低低,观观察察的的实实验验效效应应较较为

371、为客客观观。如如果果在在实实验验研研究究中中,出出现现因因各各种种原原因因而而导导致致动动物物意意外外死死亡亡或或缺缺失失时时,可可据据情情予予以补充,收集资料及分析资料均较为方便。以补充,收集资料及分析资料均较为方便。三、实验研究的分类三、实验研究的分类2021/3/11526第10章实验设计END返回章目录C.CHENG返回总目录 共666页1 1。动动物物实实验验 几几乎乎可可用用于于医医学学研研究究的的各各个个领领域域。由由于于动动物物与与人人体体之之间间在在种种属属等等等等方方面面存存在在巨巨大大差差异异,因因此此,动动物物实实验验的的研研究究结结果果不不能能直直接接推推论论到到人人

372、体体上上,而而是是可可以以作作为人体研究的参考依据或基础数据。为人体研究的参考依据或基础数据。常常用用于于医医学学研研究究的的实实验验动动物物有有大大白白鼠鼠、小小白白鼠鼠、豚豚鼠鼠、兔兔子子、猫猫、狗狗、羊羊和和猪猪等等,还还可可以以是是猴猴及及灵灵长长目目类类动动物物。各各种种动动物物都都有有其其自自身身的的特特点点,选选择择动动物物时时,要要根根据据研研究究目目的的先先确确定定动动物物的的种种类类,还还应应特特别别注注意意动动物物的的性性别别、年年龄、品系等特征。龄、品系等特征。2021/3/11527第10章实验设计END返回章目录C.CHENG返回总目录 共666页v 临床试验临床试

373、验 是指按科学的实验方法,研究疾病在临床是指按科学的实验方法,研究疾病在临床阶段规律的试验。临床试验研究的对象主要是阶段规律的试验。临床试验研究的对象主要是病人或病人或健康人健康人。1 1)选择病人可以作为实验组也可以作为对照组。一般选择病人可以作为实验组也可以作为对照组。一般是选择患某种确诊疾病的患者为观察病例。选择病人是选择患某种确诊疾病的患者为观察病例。选择病人除考虑病人本身的特征外,还要考虑疾病的特征,如除考虑病人本身的特征外,还要考虑疾病的特征,如病情的发展状况,常规治疗方案的疗效情况,病人的病情的发展状况,常规治疗方案的疗效情况,病人的生存状况是否存在危险等等方面。生存状况是否存在

374、危险等等方面。 2.2.临床试验(临床试验(clinical clinical trialtrial)2021/3/11528第10章实验设计END返回章目录C.CHENG返回总目录 共666页2 2)选择健康人)选择健康人 一般是作为试验的对照组,考虑的各方面因素与病一般是作为试验的对照组,考虑的各方面因素与病人相同或相近。人相同或相近。由于人的背景因素及个性特征极为复由于人的背景因素及个性特征极为复杂杂,在进行临床试验研究时,除考虑上述因素外,还,在进行临床试验研究时,除考虑上述因素外,还要考虑医德等方面的问题。在选择病人及健康人、选要考虑医德等方面的问题。在选择病人及健康人、选择处理因素

375、时,要非常慎重。试验前应该经过科研小择处理因素时,要非常慎重。试验前应该经过科研小组成员及有关专家的认真讨论,并进行周密设计,以组成员及有关专家的认真讨论,并进行周密设计,以避免出现各种意外情况。因此,针对人体的临床试验避免出现各种意外情况。因此,针对人体的临床试验研究与动物试验研究存在很大的区别。这是每位医学研究与动物试验研究存在很大的区别。这是每位医学科研工作者应该十分注意的。科研工作者应该十分注意的。 2021/3/11529第10章实验设计END返回章目录C.CHENG返回总目录 共666页3 3。社社区区干干预预试试验验(community community interventio

376、n intervention trialtrial) 是是指指对对社社区区中中的的所所有有人人群群施施加加某某种种处处理理因因素素并并观观察察一一段较长的时间。段较长的时间。其其目目的的是是通通过过干干扰扰某某些些在在人人群群中中存存在在的的危危险险因因素素或或施施加加某某种种保保护护性性措措施施,观观察察处处理理因因素素在在社社区区人人群群中中产产生生的的效效应应或或预预防防效效果果。典典型型的的社社区区干干预预试试验验的的实实例例之之一一是是在在社社区区人人群群的的饮饮水水中中加加入入氟氟化化物物以以观观察察是是否否能能够够降降低低人人群群的的龋龋齿齿发发生生率率的的试试验验。由由于于社社

377、区区干干预预试试验验中中涉涉及及人人群群数数量量多多,人人群群结结构构复复杂杂,不不易易控控制制处处理理因因素素及及背背景景干干扰扰因因素素,且且难难以以对对人人群群给给予予处处理理因因素素时时进进行行随随机机化化分分配配,其其试试验验效效果果及及效效应应的的确确切切性性往往往往不不易易准准确确判断或确定。判断或确定。2021/3/11530第10章实验设计END返回章目录C.CHENG返回总目录 共666页典典型型的的社社区区干干预预试试验验的的实实例例之之一一是是在在社社区区人人群群的的饮饮水水中中加加入入氟氟化化物物以以观观察察是是否否能能够够降降低低人人群群的的龋龋齿齿发发生生率率的的

378、试试验验。由由于于社社区区干干预预试试验验中中涉涉及及人人群群数数量量多多,人人群群结结构构复复杂杂,不不易易控控制制处处理理因因素素及及背背景景干干扰扰因因素素,且且难难以以对对人人群群给给予予处处理理因因素素时时进进行行随随机机化化分分配配,其其试试验验效效果及效应的确切性往往不易准确判断或确定。果及效应的确切性往往不易准确判断或确定。第一节第一节 实验研究实验研究2021/3/11531第10章实验设计END返回章目录C.CHENG返回总目录 共666页第二节第二节 实验设计的基本要素实验设计的基本要素实验设计有实验设计有三个基本要素三个基本要素,即受试对象、处理因素和,即受试对象、处理

379、因素和实验效应。三个基本要素是相互联系的。实验效应。三个基本要素是相互联系的。 在实验设计阶段,研究人员应根据实验研究的目的,在实验设计阶段,研究人员应根据实验研究的目的,紧紧抓住这三个基本要素,并应通盘考虑如何去合理紧紧抓住这三个基本要素,并应通盘考虑如何去合理有效地安排这三个基本要素。只有这样,实验设计才有效地安排这三个基本要素。只有这样,实验设计才会有明确的方向。会有明确的方向。实验设计是实验研究中最为重要和实验设计是实验研究中最为重要和关键的第一步。必须给予高度重视。关键的第一步。必须给予高度重视。有些研究人员未能充分认识到这第一步的重要性。经有些研究人员未能充分认识到这第一步的重要性

380、。经常是先进行实验研究工作,其后才考虑实验设计问题。常是先进行实验研究工作,其后才考虑实验设计问题。 2021/3/11532第10章实验设计END返回章目录C.CHENG返回总目录 共666页一、受试对象一、受试对象受试对象(受试对象(study subjectsstudy subjects)是指在实验研究中研究是指在实验研究中研究人员所要观察的客体,即处理因素作用的对象。受试人员所要观察的客体,即处理因素作用的对象。受试对象主要包括人、动物、微生物以及人或动物的试验对象主要包括人、动物、微生物以及人或动物的试验材料。如器官、组织、细胞、血液、尿液、粪便等。材料。如器官、组织、细胞、血液、尿

381、液、粪便等。 第二节 实验设计的基本要素2021/3/11533第10章实验设计END返回章目录C.CHENG返回总目录 共666页选择受试对象是根据科研课题的研究目的而确定的。选择受试对象是根据科研课题的研究目的而确定的。选择受试对象应考虑下列几点:选择受试对象应考虑下列几点:进进行行基基础础性性的的医医学学研研究究,多多选选择择动动物物及及其其材材料料作作为为受试对象,并可由此积累资料和基础数据;受试对象,并可由此积累资料和基础数据;观观察察临临床床疗疗效效、临临床床检检验验水水平平、诊诊断断水水平平及及社社区区干干预预试试验验等等,多多选选择择人人体体及及其其材材料料作作为为受受试试对对

382、象象。一一般般常常以以病病人人为为实实验验组组,健健康康人人为为对对照照组组;也也可可选选择择几几组组不同类型的病人分别作为实验组和对照组。不同类型的病人分别作为实验组和对照组。2021/3/11534第10章实验设计END返回章目录C.CHENG返回总目录 共666页(一)(一) 受试对象的基本条件受试对象的基本条件受试对象应具备下列基本条件。受试对象应具备下列基本条件。(1 1)敏敏感感性性:是是指指受受试试对对象象接接受受处处理理因因素素后后,容容易易显显示示实验效应。实验效应。(2 2)特特异异性性:是是指指受受试试对对象象接接受受处处理理因因素素后后,只只产产生生特特定的实验效应。定

383、的实验效应。(3 3)稳稳定定性性:是是指指受受试试对对象象产产生生的的实实验验效效应应仅仅在在特特定定范范围内波动,且波动相对较小。围内波动,且波动相对较小。(4 4)经济性:是指受试对象容易获取且价格便宜。)经济性:是指受试对象容易获取且价格便宜。(5 5)可可行行性性:是是指指受受试试对对象象便便于于施施加加处处理理因因素素及及获获取取标标本。本。(6 6)相相似似性性:是是指指动动物物产产生生的的实实验验效效应应尽尽可可能能与与人人体体近近似。似。2021/3/11535第10章实验设计END返回章目录C.CHENG返回总目录 共666页(一)(一) 常用受试对象的基本特征常用受试对象

384、的基本特征1 1。动动物物 医医学学研研究究中中的的各各个个领领域域几几乎乎都都要要用用到到实实验验动动物物。使使用用动动物物作作为为受受试试对对象象非非常常方方便便,安安全全性性高高,价价格格相相对对便便宜宜,而而且且不不涉涉及及人人类类的的医医德德问问题题。研研究究中中动动物物意意外外缺缺失失可可以以据据情情予予以以补补充充。饲饲养养、管管理理及及观观察察动动物物十十分分方方便便且且容容易易做做到到。选选择择动动物物一一般般要要考考虑虑动动物物的的种种类类、种种属属、品品系系、窝窝别别、性性别别、年年龄龄、体体重重、健健康康状状况况、是是否否容容易易饲饲养养和和存存活活,对对施施加加的的处

385、处理理因因素素的的反应特征等方面。反应特征等方面。2021/3/11536第10章实验设计END返回章目录C.CHENG返回总目录 共666页(1 1)小小白白鼠鼠及及大大白白鼠鼠 啮啮齿齿类类动动物物。主主要要用用于于进进行行毒毒理理学学研研究究。可可以以研研究究各各种种有有害害毒毒物物的的急急慢慢性性毒毒性性作作用用及及“三三致致”作作用用,即即毒毒物物的的致致突突变变作作用用,致致畸畸变变作作用用及及致致癌癌作作用用。用用此此类类动动物物进进行行实实验验研研究究,其其特特点点是是价价格格低低,易易饲饲养养,可可以以大大量量使使用用。但但由由于于啮啮齿齿类类动动物物缺缺乏乏呕呕吐吐反反射射

386、,故故凡凡是是能能引引起起呕呕吐吐反反射射的的化化合合物物的的毒毒性性研究,一般不能使用此类动物。研究,一般不能使用此类动物。(2 2)兔兔 也也属属于于啮啮齿齿类类动动物物。用用于于化化合合物物的的毒毒性性试试验验研研究究。尤尤其其是是经经皮皮肤肤接接触触的的毒毒作作用用试试验验。也也可可用用于于胃胃肠道对外来化合物的吸收动力学研究。肠道对外来化合物的吸收动力学研究。2021/3/11537第10章实验设计END返回章目录C.CHENG返回总目录 共666页(3 3)猫猫和和狗狗 为为非非啮啮齿齿类类动动物物的的典典型型代代表表。可可用用于于毒毒理理学学试试验验研研究究,也也可可用用于于生生

387、理理学学研研究究。如如进进行行血血压压、睡睡眠眠等等方方面面的的研研究究。但但猫猫与与狗狗的的价价格格较较高高,不不适适于于大大数量使用。数量使用。(4 4)猪)猪 其皮肤结构与人体较近似,可用于各种毒物其皮肤结构与人体较近似,可用于各种毒物对对皮肤皮肤的毒性作用研究。猪的躯体较大,价格较高,的毒性作用研究。猪的躯体较大,价格较高,不便于大量使用。不便于大量使用。(5 5)其其它它 猴猴与与灵灵长长目目类类动动物物与与人人类类较较接接近近,但但其其价价格格昂昂贵贵,只只用用于于某某些些特特殊殊研研究究。一一般般情情况况下下不不使使用用此此类动物。类动物。2021/3/11538第10章实验设计

388、END返回章目录C.CHENG返回总目录 共666页2 2。人人体体 以以人人体体作作为为观观察察对对象象,涉涉及及的的问问题题很很多多且且较较为复杂,一般应考虑下列几个方面:为复杂,一般应考虑下列几个方面:(1 1)一一般般条条件件 性性别别、年年龄龄、民民族族、个个人人嗜嗜好好、生生活活习惯、居住地区等。习惯、居住地区等。(2 2)健健康康状状况况 既既往往病病史史、家家族族成成员员病病史史、目目前前健健康康状况,身体发育状况等。状况,身体发育状况等。(3 3)社会因素)社会因素 职业、文化程度、经济条件、居住条职业、文化程度、经济条件、居住条件、家庭状况、心理状况、个性特征、病人及其家属

389、件、家庭状况、心理状况、个性特征、病人及其家属的合作态度等。的合作态度等。 2021/3/11539第10章实验设计END返回章目录C.CHENG返回总目录 共666页(4 4)疾疾病病因因素素 病病种种、病病型型、病病期期、病病程程、病病情情、诊诊断方法、诊断标准、试验研究的时间期限等。断方法、诊断标准、试验研究的时间期限等。(5 5)机机体体材材料料 标标本本的的获获取取部部位位、获获取取条条件件、新新鲜鲜程程度、保存方法、培养条件、运输及传送方式等。度、保存方法、培养条件、运输及传送方式等。 (6 6)外外界界环环境境因因素素 医医院院规规模模、医医疗疗水水平平、医医疗疗设设备备、医医护

390、护人人员员的的水水平平及及素素质质、病病房房的的大大小小、病病房房中中病病人数量、病人距离医院的远近,就诊的方便程度等。人数量、病人距离医院的远近,就诊的方便程度等。2021/3/11540第10章实验设计END返回章目录C.CHENG返回总目录 共666页人体作为受试对象人体作为受试对象,常用于临床治疗方案的疗效观察,常用于临床治疗方案的疗效观察研究以及某种疫苗在人群中预防某种疾病的效果观察研究以及某种疫苗在人群中预防某种疾病的效果观察等。在临床治疗工作中,每一位病人都可以作为一个等。在临床治疗工作中,每一位病人都可以作为一个观察对象。但是,按照实验设计的四个基本原则,如观察对象。但是,按照

391、实验设计的四个基本原则,如想在特定时期内选择几组除处理因素不同以外,其它想在特定时期内选择几组除处理因素不同以外,其它各方面条件都基本一致的病例,则是一件相当困难的各方面条件都基本一致的病例,则是一件相当困难的事情。事情。 2021/3/11541第10章实验设计END返回章目录C.CHENG返回总目录 共666页处处理理因因素素(study study factorfactor) 是是指指由由研研究究人人员员施施加加于于受受试试对对象象并并能能产产生生一一定定试试验验效效应应的的因因素素。医医学学科科研研中中常常用用的的处处理因素主要有下列几大类:理因素主要有下列几大类:1.1.物物理理因因

392、素素 电电、磁磁、光光、声声、温温度度、射射线线、微微波波、超超声声波等。波等。2.2.化化学学因因素素 药药物物、营营养养素素、激激素素、毒毒物物、各各种种有有机机和和无无机化合物等。机化合物等。3.3.生物因素生物因素 寄生虫、真菌、细菌、病毒及其生物制品等。寄生虫、真菌、细菌、病毒及其生物制品等。2021/3/11542第10章实验设计END返回章目录C.CHENG返回总目录 共666页处处理理因因素素 在在实实验验设设计计阶阶段段也也要要认认真真考考虑虑并并仔仔细细分分析析。尤尤其其是是处处理理因因素素的的剂剂量量及及水水平平数数应应该该通通过过预预试试验验或或据据以以往往经经验有一定

393、的了解和把握。验有一定的了解和把握。处处理理因因素素剂剂量量过过小小,受受试试对对象象不不产产生生反反应应,达达不不到到观观察察试试验效应的目的。验效应的目的。如如果果剂剂量量过过大大,则则可可能能导导致致受受试试对对象象的的强强烈烈反反应应乃乃至至死死亡亡。对对动动物物进进行行毒毒理理学学研研究究时时,处处理理因因素素的的剂剂量量变变化化范范围围较较大大,可可以以使使动动物物不不出出现现反反应应,刚刚出出现现反反应应,到到动动物物出出现现较较大大反反应应或或死死亡亡。对对于于临临床床试试验验,由由于于针针对对的的是是人人体体,控控制制处处理理因因素素的的剂剂量量范范围围是是非非常常重重要要的

394、的。其其注注意意点点是是,应应在在保保证证人人体体安安全全的的前前提提下下,将将处处理理因因素素安安全全剂剂量量范范围围内内的的不不同同剂剂量量水平施加于人体,观察机体的反应及试验效应。水平施加于人体,观察机体的反应及试验效应。2021/3/11543第10章实验设计END返回章目录C.CHENG返回总目录 共666页在实验研究中,由于影响试验结果的因素很多,有时在实验研究中,由于影响试验结果的因素很多,有时则十分复杂。因此,在安排施加处理因素时,应考虑则十分复杂。因此,在安排施加处理因素时,应考虑下列几个方面下列几个方面 。1 1。抓住实验中的主要因素抓住实验中的主要因素 任何一项实验研究都

395、有其任何一项实验研究都有其主要的方面或主要矛盾。主要的方面或主要矛盾。 2 2。确定处理因素和非处理因素确定处理因素和非处理因素 实验研究中应根据研实验研究中应根据研究目的确定处理因素和非处理因素。一般情况下,两究目的确定处理因素和非处理因素。一般情况下,两者的区别并不困难。者的区别并不困难。 3 3。处理因素标准化处理因素标准化 是指在进行同一个实验研究时,是指在进行同一个实验研究时,施加于多个受试对象的处理因素是相同一致的。不能施加于多个受试对象的处理因素是相同一致的。不能随意加以改变。尤其是用于病人的药物。随意加以改变。尤其是用于病人的药物。 2021/3/11544第10章实验设计EN

396、D返回章目录C.CHENG返回总目录 共666页三、实验效应三、实验效应实验效应(实验效应(experimental effectexperimental effect)是指处理因素施加于是指处理因素施加于受试对象并经过一定时间,受试对象产生的各种反应及表受试对象并经过一定时间,受试对象产生的各种反应及表现。这些反应可以是主观的,也可以是客观的。现。这些反应可以是主观的,也可以是客观的。实验效应可以用各种各样的具体指标来表示。观察实验效实验效应可以用各种各样的具体指标来表示。观察实验效应,应尽可能选择客观指标以及容易检测及分析的指标。应,应尽可能选择客观指标以及容易检测及分析的指标。 第二节第

397、二节 实验设计的基本要素实验设计的基本要素2021/3/11545第10章实验设计END返回章目录C.CHENG返回总目录 共666页(一)观察指标的分类(一)观察指标的分类 观察指标按其性质一般可以分为下列几类:观察指标按其性质一般可以分为下列几类:1.1.定定量量指指标标 可可以以用用具具体体的的度度量量衡衡单单位位来来表表示示的的指指标标。如如人人体体的的身身高高用用厘厘米米表表示示,体体重重用用公公斤斤表表示示,脉脉搏搏用用每每分分钟钟的的次次数数来来表表示示。计计量量指指标标可可以以根根据据具具体体指指标标的的要求,精确到小数点后面若干位。要求,精确到小数点后面若干位。2.2.分分类

398、类指指标标 按按受受试试对对象象的的属属性性或或特特征征先先分分类类,再再计计数数各各类类的的个个数数。用用绝绝对对数数或或相相对对数数来来表表示示。如如某某检检测测指指标标的的结结果果可可以以用用“是是”或或“否否”,“阴阴性性”或或“阳阳性性”来表示。来表示。2021/3/11546第10章实验设计END返回章目录C.CHENG返回总目录 共666页3.3.等级指标等级指标 按试验效应的程度分为若干等级,并计按试验效应的程度分为若干等级,并计数各等级的个数。该指标介于定量及分类指标之间。数各等级的个数。该指标介于定量及分类指标之间。如用某治疗方案治疗病人,其观察结果可以分为四个如用某治疗方

399、案治疗病人,其观察结果可以分为四个等级,即:无效,显效,好转,痊愈。这四个等级可等级,即:无效,显效,好转,痊愈。这四个等级可以用一个或多个具体量度指标来确定。以用一个或多个具体量度指标来确定。2021/3/11547第10章实验设计END返回章目录C.CHENG返回总目录 共666页( (二)选择观察指标的要求二)选择观察指标的要求1.1.关关联联性性 是是指指观观察察指指标标与与研研究究目目的的有有着着本本质质而而密密切切的的联联系系,能能够够确确切切反反映映处处理理因因素素的的试试验验效效应应。这这些些指指标可以通过查阅文献或根据以往经验而获得。标可以通过查阅文献或根据以往经验而获得。2

400、.2.客客观观性性 是是指指能能够够借借助助各各种种检检测测手手段段及及方方法法所所观观测测记记录录的的指指标标。如如血血压压,红红细细胞胞数数,心心电电图图,尿尿铅铅含含量量等指标。等指标。2021/3/11548第10章实验设计END返回章目录C.CHENG返回总目录 共666页3.3.精确性精确性 精确性包括两层含义。精确性包括两层含义。其一是准确度其一是准确度,即,即指实际测量值与真值的接近程度。准确度越高,测量指实际测量值与真值的接近程度。准确度越高,测量值越接近真值,误差则越小。尽管真值往往未知,但值越接近真值,误差则越小。尽管真值往往未知,但准确度越高,指标的可靠性越高。准确度越

401、高,指标的可靠性越高。其二是精密度其二是精密度,指,指在重复观察及测量时,观察值与其平均值的接近程度。在重复观察及测量时,观察值与其平均值的接近程度。精密度越高,说明重复的测量值越接近,检测设备或精密度越高,说明重复的测量值越接近,检测设备或手段的稳定性越好。手段的稳定性越好。2021/3/11549第10章实验设计END返回章目录C.CHENG返回总目录 共666页4.4.稳稳定定性性 是是指指观观察察指指标标变变异异度度的的大大小小。稳稳定定性性高高,则则变变异异度度小小,指指标标的的代代表表性性强强,反反之之亦亦然然。稳稳定定性性一一般般可可以以用用该该指指标标的的变变异异系系数数来来表

402、表示示。如如果果变变异异系系数数不不超过超过15%15%20%20%,则该指标的稳定性较好。,则该指标的稳定性较好。5.5.灵灵敏敏性性 是是指指各各种种检检测测手手段段和和方方法法能能够够检检测测出出试试验验效效应应微微小小变变化化的的能能力力。灵灵敏敏性性越越高高,则则检检测测出出试试验验效效应应微微小小变变化化的的能能力力越越强强。随随着着科科学学技技术术的的快快速速发发展展,检测手段的灵敏性将会越来越高。检测手段的灵敏性将会越来越高。2021/3/11550第10章实验设计END返回章目录C.CHENG返回总目录 共666页6.6.特异性特异性 是指检测指标的排它性是指检测指标的排它性

403、, ,是观察指标对某种是观察指标对某种特殊试验效应及结果的反映能力。特异性越强,观察特殊试验效应及结果的反映能力。特异性越强,观察指标反映某种试验效应的能力越强。特异性对诊断严指标反映某种试验效应的能力越强。特异性对诊断严重疾病的意义非常重要。如果某检测指标特异性强,重疾病的意义非常重要。如果某检测指标特异性强,则该指标对确诊和早期发现严重疾病具有直接意义。则该指标对确诊和早期发现严重疾病具有直接意义。如检测指标甲胎蛋白对确诊早期肝癌具有重要意义。如检测指标甲胎蛋白对确诊早期肝癌具有重要意义。 2021/3/11551第10章实验设计END返回章目录C.CHENG返回总目录 共666页6.6.

404、特异性特异性 是指检测指标的排它性是指检测指标的排它性, ,是观察指标对某种是观察指标对某种特殊试验效应及结果的反映能力。特异性越强,观察特殊试验效应及结果的反映能力。特异性越强,观察指标反映某种试验效应的能力越强。特异性对诊断严指标反映某种试验效应的能力越强。特异性对诊断严重疾病的意义非常重要。如果某检测指标特异性强,重疾病的意义非常重要。如果某检测指标特异性强,则该指标对确诊和早期发现严重疾病具有直接意义。则该指标对确诊和早期发现严重疾病具有直接意义。如检测指标甲胎蛋白对确诊早期肝癌具有重要意义。如检测指标甲胎蛋白对确诊早期肝癌具有重要意义。 2021/3/11552第10章实验设计END

405、返回章目录C.CHENG返回总目录 共666页(三)(三)消除心理偏性的方法消除心理偏性的方法心心理理偏偏性性是是指指研研究究人人员员及及受受试试对对象象由由于于各各自自的的心心理理偏偏见见而而在在观观察察或或描描述述试试验验效效应应时时产产生生的的误误差差。如如医医护护人人员员容容易易认认为为自自己己使使用用的的治治疗疗方方案案要要好好于于其其他他人人的的治治疗疗方方案案。病病人人则则容容易易受受医医院院规规模模大大小小,医医疗疗设设备备的的先先进进程程度度,医医院院医医疗疗水水平平的的高高低低,权权威威医医护护人人员员或或普普通通医医护护人人员员治治疗疗等等等等方方面面的的心心理理影影响响

406、。这这些些影影响响可可以以导导致致病病人人主主观观感感觉觉的的偏偏见见。消消除除上上述述心心理理偏偏性性的的方方法法一一般般是使用盲法设计。是使用盲法设计。2021/3/11553第10章实验设计END返回章目录C.CHENG返回总目录 共666页第三节第三节 实验设计的基本原则实验设计的基本原则实实验验设设计计包包括括四四项项基基本本原原则则,即即随随机机化化的的原原则则,对对照照的原则,重复的原则和均衡的原则。的原则,重复的原则和均衡的原则。一、随机化的原则一、随机化的原则1.1.概念及用途概念及用途 随机化(随机化(randomizationrandomization)是指总体中是指总体

407、中的每一个个体都有均等的机会被抽取或被分配到实验的每一个个体都有均等的机会被抽取或被分配到实验组及对照组中去。随机化原则的核心是机会均等。使组及对照组中去。随机化原则的核心是机会均等。使用随机化方法可以消除在抽样及分组过程中,由于研用随机化方法可以消除在抽样及分组过程中,由于研究人员对受试对象主观意愿的选择而造成试验效应的究人员对受试对象主观意愿的选择而造成试验效应的误差。误差。 2021/3/11554第10章实验设计END返回章目录C.CHENG返回总目录 共666页2.2.随随机机化化的的方方法法 随随机机化化的的方方法法有有多多种种。常常用用的的有有抽抽签签法法,抓抓阄阄法法,随随机机

408、数数字字法法等等。随随机机数数字字法法一一般般有有随随机机数数字字表表和和随随机机排排列列表表。普普通通函函数数型型电电子子计计算算器器也也可可以以显显示示随随机机数数字字。随随机机数数字字表表中中出出现现数数字字0 09 9的的机机会会或或概概率率是是均均等等的的。利利用用随随机机数数字字分分组组的的方方法法很很多多也也很很灵活。灵活。2021/3/11555第10章实验设计END返回章目录C.CHENG返回总目录 共666页对照(对照(controlcontrol)是指在实验研究中使受试对象的处理是指在实验研究中使受试对象的处理因素和非处理因素的试验效应的差异有一个科学的对因素和非处理因素

409、的试验效应的差异有一个科学的对比。主要目的是为了排除对照组和实验组中非处理因比。主要目的是为了排除对照组和实验组中非处理因素对试验效应的影响或干扰作用,并使得实验组和对素对试验效应的影响或干扰作用,并使得实验组和对照组具有可比性。对照的基本要求是,除处理因素作照组具有可比性。对照的基本要求是,除处理因素作有计划的变化外,实验组与对照组的其它条件尽量保有计划的变化外,实验组与对照组的其它条件尽量保持一致。持一致。 二、对照的原则二、对照的原则2021/3/11556第10章实验设计END返回章目录C.CHENG返回总目录 共666页实实验验研研究究中中设设置置对对照照组组是是非非常常重重要要的的

410、。常常用用的的对对照照方方法有下列几种。法有下列几种。(一)空白对照(一)空白对照 空白对照是指对照组不施加任空白对照是指对照组不施加任何处理因素。常用于防疫系统疫苗接种效果的观察与何处理因素。常用于防疫系统疫苗接种效果的观察与研究。研究。注注意意:在在动动物物实实验验研研究究中中,可可以以使使用用空空白白对对照照,而而在在针针对对人人体体的的临临床床试试验验研研究究中中,一一般般不不能能使使用用空空白白对对照照。对对照照组组可可以以使使用用常常规规疗疗法法以以保保证证病病人人的的生生命命安安全全,而而对危重病人则更要注意不能使用空白对照。对危重病人则更要注意不能使用空白对照。 2021/3/

411、11557第10章实验设计END返回章目录C.CHENG返回总目录 共666页(二)标准对照(二)标准对照 标准对照是指以公认标准对照是指以公认或习惯的标准方法、标准值或正或习惯的标准方法、标准值或正常值作为对照。这些对照值或标准值一般是多个地区常值作为对照。这些对照值或标准值一般是多个地区多年累积的经验结果,具有参考价值和意义。多年累积的经验结果,具有参考价值和意义。实验研究中一般不用标准值作对照,主要是某项实验实验研究中一般不用标准值作对照,主要是某项实验研究中的实验条件难以与标准值的实验条件相一致,研究中的实验条件难以与标准值的实验条件相一致,不具备良好的可比性。临床试验研究中可以用常规

412、疗不具备良好的可比性。临床试验研究中可以用常规疗法或经验疗法作为标准对照组。法或经验疗法作为标准对照组。 2021/3/11558第10章实验设计END返回章目录C.CHENG返回总目录 共666页(三)(三) 实验对照实验对照实验对照是指对照组虽未施加处理因素,但却施加了实验对照是指对照组虽未施加处理因素,但却施加了某种与处理因素有关的实验因素。这是一种比较特殊某种与处理因素有关的实验因素。这是一种比较特殊的非处理因素。的非处理因素。 例如,研究赖氨酸对促进儿童的生长发育作用,实验例如,研究赖氨酸对促进儿童的生长发育作用,实验组儿童的课间餐为加赖氨酸的面包,对照组为不加赖组儿童的课间餐为加赖

413、氨酸的面包,对照组为不加赖氨酸的面包,两组儿童面包的数量是一致的。氨酸的面包,两组儿童面包的数量是一致的。 2021/3/11559第10章实验设计END返回章目录C.CHENG返回总目录 共666页(四)(四)自身对照自身对照自身对照是指对照和实验在同一个受试对象身上进行,自身对照是指对照和实验在同一个受试对象身上进行,只是在进行对照组和实验组的观察时,在时间上有前只是在进行对照组和实验组的观察时,在时间上有前后顺序的不同。后顺序的不同。(五)(五)相互对照相互对照相互对照是指不专门设置对照组,而以各实验组之间相互对照是指不专门设置对照组,而以各实验组之间互为对照,比较各处理因素试验效应的相

414、对大小及作互为对照,比较各处理因素试验效应的相对大小及作用。用。 2021/3/11560第10章实验设计END返回章目录C.CHENG返回总目录 共666页(六)(六) 安慰剂对照安慰剂对照安慰剂(安慰剂(placeboplacebo)是指一种无药理作用的假药,其与)是指一种无药理作用的假药,其与治疗药物在外观、剂型等方面不能被受试对象所识别。治疗药物在外观、剂型等方面不能被受试对象所识别。安慰剂对照则是指将安慰剂施加于对照组的受试对象。安慰剂对照则是指将安慰剂施加于对照组的受试对象。安慰剂对照是一种特殊的空白对照,其目的主要是排安慰剂对照是一种特殊的空白对照,其目的主要是排除病人或受试对象

415、的心理偏见。除病人或受试对象的心理偏见。人作为受试对象具有复杂的心理过程,极易受到各种人作为受试对象具有复杂的心理过程,极易受到各种外界因素的影响和干扰。外界因素的影响和干扰。 2021/3/11561第10章实验设计END返回章目录C.CHENG返回总目录 共666页(七)(七)历史对照历史对照历史对照是指以过去或以往的研究结果作为对照。主历史对照是指以过去或以往的研究结果作为对照。主要用于对难治或无法治愈的疾病的研究,如晚期恶性要用于对难治或无法治愈的疾病的研究,如晚期恶性肿瘤,狂犬病等疾病。肿瘤,狂犬病等疾病。由于这些疾病难以治愈或无法治愈,这种累积下来的由于这些疾病难以治愈或无法治愈,

416、这种累积下来的治疗结果就成为历史对照。例如,狂犬病一但发病,治疗结果就成为历史对照。例如,狂犬病一但发病,其治愈率几乎为零,这是一个历史的治疗结果。历史其治愈率几乎为零,这是一个历史的治疗结果。历史对照一般不宜使用,应用时应特别注意资料的各种背对照一般不宜使用,应用时应特别注意资料的各种背景条件因素及其可比性。景条件因素及其可比性。 2021/3/11562第10章实验设计END返回章目录C.CHENG返回总目录 共666页三、重复的原则三、重复的原则重复(重复(replicationreplication)是指实验组和对照组的受试对象是指实验组和对照组的受试对象应具有一定的数量。重复表现为二

417、个含义:其一是样应具有一定的数量。重复表现为二个含义:其一是样本含量的大小;其二是同一试验重复次数的多少,两本含量的大小;其二是同一试验重复次数的多少,两者的本质是相同的。按照抽样误差变化的规律,在抽者的本质是相同的。按照抽样误差变化的规律,在抽样中,随着样本含量的增大或重复次数的增加,抽样样中,随着样本含量的增大或重复次数的增加,抽样误差将逐渐减小。误差将逐渐减小。 2021/3/11563第10章实验设计END返回章目录C.CHENG返回总目录 共666页如如果果研研究究总总体体中中的的所所有有个个体体,其其优优点点是是研研究究的的指指标标准准确确可可靠靠,没没有有抽抽样样误误差差,具具有

418、有较较高高或或很很高高的的参参考考价价值值;缺缺点点是是耗耗费费大大量量的的人人力力、物物力力、财财力力和和时时间间,一一般般情情况况下下是是不不采采用用的的。研研究究样样本本的的优优点点是是节节省省人人力力、物物力力、财财力力和和时时间间;缺缺点点是是观观察察指指标标存存在在抽抽样样误误差差,降降低低了了指指标标的的准准确确性性和和可可靠靠性性。如如果果未未认认真真进进行行实实验验设设计计和和考考虑虑抽抽样样方方法法,则则样样本本指指标标常常可可导导致致错错误误的的结结论论。这这也是在抽样研究中要十分注意的问题。也是在抽样研究中要十分注意的问题。2021/3/11564第10章实验设计END

419、返回章目录C.CHENG返回总目录 共666页四、均衡的原则四、均衡的原则均均衡衡的的原原则则也也称称为为齐齐同同原原则则,是是指指对对照照组组除除处处理理因因素素与与实实验验组组不不同同外外,其其它它各各种种条条件件及及因因素素应应基基本本一一致致。这这些些条条件件及及因因素素即即指指非非处处理理因因素素或或称称为为背背景景因因素素。对对照照组组与与实实验验组组应应具具有有较较好好的的均均衡衡性性,这这样样才才能能保保证证各各组组之之间间具具有有较较好好的的可可比比性性,才才能能充充分分显显示示出出实实验验组组处处理理因因素素的的效效应应和和作作用用,排排除除其其它它各各种种因因素素的的干干

420、扰扰和和影影响。响。2021/3/11565第10章实验设计END返回章目录C.CHENG返回总目录 共666页第四节第四节 样本含量的估计样本含量的估计一、确定样本含量的意义一、确定样本含量的意义正确确定样本含量是实验设计中的一个重要部分,在正确确定样本含量是实验设计中的一个重要部分,在估计样本含量时,应当注意克服两种倾向:估计样本含量时,应当注意克服两种倾向:v1 1。某些研究工作者片面追求增大样本例数,认为样本某些研究工作者片面追求增大样本例数,认为样本例数越大越好,甚至提出例数越大越好,甚至提出“大量观察大量观察”是确定样本含是确定样本含量的一个重要原则,其结果导致人力、物力和时间上量

421、的一个重要原则,其结果导致人力、物力和时间上的浪费。的浪费。2021/3/11566第10章实验设计END返回章目录C.CHENG返回总目录 共666页v2. 2. 确确定定总总体体标标准准差差 由由于于总总体体标标准准差差往往往往未未知知或或不不易易获获得得,一一般般可可用用预预试试验验的的样样本本标标准准差差S S来来估估计计或代替。或代替。3. 3. 确确定定第第一一类类错错误误的的概概率率 也也称称为为检检验验水水准准或或显显著著性性水水平平,越越小小,所所需需样样本本例例数数越越多多。习习惯惯上上,检检验验水水准准一一般般取取 0.050.05,并并可可根根据据专专业业要要求求决决定

422、定取取单单侧侧或双侧或双侧 。2021/3/11567第10章实验设计END返回章目录C.CHENG返回总目录 共666页4. 4. 检验效能(检验效能(1-1-) 检验效能也称为把握度,检验效能也称为把握度,是指在特定水准下,若总体间确实存在差异,则该次是指在特定水准下,若总体间确实存在差异,则该次试验能发现此差异的概率。其中的试验能发现此差异的概率。其中的为第二类错误。为第二类错误。(1 1)越大,即把握度越高,所需样本例数越多。)越大,即把握度越高,所需样本例数越多。通常取通常取0.10.1或或0.20.2,相应的检验效能为,相应的检验效能为0.90.9或或0.80.8。一般检验效能不宜

423、低于。一般检验效能不宜低于0.750.75,否则第二类错误增,否则第二类错误增大,大,“存伪存伪”的概率增加。的概率增加。 2021/3/11568第10章实验设计END返回章目录C.CHENG返回总目录 共666页样本含量估计的方法较多,有些公式较为复杂,计算样本含量估计的方法较多,有些公式较为复杂,计算繁琐。最常用的几种方法有:繁琐。最常用的几种方法有: 1 1。样本均数与总体均数的比较样本均数与总体均数的比较 2 2。两样本均数的比较两样本均数的比较3 3。两样本率的比较两样本率的比较 具体计算方法公式:略。具体计算方法公式:略。三、常用样本含量估计方法三、常用样本含量估计方法2021/

424、3/11569第10章实验设计END返回章目录C.CHENG返回总目录 共666页q 完全随机设计(完全随机设计(completely random designcompletely random design) 也也称为单因素设计,该设计只能分析一个处理因素的作用。称为单因素设计,该设计只能分析一个处理因素的作用。处理因素可有处理因素可有2 2个或个或2 2个以上水平,每个水平代表一个分组。个以上水平,每个水平代表一个分组。可用抽签法、抓阄法或随机数字法等将受试对象随机分配可用抽签法、抓阄法或随机数字法等将受试对象随机分配到各实验组及对照组中。该设计的特点是,简单方便,应到各实验组及对照组中

425、。该设计的特点是,简单方便,应用广泛,容易进行统计分析;但只能分析一个因素的作用,用广泛,容易进行统计分析;但只能分析一个因素的作用,效率相对较低。如果只有两个分组时,可用效率相对较低。如果只有两个分组时,可用t t检验或单因检验或单因素方差分析处理资料。如果组数大于等于素方差分析处理资料。如果组数大于等于3 3时,可用单因时,可用单因素方差分析处理资料。素方差分析处理资料。一、完全随机设计一、完全随机设计第五节第五节 常用实验设计方法常用实验设计方法 2021/3/11570第10章实验设计END返回章目录C.CHENG返回总目录 共666页该设计如果用于临床试验,也可称为临床试验设计中该设

426、计如果用于临床试验,也可称为临床试验设计中的的随机对照试验随机对照试验(randomized control trialrandomized control trial);如);如果其中采用了盲法设计,则又称为果其中采用了盲法设计,则又称为随机盲法对照试验随机盲法对照试验(randomized blind control trialrandomized blind control trial)。)。注意注意,在受,在受试对象分组前,应使其非处理因素尽量达到均衡,然试对象分组前,应使其非处理因素尽量达到均衡,然后再采用随机方法对受试对象进行分组,这样才能使后再采用随机方法对受试对象进行分组,这样

427、才能使得各组的可比性高,均衡性强。得各组的可比性高,均衡性强。 2021/3/11571第10章实验设计END返回章目录C.CHENG返回总目录 共666页例例10.410.4 按按单单因因素素设设计计要要求求,将将1515只只动动物物等等量量分分为为A A、B B、C C三组。三组。设计及分组步骤如下。设计及分组步骤如下。(1 1)选选取取1515只只品品系系相相同同,性性别别相相同同,年年龄龄相相同同或或相相近近,体重相近的动物体重相近的动物1515只。只。(2 2)将)将1515只动物任意编号为只动物任意编号为1 11515号。号。2021/3/11572第10章实验设计END返回章目录

428、C.CHENG返回总目录 共666页表表10-4 10-4 单因素设计动物分组方法单因素设计动物分组方法(3 3)查附表)查附表1717,“随机排列表随机排列表”,预先规定:从该表,预先规定:从该表第第1212行顺序查抄行顺序查抄1 11515范围内的随机数字范围内的随机数字1515个,小于个,小于1 1及及大于大于1515的数字舍去。数字的数字舍去。数字1 15 5归入归入A A组,组,6 61010归入归入B B组,组,11111515归入归入C C组。组。(4 4)1515只动物分组方法及结果,见表只动物分组方法及结果,见表10-410-4。2021/3/11573第10章实验设计END

429、返回章目录C.CHENG返回总目录 共666页配对设计(配对设计(paired designpaired design)是将受试对象按一定条件是将受试对象按一定条件配成对子,分别给予每对中的两个受试对象以不同的配成对子,分别给予每对中的两个受试对象以不同的处理。配对的条件是影响实验效应的主要非处理因素。处理。配对的条件是影响实验效应的主要非处理因素。在这些非处理因素中,动物主要有:种属,性别,年在这些非处理因素中,动物主要有:种属,性别,年龄,体重,窝别等因素;人群主要有:种族,性别,龄,体重,窝别等因素;人群主要有:种族,性别,年龄,体重,文化教育背景,生活背景,居住条件,年龄,体重,文化教

430、育背景,生活背景,居住条件,劳动条件等。其中病人还应考虑疾病类型,病情严重劳动条件等。其中病人还应考虑疾病类型,病情严重程度,诊断标准等方面。配对设计的目的是降低、减程度,诊断标准等方面。配对设计的目的是降低、减弱或消除两个比较组的非处理因素的作用。弱或消除两个比较组的非处理因素的作用。 二、配对设计二、配对设计2021/3/11574第10章实验设计END返回章目录C.CHENG返回总目录 共666页该该设设计计的的特特点点是是:可可以以节节约约样样本本含含量量,增增强强组组间间均均衡衡性性,提提高高试试验验效效率率,减减轻轻人人力力、物物力力和和财财力力负负担担。在在临临床床试试验验中中,

431、配配对对设设计计应应用用广广泛泛。医医学学科科研研中中常常见见的的配对设计有下列几种类型:配对设计有下列几种类型:(1 1)配配对对设设计计 将将两两个个条条件件相相近近的的受受试试对对象象按按1:11:1配配成成对对子子,然然后后对对每每对对中中的的个个体体随随机机分分组组,再再施施加加处处理理因素观察效应。因素观察效应。2021/3/11575第10章实验设计END返回章目录C.CHENG返回总目录 共666页(2 2)自自身身对对照照设设计计 临临床床上上常常见见情情况况是是,把把病病人人治治疗疗前前与与治治疗疗后后的的检检测测指指标标值值作作为为一一对对数数据据。若若干干个个病病人人的

432、的检检测测值值作作为为若若干干对对数数据据。这这种种设设计计为为配配对对设设计计中中的的一种。一种。(3 3)同同一一标标本本用用两两种种方方法法检检测测 采采集集的的同同一一份份标标本本或或样样品品如如果果用用两两种种方方法法进进行行检检测测,则则得得到到一一对对数数据据。检检测测一一批批样样品品则则得得到到若若干干对对数数据据。此此种种设设计计也也属属于于配配对对设计。设计。 2021/3/11576第10章实验设计END返回章目录C.CHENG返回总目录 共666页交交叉叉设设计计(cross-over cross-over designdesign)是是一一种种特特殊殊的的自自身身对对

433、照照设设计计。它它克克服服了了由由于于施施加加于于受受试试对对象象的的处处理理因因素素在在时间上的不同而导致的试验效应的偏差。时间上的不同而导致的试验效应的偏差。(一)交叉设计的特点(一)交叉设计的特点1.1.节约样本含量,试验效率高。节约样本含量,试验效率高。2.2.可可以以均均衡衡因因施施加加处处理理因因素素的的时时间间顺顺序序不不同同对对试试验验效效应的影响。应的影响。3.3.每个受试对象均可接受每个受试对象均可接受A A和和B B两种处理因素。两种处理因素。4.4.需需用用交交叉叉设设计计的的方方差差分分析析方方法法处处理理数数据据,其其计计算算稍稍嫌繁琐。嫌繁琐。三、交叉设计三、交叉

434、设计2021/3/11577第10章实验设计END返回章目录C.CHENG返回总目录 共666页例例10.5 10.5 试将试将1010对受试者随机分入甲、乙两处理组。对受试者随机分入甲、乙两处理组。先先将将受受试试者者编编号号,如如第第一一对对第第1 1受受试试者者编编为为1.11.1,第第2 2受受试试者者编编为为1.21.2,余余仿仿此此。随随机机指指定定附附表表1717随随机机排排列列表表第第2 2行行,舍舍去去10101919之之间间的的数数字字,并并规规定定单单数数取取甲甲乙乙顺顺序序,双数取乙甲顺序。,双数取乙甲顺序。表表10-5 10-5 按配对设计的要求将按配对设计的要求将1

435、010对病人进行分组对病人进行分组2021/3/11578第10章实验设计END返回章目录C.CHENG返回总目录 共666页5.5.要要求求两两种种处处理理因因素素不不能能相相互互影影响响。观观察察时时间间不不能能过过长,处理效应不能持续过久。长,处理效应不能持续过久。6.6.临临床床试试验验设设计计中中,不不适适合合于于急急性性病病的的疗疗效效观观察察。由由于于急急性性病病的的病病程程较较短短,在在试试验验的的第第一一阶阶段段该该病病可可能能已已经治愈,则在第二阶段不可能再显示出疗效。经治愈,则在第二阶段不可能再显示出疗效。7.7.该该设设计计应应采采用用双双盲盲法法设设计计较较好好,以以

436、避避免免试试验验执执行行者者和病人的心理偏见。和病人的心理偏见。2021/3/11579第10章实验设计END返回章目录C.CHENG返回总目录 共666页(二)设计方法(二)设计方法 1.1.先将条件相近的受试对象按先将条件相近的受试对象按1:11:1配成若干对子;配成若干对子;2.2.用随机方法将每对中的两个个体分为两组;用随机方法将每对中的两个个体分为两组;3.3.决决定定两两个个组组中中的的哪哪个个组组的的受受试试对对象象先先用用A A处处理理因因素素,后后用用B B处处理理因因素素;另另一一组组的的受受试试对对象象则则与与此此相相反反。例例如如,第第一一组组先先给给A A,第第二二组

437、组先先给给B B;经经一一定定时时间间后后,第第一一组再给组再给B B,第二组再给,第二组再给A A。4.4.在在试试验验的的不不同同时时期期即即前前后后两两个个阶阶段段,A A与与B B两两种种处处理理因因素素既既同同时时使使用用又又交交叉叉使使用用。两两组组中中A A结结果果与与B B结结果果之之差即为试验效应。差即为试验效应。2021/3/11580第10章实验设计END返回章目录C.CHENG返回总目录 共666页例例10.6已配成对子的已配成对子的10对病人(共计对病人(共计20例),请将他例),请将他们按交叉设计要求进行们按交叉设计要求进行A、B两种处理方式的随机分配。两种处理方式

438、的随机分配。分组方法及步骤如下。分组方法及步骤如下。(1)将将10对对病病人人任任意意编编为为110号号,再再将将每每对对病病人人依依次编号为次编号为1.1、1.2,2.1、2.2,等。等。(2)查查附附表表17随随机机排排列列表表。任任意意指指定定随随机机排排列列表表一一行行,比比如如从从该该表表第第9行行,舍舍去去1020,将将随随机机数数字字列列于于表表10-6中中。若若遇遇随随机机数数字字的的单单数数,则则对对子子中中的的第第1个个病病人人先先A后后B,对对子子中中的的第第2个个病病人人先先B后后A。若若遇遇双双数数,则则对对子子中中的的第第1个个病病人人先先B后后A,第第2个个病病人

439、人先先A后后B。余余类推。类推。2021/3/11581第10章实验设计END返回章目录C.CHENG返回总目录 共666页表表10-6按交叉设计要求对按交叉设计要求对10对病人进行分组对病人进行分组注意注意:所谓:所谓“先先A A后后B B”是指试验开始的第一阶段,是指试验开始的第一阶段,先对相应病人使用先对相应病人使用A A处理因素;在试验的第二阶处理因素;在试验的第二阶段对该病人使用段对该病人使用B B处理因素。处理因素。“先先B B后后A A”的意义的意义与此相反。与此相反。 2021/3/11582第10章实验设计END返回章目录C.CHENG返回总目录 共666页随机区组设计(随机

440、区组设计(randomized block designrandomized block design)也称为配也称为配伍组设计或双因素设计。伍组设计或双因素设计。它是它是1:11:1配对设计的扩大。该设计是将受试对象按配对配对设计的扩大。该设计是将受试对象按配对条件先划分成若干个区组或配伍组,再将每一区组中条件先划分成若干个区组或配伍组,再将每一区组中的各受试对象随机分配到各个处理组中去。的各受试对象随机分配到各个处理组中去。 四、随机区组设计四、随机区组设计2021/3/11583第10章实验设计END返回章目录C.CHENG返回总目录 共666页进一步提高了各区组及处理组的均衡性及可比性

441、;进一步提高了各区组及处理组的均衡性及可比性;可控制一般设计中的混杂性偏倚;可控制一般设计中的混杂性偏倚;节约样本含量,增强试验效率;节约样本含量,增强试验效率;可同时分析两个处理因素的作用,且两因素应相互可同时分析两个处理因素的作用,且两因素应相互独立,无交互作用;独立,无交互作用;每一区组中受试对象的个数即为处理组数,每一处每一区组中受试对象的个数即为处理组数,每一处理组中受试对象的个数即为区组数;理组中受试对象的个数即为区组数;可用双因素方差分析方法处理数据,计算较为繁琐;可用双因素方差分析方法处理数据,计算较为繁琐;应特别注意该设计中受试对象的区组分组方法和处应特别注意该设计中受试对象

442、的区组分组方法和处理组分组方法,否则将影响到该设计的均衡性及试验理组分组方法,否则将影响到该设计的均衡性及试验效率。效率。 该设计的特点是:该设计的特点是:2021/3/11584第10章实验设计END返回章目录C.CHENG返回总目录 共666页例例10.710.7 研研究究人人员员在在进进行行科科研研时时,要要观观察察2 2个个因因素素的的作作用用。欲欲用用2020只只动动物物分分为为五五个个区区组组和和四四个个处处理理组组。试试进进行行设设计计及分组。及分组。设计及分组方法和步骤如下:设计及分组方法和步骤如下:(1 1)该设计可采用随机区组设计方案。分析的两个因素)该设计可采用随机区组设

443、计方案。分析的两个因素的作用可分别列为区组因素和处理组因素。两因素服从的作用可分别列为区组因素和处理组因素。两因素服从正态分布、方差齐性且相互独立。正态分布、方差齐性且相互独立。 (2 2)取同一品系的动物)取同一品系的动物2020只。其中每一区组取同一窝出只。其中每一区组取同一窝出生的动物生的动物4 4只。五个区组即为五个不同窝别的动物。只。五个区组即为五个不同窝别的动物。 2021/3/11585第10章实验设计END返回章目录C.CHENG返回总目录 共666页(3 3)将将每每一一区区组组的的4 4只只动动物物分分别别顺顺序序编编号号为为1 14 4号号,5 58 8号号,9 9121

444、2号号,13131616号号,17172020号号,接接受受A A、B B、C C、D D四种处理方式。四种处理方式。(4 4)查查附附表表17 17 随随机机排排列列表表,任任意意指指定定5 5行行,如如第第9 9至至第第1313行行。每每行行只只随随机机取取数数1 14 4,其其余余数数舍舍去去。依依次次将将随随机机数数字字记记录录于于各各配配伍伍组组的的编编号号下下,其其随随机机数数字字即即为为该动物应分入的处理组,见表该动物应分入的处理组,见表10-710-7。2021/3/11586第10章实验设计END返回章目录C.CHENG返回总目录 共666页表表10-7 10-7 按随机区组

445、设计要求对按随机区组设计要求对2020只动物进行分组只动物进行分组表表10-820只动物的分组结果只动物的分组结果2021/3/11587第10章实验设计END返回章目录C.CHENG返回总目录 共666页拉丁方(拉丁方(Latin square Latin square )是指用是指用r r个拉丁字母排成个拉丁字母排成r r行行r r列的方阵,使每行每列中的每个字母都只出现一次,列的方阵,使每行每列中的每个字母都只出现一次,此方阵叫此方阵叫r r阶拉丁方或阶拉丁方或rrrr拉丁方。拉丁方设计拉丁方。拉丁方设计(Latin square designLatin square design)是利

446、用拉丁方来安排并观察)是利用拉丁方来安排并观察分析三个处理因素试验效应的设计方法。分析三个处理因素试验效应的设计方法。拉拉丁丁方方设设计计的的基基本本要要求求是是:必必须须是是三三个个因因素素的的试试验验,而而且且三三个个因因素素的的水水平平数数相相等等;三三个个因因素素相相互互独独立立,无无交交互互作作用用;三三个个因因素素试试验验效效应应的的测测量量指指标标服服从从正正态分布且方差齐性。态分布且方差齐性。 五五* *、拉丁方设计、拉丁方设计2021/3/11588第10章实验设计END返回章目录C.CHENG返回总目录 共666页拉拉丁丁方方设设计计的的基基本本特特点点是是:拉拉丁丁方方设

447、设计计分分别别用用行行间间、列列间间和和字字母母间间表表示示三三个个因因素素及及其其不不同同水水平平;拉拉丁丁方方方方阵阵可可以以进进行行随随机机化化,目目的的是是打打乱乱原原字字母母排排列列的的有有序序性性。具具体体方方法法是是,将将整整行行的的字字母母上上下下移移动动或或将将整整列列的的字字母母左左右右移移动动。经经多多次次移移动动即即可可以以打打乱乱字字母母的的顺顺序序性性并并达达到到字字母母排排列列的的随随机机化化;无无论论如如何何随随机机化化,方方阵阵中中每每行行每每列列每每个个字字母母仍仍只只出出现现一一次次;拉拉丁丁方方设设计计均均衡衡性性强强,试试验验效效率率高高,节节省省样样

448、本本含含量量,可可用用拉拉丁丁方方设设计的方差分析处理数据,但计算较为繁琐。计的方差分析处理数据,但计算较为繁琐。2021/3/11589第10章实验设计END返回章目录C.CHENG返回总目录 共666页例例10.8将将44拉丁方的有序字母随机化。见表拉丁方的有序字母随机化。见表10-9。表表10-9中中,第第(1)栏栏的的拉拉丁丁方方字字母母有有顺顺序序,尚尚未未随随机机化化。第第(2)栏栏:将将第第(1)栏栏的的第第1行行与与第第3行行交交换换位位置置。第第(3)栏栏:将将第第(2)栏栏的的第第1列列与与第第3列列交交换换位位置。还可以继续随机化,直到满意为止。置。还可以继续随机化,直到

449、满意为止。表表10-9拉丁方方阵的随机化拉丁方方阵的随机化2021/3/11590第10章实验设计END返回章目录C.CHENG返回总目录 共666页六六* *、析因设计、析因设计(一一)概念及特点概念及特点析因设计(析因设计(factorialdesign)也称为析因实验也称为析因实验(factorialexperiment),是一种多因素的交叉分组),是一种多因素的交叉分组设计。它不仅可检验每个因素各水平间的差异,而且设计。它不仅可检验每个因素各水平间的差异,而且可检验各因素间的交互作用。可检验各因素间的交互作用。交互作用交互作用是指两个或多个因素的作用相互影响,各是指两个或多个因素的作用

450、相互影响,各因素间互不独立,一个因素的水平有改变时,另一个因素间互不独立,一个因素的水平有改变时,另一个或几个因素的效应也相应有所改变。交互作用的结果或几个因素的效应也相应有所改变。交互作用的结果是使总的试验效应增强或降低。是使总的试验效应增强或降低。2021/3/11591第10章实验设计END返回章目录C.CHENG返回总目录 共666页最最简简单单的的析析因因设设计计为为22(或或22)析析因因设设计计。其其意意义义为为:试试验验中中共共有有2个个因因素素,每每个个因因素素各各有有两两个个水水平平。再再如如,222(或或23)析析因因设设计计,表表示示试试验验中中有有三三个个因因素素,每

451、每个因素各有两个水平。个因素各有两个水平。数数字字表表达达式式中中的的指指数数表表示示因因素素个个数数,底底数数表表示示每每个个因因素的水平数。素的水平数。析析因因设设计计的的特特点点是是:可可分分析析多多个个因因素素多多个个水水平平的的试试验验效效应应,可可以以分分析析各各因因素素的的独独立立作作用用及及其其各各级级交交互互作作用用;节节省省样样本本含含量量,试试验验效效率率高高;设设计计时时较较为为复复杂杂,计计算算较较为为繁繁琐琐。可可用用析析因因设设计计的的方方差差分分析析处处理理数数据据。当当因因素素个个数数较较多多时时,计计算算量量大大,计计算算工工作作相相当当繁繁琐,对计算结果的

452、解释也会变得十分错综复杂。琐,对计算结果的解释也会变得十分错综复杂。2021/3/11592第10章实验设计END返回章目录C.CHENG返回总目录 共666页22析因实验作用模式析因实验作用模式表表101022析因设计作用模式析因设计作用模式2021/3/11593第10章实验设计END返回章目录C.CHENG返回总目录 共666页(三)交互作用的类型(三)交互作用的类型设实验研究中有设实验研究中有A、B、C、D四种因素,其交互作用的类型如下。四种因素,其交互作用的类型如下。(1)独立作用独立作用:A、B、C、D,是四个因素各自的单独作用。,是四个因素各自的单独作用。(2)一一级级交交互互作

453、作用用:AB,AC,AD,BC,BD,CD,是任意两个因素的共同作用。是任意两个因素的共同作用。(3)二二级级交交互互作作用用:ABC,ABD,ACD,BCD,是是任意三个因素的共同作用。任意三个因素的共同作用。(4)三级交互作用三级交互作用:ABCD,是四个因素的共同作用。,是四个因素的共同作用。上上述述独独立立作作用用与与交交互互作作用用总总共共需需进进行行15次次试试验验,目目的的在在于于得得出出各各因因素素的的最最佳佳水水平平及及其其组组合合。随随着着试试验验因因素素的的增增加加,交交互互作作用用及及试试验次数会急剧增加。当试验次数很多时,则宜采用正交试验设计。验次数会急剧增加。当试验

454、次数很多时,则宜采用正交试验设计。2021/3/11594第10章实验设计END返回章目录C.CHENG返回总目录 共666页七七* *、正交试验设计、正交试验设计 (一一)概念及特点概念及特点正交试验设计(正交试验设计(orthogonalexperimentaldesign)是一)是一种高效的多因素试验的设计方法。它利用一套规格化种高效的多因素试验的设计方法。它利用一套规格化的正交表,合理地安排实验,通过对实验结果进行分的正交表,合理地安排实验,通过对实验结果进行分析,获得有用的信息。析,获得有用的信息。正交设计的特点正交设计的特点是:是:可分析三个及三个以上因素的作用及其交互作用。可分析

455、三个及三个以上因素的作用及其交互作用。用最少的试验次数获得更多的信息。用最少的试验次数获得更多的信息。可用方差分析处理正交设计的测量数据,但计算十可用方差分析处理正交设计的测量数据,但计算十分繁琐。分繁琐。2021/3/11595第10章实验设计END返回章目录C.CHENG返回总目录 共666页(二)设计方法及步骤(二)设计方法及步骤正交实验设计的步骤如下。正交实验设计的步骤如下。(1)根据研究目的选择因素及其水平数;)根据研究目的选择因素及其水平数;(2)选选择择正正交交表表正正交交表表是是已已经经制制好好的的统统计计用用表表,专专供供正正交交实实验验设设计计使使用用。表表格格的的类类型型

456、表表示示符符号号为为Ln(tk)。其其中中n表表示示一一套套试试验验所所需需受受试试对对象象的的个个数数,t表表示示每每个个因因素素的的水水平平数数,k 表表示示可可分分析析的的因因素素数数。例例如如,L8(27)的的意意义义为为:一一套套试试验验需需8个个受受试试对对象象,每每个个因因素素有有2个个水水平平,最最多多可可分分析析7个个因因素素的的作作用用及及其其交交互互作作用用。选选择择哪哪一一种种正正交交表表取取决决于于某某项项研研究究的的因因素素数数,各各因因素素水水平平数数及及各各因因素素间间交交互互作用的项数。作用的项数。2021/3/11596第10章实验设计END返回章目录C.C

457、HENG返回总目录 共666页(三)正交表应用实例分析(三)正交表应用实例分析例例10.9根据研究目的选择一个根据研究目的选择一个L4(23)正交表,并对该正交表及)正交表,并对该正交表及其特点作出分析。其特点作出分析。表表1011L4(23)正交表)正交表2021/3/11597第10章实验设计END返回章目录C.CHENG返回总目录 共666页1.1.分分析析 该该正正交交表表L L4 4(2 23 3)的的意意义义为为:每每套套试试验验选选择择4 4个个受受试试对对象象,此此处处指指表表中中试试验验号号。最最多多可可安安排排3 3个个试试验验因因素素,用用列列号号表表示示。每每因因素素有

458、有2 2个个水水平平,水水平平1 1和和水水平平2 2由由表表中中数数字字1 1和和数数字字2 2表表示示。在在1 1号号试试验验中中,第第1 1,2 2,3 3列列安安排排的的3 3个个因因素素均均取取水水平平1 1;第第2 2号号试试验验中中,第第1 1,2 2,3 3列的因素则分别取列的因素则分别取1 1,2 2,2 2水平;余类推。水平;余类推。2021/3/11598第10章实验设计END返回章目录C.CHENG返回总目录 共666页2该正交表的特点该正交表的特点(1)每列中出现水平每列中出现水平1和水平和水平2的次数相等。的次数相等。(2)对对于于任任意意两两列列的的同同一一横横行

459、行,由由两两个个数数字字构构成成数数据据对对。本本例例的的数数据据对对有有:(1,1),(1,2),(2,1),(2,2)。在在整整个个正正交交表表中中,上上述述四四个个不不同同数数据据对对出出现现的的次次数数相相等等。例例如如,在在第第1,2列列同同一一横横行行中中,数数据据对对(1,1),(1,2)各各出出现现一一次次;在在第第1,3列列的的同同一一横横行行中中,这这两两个个数数据据对对又又各各出出现现一一次次;在在第第2,3列列中中,这这两两个个数数据据对对又又再再出出现现一一次次。这这两两个个不不同同的的数数据据对对总总共共各各出出现现3次次。出出现现次次数数相相等等。其其余余二二个个

460、数数据据对对出出现次数也相等。现次数也相等。2021/3/11599第10章实验设计END返回章目录C.CHENG返回总目录 共666页八、盲法设计八、盲法设计 v 盲盲法法设设计计(design design of of blind blind methodmethod)是是指指使使研研究究人人员员或或病病人人不不知知道道具具体体的的研研究究设设计计方方案案,从从而而避避免免双方由于心理偏见造成的试验效应的偏差。双方由于心理偏见造成的试验效应的偏差。v 盲盲法法设设计计: 一一般般分分为为单单盲盲法法及及双双盲盲法法。单单盲盲法法是是指指受受试试对对象象不不知知道道自自己己被被施施加加何何种

461、种处处理理因因素素,不不知知道道该该处处理理因因素素的的预预期期结结果果或或效效应应,而而研研究究人人员员知知道道具具体体的设计方案。该法主要用于消除受试对象的心理偏见。的设计方案。该法主要用于消除受试对象的心理偏见。2021/3/11600第10章实验设计END返回章目录C.CHENG返回总目录 共666页v 双盲法双盲法 是是指指实实验验执执行行者者及及受受试试对对象象均均不不知知道道具具体体的的设设计计方方案案及及处处理理因因素素的的预预期期结结果果或或效效应应。只只有有该该实实验验设设计计的的总总负负责责人人知知道道具具体体的的设设计计方方案案。双双盲盲法法可可以以避避免免和和消消除除

462、医医护护人人员员和和病病人人双双方方的的心心理理偏偏见见。盲盲法法设设计计在在临临床床试试验验中中应应用用广广泛泛,尤尤其其是是针针对对病病人人的的单单盲盲法法,应应用用更更为广泛。为广泛。2021/3/11601第10章实验设计END返回章目录C.CHENG返回总目录 共666页THANKYOUFORLISTENING2021/3/11602第10章实验设计END返回章目录返回总目录 共666页C.CHENG医学统计学主讲 程 琮泰山医学院预防医学教研室泰山医学院预防医学教研室 医学本科生用2021/3/11603第11章调查设计END返回章目录返回总目录 共666页C.CHENGTeach

463、ing Plan for Medical Students Medical StatisticsMedical StatisticsPROFESSORCHENGPROFESSORCHENGCONGCONGDept.ofPreventiveMedicineDept.ofPreventiveMedicineTaishanMedicalCollegeTaishanMedicalCollege2021/3/11604第11章调查设计END返回章目录返回总目录 共666页C.CHENG第第1111章调查设计章调查设计 目录目录q 第五节第五节 样本含量的估计样本含量的估计q 第二节第二节 调查计划调查计

464、划q 第三节第三节 整理与分析计划整理与分析计划q 第四节第四节 四种基本抽样方法四种基本抽样方法q 第一节第一节 调查研究的特点调查研究的特点q 第六节第六节 调查误差的控制调查误差的控制q 第七节第七节 敏感问题的调查方法敏感问题的调查方法2021/3/11605第11章调查设计END返回章目录返回总目录 共666页C.CHENG第十一章第十一章 调查设计调查设计第一节第一节 调查研究的特点调查研究的特点调查设计调查设计:是统计研究设计的一个重要部分,是医学科:是统计研究设计的一个重要部分,是医学科学研究的重要手段。学研究的重要手段。v调查研究调查研究的主要特点是研究过程中没有人为施加的干

465、的主要特点是研究过程中没有人为施加的干预措施,而是客观地观察记录某些现象的现状及其相预措施,而是客观地观察记录某些现象的现状及其相关特征。关特征。v在调查中,与研究的现象及其相关特征(包括研究因在调查中,与研究的现象及其相关特征(包括研究因素和非研究因素)是客观存在的,不能采用随机分配素和非研究因素)是客观存在的,不能采用随机分配的方法来平衡或消除非研究因素对研究结果的影响,的方法来平衡或消除非研究因素对研究结果的影响,这是调查研究这是调查研究区别于区别于实验研究的最重要的特征。实验研究的最重要的特征。 2021/3/11606第11章调查设计END返回章目录返回总目录 共666页C.CHEN

466、Gq调查研究分为调查研究分为(1 1)横断面研究)横断面研究(2 2)现状研究)现状研究(3 3)观察性研究。)观察性研究。 通过横断面调查,可以了解某一特定时通过横断面调查,可以了解某一特定时间断面上特定人群中疾病或卫生服务的间断面上特定人群中疾病或卫生服务的现状及其与之相联系的各种因素(如某现状及其与之相联系的各种因素(如某病的患病率、人体的各种生理生化或病病的患病率、人体的各种生理生化或病理指标、卫生资源状况等)的分布情况。理指标、卫生资源状况等)的分布情况。 2021/3/11607第11章调查设计END返回章目录返回总目录 共666页C.CHENG第二节第二节 调查计划调查计划q调查

467、计划,主要应解决下列几方面的问题。调查计划,主要应解决下列几方面的问题。 q一、明确调查目的和指标一、明确调查目的和指标 v 一是了解参数,用以说明总体特征;一是了解参数,用以说明总体特征;v 二是研究变量间的相关联系,探索病因。这些都需二是研究变量间的相关联系,探索病因。这些都需要通过具体指标来说明。因此,一定要把调查目的具要通过具体指标来说明。因此,一定要把调查目的具体到指标。体到指标。v 指标要精选,要重点突出。尽量选用客观性强、指标要精选,要重点突出。尽量选用客观性强、灵敏度高和特异性强的定量指标,少用定性指标。灵敏度高和特异性强的定量指标,少用定性指标。 2021/3/11608第1

468、1章调查设计END返回章目录返回总目录 共666页C.CHENG二、确定观察对象和观察单位 q 根根据据调调查查目目的的和和指指标标,确确定定观观察察对对象象和和观观察察单单位位,即即划划清清调调查查总总体体的的同同质质范范围围,特特别别是是作作参参数数估估计计时时更更为重要。为重要。q如如上上述述食食管管癌癌调调查查,观观察察对对象象是是该该地地某某年年的的常常住住人人口口,观观察察单单位位是是每每个个“人人”,同同属属该该地地区区和和时时间间范范围围的的全全部常住人口组成研究的总体。部常住人口组成研究的总体。q注注意意:观观察察对对象象可可以以是是人人,但但观观察察单单位位则则也也可可以以

469、是是人人的眼睛或牙齿等。的眼睛或牙齿等。2021/3/11609第11章调查设计END返回章目录返回总目录 共666页C.CHENG三、调查方法 q按调查的范围,可分为按调查的范围,可分为普查普查和和非全面调查非全面调查,后者又以,后者又以抽样调查抽样调查和和典型调查典型调查最为常用最为常用 。1 1. .普普查查(censuscensus)亦亦称称全全面面调调查查(complete complete surveysurvey) 就就是是将将组组成成总总体体的的所所有有观观察察单单位位全全部部加加以以调调查查,如如我我国国的的第第五五次次人人口口普普查查。理理论论上上只只有有普普查查才才能能取

470、取得得总总体体参参数数,没没有有抽抽样样误误差差,但但往往往往非非抽抽样样误误差差较较大大。普普查查一一般般都都是是用用于于了了解解总总体体某某一一特特定定“时时点点”的的情情况况,如如年中人口数,时点患病率等。年中人口数,时点患病率等。2 2. .抽样调查(抽样调查(sampling surveysampling survey) 是指从总体中随机是指从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息抽取一定数量的观察单位组成样本,然后用样本信息来推断总体特征。因而节省人力、财力和时间来推断总体特征。因而节省人力、财力和时间 2021/3/11610第11章调查设计END返回章目录返回

471、总目录 共666页C.CHENG3.3.典型调查(典型调查(typical surveytypical survey) 亦称案例调查,即在亦称案例调查,即在对事物作全面分析的基础上,有目的地选定典型的人、对事物作全面分析的基础上,有目的地选定典型的人、典型的单位进行调查。典型的单位进行调查。 由于典型调查没有遵循随机抽样的原则,不能用于由于典型调查没有遵循随机抽样的原则,不能用于估计总体参数,但在一定条件下,根据专业知识,选估计总体参数,但在一定条件下,根据专业知识,选定一般典型,可对总体特征作经验推论,但这不属统定一般典型,可对总体特征作经验推论,但这不属统计推断的范畴。计推断的范畴。 20

472、21/3/11611第11章调查设计END返回章目录返回总目录 共666页C.CHENG四、搜集原始资料的方式 q 主要有两种:直接观察法和采访法主要有两种:直接观察法和采访法 q 1.1.直接观察法直接观察法 是由调查人员到现场对是由调查人员到现场对观察对象进行直接观察、检查、测量或观察对象进行直接观察、检查、测量或计数来取得资料。计数来取得资料。q 2.2.采访法采访法 是根据被调查者的回答来搜是根据被调查者的回答来搜集资料。集资料。2021/3/11612第11章调查设计END返回章目录返回总目录 共666页C.CHENG 采访的方式常用的有三种:采访的方式常用的有三种:访问访问: :即

473、通过调查人向被调查人作口头询问,将答案填即通过调查人向被调查人作口头询问,将答案填入调查表,此法可以保证被调查人对问题的理解与设入调查表,此法可以保证被调查人对问题的理解与设计要求一致和调查资料的准确性。计要求一致和调查资料的准确性。开调查会开调查会:即利用召开知情人座谈会的方式来搜集一:即利用召开知情人座谈会的方式来搜集一些资料,如农村食管癌死亡调查中,可通过召开村乡些资料,如农村食管癌死亡调查中,可通过召开村乡干部、乡村医生、妇女代表等知情人员的调查会,全干部、乡村医生、妇女代表等知情人员的调查会,全面回顾调查期内的死者,初步推定死因,填入面回顾调查期内的死者,初步推定死因,填入“死亡死亡

474、人口登记表人口登记表”,再从表中选出可疑的食管癌死者,逐,再从表中选出可疑的食管癌死者,逐户进行访问后确诊。因此,开调查会可起到初筛和快户进行访问后确诊。因此,开调查会可起到初筛和快速取得资料的作用。速取得资料的作用。2021/3/11613第11章调查设计END返回章目录返回总目录 共666页C.CHENG信访:信访:即将调查表邮寄给被调查人,请即将调查表邮寄给被调查人,请他们填好后寄回,如病例随访调查等常他们填好后寄回,如病例随访调查等常用。采用信访法可节省人力、财力,但用。采用信访法可节省人力、财力,但由于调查人与被调查人不见面,被调查由于调查人与被调查人不见面,被调查人对调查问题的理解

475、,常发生与设计要人对调查问题的理解,常发生与设计要求不一致的情况,一般失访较多,以致求不一致的情况,一般失访较多,以致影响调查资料的质量。影响调查资料的质量。 2021/3/11614第11章调查设计END返回章目录返回总目录 共666页C.CHENG五、确定调查项目和调查表 q 根据调查指标确定每个观察单位的调查项目包括分析根据调查指标确定每个观察单位的调查项目包括分析项目和备查项目。项目和备查项目。 1.1.分析项目分析项目 是直接用于计算调查指标,以及分析明确排是直接用于计算调查指标,以及分析明确排除混杂因素影响所必须的内容。除混杂因素影响所必须的内容。 2.2.备查项目备查项目 是为了

476、保证分析项目填写的完整、准确,便是为了保证分析项目填写的完整、准确,便于核查、补填和更正而设置的,通常不直接用于分析。于核查、补填和更正而设置的,通常不直接用于分析。如姓名,地址,联系电话等。如姓名,地址,联系电话等。 2021/3/11615第11章调查设计END返回章目录返回总目录 共666页C.CHENG表11-1 调查表举例 居居民民食食管管癌癌死死亡亡调调查查表表(编码)(编码)住址住址_县县_乡乡_村村_居民组居民组死者姓名死者姓名_性别性别1男男2女女死亡日期死亡日期_年年_月月_日日出生日期出生日期_年年_月月_日日死时实足年龄死时实足年龄_岁岁诊断依据诊断依据检查:检查:X线

477、线1阳性阳性2阴性阴性9可疑可疑细胞病理细胞病理1阳性阳性2阴性阴性9可疑可疑临床表现:临床表现:进行性吞咽困难进行性吞咽困难1有有2无无9不明不明食物反流食物反流1有有2无无9不明不明胸骨后闷、胀痛胸骨后闷、胀痛1有有2无无9不明不明进行性消瘦或恶病质进行性消瘦或恶病质1有有2无无9不明不明病程病程_月月诊断结果诊断结果1是是2否否3可疑可疑调查人调查人_调查日期调查日期_年年_月月_日日2021/3/11616第11章调查设计END返回章目录返回总目录 共666页C.CHENGq 项目的答案有两种设计:项目的答案有两种设计:q 封闭式选择答案封闭式选择答案: : 有确定的多个固定答案可选,

478、有确定的多个固定答案可选,一般只选一项,此类宜多用。一般只选一项,此类宜多用。 q 开放式回答开放式回答。即不预先给定固定答案,让被调查者。即不预先给定固定答案,让被调查者自由地说出自己的情况和想法,如症状或病程等。自由地说出自己的情况和想法,如症状或病程等。优优点点是可用于设计者不了解答案有哪些,或答案难于一是可用于设计者不了解答案有哪些,或答案难于一一列举;一列举;缺点缺点是容易离题,调查时间花费较多,不便是容易离题,调查时间花费较多,不便综合汇总。综合汇总。2021/3/11617第11章调查设计END返回章目录返回总目录 共666页C.CHENG调查表q 调调查查表表(question

479、naire)(questionnaire),或或称称问问卷卷:把把调调查查项项目目按按提问的罗辑顺序列成表格,供调查时使用。提问的罗辑顺序列成表格,供调查时使用。q 调查表的格式可分为单一表和一览表。调查表的格式可分为单一表和一览表。q 单单一一表表:每每表表只只填填一一个个观观察察单单位位,每每一一观观察察单单位位的的调调查查项项目目较较多多时时适适用用于于大大量量人人群群的的调调查查;整整理理资资料料十十分方便。分方便。q一一览览表表:每每表表可可填填多多个个观观察察单单位位,每每一一观观察察单单位位的的调调查查项项目目较较少少时时。适适用用于于较较小小人人群群的的调调查查。整整理理资资料

480、料不不太方便。太方便。2021/3/11618第11章调查设计END返回章目录返回总目录 共666页C.CHENG六、制订调查的组织计划六、制订调查的组织计划q 主要包括:主要包括:q 组组织织领领导导,宣宣传传动动员员群群众众,时时间间进进度度,调调查查员员培培训训,任任务务分分工工与与联联系系,经经费费预预算算,调调查查表表格格和和宣宣传传资资料料的的准准备备,以以及及调调查查资资料料的的检检查查制制度度等等内内容容。在在正正式式调调查查之之前前,应应先先作作小小范范围围的的试试查查,以以便便检检验验调调查查表表设设计计,并作必要的修改。并作必要的修改。q 检查资料有无错误,一般从两方面考

481、虑:检查资料有无错误,一般从两方面考虑:q 逻逻辑辑检检查查,即即根根据据项项目目的的性性质质及及其其相相互互关关系系,检检查查填写内容有无矛盾,填写内容有无矛盾,q 计算机检查,即验算计算机项目有无错误计算机检查,即验算计算机项目有无错误 2021/3/11619第11章调查设计END返回章目录返回总目录 共666页C.CHENG第三节第三节 整理与分析计划整理与分析计划 一、一、数据的计算机录入与清理数据的计算机录入与清理 1.1.录入前录入前 :设置数据范围。:设置数据范围。2.2.录入时:录入时: 对同一资料,用甲、乙两位录入员,分别重对同一资料,用甲、乙两位录入员,分别重复录入。复录

482、入。 3.3.录入后录入后 抽查部分调查表,了解输入质量。抽查部分调查表,了解输入质量。用统计软件做些简单的统计描述,如编制频数分布表,用统计软件做些简单的统计描述,如编制频数分布表,发现异常值;作两相关变量的散点图,发现异常点等发现异常值;作两相关变量的散点图,发现异常点等针对调查项目间的逻辑关系,编制检查程序,用于检查针对调查项目间的逻辑关系,编制检查程序,用于检查数据间的逻辑矛盾。数据间的逻辑矛盾。2021/3/11620第11章调查设计END返回章目录返回总目录 共666页C.CHENG二、设计分析表和资料的分组二、设计分析表和资料的分组 设计分组设计分组(classification

483、)是将性质相同的观察单位合在是将性质相同的观察单位合在一起,将性质不同的观察单位分开,把组内的差异性一起,将性质不同的观察单位分开,把组内的差异性或相似性显示出来。或相似性显示出来。分组有两种:分组有两种:类型分组,按分组因素的类别来分组,类型分组,按分组因素的类别来分组,如将观察单位按性别、职业、疾病分类,某项检查结如将观察单位按性别、职业、疾病分类,某项检查结果的阳性或阴性等分组;果的阳性或阴性等分组;数量分组,即按分组因素数量分组,即按分组因素的数量大小来分组,如将观察单位按年龄大小、血压的数量大小来分组,如将观察单位按年龄大小、血压高低等分组。两种分组往往结合使用高低等分组。两种分组往

484、往结合使用。2021/3/11621第11章调查设计END返回章目录返回总目录 共666页C.CHENG三、汇总方法三、汇总方法 手工汇总一般采用划记法或分卡法。手工汇总一般采用划记法或分卡法。1.划划记记法法就就是是汇汇总总时时用用划划“正正”字字或或“”来来记记数数。此此法法简简便便易易行行,但但易易出出错错,因因此此,划划记记时时要要小小心心细细致致,至至少少要要重重复复划划两两遍遍以以资资核核对对。常常用用于于观观察察单单位位数数不不多多、调查项目较少的汇总。调查项目较少的汇总。2.分卡法分卡法就是直接把原始记录卡分别归入各组,经过就是直接把原始记录卡分别归入各组,经过核对,然后清点每

485、组卡片的张数,就是该组的观察单核对,然后清点每组卡片的张数,就是该组的观察单位数。位数。3.穿孔法:穿孔法:在调查表的边缘打上一些孔,对于阳性指在调查表的边缘打上一些孔,对于阳性指标将孔剪开与外界相通,通过穿孔将阳性指标分出来。标将孔剪开与外界相通,通过穿孔将阳性指标分出来。此法在手工汇总中是最方便快捷的。此法在手工汇总中是最方便快捷的。2021/3/11622第11章调查设计END返回章目录返回总目录 共666页C.CHENG四、组织计划四、组织计划 q一般包括:一般包括:组织分工、时间进度和汇总要求等,组织分工、时间进度和汇总要求等,特别是大规模的协作调查,有明确特别是大规模的协作调查,有

486、明确的组织计划才能使各的组织计划才能使各协作协作单位步骤单位步骤一致,按期完成总结。一致,按期完成总结。2021/3/11623第11章调查设计END返回章目录返回总目录 共666页C.CHENG第四节第四节 四种基本抽样方法四种基本抽样方法 q 不不同同抽抽样样方方法法,样样本本均均数数及及其其抽抽样样误误差差的的算算法法不不同同,而而且且无无限限总总体体和和有有限限总总体体抽抽样样的的算算法法也也不不同同。前前面面各各章章讲讲的的都都是是无无限限总总体体抽抽样样,而而在在现现场场调调查查中中,常常在在有有限限总总体中抽样。常用的抽样方法有下列四种。体中抽样。常用的抽样方法有下列四种。一、单

487、纯随机抽样一、单纯随机抽样 单纯随机抽样(单纯随机抽样(simple random samplingsimple random sampling) 是指先是指先将调查总体的全部观察单位编号,再用随机数字表或抽将调查总体的全部观察单位编号,再用随机数字表或抽签等方法随机抽取部分观察单位组成样本。签等方法随机抽取部分观察单位组成样本。优点优点是均数(或率)及标准误的计算简便。是均数(或率)及标准误的计算简便。缺缺点点是是当当总总体体例例数数较较多多时时,要要对对观观察察单单位位一一一一编编号号,甚甚为为麻烦,实际工作中有时难于办到。麻烦,实际工作中有时难于办到。 2021/3/11624第11章调

488、查设计END返回章目录返回总目录 共666页C.CHENG二、系统抽样二、系统抽样系统抽样(系统抽样(systematicsampling)又称等距抽样或机械又称等距抽样或机械抽样。即先将总体的观察单位按某一顺序号等分成抽样。即先将总体的观察单位按某一顺序号等分成n个部个部分,再从第一部分随机抽第分,再从第一部分随机抽第k号观察单位,依次用相等间号观察单位,依次用相等间隔,机械地从每一部分各抽一个观察单位组成样本。隔,机械地从每一部分各抽一个观察单位组成样本。系统抽样的系统抽样的优点优点是:是:易于理解,简便易行。易于理解,简便易行。容易得到容易得到一个按比例分配的样本。一个按比例分配的样本。

489、系统抽样的系统抽样的缺点缺点是:是:当总体的观察单位按顺序有周期趋当总体的观察单位按顺序有周期趋势或单调增减趋势,则系统抽样将产生明显的偏性。势或单调增减趋势,则系统抽样将产生明显的偏性。实际工作中的一般按单纯随机抽样方法估计抽样误差,实际工作中的一般按单纯随机抽样方法估计抽样误差,但系统抽样抽取各处观察单位并不是彼此独立的,但系统抽样抽取各处观察单位并不是彼此独立的,2021/3/11625第11章调查设计END返回章目录返回总目录 共666页C.CHENG三、整群抽样三、整群抽样q而而整群抽样(整群抽样(cluster samplingcluster sampling) 是先将总体划是先将

490、总体划分为分为K K个个“群群”组,每个群包括若干观察单位;再随机组,每个群包括若干观察单位;再随机抽取抽取k k个个“群群”,并将被抽取的各个群的全部观察单位,并将被抽取的各个群的全部观察单位组成样本。组成样本。q整群抽样的整群抽样的最大优点最大优点是便于组织,节省经费,容易控是便于组织,节省经费,容易控制调查质量。它的制调查质量。它的缺点缺点是当样本例数一定时,其抽样是当样本例数一定时,其抽样误差一般大于单纯随机抽样的误差。误差一般大于单纯随机抽样的误差。 2021/3/11626第11章调查设计END返回章目录返回总目录 共666页C.CHENG四、分层抽样四、分层抽样q分层抽样(分层抽

491、样(stratifiedsampling)又称分类抽样,即先又称分类抽样,即先按影响观察值变异较大的某种特征,将总体分为若干按影响观察值变异较大的某种特征,将总体分为若干类型或组别,再从每一层内随机抽取一定数量的观察类型或组别,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。有两种方法:单位,合起来组成样本。有两种方法:q按比例分配(按比例分配(proportionalallocation)法)法q最优分配(最优分配(optimumallocation)法)法q分层抽样的分层抽样的优点优点是:是:减少抽样误差。分层后增加了减少抽样误差。分层后增加了层内的同质性,因而可导致观察值的变异度

492、减小,各层内的同质性,因而可导致观察值的变异度减小,各层的抽样误差减小,层的抽样误差减小,。便于对不同的层采用不同的便于对不同的层采用不同的抽样方法。抽样方法。还可对不同层独立进行分析。还可对不同层独立进行分析。2021/3/11627第11章调查设计END返回章目录返回总目录 共666页C.CHENG第五节第五节 样本含量估计样本含量估计 q在在抽抽样样设设计计中中还还要要考考虑虑样样本本含含量量的的大大小小,即即样样本本观观察察单单位位数数的的多多少少问问题题。因因为为样样本本例例数数过过少少,所所得得指指标标不不够够稳稳定定,用用于于推推断断总总体体的的精精度度差差,检检验验效效能能低低

493、;样样本本例例数数过过多多,不不但但造造成成不不必必要要的的浪浪费费,也也给给调调查查的的质质量量控控制制带带来来更更多多的的困困难难。估估计计样样本本例例数数的的目目的的是是在在保保证证一一定定精精度度和和检检验验效效能能的的前前提提下下,确确定定最最少少的的观观察察单单位位数。数。2021/3/11628第11章调查设计END返回章目录返回总目录 共666页C.CHENGq 抽抽样样方方法法不不同同,估估计计样样本本例例数数的的方方法法各各异异。本本节节重重点点讲讲述述单单纯纯随随机机抽抽样样时时,估估计计总总体体均均数数所所需需样样本本例例数数n n的的方法,为此要确定:方法,为此要确定

494、:q 容容许许误误差差,即即预预计计样样本本统统计计量量与与相相应应总总体体参参数数的的最大相差值控制范围。最大相差值控制范围。q 所所调调查查总总体体的的标标准准差差,若若不不了了解解,须须通通过过试试查查、过过去去的的经经验验或或有有关关资资料料作作估估计计。有有限限总总体体抽抽样样,还还须须了解总体观察单位数了解总体观察单位数N N。q 第第一一类类错错误误的的概概率率,通通常常取取=0.05=0.05。若若要要求求越越小小,则则所所需需样样本本例例数数越越多多,要要结结合合需需要要与与可可能能来来决决定。定。q 具体抽样方法:略。具体抽样方法:略。2021/3/11629第11章调查设

495、计END返回章目录返回总目录 共666页C.CHENG第六节第六节 调查误差的控制调查误差的控制q调查结果常常出现误差。调查结果常常出现误差。q除除有有抽抽样样误误差差外外,还还可可能能有有非非抽抽样样误误差差。抽抽样样误误差差不不仅仅易易于于控控制制,还还可可作作出出估估计计,但但非非抽抽样样误误差差的的控控制制却却比较复杂。比较复杂。q因因为为:抽抽样样误误差差的的控控制制主主要要与与调调查查设设计计人人员员有有关关;而而非非抽抽样样误误差差的的控控制制,不不仅仅与与设设计计人人员员有有关关,还还涉涉及及到为数众多的调查人员和观察对象;到为数众多的调查人员和观察对象;q从从时时间间上上来来

496、说说,抽抽样样误误差差的的控控制制,主主要要在在设设计计阶阶段段;而而非非抽抽样样误误差差的的控控制制,则则要要求求贯贯穿穿到到设设计计、资资料料搜搜集集、整整理理、分分析析的的全全过过程程。非非抽抽样样误误差差来来源源纷纷繁繁,形形式式多多样。样。2021/3/11630第11章调查设计END返回章目录返回总目录 共666页C.CHENG一、设计阶段一、设计阶段非抽样误差可能来自非抽样误差可能来自:调查指标选择不当调查指标选择不当 调查对象的范围划分不当。调查对象的范围划分不当。 调查项目的定义不明确。调查项目的定义不明确。 周岁年龄计算不准确。周岁年龄计算不准确。 编制周密的逻辑检查与计算

497、检查提纲,以提高资料检编制周密的逻辑检查与计算检查提纲,以提高资料检查的效果。查的效果。2021/3/11631第11章调查设计END返回章目录返回总目录 共666页C.CHENG二、调查阶段二、调查阶段非抽样误差可能来自:非抽样误差可能来自:调查人员的工作态度不好,业务水平不足。调查人员的工作态度不好,业务水平不足。被调查者因故不在、躲避调查、拒绝回答、有意隐被调查者因故不在、躲避调查、拒绝回答、有意隐瞒、记忆不清等。瞒、记忆不清等。为此应广泛开展宣传,争取群众积极配合;家访要摸为此应广泛开展宣传,争取群众积极配合;家访要摸清被调查者在家的时间规律,并作必要的补查;对敏清被调查者在家的时间规

498、律,并作必要的补查;对敏感问题,要进行细致的思想工作,注意保密,或从侧感问题,要进行细致的思想工作,注意保密,或从侧面了解,或用下节随机应答技术;对记忆不清者可请面了解,或用下节随机应答技术;对记忆不清者可请知情人、同龄人帮助回忆。知情人、同龄人帮助回忆。2021/3/11632第11章调查设计END返回章目录返回总目录 共666页C.CHENG三、整理与分析阶段三、整理与分析阶段非非抽抽样样误误差差可可能能来来自自编编码码、录录入入、汇汇总总、计计算算等等方方面面的的错错误误。为为此此,应应严严格格地地进进行行资资料料清清理理和和检检查查,及及时时发现和更正错误。发现和更正错误。评价调查质量

499、必须联系非抽样误差的控制,后者一般评价调查质量必须联系非抽样误差的控制,后者一般采用两种方法来衡量:采用两种方法来衡量:抽样复查。即随机抽取部分抽样复查。即随机抽取部分已调查对象,再次组织更严格的标准调查,抽查人员已调查对象,再次组织更严格的标准调查,抽查人员不得在原调查单位参加复查不得在原调查单位参加复查与不同来源的同类资料作对比。与不同来源的同类资料作对比。2021/3/11633第11章调查设计END返回章目录返回总目录 共666页C.CHENG第七节第七节* * 敏感问题的调查方法敏感问题的调查方法q 敏感问题敏感问题(sensitive question)(sensitive que

500、stion) 包括对国家政策、包括对国家政策、社会规范、伦理道德的态度、经济收入、生活行为以社会规范、伦理道德的态度、经济收入、生活行为以及个人隐私等。被调查者往往被拒绝回答或隐瞒,但及个人隐私等。被调查者往往被拒绝回答或隐瞒,但却是一个不容忽视的社会问题。却是一个不容忽视的社会问题。q 对对敏敏感感问问题题的的调调查查应应该该既既能能满满足足其其本本人人不不泄泄密密,又又能能如如实实了了解解社社会会群群体体的的问问题题。对对敏敏感感问问题题的的调调查查经经常常采采用用的的是是随随机机应应答答技技术术(randomized randomized response response techni

501、que, RRTtechnique, RRT)。)。q 具体方法:具体方法:略。略。 2021/3/11634第11章调查设计END返回章目录返回总目录 共666页C.CHENGThank You for Listening2021/3/11635第11章调查设计结束结束返回章目录返回总目录 共666页C.CHENG医学统计学医学统计学 主讲 程琮泰山医学院预防医学教研室泰山医学院预防医学教研室本科生用本科生用2021/3/11636第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG第第1212章统计表与统计图章统计表与统计图 目录目录q 第二节统计图第二节统计图q

502、 第一节第一节 统计表统计表2021/3/11637第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG学习要求掌握统计表与统计图的概念和意义;掌握统计表与统计图的概念和意义;掌握统计表与统计图的特点及应用条件;掌握统计表与统计图的特点及应用条件;掌握统计表与统计图的绘制原则;掌握统计表与统计图的绘制原则;掌握统计表与统计图的类型及各类型的应用条件掌握统计表与统计图的类型及各类型的应用条件.2021/3/11638第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG统计表(统计表(statistical tablestatistical ta

503、ble)- - 把统计分把统计分析资料及其指标用表格列出,称为统计表。它析资料及其指标用表格列出,称为统计表。它可以代替冗长的文字叙述,便于计算、分析和可以代替冗长的文字叙述,便于计算、分析和对比。对比。统计图(统计图(statistical graphstatistical graph)- - 是用点、是用点、线、面等表达统计资料中数量及其变化趋势,线、面等表达统计资料中数量及其变化趋势,使统计资料更形象、更易懂,可直观地反映出使统计资料更形象、更易懂,可直观地反映出事物间的数量关系。事物间的数量关系。 第一节第一节 统计表统计表2021/3/11639第12章统计表与统计图 结束结束返回章

504、目录返回总目录 共666页C.CHENG由由于于统统计计图图对对数数量量的的表表达达比比较较粗粗略略,不不便便作作深深入入细细致致的的分分析析,所所以以一一般般在绘制统计图时,都应附有统计表。在绘制统计图时,都应附有统计表。2021/3/11640第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG统计表主要有表序、标题、标目、表体和线条等组成,统计表主要有表序、标题、标目、表体和线条等组成,其基本格式如下:其基本格式如下:表序表序 标题标题 2021/3/11641第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG一、制表的基本要求一、制

505、表的基本要求1.标题标题:简明扼要能概括表中内容简明扼要能概括表中内容,它应包括时它应包括时间、地点、内容等。标题应写在表顶线的上端间、地点、内容等。标题应写在表顶线的上端中间的位置中间的位置。2.标目标目用以说明表内数字含义的部分叫标目。用以说明表内数字含义的部分叫标目。(1)横横标标目目横横标标目目位位于于表表左左侧侧,是是统统计计表表所所要要叙述的主语,它说明同一横行数字的意义。叙述的主语,它说明同一横行数字的意义。(2)纵标目纵标目纵标目位于标目线的上端,是被纵标目位于标目线的上端,是被说明事物的宾语,一般是绝对数或统计指标。说明事物的宾语,一般是绝对数或统计指标。2021/3/116

506、42第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG3.3.线条线条 线条应尽量减少,除顶线、标目线、线条应尽量减少,除顶线、标目线、合计线和底线外,其余线条均可省略。特别是合计线和底线外,其余线条均可省略。特别是表的左上角的斜线和两侧的边线应一律不用表的左上角的斜线和两侧的边线应一律不用 。4.4.数字数字 表内的数字一律用阿位伯数字,同一表内的数字一律用阿位伯数字,同一指标位数要对齐,小数点的位数要一致,一般指标位数要对齐,小数点的位数要一致,一般保留保留1 12 2位小数。无数字的空格用位小数。无数字的空格用“”表示,表示,暂缺或未记录用暂缺或未记录用“”表

507、示。表示。5.5.备注备注 表内不应有其他文字出现,需要说明表内不应有其他文字出现,需要说明的备注用的备注用“* *”号标出,写在表的底线下面。号标出,写在表的底线下面。 2021/3/11643第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG二、统计表的种类二、统计表的种类 1.简简单单表表只只按按一一个个特特征征或或标标志志分分组组的的统统计计表表称为简单表。如表称为简单表。如表12-1。2.复合表复合表按两个或两上以上特征或标志结合按两个或两上以上特征或标志结合起来分组的统计表称复合表或组合表。起来分组的统计表称复合表或组合表。2021/3/11644第12

508、章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG表表12-1某地某年流行性脑脊髓炎各病型的病死率某地某年流行性脑脊髓炎各病型的病死率2021/3/11645第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG表表12-2某地某地1995年流行性脑脊髓膜炎不同病型病死率与病情轻重的关系年流行性脑脊髓膜炎不同病型病死率与病情轻重的关系2021/3/11646第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG第二节第二节 统计图统计图统计图统计图有多种,医学研究工作中常用的统计图有多种,医学研究工作中常用的统计图有:有:直

509、条图、百分直条图、圆形图、线图、半对数直条图、百分直条图、圆形图、线图、半对数线图、直方图、散点图、箱式图和统计地图等线图、直方图、散点图、箱式图和统计地图等。2021/3/11647第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG1.1.根据资料性质和分析的目的,根据资料性质和分析的目的,正确选择合适的图型。正确选择合适的图型。间断性资料间断性资料:(1)直条图、箱式图)直条图、箱式图比较各个相互独立的比较各个相互独立的样本指标样本指标。(2)圆形图、百分直条图)圆形图、百分直条图表示各组成部分表示各组成部分或各构成部分的情况或各构成部分的情况。2021/3/1

510、1648第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG连续性资料连续性资料线图线图表示数量随时间的变迁;表示数量随时间的变迁;表示某表示某种现象随另一种现象而变迁种现象随另一种现象而变迁。半对数线图半对数线图比较两个或几个率的变化速度比较两个或几个率的变化速度直方图直方图表示变量的频数分布。表示变量的频数分布。地域性资料地域性资料:统计地图:表示某种事物的地理分布统计地图:表示某种事物的地理分布。2021/3/11649第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG2.每图应有标题每图应有标题,其要求与统计表相同,一般,其要求与统

511、计表相同,一般放在图下方正中。放在图下方正中。3.纵横两轴应有标目纵横两轴应有标目并注明单位。并注明单位。v横标目横标目:一般表示主语,如疾病名称、发病时:一般表示主语,如疾病名称、发病时间、年龄组等,尺度自左向右;间、年龄组等,尺度自左向右;v纵标目纵标目:表示宾语,一般表示频数、比或率,:表示宾语,一般表示频数、比或率,尺度自下而上,一般需从零开始,由小到大。尺度自下而上,一般需从零开始,由小到大。v纵横两轴纵横两轴长宽比例长宽比例一般为一般为5:7为宜。为宜。v4.若图中用不同颜色或线条代表不同事物若图中用不同颜色或线条代表不同事物,则,则须在图中加以说明。须在图中加以说明。2021/3

512、/11650第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG二、常用统计图及其绘制方法二、常用统计图及其绘制方法1.直条图(直条图(bargraph)它是以等宽直条的长短来表示各指标的数值,它是以等宽直条的长短来表示各指标的数值,用来表示各相互独立指标之间的对比关系。直用来表示各相互独立指标之间的对比关系。直条图有条图有单式直条图单式直条图(见图(见图12-1)、)、复式直条图复式直条图(见图(见图12-2)两种。)两种。2021/3/11651第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG2021/3/11652第12章统计表与统

513、计图 结束结束返回章目录返回总目录 共666页C.CHENG2. 2. 圆形图(圆形图(pie graphpie graph) 圆形图是以圆面积为圆形图是以圆面积为100%100%,圆内各扇形面积为,圆内各扇形面积为各部分所占的百分比,用来表示总体各组成部各部分所占的百分比,用来表示总体各组成部分的构成比。如图分的构成比。如图12-312-3。 圆圆面面积积的的百百分分之之一一相相当当于于3.63.6,将将资资料料各各部部分分所所占占的的百百分分数数乘乘以以3.63.6即即得得各各部部分分应应占占的度数。的度数。 圆圆内内各各部部分分按按百百分分比比的的大大小小顺顺序序或或按按事事物物自自然然

514、顺顺序序排排列列,一一般般以以时时钟钟1212点点或或9 9点点的的位位置置作作始点,顺时针方向排列。始点,顺时针方向排列。 2021/3/11653第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG图图12-3 199612-3 1996年我国农村居民主要疾病的死因构成比年我国农村居民主要疾病的死因构成比 2021/3/11654第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG3. 3. 百分直条图(百分直条图(percent bar percent bar graphgraph) 亦称构成直条图,其作用和适用范围亦称构成直条图,其作

515、用和适用范围与圆形图是相同的。它只是以一直条与圆形图是相同的。它只是以一直条的面积为的面积为100%100%,直条内各段的面积为,直条内各段的面积为相应部分所占的百分比。见图相应部分所占的百分比。见图12-412-4。 2021/3/11655第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG图图12-4 12-4 某地某地19831983年五种主要死因年五种主要死因构成构成 2021/3/11656第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG4. 4. 线图(线图(line graphline graph) 它是用线段的上升、下降

516、来说明某事它是用线段的上升、下降来说明某事物在时间上的发展变化的趋势,或某现物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。如图象随另一现象变迁的情况。如图12-512-5,适用于连续性资料。适用于连续性资料。 2021/3/11657第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG图图12-5 12-5 某市市区人口各年度出生率(某市市区人口各年度出生率(1 1)、死亡率)、死亡率(1(1) )、自然增加率、自然增加率(1(1) )2021/3/11658第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG5.5.半半对对数数

517、线线图图(semilogarithmic semilogarithmic line line graphgraph) 它它是是纵纵轴轴为为对对数数尺尺度度,横横轴轴为为算算术术尺尺度度的的线线图图。由由于于同同样样的的增增长长速速度度在在对对数数尺尺度度上上的的距距离离是是相相等等的的,因因此此便便于于两两事事物物或或两两种种以以上上事事物物在在发发展展速速度度上上的的对对比比。如如图图12-612-6。2021/3/11659第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG图图12-6 12-6 某市市区各年度急性传染病、肺结核死亡率某市市区各年度急性传染病、肺

518、结核死亡率(1/10(1/10万万) ) 2021/3/11660第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG6.直方图(直方图(histogram)直方图是以各矩形的面积表示各组段的频数,直方图是以各矩形的面积表示各组段的频数,各矩形面积的总和为总频数,适用于表示连续各矩形面积的总和为总频数,适用于表示连续性资料的频数分布。性资料的频数分布。2021/3/11661第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG图图12-7 12-7 某市某年乙脑患者的年龄分布(正确图)某市某年乙脑患者的年龄分布(正确图) 图图12-8 12-

519、8 某市某年乙脑患者的年龄分布(错误图)某市某年乙脑患者的年龄分布(错误图) 2021/3/11662第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG7. 7. 散点图(散点图(scatter diagramscatter diagram) 散散点点图图是是用用点点的的密密集集程程度度和和趋趋势势表表示示两两现现象象间的相关关系。见第九章。间的相关关系。见第九章。. .箱式图箱式图(box plot)(box plot) 常常用用于于反反映映几几组组数数据据的的变变化化情情况况并并进进行行直直观观比比较较分分析析,如如图图12-912-9。以以“箱箱子子”上上端端

520、为为P P7575, , 下下端端为为P P2525,中中间间以以横横线线示示P P5050,最最大大值值、最最小小值值为为“箱箱子子”上上下下两两个个柄柄,用用于于数数据据直直观观比比较较分析。分析。2021/3/11663第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG图图12-9 12-9 抑肿瘤药不同剂量组与对照组用药后小白鼠肿抑肿瘤药不同剂量组与对照组用药后小白鼠肿瘤重量的比较瘤重量的比较 2021/3/11664第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENG9. 9. 统计地图(统计地图(statistical mapstatistical map) 统计地图是用点、线、颜色、形象统计地图是用点、线、颜色、形象或其他符号绘制于地图上,以表示或其他符号绘制于地图上,以表示某种事物的地理分布情况。某种事物的地理分布情况。 2021/3/11665第12章统计表与统计图 结束结束返回章目录返回总目录 共666页C.CHENGTHANKYOUFORLISTENING2021/3/11666第12章统计表与统计图

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号