中南大学医学统计学5年制预防医学用第816章课件

上传人:壹****1 文档编号:579760433 上传时间:2024-08-27 格式:PPT 页数:463 大小:3.18MB
返回 下载 相关 举报
中南大学医学统计学5年制预防医学用第816章课件_第1页
第1页 / 共463页
中南大学医学统计学5年制预防医学用第816章课件_第2页
第2页 / 共463页
中南大学医学统计学5年制预防医学用第816章课件_第3页
第3页 / 共463页
中南大学医学统计学5年制预防医学用第816章课件_第4页
第4页 / 共463页
中南大学医学统计学5年制预防医学用第816章课件_第5页
第5页 / 共463页
点击查看更多>>
资源描述

《中南大学医学统计学5年制预防医学用第816章课件》由会员分享,可在线阅读,更多相关《中南大学医学统计学5年制预防医学用第816章课件(463页珍藏版)》请在金锄头文库上搜索。

1、第八章第八章实验设计实验设计中南大学医学统计学(5年制预防医学用第816章)设计设计实验设计实验设计调查设计调查设计专业设计专业设计统计设计统计设计专业设计专业设计统计设计统计设计中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素实验设计三要素:受试对象(object)处理因素(treatment)实验效应(experimentaleffect)中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素 受试对象受试对象 受试对象或称研究对象是处理因素作用的客体,是根据研究目的确定的研究总体。 研究目的不同, 医学研究的对象可以是人、

2、动物和植物,也可以是某个器官、细胞和血清等生物材料。中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素按试验对象,实验可以分为三类:动物实验(animalexperiment), 其受试对象为动物;临床试验(clinicaltrial), 其受试对象通常为患者;现场试验(fieldtrial), 其受试对象通常为正常人群。中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素受试对象作严格的规定,以保证其同质同质性性( (homogeneity) )和代表性和代表性 同质性:同质性:动物的种类、品系、年龄、性别、体重、窝别和营养状

3、况等。人群的性别、年龄、民族、职业、文化程度和经济状况、病情和病程等。 代表性:代表性:随机抽样随机抽样中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素受试对象应满足两个基本条件:一是对处理因素敏感敏感;二是反应必须稳定稳定。选择受试对象应明确其纳入标准纳入标准(inclusioncriteria)和排除标准排除标准(exclusioncriteria)。中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素 处理因素处理因素处理因素或受试因素处理因素或受试因素:根据研究目确定的欲施加或欲观察的、并能引起受试对象直接或间接效应的

4、因素,简称处理或因素(factor)。是根据研究目的确定的主要因素,处理因素在整个实验中应始终要保持不变 非处理因素非处理因素:与处理因素可能同时存在的能使受试对象产生效应的非研究因素。非处理因素干扰效应与所研究因素间关系的观察与分析,常常又称混杂因素(confounder)。中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素处理因素种类:生物性、化学性、物理性生物性、化学性、物理性处理因素水平:每个因素在数量上或强度上可有不同。 单因素因素单水平水平:研究某药物对原发性高血压患者的降压作用; 单因素多水平因素多水平:研究某药不同剂量的降血糖作用; 多因素多因

5、素单水平水平:比较不同药物或不同疗法对某病的治疗效果; 多因素多水平多因素多水平:临床上探索某肿瘤的联合化疗方案等。 中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素 实验效应实验效应 实验效应是处理因素作用于受试对象的反应(response)和结局(outcome),它通过观察指标(统计学常将指标称为变量)来体现。 观察指标应具有客观性、精确性、特异性和灵敏性。 中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素客观性:客观性:客观指标则是借助测量仪器和检验等手段来反映的观察结果,客观指标具有较好的真实性和可靠性。 主观指

6、标是受试对象的主观感觉、记忆、陈述或实验者的主观判断结果;而。主观指标具有随意性和偶然性。中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素精确性精确性:包括准确度(accuracy)和精密度(precision)两层含义。 准确度指观察值与真值的接近程度,主要受系统误差的影响; 精密度指重复观察时,观察值与其均数的接近程度,其差值属于随机误差。中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素特异性和灵敏性:特异性和灵敏性:某指标的特异度(specificity)反映其鉴别真阴性的能力,灵敏度(sensitivity)则反映

7、其检出真阳性的能力。特异度高的指标不易受混杂因素的干扰;灵敏度高的指标能将处理因素的效应更好地显示出来。中南大学医学统计学(5年制预防医学用第816章)实验设计的基本要素实验设计的基本要素4)4)指标的盲法观察指标的盲法观察: 为消除或最大限度地减少主观偏性,在设计时常采用盲法(blindmethod)。 单盲法单盲法( (singleblindmethod) ):受试对象不知道自己分在哪一组; 双盲法双盲法( (doubleblindmethod) ):受试对象和实验执行者均不知道受试对象分在哪一组 三盲法三盲法( (tripleblindmethod) ):受试对象、实验执行者和统计分析人

8、员三者均不知道受试对象分在哪一组中南大学医学统计学(5年制预防医学用第816章)实验设计的基本原则实验设计的基本原则实验设计的基本原则对照对照(control)随机化随机化(randomization)重复重复(replication)中南大学医学统计学(5年制预防医学用第816章)实验设计的基本原则对照原则对照原则目的: 显露处理因素的效应; 控制混杂因素和偏倚; 判断不良反应。中南大学医学统计学(5年制预防医学用第816章)实验设计的基本原则对照的形式:(1)安慰剂对照(placebocontrol)(2)空白对照(blank control) (3)实验对照(experimental c

9、ontrol) (4)自身对照(self control) (5)标准对照(standard control) 中南大学医学统计学(5年制预防医学用第816章)实验设计的基本原则随机化原则随机化原则 随机化是使每个受试对象都有同等的机会被抽取或分到不同的实验组和对照组。随机化形式(1)抽样的随机 (2)分组的随机(3)实验顺序的随机中南大学医学统计学(5年制预防医学用第816章)实验设计的基本原则完全随机化(1)编编号号 将n个受试对象编号,动物可按体重大小,患者可按就诊顺序。(2)取取随随机机数数 可从随机数字表或计算器或计算机获得。每个受试对象获得的随机数可是一位数,也可是两位数或三位数,

10、一般要求与n的位数相同。 (3)确定组别 根据受试对象获得的随机数决定受试对象在哪一组。分两组可按随机数的奇偶;分k组可按随机数除以k后的余数进行分组。中南大学医学统计学(5年制预防医学用第816章)实验设计的基本原则例8-1 试将同性别、体重相近的30只动物分到A、B、C三组。 先将动物按体重编号,再从本书后面所附随机数字表中任一行如第16行最左开始连续取30个两位数字。最后将这30个两位数字分别除以3,余数0、1、2分别对应于A、B、C三组中南大学医学统计学(5年制预防医学用第816章)实验设计的基本原则分层随机化分层随机化步骤:(1)编号排序 将每层的受试对象编号排序,如体重从轻到重,时

11、间由前至后等。(2)取随机数 从随机数字表或计算器或计算机获得。每个受试对象可取两位数。 (3)确定组别 根据每层受试对象获得的随机数的大小顺序决定受试对象在哪一组。对每个处理也可规定顺序,如处理A, B, C, 分别对应于序号1, 2, 3, 。 中南大学医学统计学(5年制预防医学用第816章)实验设计的基本原则重复原则重复原则 重复是指在相同实验条件下进行多次研究或多次观察。重复的情形: (1)整个实验的重复(2)用多个受试对象进行重复 有足够的样本含量(sample size),(3)同一受试对象的重复观察 重复最主要的作用是估计实验误差。中南大学医学统计学(5年制预防医学用第816章)

12、常用的实验设计方案常用的实验设计方案方案方案:完全随机设计完全随机设计配对设计配对设计随机区组设计随机区组设计交叉设计交叉设计析因设计析因设计中南大学医学统计学(5年制预防医学用第816章)完全随机设计完全随机设计 1、设计模式:目标人群随机抽样研究对象试验组对照组随机分配阳性阴性阳性阴性中南大学医学统计学(5年制预防医学用第816章)常用的实验设计方案常用的实验设计方案交叉设计交叉设计设计模式: 阳性 阳性 甲组(方案A) 洗 方案B对象 阴性 脱 阴性 阳性 期 阳性 乙组(方案B) 方案A 阴性 阴性中南大学医学统计学(5年制预防医学用第816章)常用的实验设计方案常用的实验设计方案中南

13、大学医学统计学(5年制预防医学用第816章)常用的实验设计方案常用的实验设计方案中南大学医学统计学(5年制预防医学用第816章)样本含量的估计样本含量的估计影响样本含量估计的因素影响样本含量估计的因素1.第一类错误概率的大小。越小所需样本含量愈多,2.检验功效(1)或第二类错误概率的大小检验功效愈大,第二类错误的概率愈小,所需样本含量愈多。3.容许误差容许误差愈大,所需样本含量愈小。4.总体标准差或总体概率反映资料的变异度。愈大,所需样本含量自然愈多。总体概率越近于0.50,则所需样本含量愈多。中南大学医学统计学(5年制预防医学用第816章)样本含量的估计样本含量的估计样本含量估计的方法样本含

14、量估计的方法 样本含量的估计方法: 查表法:查有关样本含量表, 计算法:根据假设检验的公式反推。中南大学医学统计学(5年制预防医学用第816章)样本含量的估计样本含量的估计(1)单样本均数检验或均数的配对检验中南大学医学统计学(5年制预防医学用第816章)样本含量的估计样本含量的估计(2)两样本均数检验中南大学医学统计学(5年制预防医学用第816章)样本含量的估计样本含量的估计(3)单样本频率检验中南大学医学统计学(5年制预防医学用第816章)临床试验设计临床试验设计规范性文件规范性文件中华人民共和国药品管理法新药审批办法药品临床试验管理规范(GoodClinicalPractice,GCP)

15、化学药品和生物制品临床试验的生物统计学指导原则中南大学医学统计学(5年制预防医学用第816章)临床试验设计临床试验设计临床试验的分期临床试验的分期 I期临床试验为新药研究的起始期,往往在数名志愿者身上进行,必要时可包括病人。初步的临床药理学及人体安全性评价 期临床试验为新药临床评价最为重要的一期。盲法的随机对照试验(RCT),对新药的有效性和安全性作出初步评价,推荐临床给药剂量。 期临床试验为扩大的多中心临床试验,进一步评价药物的有效性、安全性。 期临床试验为药品上市后的监测中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)特殊问题:特殊问题:1、

16、研究对象的选择: 临床试验的研究对象必须是临床已确定诊断的“典型”病人。最好能从病例总体中随机抽取研究对象,以确保样本的代表性。否则其结果不能推理到病人总体。病人的一些特征如病情的严重程度、性别、年龄等均会对疗效产生影响。中南大学医学统计学(5年制预防医学用第816章)临床试验临床试验2、诊断标准 有2层意思:一是病例的诊断标准,应为确诊的、统一的标准;二是入选试验的病人对象的标准,可限制一些条件,但必须严格执行。标准不清楚,容易产生错误分类误差,因而影响疗效的评价。中南大学医学统计学(5年制预防医学用第816章)临床试验临床试验3、样本大小的估计 在进行临床试验时要注意有适宜的样本数,样本过

17、少,回减低研究效率,得不出研究结果;样本过大则导致不必要的浪费,更会影响研究的质量。治疗方案的有效率、显著性水平和把握度对样本的大小有影响。 估计的方法有公式法和查表法。中南大学医学统计学(5年制预防医学用第816章)临床试验临床试验中南大学医学统计学(5年制预防医学用第816章)临床试验临床试验4、随机分组随机分组 其其目目的的是是确确保保两两组组在在某某些些特特征征上上的的可可比比性性。随随机机的的方方法法可可用用简简单单随随机机法法(随随机机数数字字表表)和和区组随机法。区组随机法。5 5、盲法的应用、盲法的应用 即即让让某某些些人人不不知知道道研研究究的的分分组组情情况况及及每每组组所

18、所采采取取的的措措施施的的方方法法。目目的的是是避避免免试试验验者者和和受受试者的偏倚和主观偏见。盲法的具体方式有试者的偏倚和主观偏见。盲法的具体方式有: 中南大学医学统计学(5年制预防医学用第816章)临床试验临床试验 单单盲盲:即即研研究究者者和和研研究究对对象象有有一一方方不不知知道道研研究的分组情况。究的分组情况。 双双盲盲:即即研研究究者者和和研研究究对对象象均均不不知知道道每每个个研研究对象的分组情况。究对象的分组情况。 三三盲盲:即即研研究究者者和和研研究究对对象象以以及及资资料料分分析析人人员均不知道研究的分组情况。员均不知道研究的分组情况。 公公开开试试验验:即即研研究究者者

19、研研究究对对象象均均知知道道研研究究的的分分组组情情况况。有有些些研研究究一一定定要要用用公公开开试试验验,如如手手术疗效的考核。术疗效的考核。中南大学医学统计学(5年制预防医学用第816章)临床试验临床试验6 6、安慰剂的使用、安慰剂的使用 是一种在外观形状(如是一种在外观形状(如大小、气味、颜色等)与试验组所用制大小、气味、颜色等)与试验组所用制剂相似的制剂,或缺乏特异有效成分剂相似的制剂,或缺乏特异有效成分(称为消极安慰剂),或为目前公认有(称为消极安慰剂),或为目前公认有效的常用的制剂(称为积极安慰剂)。效的常用的制剂(称为积极安慰剂)。目的是消除受试者的主观偏见。目的是消除受试者的主

20、观偏见。中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料

21、的方差分析中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析1.总变异60名2型糖尿病患者的餐后2小时血糖Xij大小各不相同,与它们的总均数(overallmean)也不相同,这种变异称为总变异(totalvariation)。该变异既包含了随机误差(即2型糖尿病患者的个体差异和测量误差),又包含了三组用药即处理的不同,其大小用所有数据(N=60)的方差即均方MS(meansquare)来表示。中南大学医学统计学(5年制预防医学用第816章)完全随机

22、设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料

23、的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分

24、析(2)计算检验统计量计算检验统计量可根据下表的公式和前面表9-1下半部分数据来计算。也可用统计软件包如SAS或SPSS等进行计算,直接获得表9-4的方差分析表。中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)完全随机设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析中南大学医学统计学(

25、5年制预防医学用第816章)例例9-2为探索丹参对肢体缺血再灌注损伤的影响,为探索丹参对肢体缺血再灌注损伤的影响,将将30只纯种新西兰实验用大白兔,按窝别相同、只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为体重相近划分为10个区组。每个区组个区组。每个区组3只大白只大白兔随机采用兔随机采用A、B、C三种处理方案,即在松止三种处理方案,即在松止血带前分别给予丹参血带前分别给予丹参2ml/kg、丹参、丹参1ml/kg、生、生理盐水理盐水2ml/kg,在松止血带前及松后,在松止血带前及松后1小时分小时分别测定血中白蛋白含量别测定血中白蛋白含量(g/L),算出白蛋白减,算出白蛋白减少量如下表少量

26、如下表9-6所示,问所示,问A、B两方案分别与两方案分别与C方案的处理效果是否不同?方案的处理效果是否不同?中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析

27、中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析(2)计算检验统计量计算检验统计量变异来源变异来源SSdfMSFP处理组处理组13.701826.850932.6390.05误差误差3.7790180.2099总总19.038529中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)随机区组设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章

28、)随机区组设计资料的方差分析中南大学医学统计学(5年制预防医学用第816章)重复测量资料的方差分析例例9-4为研究减肥新药盐酸西布曲明片和盐酸西布曲为研究减肥新药盐酸西布曲明片和盐酸西布曲明胶囊的减肥效果是否不同,以及肥胖患者服药后不明胶囊的减肥效果是否不同,以及肥胖患者服药后不同时间的体重随时间的变化情况。采用双盲双模拟随同时间的体重随时间的变化情况。采用双盲双模拟随机对照试验,将体重指数机对照试验,将体重指数BMI 27的肥胖患者的肥胖患者40名随机名随机等分成两组,一组给予盐酸西布曲明片等分成两组,一组给予盐酸西布曲明片+模拟盐酸西布模拟盐酸西布曲明胶囊,另一组给予盐酸西布曲明胶囊曲明胶

29、囊,另一组给予盐酸西布曲明胶囊+模拟盐酸西模拟盐酸西布曲明片。所有患者每天坚持服药,共服药布曲明片。所有患者每天坚持服药,共服药6个月个月(24周周),受试期间禁用任何影响体重的药物,而且受试对,受试期间禁用任何影响体重的药物,而且受试对象行为、饮食及运动与服药前的平衡期均保持一致。象行为、饮食及运动与服药前的平衡期均保持一致。分别于平衡期分别于平衡期(0周周)、服药后的、服药后的8周、周、16周、周、24周测定周测定肥胖患者的体重肥胖患者的体重(kg)得表得表9-13的资料。的资料。中南大学医学统计学(5年制预防医学用第816章)受试对象j剂型k服药后测定时间i(周)受试对象j剂型k服药后测

30、定时间i(周)0816240816241184.482.282.283.021264.461.461.862.021105.0100.897.496.622291.088.487.489.63163.862.061.660.423276.076.272.871.64186.285.583.081.824271.072.069.868.45175.673.474.073.025269.466.662.860.86161.260.460.860.226289.987.492.695.57167.866.063.463.627266.863.662.661.68177.273.672.672.028

31、263.461.262.662.09173.272.272.274.629270.067.669.869.410165.463.662.660.830286.684.081.478.011180.077.072.469.431290.484.477.471.012174.477.075.277.432274.873.672.876.613182.680.481.279.633267.464.461.058.214168.665.063.263.434284.482.280.275.415179.077.073.872.535279.076.076.578.516169.466.864.460.

32、836287.483.281.277.217172.671.068.270.237268.765.863.066.418172.472.672.872.638283.081.878.478.419175.673.473.472.239266.564.463.465.420180.078.076.474.840264.662.664.262.0中南大学医学统计学(5年制预防医学用第816章)重复测量资料和随机区组设计资料的区别:(1)重复测量资料中同一受试对象(看成区组)的数据高度相关,无论哪位受试对象服用盐酸西布曲明片剂或是胶囊,其服药后8周、16周和24周的体重均和前面时间点(含服药前的0周

33、)的体重相关。表9-14为分不同剂型后使用统计软件包计算得到的各时点简单相关系数r,从中可以看出,不同时点间相关系数介于0.8500.989之间,其P值全为0.000,均有统计学意义,说明不同时点数据其相关性较强。重复测量资料的方差分析中南大学医学统计学(5年制预防医学用第816章)(k=1时)服药后测定时间i服药后测定时间i(周)(k=2时)服药后测定时间i服药后测定时间i(周)816248162400.9890.9710.93900.9890.944 0.85080.9860.96680.961 0.880160.985160.958中南大学医学统计学(5年制预防医学用第816章)(2)重

34、复测量资料中的处理因素在受试对象(看成区组)间为随机分配,但受试对象(看成区组)内的各时间点往往是固定的,不能随机分配;随机区组设计资料中每个区组内的受试对象彼此独立,处理只在区组内随机分配,同一区组内的受试对象接受的处理各不相同。本节主要介绍两因素重复测量资料的单变量方差分析方法。重复测量资料的方差分析中南大学医学统计学(5年制预防医学用第816章)离均差平方和与自由度的分解离均差平方和与自由度的分解两因素重复测量资料的总变异包括两部分:横向分组的受试对象间(betweensubjects)的变异纵向分组的受试对象内(withinsubjects)的变异。其中横向分组受试对象间的变异又分为处

35、理因素K(在此为剂型)的变异和个体间误差的变异两部分;而纵向分组受试对象内的变异则可分为时间因素I的变异、处理K和时间I的交互作用(KI)以及个体内误差的变异三部分重复测量资料的方差分析中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)重复测量资料方差分析的基本步骤重复测量资料方差分析的基本步骤重复测量资料的方差分析步骤仍为三步,本例如下:(1)建立检验假设,确定检验水准建立检验假设,确定检验水准对于处理因素对于处理因素KH0:不同剂型(片剂和胶囊)的减肥效果相同H1:不同剂型(片剂和胶囊)的减肥效果不同重复测量资料的方差分析中南大学医学统计学(5

36、年制预防医学用第816章)对于时间因素对于时间因素IH0:服用减肥药前后不同时间体重的总体均数全相等H1:服用减肥药前后不同时间体重的总体均数不全相等对于交互作用对于交互作用KIH0:药物剂型K和时间I无交互效应H1:药物剂型K和时间I有交互效应均取=0.05重复测量资料的方差分析中南大学医学统计学(5年制预防医学用第816章)(2)计算检验统计量计算检验统计量使用统计软件包SAS或SPSS等进行计算。对本例可得到表9-15的方差分析表(3)确定确定P值,作出推断结论值,作出推断结论以求F值时分子自由度1、分母自由度2查附表3的F界值表得相应P值,或直接由计算机所给P值作出推断结论。本例,按=

37、0.05水准,减肥药剂型K(片剂和胶囊),剂型K与时间I的交互效应KI均不拒绝H0,无统计学意义,还不能认为盐酸西布曲明不同剂型的减肥效果不同,也还不能认为剂型K与时间I间有交互效应。而时间因素I拒绝H0,接受H1,有统计学意义,可认为服用减肥药盐酸西布曲明前后不同时间(8周、16周和24周)的平均体重不全同。重复测量资料的方差分析中南大学医学统计学(5年制预防医学用第816章)变异来源SSdfMSFP(受试对象间)(13163.9810)(39)处理K 5.929015.92900.0170.897个体间误差13158.052038346.2645(受试对象内)(904.6500)(120)

38、时间I 384.53003128.1767 28.2130.000交互作用KI 2.194030.73130.1610.922个体内误差 517.92601144.5432总14068.631015988.4820中南大学医学统计学(5年制预防医学用第816章)重复测量资料方差分析的前提条件重复测量资料方差分析的前提条件进行重复测量资料的方差分析,除需满足一般方差分析的条件外(详后),还需特别满足协方差阵(covariancematrix)的球形性(sphericity/circularity)或复合对称性(compoundsymmetry)。Box(1954)指出,若球形对称性质不能满足,则

39、方差分析的F值是有偏的,因为它增大了第一类错误的概率。球对称性通常采用Mauchly检验(Mauchlystest)来判断重复测量资料的方差分析中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较两均数之差标准误对比组A与B(1)(2)(3)tP(4)(5)1与与33.76521.24833

40、.0160.0020.0051与与23.39521.26502.6840.0050.012与与30.37001.28000.2890.50中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较(2)计算检验统计量计算检验统计量两均数之差对比组T与C(1)(2)tDPA与C-1.5900-7.7600.01B与C-1.1940-5.8270.

41、01中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较(3)确定P值,作出推断结论将表中tD取绝对值,并以计算MS误差时的自由度误差=18和实验组数a=k1=2(不含对照组)查附表5的Dunnettt界值表得P值,按=0.05水准,A方案与C方案、B方案与C方案均拒绝H0,接受H1,有统计学意义。可以认为A方案与C方案、B方案与C方案大白兔血中白蛋白的减少量不同。中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较SNK-q检验SNK(Student-Newman-Keuls)检验,亦称q检验,适用于多个样本均数两两之间的全面比较。检验统计

42、量q的计算公式为:=误差中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较(2)计算检验统计量计算检验统计量首先将三个样本均数由小到大排列,并编组次(3)确定确定P值,作出推断结论值,作出推断结论组别高剂量组(i=1)低剂量组(i=2)对照组(i=3)9.19525.80005.4300组次123中南大学医学统计学(5年制预防医学用第816章)第六节多个样本均数间的多重比较两均数之差两均数之差标准误q对比组A与B

43、(1)(2),(3)对比组内包含组数aq临界值P0.050.01(5)(6)(7)(8)1与与33.76520.88274.26633.404.280.010.051与与23.39520.89453.79622.833.760.05中南大学医学统计学(5年制预防医学用第816章)第十章第十章 基于秩次的非参基于秩次的非参数检验数检验中南大学医学统计学(5年制预防医学用第816章)本章内容:第一节配对样本比较的Wilcoxon符号秩检验第二节两个独立样本比较的Wilcoxon秩和检验第三节完全随机设计多个样本比较的Kruskal-WallisH 检验第四节随机区组设计多个样本比较的Friedma

44、nM检验中南大学医学统计学(5年制预防医学用第816章)概述前面所述的计量资料的t 检验和F 检验,都是基于总体分布为正态分布、总体方差相等的前提下对总体均数进行的检验。这类检验方法总体分布为已知的函数形式,是对其总体参数作假设检验称为参数检验(parametrictest)。中南大学医学统计学(5年制预防医学用第816章)若总体分布未知或已知总体分布与检验所要求的条件不符,数据转换也不使其满足参数检验的条件,这时需要采用一种不依赖于总体分布的具体形式,与总体参数无关的检验方法。这种方法不受总体参数的影响,它检验的是分布,不是参数,称为非参数检验(nonparametrictest)。中南大学

45、医学统计学(5年制预防医学用第816章)本 章 介 绍 常 用 的 秩 转 换 ( ranktransformation)的非参数检验,也称秩和检验(ranksumtest),该类方法在非参数检验中占有重要地位。秩转换的非参数检验是首先将定量数据从小到大,或等级从弱到强转换成秩后,再求秩和,计算检验统计量秩统计量,做出统计推断。中南大学医学统计学(5年制预防医学用第816章)由于秩统计量的分布与原数据总体分布无关,具有较好的稳健性,可用于任何分布类型的资料。例如,一端或两端有不确定数值(如15.0)的资料、总体分布为偏态或分布不明的小样本(比如n50时)超出附表9范围,可用正态近似法作u检验。

46、中南大学医学统计学(5年制预防医学用第816章)当n不很大时,统计量Z需要作如下的连续性校正:中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)二、一组样本资料的符号秩和检验二、一组样本资料的符号秩和检验若单组随机样本来自正态总体,比较其总体均数与某常数是否不同,可用检验;若样本来自非正态总体或总体分布无法确定,也可用Wilcoxon符号秩和检验,检验总体中位数是否等于某已知数值。中南大学医学统计学(5年制预防医学用第816章)例10-2已知某地正常人尿氟含量的中位数为2.15mmol/L。今在该地某厂随机抽取12名工人,测得尿氟含量(mmol/L

47、),结果见表10-2。问该厂工人的尿氟含量是否高于当地正常人?中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)1、 求差值0Mxdi=,见表10-2的第(2)栏。2、 检验假设0H :差值的总体中位数等于零,即0)(=dMd1H :差值的总体中位数不等于零,即0)(箎dMd05. 0=3.编秩对差值的绝对值编秩,方法同上。4. 求正、负秩和并确定检验统计量本例,T+=62.5,T-=3.5,T+与T-之和为66,恰好等于11(11+1)/2,表明秩和的计算无误;取T=min( T+,T-)3.5。中

48、南大学医学统计学(5年制预防医学用第816章)5. 确定P值并做出推断结论本例,n=11,T=3.5,查配对设计用T界值表,得P0.05;按=0.05检验水准,不拒绝H0 。不能认为某河流甲乙断面亚硝酸盐氮含量的总体分布的位置不同。中南大学医学统计学(5年制预防医学用第816章)若Z超过标准正态分布的临界值,则拒绝 。中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)二、两组有序变量资料的秩和检验二、两组有序变量资料的秩和检验例10-4 某研究者欲评价新药按摩乐口服液治疗高甘油三脂血症的疗效,将高甘油三脂血症患者189例随机分为两组,分别用按摩乐口

49、服液和山楂精降脂片治疗,数据见表10-4,问两种药物治疗高甘油三脂血症的疗效有无不同?中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)先确定各等级的合计人数、秩范围和平均秩,见表10-4的(4)栏、(5)栏和(6)栏,再计算两样本各等级的秩和,见(7)栏和(8)栏;本例T=7663;中南大学医学统计学(5年制预防医学用第816章)计算Z值中南大学医学统计学(5年制预防医学用第816章)第三节完全随机化设计多组独立样本的完全随机化设计多组独立样本的秩和检验秩和检验中南大学医学统计学(5年制预防医学用第816章)一、多组连续变量资料的秩和检验一、多组

50、连续变量资料的秩和检验 例10-5 某研究者欲研究A、B两个菌种对小鼠巨噬细胞吞噬功能的激活作用,将60只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬指数,试比较三组吞噬指数有无差别?中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)二、多组有序变量资料的秩和检验二、多组有序变量资料的秩和检验例10-6 四种疾病患者痰液内嗜酸性粒细胞的检查结果见表10-6。问

51、四种疾病患者痰液内嗜酸性粒细胞的等级分布有无差别?中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)第四节 随机化区组设计资料的秩和检验随机化区组设计资料的秩和检验中南大学医学统计学(5年制预防医学用第816章)例10-7 欲用学生的综合评分来评价四种教学方式的不同,按照年龄、性别、年级、社会经济地位、学习动机相同和智力水平、学习情况相近作为配伍条件,将4名学生分为一组,共8组,每区组的4名学生随机分到四种不同的教学实验组,经过相同的一段时间后,测得学习

52、成绩的综合评分,试比较四种教学方式对学生学习成绩的综合评分影响有无不同?中南大学医学统计学(5年制预防医学用第816章)本例属随机化区组设计,观察指标为连续型变量资料,各实验组(不同教学方式组)来自非正态总体,不宜做随机化区组设计方差分析。中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)第十一章两变量关联性分析中南大学医学统计学(5年制预防医学用第816章) 本章内容本章内容 第一节第一节 线性相关线性相

53、关 第二节第二节 秩相关秩相关 第三节第三节 分类变量的关联性分析分类变量的关联性分析 中南大学医学统计学(5年制预防医学用第816章)第一节第一节线性相关线性相关一一线性相关的概念线性相关的概念线性相关(linearcorrelation)又称简单相关(simplecorrelation),用于双变量正态分布(bivariatenormaldistribution)资料。其性质可由图11-2散点图直观的说明。中南大学医学统计学(5年制预防医学用第816章)目的:研究两个变量X,Y数量上的依存(或相关)关系。特点:统计关系中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年

54、制预防医学用第816章)二、相关系数的意义与计算1.意义:相关意义:相关(correlationcoefficient)又称又称Pearson积差相关系数,用来说明具有直线关系积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。的两变量间相关的密切程度与相关方向。2.计算:计算:样本相关系数的计算公式为样本相关系数的计算公式为(11-3)中南大学医学统计学(5年制预防医学用第816章)例11-2计算例11-1中凝血酶浓度X与凝血酶时间Y之间样本相关系数。由例11-1得,由公式11-3得中南大学医学统计学(5年制预防医学用第816章)相关系数的特点1.相关系数r是一个无量纲的数

55、值,且-1r0为正相关,r0,表表示示直直线线与与纵纵轴轴的的交交点点在在原点的上方原点的上方a 0,直线从左下方走向右上方,直线从左下方走向右上方,Y 随随X 增大而增大;增大而增大;b0,直线从左上方走向右下方,直线从左上方走向右下方,Y 随随X 增大而减小;增大而减小;b=0,表示直线与表示直线与X 轴平行,轴平行,X 与与Y 无直线关系无直线关系b 的统计学意义是:的统计学意义是:X 每增加每增加(减减)一个单位,一个单位,Y 平均改变平均改变b个单位个单位中南大学医学统计学(5年制预防医学用第816章)回归模型的前提假设回归模型的前提假设线性回归模型的前提条件是:线性线性(linea

56、r)独立独立(independent)正态正态(normal)等方差等方差(equalvariance)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)残差(residual)或剩余值,即实测值Y与假定回归线上的估计值的纵向距离。求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。原则:最小二乘法(leastsumofsquares),即可保证各实测点至直线的纵向距离的平方和最小回归参数的估计回归参数的估计最小二乘原则最小二乘原则中南大学医学统计学(5年制预防医学用第816章)回

57、归参数的估计方法回归参数的估计方法 中南大学医学统计学(5年制预防医学用第816章)本例:n=15X=14.7X2=14.81Y=224XY=216.7Y2=3368中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)解题步骤中南大学医学统计学(5年制预防医学用第816章)3、计算有关指标的值4、计算回归系数和截距5、列出回归方程中南大学医学统计学(5年制预防医学用第816章) 此直线必然通过点此直线必然通过点( , )( , )且与纵坐标轴且与纵坐标轴相交于截距相交于截距a a 。如果散点图没有从坐标

58、。如果散点图没有从坐标系原点开始,可在自变量实测范围内远系原点开始,可在自变量实测范围内远端取易于读数的端取易于读数的 值代入回归方程得到值代入回归方程得到一个点的坐标,连接此点与点一个点的坐标,连接此点与点( , )( , )也可绘出回归直线。也可绘出回归直线。 绘制回归直线绘制回归直线中南大学医学统计学(5年制预防医学用第816章)总体回归系数总体回归系数的的的统计推断样本回归系数样本回归系数b的标准误的标准误 中南大学医学统计学(5年制预防医学用第816章)回归方程的假设检验建立样本直线回归方程,只是完成了统计分析中两变量关系的统计描述,研究者还须回答它所来自的总体的直线回归关系是否确实

59、存在,即是否对总体有?中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)1方差分析中南大学医学统计学(5年制预防医学用第816章)Y的离均差,总变异残差回归的变异中南大学医学统计学(5年制预防医学用第816章)数理统计可证明:中南大学医学统计学(5年制预防医学用第816章)上式用符号表示为式中中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)上述三个平方和,各有其相应的自由度,并有如下的关系:中南大学医学统计学(5年制预防医学用第816章)如果两变量间总体

60、回归关系确实存在,回归的贡献就要大于随机误差,大到何种程度时可以认为具有统计意义,可计算统计量F:中南大学医学统计学(5年制预防医学用第816章)式中中南大学医学统计学(5年制预防医学用第816章)t 检验中南大学医学统计学(5年制预防医学用第816章)检验例12-1数据得到的直线回归方程是否成立?中南大学医学统计学(5年制预防医学用第816章)(1)方差分析中南大学医学统计学(5年制预防医学用第816章)方差分析表中南大学医学统计学(5年制预防医学用第816章)(2)t 检验参数的意义是:若自变量X增加一个单位,反应变量Y的平均值便增加 中南大学医学统计学(5年制预防医学用第816章)注意:

61、中南大学医学统计学(5年制预防医学用第816章)总体回归系数的可信区间利用上述对回归系数的t检验,可以得到的1双侧可信区间为中南大学医学统计学(5年制预防医学用第816章)本例b=-6.9802,自由度=13,t0.05,13=2.16,Sb=0.78655,代入公式(12-7)得参数的95%置信区间为=(-8.6791-5.2813)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)第二节线性回归的应用(估计和预测)中南大学医学统计学(5年制预防医学用第816章)反映其抽样误差大小的标准误为中南大学医学统计学(5年制预防医学用第816章)例12-

62、1中,第一观测值X1=1.1,0.4994,0.404,代入(12.8)式获得第一观测点X1对应的的标准误为0.1599Y的总体均数的95%置信区间为14.0957(2.16)(0.1599)(13.7502,14.4412)中南大学医学统计学(5年制预防医学用第816章)实测值实测值预测Y的均值Y的均值的标准误Y的均值的95%置信区间Y值的95%预测区间残差对象实测值X实测值Y预测值均值均值的标准误Y均值的95%CIY值的95%预测区间残差下限上限下限上限11.11414.09570.159913.750214.441212.961815.2297-0.095721.21313.39770.

63、215912.931313.864112.221214.5741-0.397731.01514.79370.130014.512815.074713.677715.90970.206340.91515.49170.143615.181515.802014.368016.6155-0.491751.21313.39770.215912.931313.864112.221214.5741-0.397761.11414.09570.159913.750214.441212.961815.2297-0.095770.91615.49170.143615.181515.802014.368016.615

64、50.508380.61717.58580.325616.882518.289216.296918.8747-0.585891.01414.79370.130014.512815.074713.677715.9097-0.7937100.91615.49170.143615.181515.802014.368016.61550.5083111.11514.09570.159913.750214.441212.961815.22970.9043120.91615.49170.143615.181515.802014.368016.61550.5083131.11414.09570.159913.

65、750214.441212.961815.2297-0.0957141.01514.79370.130014.512815.074713.677715.90970.2063150.71716.88780.255316.336317.439315.675118.10050.1122中南大学医学统计学(5年制预防医学用第816章)以上是给定某一X值时所对应的总体均数的置信区间。当同时考虑X的所有可能取值时,总体均数的点估计就是根据样本算得的回归直线(1-)置信区间的上下限连起来形成一个弧形区带,称为回归直线的(1-)置信带(confidenceband)。同样,因为其标准误是X的函数,所以在均数(

66、)点处置信带宽度最小,越远离该均数点,置信带宽度越大。中南大学医学统计学(5年制预防医学用第816章)图12-4中,左图显示位于最小二乘回归线上下两侧的两条弧形虚线为总体回归线的(1-)置信区带。右图的实线表示可能的总体回归线,它们落在弧形虚线所确定的置信带内。(1-)置信带的意义是:在满足线性回归的假设条件下,可以认为真实的回归直线落在两条弧形曲线所形成的区带内,置信度为(1-)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)以第一观测点数据(X1=1.1)点为例,该点预测值的标准差为=0.524

67、89182第一数据点的预测区间为:14.0957(2.16)(0.0.5249)=12.961815.2297当同时考虑X的所有可能取值时,个体Y值的95%预测区间形成一个带子,称为Y值的95%预测带,它比总体回归线95%置信带更宽。图12-5和图12-6同时显示个体Y值的预测带与总体回归线的置信带,可见,在相同信度下,个体值预测带的曲线要比回归线置信带的曲线离回归直线更远。中南大学医学统计学(5年制预防医学用第816章)PICI中南大学医学统计学(5年制预防医学用第816章)决定系数(coefficientofdetermination)定义为回归平方和与总平方和之比,计算公式为:取值在0到

68、1之间且无单位,其数值大小反映了回归贡献的相对程度,也就是在Y的总变异中回归关系所能解释的百分比。中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)第三节第三节残差分析残差分析残差残差(residual)是指观测值Yi与回归模型拟合值之差残差分析(residualanalysis)旨在通过残差深入了解数据与模型之间的关系,评价实际资料是否符合回归模型假设,识别异常点等。例如,第一数据点的残差e1=14-14.0957=-0.0957,如此类推,计算出各数据点的残差值示于表12-2的第10列中。将第10列的残差减去其均数,除以其标准差,便得标准化残差

69、。中南大学医学统计学(5年制预防医学用第816章)若以反应变量取值Yi为横坐标,以标准化残差为纵坐标,构成的散点图如图12-7所示。类似地,也可以自变量取值Xi为横坐标,以标准化残差为纵坐标,构成的散点图。这类散点图统称为标准化残差图。中南大学医学统计学(5年制预防医学用第816章)图12-8给出的是以自变量取值为纵坐标,以残差为横坐标的残差图的常见类型。其中,图(e)显示残差呈随机分布;图(a)、(b)和(f)表示残差不满足方差齐性条件;图(c)显示存在非线性关系;图(d)显示有的点处于2倍标准差以外,可能是异常点。中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预

70、防医学用第816章)第四节第四节非线性回归非线性回归非线性回归要比线性回归更能充分地表达变量间的关系。当今线性回归之所以比非线性回归应用甚多,原因在于无论从数学理论还是计算方法,线性回归都比非线性回归模型简单得多。中南大学医学统计学(5年制预防医学用第816章)通过自变量的变换实现线性化通过自变量的变换实现线性化实践中有两类非线性关系,一类是通过自变量X的适当变换可线性化的,另一类是不可能通过自变量X的变换实现线性化的X数据变换不能线性化的关系不能线性化的关系中南大学医学统计学(5年制预防医学用第816章)变换自变量实现线性回归步骤变换自变量实现线性回归步骤 1.将观测数据(Xi, Yi),

71、i=1,2,n作散点图,观察散点分布特征类似于何种函数类型;2.按照所选定的函数进行相应的变量变换;3.对变换后的数据用常规最小二乘法(OLS)作线性模型的参数估计。4.一般拟合多个相近的模型,然后通过对各个模型的拟合优度评价挑选较为合适的模型。 中南大学医学统计学(5年制预防医学用第816章)例12-2为了研究某药物浓度与肾上腺素释放的量关系,选取10个给药物浓度水平,每种药物剂量水平上重复5次试验,观测结果如表12-3所示。欲用合适的回归模型描述该药品剂量与反应的规律中南大学医学统计学(5年制预防医学用第816章)药物剂量(mg)肾上腺素释放量(pg/ml)1519.2614.2917.6

72、018.3616.532021.2021.7820.7720.6523.382521.7722.6122.7021.1721.653023.4723.2221.7424.0224.053523.8825.3222.9024.8423.704025.2724.6924.6724.4825.244524.2024.9425.5225.0227.435027.9825.8826.6726.3125.945527.4224.9126.4228.2425.496028.4127.0929.0428.8527.89中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816

73、章)由结果可见:在所拟合的三种模型中,以x对数函数回归的效果最佳,该模型拟合的残差均方最小,决定系数最大模型名称回归方程MSEF值P值R2值简单线性1.91786212.480.00010.8157对数函数1.39592309.88.00010.8659二次函数2.72770135.050.00010.852中南大学医学统计学(5年制预防医学用第816章)值得一提的是,本节只涉及对自变量X进行变换,然后以变换后的数据用标准最小二乘(OLS)法求解模型的参数估计与模型评价。当涉及到对反应变量y实施非线性变换如Z=ln(Y)时,因为OLS只保证变换后的Z,即ln(Y)的残差平方和最小,并不能保证原

74、变量Y的残差平方和也最小,所以在此情况下,我们建议用统计软件来完成非线性拟合,例如,用SAS系统中的PROCNLIN程序产生非线性模型参数的最小二乘估计。中南大学医学统计学(5年制预防医学用第816章)直线回归应用的注意事项直线回归用于定量刻画应变量Y对自变量X在数值上的依存关系,其中应变量的定夺主要依专业要求而定,可以考虑把易于精确测量的变量作为X,另一个随机变量作Y,例如用身高估计体表面积。两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归分析。1根据分析目的选择变量及统计方法中南大学医学统计学(5年制预防医学用第816章)2进行回归分析前应绘制散点图(1)散点图可考察两

75、变量是否有直线趋势;(2)可发现异常点(outlier)。散点图对异常点的识别与处理需要从专业知识和现有数据两方面来考虑,结果可能是现有回归模型的假设错误需要改变模型形式,也可能是抽样误差造成的一次偶然结果甚至过失误差。需要认真核对原始数据并检查其产生过程认定是过失误差,或者通过重复测定确定是抽样误差造成的偶然结果,才可以谨慎地剔除或采用其它估计方法。中南大学医学统计学(5年制预防医学用第816章)3资料的要求直线回归要求至少对于每个X 相应的Y 要服从正态分布,X可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量;*对于双变量正态分布资料,根据研究目的可选择由X 估计Y 或

76、者由Y 估计X ,一般情况下两个回归方程不相同)。中南大学医学统计学(5年制预防医学用第816章)反应两变量关系密切程度或数量上影响大小的统计量应该是回归系数的绝对值,而不是假设检验的P值。 P值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越“显著”。另外,直线回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围。4结果解释及正确应用中南大学医学统计学(5年制预防医学用第816章)当实际资料不能满足直线回归模型的要求而无法用最小二乘法估计回归方程时,可使用秩回归中南大学医学统计学(5年制预防医学用第816章)练习题:练习题:P238 三、计算分析题三、计算分析题 1

77、,21,2中南大学医学统计学(5年制预防医学用第816章)第第13章章多重线性回归与相关多重线性回归与相关(multiplelinearregression&multiplecorrelation)中南大学医学统计学(5年制预防医学用第816章)content第一节第一节多重线性回归的概念与统计推断多重线性回归的概念与统计推断第二节假设检验及其评价第三节第三节复相关系数与偏相关系数复相关系数与偏相关系数第四节自变量筛选第五节第五节多元线性回归的应用与注意事项多元线性回归的应用与注意事项中南大学医学统计学(5年制预防医学用第816章)目的:作出以多个自变量估计应变量的多元线性回归方程。资料:应变

78、量为定量指标;自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换。用途:解释和预报。更精确意义:由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。中南大学医学统计学(5年制预防医学用第816章)第一节第一节多重线性回归的概念多重线性回归的概念与统计推断与统计推断中南大学医学统计学(5年制预防医学用第816章)变量:变量:应变量应变量1个,自变量个,自变量k 个,共个,共k+1个。个。样本含量:样本含量:n数据格式见表数据格式见表13-1回归模型一般形式:回归模型一般

79、形式:一、数据与多元线性回归模型一、数据与多元线性回归模型中南大学医学统计学(5年制预防医学用第816章)多元回归分析数据格式 条件条件中南大学医学统计学(5年制预防医学用第816章)车流(X1)气温(X2)气湿(X3)风速(X4)一氧化氮(Y)车流(X1)气温(X2)气湿(X3)风速(X4)一氧化氮(Y)130020.0800.450.06694822.5692.000.005144423.0570.500.076144021.5792.400.01178626.5641.500.001108428.5593.000.003165223.0840.400.170184426.0731.000

80、.140175629.5720.900.156111635.0922.800.039175430.0760.800.120165620.0831.450.059120022.5691.800.040153623.0571.500.087150021.8770.600.12096024.8671.500.039120027.0581.700.100178423.3830.900.222147627.0650.650.129149627.0650.650.145182022.0830.400.135106026.0581.830.029143628.0682.000.099143628.0682.

81、000.099中南大学医学统计学(5年制预防医学用第816章)一一般般步步骤骤建立回归方程(样本)(2)检验并评价回归方检验并评价回归方程程及各自变量的作用大小及各自变量的作用大小中南大学医学统计学(5年制预防医学用第816章)二、多元线性回归方程的建立样本估计而得的多重线性回归方程bj为自变量Xj 的偏回归系数(partial regression coefficient),是j的估计值,表示当方程中其他自变量保持常量时,自变量Xj变化一个计量单位,反应变量Y的平均值变化的单位数。 中南大学医学统计学(5年制预防医学用第816章)求偏导数(一阶)原 理最小二乘法统计软件包统计软件包中南大学医

82、学统计学(5年制预防医学用第816章)第二节假设检验及其评价1.方差分析法:方差分析法:(一)对回归方程中南大学医学统计学(5年制预防医学用第816章) 多元线性回归方差分析表中南大学医学统计学(5年制预防医学用第816章)变异来源自由度SSMSFP回归模型4 40.063960.063960.015990.0159917.5917.59.0001.0001残差19190.017270.017270.000909030.00090903总变异23230.081230.08123表13-2显示,P 1表示被标准化组的死亡率高于标准人口死亡率;SMR 1表示被标准化组的死亡率低于标准人口死亡率;间

83、接法标准化死亡率是对原总死亡率的校正,校正系数为SMR。中南大学医学统计学(5年制预防医学用第816章)死亡率的标准化标准化法的注意事项标准化法的注意事项注意标准化法的适用条件。一般来说,满足如下两个条件时才用标准化:(1)欲比较的两个人群内部的年龄分布不同;(2)每个人群内部年龄别死亡率也各不相同标准化死亡率并不是被标化组本身的某一种“真值”,而是用标准人口作为平台,对各被标化组进行的调整中南大学医学统计学(5年制预防医学用第816章)死亡率的标准化标准组应选择有代表性的、较稳定的、数量较大的人群。一般有三种方法来选择标准组:(1)选择相互比较的人群之一作为标准组。一般选择人数较多者。(2)

84、将各个比较组的数据合并作为标准组(3)选择比较组之外的分布数据作为标准,如全国人口的年龄分布。标准化法常常用于对总体的标准化和比较样本资料进行标准化,其标准化死亡率的比较应作假设检验中南大学医学统计学(5年制预防医学用第816章)第二节现时寿命表国际上普遍采用的描述总体健康状况的指标,诸如期望寿命、质量调整寿命年(qualityadjustedlifeyears,QALYs)、伤残调整寿命年(disabilityadjustedlifeyears,DALYs)、伤残调整期望寿命(disabilityadjustedlifeexpectancy,DALE)、健康期望寿命(activelifeex

85、pectancy,ALE)、等价健康年(Healthy-yearsEquivalents,HYE)等都是在寿命表寿命表的基础上引伸出来的中南大学医学统计学(5年制预防医学用第816章)现时寿命表寿命表寿命表(lifetable),又称生命表、死亡表、死亡率表等,是根据某一特定人群的年龄别死亡率编制出来的一种统计表。寿命表分为:现时寿命表(现时寿命表(currentlifetable):现时寿命表是假定有同时出生的一代人(一般为10万人),按照现时的一系列年龄别死亡率先后死去,计算出这一代人在不同年龄的“生存概率”和“期望寿命”。定群寿命表定群寿命表(cohortlifetable):是对某一特

86、殊人群中的每一个人,从进入该特殊人群直到最后一个人死完,记录其死亡过程,计算出该特殊人群在不同时间的生存概率中南大学医学统计学(5年制预防医学用第816章)现时寿命表现时寿命表:完全寿命表完全寿命表(completelifetable):完全寿命表是以0岁开始,一岁为一组,直到某一特定人群的生命极限。简略寿命表简略寿命表(abridgedlifetable)。简略寿命表一般以5岁为一组,但5岁前和80岁及以上稍特殊,年龄分组较少,各年龄组死亡率相对稳定,因此在卫生统计中较为常用。中南大学医学统计学(5年制预防医学用第816章)现时寿命表现时寿命表的编制原理和方法例例16-4简略寿命表2002年

87、某市居民人口及死亡情况见表16-5第2、3列,试编制简略寿命表。寿命表的指标和编制步骤为:1年龄及其分组寿命表中的年龄X是“实足年龄”(exactage)。完全寿命表的年龄分组是1岁1组,可到100岁以上,如100岁以上人数少,一般把100岁及以上合并为“100”岁组。简略寿命表一般是将0,1)岁作为第一组;记为,余类推,见表16-5第1列中南大学医学统计学(5年制预防医学用第816章)中南大学医学统计学(5年制预防医学用第816章)现时寿命表2.年龄别死亡率mx这是根据各年龄组的平均人口数(Px)与相应的死亡数(Dx)计算的,它近似地反映X岁年龄组人口在XX+n年内的死亡率,用公式表示为:表

88、16-6中,第3列除以第2列即得到各年龄组死亡率,见第4列;其中的死亡率不作计算。编制寿命表的基础资料是各年龄组的平均人口数和死亡数中南大学医学统计学(5年制预防医学用第816章)现时寿命表3年龄别死亡概率(agespecificprobabilityofdeath)qx这是同时出生的一代人死于某年龄组XX+n的概率,表示X岁尚存活者(lx)在今后n年内死亡的可能性当年龄组分得较粗时,lx与X呈非线性关系,可用下式计算qx:中南大学医学统计学(5年制预防医学用第816章)现时寿命表本例按式(16-7)计算各年龄别死亡概率为了更加准确,第一组的死亡概率用经专项调查所得的婴儿死亡率代替,本例为0.

89、011708;最后一组的死亡概率为1.000000,详见表16-6第5列。中南大学医学统计学(5年制预防医学用第816章)现时寿命表4尚存人数与死亡人数尚存人数(numberofsurvivors)lx是同时出生的一代人到刚活满X岁时尚生存的人数。死亡人数dx是同时出生的一代人死于各年龄组XX+n的人数。中南大学医学统计学(5年制预防医学用第816章)现时寿命表分别按式(16-9)与(16-10)计算死亡人数与生存人数得到表16-6第6列和第7列,中南大学医学统计学(5年制预防医学用第816章)现时寿命表5生存人年数(person-yearofsurvival) Lx这是同时出生的一代人,X岁

90、尚存者在今后XX+n岁期间的生存人年数,亦称寿命表人口数。婴儿组生存人年数(L0)按下式计算:根据我国1981、1982年部分地区的婴儿死亡资料计算的a0值为:男性0.1450,女性0.1525,男女合计0.15,因此一般按0.15计算。中南大学医学统计学(5年制预防医学用第816章)现时寿命表1岁以上组生存人年数按下式计算:最后年龄组的死亡率、生存人年数和生存人数分别记为mw,Lw,lw,最后一组生存人年数按下式计算:中南大学医学统计学(5年制预防医学用第816章)现时寿命表本例,分别按式(16-11)、(16-12)和(16-13)计算生存人年数得到表16-6第8列,中南大学医学统计学(5

91、年制预防医学用第816章)现时寿命表6生存总人年数(totalperson-yearsofsurvival)Tx这是同时出生的一代人中活到X岁者今后尚能生存的总人年数,是X岁以上各年龄组生存人年数(Lx)的累计和Tx=Lx按式(16-14)计算总生存人年数得到表16-6第(9)列,如:中南大学医学统计学(5年制预防医学用第816章)现时寿命表7期望寿命(lifeexpectancy)ex这是同时出生的一代人活到X岁时,尚能生存的平均年数,也称平均可享寿命或平均余年本例,按式(16-15)计算期望寿命得到表16-6第10列,如中南大学医学统计学(5年制预防医学用第816章)现时寿命表综上所述,制

92、作现时寿命表的关键是如何将各年龄别死亡率转换为死亡概率。转换的方法有蒋庆琅法(ChiangC.L.)、Reed-Merrell法、Greville法等,不同方法所得结果稍有不同。本文介绍的是最常用的蒋庆琅法。此外,例16-4编制的是全人口寿命表,实践中,也可以分性别、城乡、民族等来编制各自的寿命表。中南大学医学统计学(5年制预防医学用第816章)现时寿命表现时寿命表指标的分析1.寿命表尚存人数寿命表尚存人数lx反映在一定年龄别死亡率基础上,假想的一代人的生存过程。尚存人数随年龄增加而减少。2.寿命表死亡人数寿命表死亡人数dx反映在一定年龄别死亡率基础上,假想的一代人的死亡过程。3寿命表死亡概率

93、寿命表死亡概率qx反映各年龄别死亡概率,表现为不对称的U型曲线。中南大学医学统计学(5年制预防医学用第816章)现时寿命表4.期望寿命期望寿命ex是评价居民健康状况的主要指标。用寿命表方法计算的期望寿命的大小,仅取决于年龄别死亡率的高低,与年龄构成无关,两地的期望寿命可以直接比较中南大学医学统计学(5年制预防医学用第816章)现时寿命表小结小结1.横断面研究指在某个时间断面(时点或很短的时间内)进行的调查研究,其目的是了解某个时点的现状,所以也称为现况研究。2.当某个主要混杂变量(如年龄)在两个人群内的分布不同时,比较这两个人群的死亡率要么分层(如年龄组)比较,要么需要进行标准化后比较。3.死

94、亡率的标准化的基本思想就是寻找统一的标准组,计算标准化死亡率。若以人口分布为标准组则称直接标准化法,若以死亡率分布为标准组,则称间接标准化法。中南大学医学统计学(5年制预防医学用第816章)现时寿命表4、现时寿命表的本质是将各年龄组“接起来”,把横断面上的现象“投射”到一个假想人群的动态过程。期望寿命即按假想的人口数根据当地各年龄组的实际死亡率来死亡时,同年龄人的平均余寿。因此,现时寿命表相当于进行标准化,不受人口年龄分布的影响,不同人口的寿命表可以相互比较。显然,死亡率的标准化也可采用寿命表的方法来处理。5、寿命表制作的关键是将死亡率转化为死亡概率。0岁组死亡概率通常用婴儿死亡率来代替。中南大学医学统计学(5年制预防医学用第816章)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号