方差分析(二)重复测量资料的方差分析

上传人:博****1 文档编号:570194500 上传时间:2024-08-02 格式:PPT 页数:48 大小:1.31MB
返回 下载 相关 举报
方差分析(二)重复测量资料的方差分析_第1页
第1页 / 共48页
方差分析(二)重复测量资料的方差分析_第2页
第2页 / 共48页
方差分析(二)重复测量资料的方差分析_第3页
第3页 / 共48页
方差分析(二)重复测量资料的方差分析_第4页
第4页 / 共48页
方差分析(二)重复测量资料的方差分析_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《方差分析(二)重复测量资料的方差分析》由会员分享,可在线阅读,更多相关《方差分析(二)重复测量资料的方差分析(48页珍藏版)》请在金锄头文库上搜索。

1、方差分析(二):方差分析(二):重复测量资料的方差分析重复测量资料的方差分析浙江大学医学院公共卫生系流行病与卫生统计教研室沈 毅2005.3 重复测量(重复测量(repeated measure)是指对同一观察对象是指对同一观察对象的同一观察指标在不同时间点上进行的多次测量,用于分的同一观察指标在不同时间点上进行的多次测量,用于分析该观察指标在不同时间上的变化特点。这类测量资料在析该观察指标在不同时间上的变化特点。这类测量资料在临床和流行病学研究中比较常见。例如,为研究某种药物临床和流行病学研究中比较常见。例如,为研究某种药物对高血压病人的治疗效果,需要定时多次测定受试者的血对高血压病人的治疗

2、效果,需要定时多次测定受试者的血压,以分析其血压的变动情况。一些传统的统计方法,如压,以分析其血压的变动情况。一些传统的统计方法,如t检验、方差分析、线性回归模型等,都要求各次观察是相检验、方差分析、线性回归模型等,都要求各次观察是相互独立的。而重复测量资料由于是对同一受试者的某项观互独立的。而重复测量资料由于是对同一受试者的某项观察指标进行的多次测量,在同一受试者的多次测量之间可察指标进行的多次测量,在同一受试者的多次测量之间可能存在某种相关性,用通常的统计方法就不能充分揭示出能存在某种相关性,用通常的统计方法就不能充分揭示出其内在的特点,有时甚至会得出错误的结论。因此,有关其内在的特点,有

3、时甚至会得出错误的结论。因此,有关重复测量资料的分析方法是近代统计学研究的热点之一。重复测量资料的分析方法是近代统计学研究的热点之一。重复测量数据结构与独立数据结构的区别及其优缺点重复测量数据结构与独立数据结构的区别及其优缺点 为了解重复测量数据与独立观察数据之间的区别,下面用一个完全随机设计的为了解重复测量数据与独立观察数据之间的区别,下面用一个完全随机设计的独立数独立数 据结构与具有一个受试者内因素据结构与具有一个受试者内因素(时间时间)的重复测量数据结构进行比较。的重复测量数据结构进行比较。 完全随机设计的独立数据结构:从正常人、可疑硅沉着病者及一期硅沉着病病人完全随机设计的独立数据结构

4、:从正常人、可疑硅沉着病者及一期硅沉着病病人中各随机抽取中各随机抽取5人,测量他们的血清黏蛋白含量人,测量他们的血清黏蛋白含量(mgL),结果列于下表中第一部分。结果列于下表中第一部分。 重复测量的数据结构:对重复测量的数据结构:对5名粉尘作业工人的血清黏蛋白含量名粉尘作业工人的血清黏蛋白含量(mg几几)连续连续3年的测量年的测量 结果列于下表中第二部分。结果列于下表中第二部分。 从上表的例子可以看出,独立数据结构的各个观察值是彼此独立的,它适宜于从上表的例子可以看出,独立数据结构的各个观察值是彼此独立的,它适宜于用通常的方差分析方法做统计分析。重复测量数据结构是对每一受试者的同一用通常的方差

5、分析方法做统计分析。重复测量数据结构是对每一受试者的同一观察指标观察指标( (血清黏蛋白含量血清黏蛋白含量) )进行的多次测量。由于这种多次测量之间可能存在相进行的多次测量。由于这种多次测量之间可能存在相关性,就需要用特殊的统计方法进行分析。关性,就需要用特殊的统计方法进行分析。 重复测量设计的主要优点是可以减少样本含量,其次是能够控制个体变异,重复测量设计的主要优点是可以减少样本含量,其次是能够控制个体变异,即个体差异。例如在单因素实验中,可以用随机区组即个体差异。例如在单因素实验中,可以用随机区组( (或称配伍组或称配伍组) )设计方法来设计方法来缩小随机误差。而重复测量设计是以同一个受试

6、者作为一个区组,故可以把它缩小随机误差。而重复测量设计是以同一个受试者作为一个区组,故可以把它看成为是随机区组设计的一种极端形式。但在随机区组设计下的每一测量都是在看成为是随机区组设计的一种极端形式。但在随机区组设计下的每一测量都是在不同受试者身上进行的,它们对某种处理因素的反应是独立的,符合独立性的假不同受试者身上进行的,它们对某种处理因素的反应是独立的,符合独立性的假定。而在重复测量设计下的测量是在同一受试者身上进行的,它们对同一处理因定。而在重复测量设计下的测量是在同一受试者身上进行的,它们对同一处理因素在不同时间上的反应可能是不独立的,后一次的测量结果可能受到前一次测量素在不同时间上的

7、反应可能是不独立的,后一次的测量结果可能受到前一次测量结果的影响。因此,对同一个体在不同时间上的测量值之间就可能存在相关关系。结果的影响。因此,对同一个体在不同时间上的测量值之间就可能存在相关关系。这给分析工作带来了一定的复杂性。这给分析工作带来了一定的复杂性。 在实际工作中,重复测量资料比独立观察资料往往更为多见。如在临床研究中,在实际工作中,重复测量资料比独立观察资料往往更为多见。如在临床研究中,需要观察病人在不同时间的某些生理、生化或病理指标的变化趋势,不同时间或需要观察病人在不同时间的某些生理、生化或病理指标的变化趋势,不同时间或疗程的治疗效果。在流行病学研究中观察队列人群在不同时间上

8、的发病情况。在疗程的治疗效果。在流行病学研究中观察队列人群在不同时间上的发病情况。在卫生学研究中,纵向观察儿童的生长发育规律等。重复测量资料在自然科学和社卫生学研究中,纵向观察儿童的生长发育规律等。重复测量资料在自然科学和社会科学的很多领域内都可见到。会科学的很多领域内都可见到。 第一节第一节 重复测量资料方差分析对协方差阵的要求重复测量资料方差分析对协方差阵的要求 在对重复测量资料进行方差分析时,除要求样本是随机的、在处理的同一个水平上的观察是独立的以及每一水平上的测定值都来自正态总体外,特别强调协方差阵(covariance matrix)的球形性(sphericity)或为符合对称性(c

9、ompound symmetry)。Box(1954)指出,若球形性质得不到满足,则方差分析的F值是有偏的,这会造成过多的拒绝本来是真的无效假设(增加型错误)。 一、协方差阵的球形性检验一、协方差阵的球形性检验 方差是指在某一时点上测定值变异性的大小,而协方差是指在两个不同时点上测定值相互变异性的大小。如果在某个时点上的取值不影响其他时点上的取值,则协方差为0,反之,则不为0。由方差协方差构成的矩阵称协方差阵。 设 k、l为两个测定时点, 代表协方差阵中的元素。当kl时为方差,kl时为协方差。共有a个测定时点,将这a个方差和(a-1)/2个协方差排成协方差阵V为: 协方差阵的球形性质是指该矩阵

10、主对角线元素(方差)相等、非主对角线元素(协方差)为零。用Mauchly氏法检验协方差阵的球形性质。Mauchly氏检验的 P值若大于研究者所选择的显著性水准时,说明协方差阵的球形性质得到满足。否则,必须对与时间有关的F统计量的分子、分母自由度进行调整,以便减少犯类错误的概率。调整系数为(epsilon)。 二、自由度调整方法二、自由度调整方法 1. 调整系数的计算 有两种调整系数。 (1)Greenhouse-Geisser调整系数 为: 式(10-2)中的 是矩阵(10-1)中第k行第l列元素, 是所有元素的总平均值, 是主对角线元素的平均值, 是第k行的平均值。 的取值在1.0与1/(a

11、-1)之间。 (2)HuynhFeldt调整系数 研究表明,当真值在0.7以上时,用 进行自由度凋整后的统计学结论偏于保守,故Huynh和Feldt提出用平均调整值 值进行调整。 值的计算公式为 式(10-3)中的g是对受试对象的某种特征(如性别或年龄)进行分组的组数,n是每组的观察例数。 2调整规则 只对具有重复测定性质的时间效应的F值的自由度,和处理时间交互作用的F值的自由度进行调整。由于F值有两个自由度v1和v2,调整的分子自由度 ,分母自由度 具体计算时可用 或 代替。用调整所得的 及 的值查 F界值表,得 。由于1,所以调整后的F临界值要大于调整前的F临界值。 第二节第二节 单因素重

12、复测量资料的方差分析单因素重复测量资料的方差分析 一、单因素重复测量资料的例子一、单因素重复测量资料的例子 例例101 一项关于不同药物治疗心律失常效果的对比研一项关于不同药物治疗心律失常效果的对比研究。对究。对9例经常出现心室早搏的病人于用药前测定其心率后例经常出现心室早搏的病人于用药前测定其心率后进行随机化给药。一部分病人按进行随机化给药。一部分病人按A药药安慰剂(安慰剂(C药)药)B药的顺序给药,另一部分病人按药的顺序给药,另一部分病人按B药药安慰剂安慰剂(C药)药)A药的顺序给药。安慰剂(药的顺序给药。安慰剂(C药)持续一周作为药物后效的清药)持续一周作为药物后效的清除期。比较用药前与

13、各种药物及除期。比较用药前与各种药物及A药与药与B药之间的心律差别。药之间的心律差别。表表101列出列出9名受试病人在用药前、安慰剂(名受试病人在用药前、安慰剂(C药)期及用药)期及用药(药(A与与B)期的心率。期的心率。 上表的下部及右侧所列的数据均从表体部分的原始测量上表的下部及右侧所列的数据均从表体部分的原始测量值派生而来,是为方差分析而准备的。本例药物水平数值派生而来,是为方差分析而准备的。本例药物水平数a4,每组观察例数每组观察例数n9,观察值总个数观察值总个数Nan36。 二、方差分析的步骤二、方差分析的步骤 1提出检验假设 检验假设为: H0:1234; H1:ih,至少有一个不

14、等式成立。 2计算离均差平方和、自由度及均方计算离均差平方和、自由度及均方 有总离均差平方有总离均差平方和、处理因素离均差平方和、受试对象间离均差平方和及受和、处理因素离均差平方和、受试对象间离均差平方和及受试对象内离均差平方和等。计算公式为:试对象内离均差平方和等。计算公式为: (1)总离均差平方和)总离均差平方和SS总总及总自由度及总自由度v总总的计算的计算 本例,本例,SS总总201647(2665)2/(49)4362.97,v总总36135。 (2)处理因素的离均差平方和)处理因素的离均差平方和SS处理处理及自由度及自由度v处理处理的计算的计算 (3)受试对象间离均差平方和SS对象间

15、及自由度v对象间的计算 (4)受试对象内离均差平方和SS对象内及自由度v对象内的计算 (5)误差的离均差平方和SS误差与自由度v误差的计算 SS误差SS总-SS处理-SS对象间,v误差(n-1)(a-1) (10-8) 本例,SS误差4362.97-1185.42-2023.721153.83,v误差(9-1)(4-1)24 根据以上4种离均差平方和与自由度计算所得的均方见表 10-2。 3. 计算F值 由于主要是处理因素的统计学检验,故只计算处理因素的F值。 F处理MS处理/MS误差,F处理服从v1v处理与v2v误差的F分布 本例,F处理395.14/48.088.22;v13,v224。所

16、有计算结果均列于表10-2中。 SAS程序给出本例的协方差阵Mauchly球形性检验的结果为P0.1628,故不必进行自由度的调整。查F界值表得:F0.01(3,24)3.01,F0.01(3,24)4.72。本例处理因素的F值为8.22,大于F0.01(3,24),故拒绝无效假设,说明处理因素间的差别具有统计学意义。 由表10-2看出,受试对象内离均差平方和等于处理因素的离均差平方和与误差的离均差平方和两项之和。 SAS程序给出 。用 调整的处理因素的分子自由度为 ;分母自由度为 。查F界值表得调整自由度后的F临界值F0.05(2,19)3.52,比未调整的F临界值大。未调整的概率 P0.0

17、006, 调整概率P0.0020。 三、平均值之间的多重比较三、平均值之间的多重比较 以上用单因素重复测量方差分析方法对心率资料进行分以上用单因素重复测量方差分析方法对心率资料进行分析之后所得到的统计学结论是:拒绝无效假设,即在治疗药析之后所得到的统计学结论是:拒绝无效假设,即在治疗药物的四个水平中,至少有一个水平的总体平均值不同于其他物的四个水平中,至少有一个水平的总体平均值不同于其他水平的总体平均值。为了确定这个特殊总体,必须进行平均水平的总体平均值。为了确定这个特殊总体,必须进行平均值之间的多重比较。但此处不能采用上一讲中介绍的多重比值之间的多重比较。但此处不能采用上一讲中介绍的多重比较

18、方法,因为那些方法都是建立在独立样本基础之上的。这较方法,因为那些方法都是建立在独立样本基础之上的。这里可采用配对样本的差值里可采用配对样本的差值t检验,因为配对样本就是重复测量检验,因为配对样本就是重复测量试验中一种最简单的对比研究设计。其检验步骤如下:试验中一种最简单的对比研究设计。其检验步骤如下: 1. 计算每一个病人在不同给药情况下的差值:di(j-h)Yij-Yih,i为病人号,j,h为药物水平号,各di(j-h)列于表10-3的右边各列中。由于设计时只考虑用药前与各种药物及A药与B药之间的差纵情况,表中只列出了di(1-2)、di(1-3)、di(1-4)及di(2-4)四种组合,

19、而不是所有可能的六种组合。 2. 进行差值t检验(参阅成对测量值之差的比较),可分别得到t值为:t(1:2)4.41,t(1:3)0.03,t(1:4)3.19,t(2:4)-0.96 3计算校正临界值t 由于是对同一份资料进行多重比较,为克服累积类错误对结果判断所造成的影响,根据Bonferroni不等式的原理对临界t值进行调整。 首先确定比较的次数 c。因该研究已事先确定只作 4次比较,故c4。若在方差分析之后再作多重比较,则只能取所有可能的比较次数。例如本例在方差分析之后再进行比较时,则比较的次数应为 c4(41)/26。 其次是选择累积 类错误的概率0.10。采用双侧检验,每次检验所用

20、的I类错误概率水准为0.10/40.0125,自由度vn-19-18,查附表2:t界值表得t0.0125/2(8)3.21。与前面计算出的t值相比较,可见用药前心率与服用A药后心率之差具有统计学意义。用药后心率平均降低12.44次/分,而用药前心率与服安慰剂后心率之间以及A药与B药之间心率之差无统计学意义。用药前心率与用B药后心率之差接近显著性水平。 第三节第三节 两因素重复测定资料的方差分析两因素重复测定资料的方差分析 两因素重复测定资料中的两因素是指一个组间因素(处两因素重复测定资料中的两因素是指一个组间因素(处理因素)和一个组内因素(时间因素)。组间因素是指分组理因素)和一个组内因素(时

21、间因素)。组间因素是指分组或分类变量,它把所有受试对象按分类变量的水平分为几个或分类变量,它把所有受试对象按分类变量的水平分为几个组。组内因素是指重复测定的时间变量。例组。组内因素是指重复测定的时间变量。例101只有组内因只有组内因素,没有组间因素。素,没有组间因素。 一、例子一、例子 例例102 一项药物代谢动力学研究,目的是对比某种药物的不同剂型在一项药物代谢动力学研究,目的是对比某种药物的不同剂型在体内的代谢速度。剂型分胶囊型和片剂型。将体内的代谢速度。剂型分胶囊型和片剂型。将16名受试对象随机分为两组,名受试对象随机分为两组,每组每组8名。一组给予胶囊,另一组给予片剂,分别在服药后名。

22、一组给予胶囊,另一组给予片剂,分别在服药后1、2、4、6及及8小时测定血中的药物浓度。测定结果见小时测定血中的药物浓度。测定结果见表表104。 S(9.73)2+(54.61)2+(30.30)2+(70.20)2238012.38 本例的组间因素是药物剂型,组内因素是测定时间。各下标的意义是:本例的组间因素是药物剂型,组内因素是测定时间。各下标的意义是:i(i1,2,g)为组间因素的分组号,为组间因素的分组号,j(j1,2,p)为测定时间为测定时间点的序号,点的序号,k(k1,2,ni)为组间因素第为组间因素第i水平的受试对象号,受试对水平的受试对象号,受试对象总数为象总数为n1n2ng。当

23、各当各ni相等时,则用相等时,则用 n代替代替ni。测量值总个数测量值总个数Ngnp本例本例g2;各组受试对象数各组受试对象数n8,p5,受试对象总数为受试对象总数为2816例,测量值总个数例,测量值总个数N80。 二、方差分析模型二、方差分析模型 一个组间因素,一个组内因素的方差分析模型为:一个组间因素,一个组内因素的方差分析模型为: Yijk+i+i+()ij+(i)k+ijk 模型中各参数的意义是:模型中各参数的意义是:为总体平均值;为总体平均值;i为处理组为处理组i的效应;的效应;i为第为第j个测定时间点的效应;(个测定时间点的效应;()ij为第为第i组在第组在第j个测定时点上个测定时

24、点上的效应,属交互作用,为固定效应;的效应,属交互作用,为固定效应;(i)k为第为第i组第组第k个观察对象个观察对象的效应,属随机效应;的效应,属随机效应;ijk为误差项。给定限制条件为:为误差项。给定限制条件为: 模型中的参数估计值与平均值之间的关系见模型中的参数估计值与平均值之间的关系见 表表 105。三、方差分析的步骤三、方差分析的步骤 1.离均差平方和、自由度及均方的计算离均差平方和、自由度及均方的计算 令令 为观察值总和,为观察值总和, 为观察值平方总和,为观察值平方总和, 为第为第i组观察值之和,组观察值之和, 第第j时点观察值之和,时点观察值之和, 为第为第i组第组第k个受试对象

25、的观察值之和,个受试对象的观察值之和, 为在(为在(ij)水平上的观察值之和。观察值总个数为水平上的观察值之和。观察值总个数为Ngpn。表。表104中同中同时列出了时列出了Tij,Tik,Ti,Tj,T和和S的值。将各离均差平方和、自由度及均方的值。将各离均差平方和、自由度及均方的计算公式列于表的计算公式列于表 106中。中。 用用表表106中所列的计算公式计算出各离均差平方和、自由度及均方见中所列的计算公式计算出各离均差平方和、自由度及均方见表表107。 2计算计算F值值本例的各本例的各F值见值见表表107。 3确定确定P值并作出统计推断值并作出统计推断 在查阅在查阅F临界值表前,要对组内变

26、量(时间)及组间临界值表前,要对组内变量(时间)及组间 组内(剂型组内(剂型时间)交互作用的自由度作调整。调整时要应用时间)交互作用的自由度作调整。调整时要应用 的估计值。的估计值。GG调整调整系数系数 ; HF调整系数调整系数 。如用。如用 计算的计算的F组内组内自由自由度调整值为:度调整值为: F组间组间*组内组内的分子自由度的调整值为:的分子自由度的调整值为: 对组间(剂型)效应仍用原来的自由度对组间(剂型)效应仍用原来的自由度 查查F临界值表得:临界值表得:F0.05(1,14)4.60。对组内(时间)效应及组间对组内(时间)效应及组间组内交互效应的组内交互效应的F临界值要用调整临界值

27、要用调整自由度得自由度得F0.05(2,29)3.33。 统计学推断为:不同剂型药物的血液浓度间的差别无统计学意义(统计学推断为:不同剂型药物的血液浓度间的差别无统计学意义( P0.0645),),不同时间的血药浓度间的差别具有统计学意义(不同时间的血药浓度间的差别具有统计学意义( P0.0001),),剂型与时间之间无明显的交互作用(剂型与时间之间无明显的交互作用( P0.3413)。)。第四节第四节 趋势分析趋势分析 趋势分析(趋势分析(trend analysis)用于分析某项观察指标用于分析某项观察指标在整个时间区间内的变化趋势,或者对比不同处理组在趋在整个时间区间内的变化趋势,或者对

28、比不同处理组在趋势上的差异。例如分析不同类型糖尿病病人在一天中的血势上的差异。例如分析不同类型糖尿病病人在一天中的血糖变化规律,分析不同性别儿童的生长发育趋势等。本节糖变化规律,分析不同性别儿童的生长发育趋势等。本节所介绍的趋势分析方法是把应变量作为时间的函数来配合所介绍的趋势分析方法是把应变量作为时间的函数来配合多项式曲线,不要求资料的协方差阵满足球形性条件多项式曲线,不要求资料的协方差阵满足球形性条件。 一、多项式曲线模型一、多项式曲线模型 一般的多项式回归模型可表示为:一般的多项式回归模型可表示为: 本节所介绍的多项式曲线是采用正交多项式系数来配合模型。其模型结构本节所介绍的多项式曲线是

29、采用正交多项式系数来配合模型。其模型结构为:为: 模型中的模型中的 是在(是在(r)阶下对第阶下对第j时点平均值时点平均值 的预报值,的预报值,Cj(1),Cj(r)是从第(是从第(1)阶起直到()阶起直到(r)阶的第阶的第j个正交多项式系数。个正交多项式系数。0,1,r为为模型参数,从实际资料中求得它们的估计值,模型参数,从实际资料中求得它们的估计值,b0,b1,br。设测定的时设测定的时间点有间点有p个,从理论上讲,幂的阶次可以达到个,从理论上讲,幂的阶次可以达到rp。在这种情况下,理论模在这种情况下,理论模型与观察资料完全一致。但在实际工作中,一般取幂的阶次型与观察资料完全一致。但在实际

30、工作中,一般取幂的阶次 r(p1)。)。当当 r1时为线形模型。利用多项式曲线作趋势分析是将两个组(如治疗组与对时为线形模型。利用多项式曲线作趋势分析是将两个组(如治疗组与对照组或不同的治疗组)之间的比较转换为两个组参数之间的比较。如果任何照组或不同的治疗组)之间的比较转换为两个组参数之间的比较。如果任何一对参数之间的差别具有统计学意义,就可认为这两条曲线的趋势不一致。一对参数之间的差别具有统计学意义,就可认为这两条曲线的趋势不一致。 二、例二、例 子子 例例103 一项药物代谢动力学研究,目的是比较某种一项药物代谢动力学研究,目的是比较某种药物的两种剂型(胶囊型和片剂型)在体内的代谢过程。药

31、物的两种剂型(胶囊型和片剂型)在体内的代谢过程。每组每组8名受试对象,给药后等时距地每隔名受试对象,给药后等时距地每隔1小时测定一次血小时测定一次血药浓度(药浓度(g/ml,用曲线下面积表示),共测定用曲线下面积表示),共测定5次。总测次。总测定值的个数定值的个数N40。资料见资料见表表108。 为了解用正交多项式作趋势分析的过程,先对胶囊型为了解用正交多项式作趋势分析的过程,先对胶囊型组进行单组资料的趋势分析,然后再把片剂型资料包括进组进行单组资料的趋势分析,然后再把片剂型资料包括进来,作两组趋势的对比分析。来,作两组趋势的对比分析。 三、单组资料的趋势分析三、单组资料的趋势分析 用用表表1

32、08中胶囊型资料作单组资料趋势分析。计算所需的数据经整理中胶囊型资料作单组资料趋势分析。计算所需的数据经整理后列于后列于表表109。由于在模型配合过程中需要反复使用误差均方进行假设检。由于在模型配合过程中需要反复使用误差均方进行假设检验,故首先进行单向方差分析,得到误差均方的估计值为:验,故首先进行单向方差分析,得到误差均方的估计值为:MS误差误差899.98,v误差误差35。 趋势分析的过程可概括为六个步骤,各步骤的计算结果见表趋势分析的过程可概括为六个步骤,各步骤的计算结果见表 1011。 1.从正交多项式系数从正交多项式系数表表1010中选择一组系数中选择一组系数C(r)(c1(r) c

33、2(r)cp(r)。)。系数系数C(r)的下标(的下标(r)是多项式曲线的阶数。本例是多项式曲线的阶数。本例 p5。从表中水平数为从表中水平数为 5的四种类型的多项式中选择一种,得到一组多项式系的四种类型的多项式中选择一种,得到一组多项式系 数数C(r)。配合过程通常先由低阶向高阶逐步过渡,故首先选择一组线性多项配合过程通常先由低阶向高阶逐步过渡,故首先选择一组线性多项式系数为式系数为C(1)(2 1 0 1 2)。)。第二步配合二次曲线时选择一组系数为第二步配合二次曲线时选择一组系数为C(2)()(2 1 2 1 2),),余类推。余类推。 2计算计算r次幂下的次幂下的(r)值:值: 3计算

34、离均差平方和计算离均差平方和SS(r) 式(式(1011)的分子中的)的分子中的n为观察例数,分母为系数的平方和(见表为观察例数,分母为系数的平方和(见表 1010 的最后一列)。的最后一列)。 4计算计算F值,确定概率值,确定概率P并作出统计推断并作出统计推断 F值的计算公式为值的计算公式为 统计量统计量F服从服从v11及及v2=v误差误差的的F分布分布 5计算该次幂下的回归系数计算该次幂下的回归系数r的估计值的估计值br 6确定回归方程并求出预报值回归方程为;确定回归方程并求出预报值回归方程为; 本例资料一直配合到四次幂的多项式曲线时仍然有统计学意义,说明该本例资料一直配合到四次幂的多项式

35、曲线时仍然有统计学意义,说明该回归曲线的弯曲度较大。最后得到的回归方程如下:回归曲线的弯曲度较大。最后得到的回归方程如下: 用式(用式(1015)对本例资料的预报结果为:)对本例资料的预报结果为: 同理得到同理得到 利用测量的平均值和预报的平均值制作的趋势图(利用测量的平均值和预报的平均值制作的趋势图( 图图 101)中,可)中,可见两条曲线几乎完全重叠。见两条曲线几乎完全重叠。 经配合多项式曲线后所得的总的回归平方和经配合多项式曲线后所得的总的回归平方和 SS回归回归为各次回归平方和为各次回归平方和的合计,即:的合计,即: SS回归回归113028.67+14366.44+10841.03+

36、4005.44142241.53 即四次多项式曲线可以解释总变异(即四次多项式曲线可以解释总变异( SS总总173734.51)的约)的约 82。四、两组重复测定资料的趋势对比四、两组重复测定资料的趋势对比 对例对例103的实验结果,如果剂型与时间之间存在交互作的实验结果,如果剂型与时间之间存在交互作用,则它们的变化趋势不同。趋势比较可进一步了解不同用,则它们的变化趋势不同。趋势比较可进一步了解不同的变化特点。正交多项式变换的对比方法是将两组资料转的变化特点。正交多项式变换的对比方法是将两组资料转变为两条正交多项式曲线,检验这两条曲线的参数是否来变为两条正交多项式曲线,检验这两条曲线的参数是否

37、来自相同总体。从低阶到高阶每次检验一个参数,因此是单自相同总体。从低阶到高阶每次检验一个参数,因此是单一自由度的比较,用于分析曲线间在哪些阶次上发生变化。一自由度的比较,用于分析曲线间在哪些阶次上发生变化。本例用本例用SAS程序程序103配合的阶次从配合的阶次从 r1到到r4的输出结果的输出结果见见表表1012。 表表1012中的平均值在各阶上的概率中的平均值在各阶上的概率 P都小于都小于0.01,反,反映在各时点上的平均水平是不相等的。剂型在各阶上的概映在各时点上的平均水平是不相等的。剂型在各阶上的概率率 P都大于都大于0.05,反映这两种剂型在血中浓度趋势基本一,反映这两种剂型在血中浓度趋

38、势基本一致,即这两条曲线基本平行。按不同剂型的平均值所绘制致,即这两条曲线基本平行。按不同剂型的平均值所绘制的趋势图见的趋势图见图图 102。 趋势分析的过程首先是检查最高阶次的参数在两组之趋势分析的过程首先是检查最高阶次的参数在两组之间是否具有统计学意义。如果组间差异具有统计学意义,间是否具有统计学意义。如果组间差异具有统计学意义,则可以认为包括本阶次及其余各阶次之间都具有不同的趋则可以认为包括本阶次及其余各阶次之间都具有不同的趋势。否则,应继续对次高阶次的参数作评价。如果在任何势。否则,应继续对次高阶次的参数作评价。如果在任何阶次上都不存在具有统计学意义的差异,说明这两条曲线阶次上都不存在

39、具有统计学意义的差异,说明这两条曲线的变化趋势是一致的。的变化趋势是一致的。 表表101 心室早博病人在用药前后的心率心室早博病人在用药前后的心率病人号(i)药 物(j)按病人(i)1:用药前2:A药3:C药4:B药测量值和(Ti)平均值( )平方和(Si)19467906731879.502591425752695523358.251373938174697329774.252212748259717228471.002043056765747227869.501937467872807230275.5022852787751067434285.502990688268765928571.2

40、52060599074828032681.5026700按药物(j)测量值和(Ti) 718.00606.00717.00624.002665平均值( )79.7867.3379.6769.3374.03平方和(Si )58336.0041284.058275.043752201647表表102 单因素重复测量资料的方差分析单因素重复测量资料的方差分析变异来源离均差平方和自由度均方FP受试对象间2023.728252.96受试对象内2339.252781.79处理因素1185.423395.148.22F调整概率G-G法组间(剂型)2635.8112635.814.030.0645组内(时间)

41、41880.79410470.2050.770.00010.0001剂型时间951.194237.801.150.34130.3366(剂型)对象9163.5514654.54误差11548.6456206.12合计66179.98.79表表108 某药的两种不同剂型在血中的浓度某药的两种不同剂型在血中的浓度(Yijk)(曲线下面积曲线下面积)剂型(i)受试对象(k)测定时间(小时)(j)12345胶囊型(1)14.86532.170110.52102.7294.3722.75028.185130.77142.27117.4033.98015.69587.53120.10101.1541.18

42、510.51091.75149.15136.8551.18528.805148.59127.84158.8263.25019.290105.53149.72136.5074.17070.220234.10199.83190.6080.9003.60091.20159.75134.092.79026.060125.000147.800129.860片剂型(2)17.33021.83077.880101.12083.89020.42012.92078.80098.05076.63030.3409.01081.900126.160117.40041.0708.12083.870136.420121.

43、08051.15027.850127.230135.830119.31063.08516.01071.65099.050101.20071.22527.880112.100116.600128.90080.79022.79074.300100.500137.2601.93018.30088.470114.220110.710表表109 趋势分析所需数据(取自表趋势分析所需数据(取自表108中胶囊型组)中胶囊型组)测定时间(小时)j总计12345观察值和Tj22.285208.480999.9901182.3601038.8003451.910平方和Sj78.6408331.740141730.

44、900180553.900140931.500471626.600 平均值2.79026.060125.000147.800129.86086.300表表1010 正交多项式系数表正交多项式系数表水平数(p)多项式(r)系数C(r)(c1(r) c2(r)cp(r)3线型(1)-1012二次型(2)1-2164线型(1)-3-11320二次型(2)1-1-114三次型(3)-13-31205线型(1)-2-101210二次型(2)2-1-2-1214三次型(3)-120-2110四次型(4)1-46-41706线型(1)-5-3-113570二次型(2)5-1-4-4-1584三次型(3)-5

45、74-4-75180四次型(4)1-322-3128五次型(5)-15-1010-51252表表1011 例例103资料配合正交多项式计算用表资料配合正交多项式计算用表时间点线型(r=1)二次型(r=2)三次型(r=3)四次型(r=4)jcj(1)cj(2)cj(3)cj(4)12.79-2-5.8525.58-1-2.7912.79226.06-1-26.06-1-26.06252.12-4-104.243125.0000-2-250.00006750.004147.801147.80-1-147.80-2-295.60-4-591.205129.862259.722259.721129.8

46、61129.86(r)375.88-158.56-116.41187.21SS(r)113028.6214366.4410841.034005.44F(r)125.5915.9612.054.45P(FF0.05(1,35)0.050.050.05F一阶(1)平均值190078.611190078.61415.570.0001剂型1556.6911556.693.400.0863误差6403.5514457.40二阶(2)平均值16837.83116837.8339.360.0001剂型1581.5811581.583.700.0751误差5988.8814427.78三阶(3)平均值15913.02115913.02106.420.0001剂型445.111445.112.980.1065误差2093.3314149.52四阶(4)平均值5162.1115162.1123.180.0003剂型311.611311.611.400.2566误差3117.8314222.70

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号