公共卫生执业医师考试中级职称考试卫生统计学

上传人:壹****1 文档编号:575644735 上传时间:2024-08-18 格式:PDF 页数:46 大小:2.45MB
返回 下载 相关 举报
公共卫生执业医师考试中级职称考试卫生统计学_第1页
第1页 / 共46页
公共卫生执业医师考试中级职称考试卫生统计学_第2页
第2页 / 共46页
公共卫生执业医师考试中级职称考试卫生统计学_第3页
第3页 / 共46页
公共卫生执业医师考试中级职称考试卫生统计学_第4页
第4页 / 共46页
公共卫生执业医师考试中级职称考试卫生统计学_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《公共卫生执业医师考试中级职称考试卫生统计学》由会员分享,可在线阅读,更多相关《公共卫生执业医师考试中级职称考试卫生统计学(46页珍藏版)》请在金锄头文库上搜索。

1、1 / 46 第一章 绪论习题 一、选择题 1统计工作和统计研究的全过程可分为以下步骤: A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把( )的事件称为小概率事件。 A.10. 0P B. 05. 0P或01. 0P C. 005. 0P D.05. 0P E. 01. 0P 38 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村 144 名妇女生育情况如下:0 胎 5 人、1 胎

2、25 人、2 胎 70 人、3胎 30 人、4 胎 14 人。该资料的类型是( A ) 。 4.分别用两种不同成分的培养基(A 与 B)培养鼠疫杆菌,重复实验单元数均为5 个,记录 48 小时各实验单元上生长的活菌数如下, A:48、84、90、123、171;B:90、116、124、225、84。该资料的类型是( C ) 。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者 41 人,治疗结果如下:治愈 8 人、显效 23 人、好转 6 人、恶化 3 人、死亡 1 人。该资料的类型是( B ) 。 7.某血库提供 6094 例 ABO 血型分布资料如下: O 型 18

3、23、 A 型 1598、 B 型 2032、AB 型 641。该资料的类型是( D ) 。 8. 100 名 18 岁男生的身高数据属于( C ) 。 第二章 统计描述习题 一、选择题 1描述一组偏态分布资料的变异度,以( )指标较好。方差和标准差不是描述正态对称的那种的变异程度么 A. 全距 B. 标准差 C. 变异系数 D. 四分位数间距 E. 方差 2各观察值均加(或减)同一数后( ) 。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 E. 以上都不对 2 / 46 3偏态分布宜用( )描述其分布的集中趋势。 A. 算术均数 B. 标准差

4、C. 中位数 D. 四分位数间距 E. 方差 4.为了直观地比较化疗后相同时点上一组乳腺癌患者血清肌酐和血液尿素氮两项指标观测值的变异程度的大小,可选用的最佳指标是( ) 。CV:当需要比较两组数据离散程度大小的时候,如果两组数据的测量尺度相差太大,或者数据量纲的不同 A.标准差 B.标准误 C.全距 D.四分位数间距 E.变异系数 5.测量了某地 152 人接种某疫苗后的抗体滴度,宜用( )反映其平均滴度。几何均数适用于资料数据为等比级或对数正态分布资料。几何平均滴度都是用 1:20,1:40,1:80 的形式表示 A. 算术均数 B. 中位数 C.几何均数 D.众数 E.调和均数 6.测量

5、了某地 237 人晨尿中氟含量(mg/L),结果如下: 尿氟值:0.2 0.6 1.0 1.4 1.8 2.2 2.6 3.0 3.4 3.8 频 数: 75 67 30 20 16 19 6 2 1 1 宜用( )描述该资料。 A. 算术均数与标准差 B.中位数与四分位数间距 C.几何均数与标准差D. 算术均数与四分位数间距 E. 中位数与标准差 7用均数和标准差可以全面描述( )资料的特征。 A. 正偏态资料 B. 负偏态分布 C. 正态分布 D. 对称分布 E. 对数正态分布 8比较身高和体重两组数据变异度大小宜采用( ) 。 A. 变异系数 B. 方差 C. 极差 D. 标准差 E.

6、四分位数间距 9血清学滴度资料最常用来表示其平均水平的指标是( ) 。 A. 算术平均数 B. 中位数 C. 几何均数 D. 变异系数 E. 标准差 10最小组段无下限或最大组段无上限的频数分布资料,可用( )描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D. 四分位数间距 E. 几何均数 11 现有某种沙门菌食物中毒患者 164 例的潜伏期资料, 宜用 ( ) 描述该资料。 A. 算术均数与标准差 B.中位数与四分位数间距 C.几何均数与标准差D. 算术均数与四分位数间距 E. 中位数与标准差 12测量了某地68 人接种某疫苗后的抗体滴度,宜用( )反映其平均滴度。 A. 算术均

7、数 B. 中位数 C.几何均数 D.众数 E.调和均数 3 / 46 第三章 抽样分布与参数估计习题 一、选择题 1 ( )分布的资料,均数等于中位数。 A. 对数 B. 正偏态 C. 负偏态 D. 偏态 E. 正态 2. 对数正态分布的原变量X是一种( )分布。 A. 正态 B. 近似正态 C. 负偏态 D. 正偏态 E. 对称 3. 估计正常成年女性红细胞计数的95%医学参考值范围时,应用( A. ) 。 A.)96. 1,96. 1(sxsx B.)96. 1,96. 1(xxsxsx C.)645. 1(lglgxxsx D.)645. 1(sx E.)645. 1(lglgxxsx

8、4. 估计正常成年男性尿汞含量的 95%医学参考值范围时,应用(E ) 。 A.)96. 1,96. 1(sxsx B.)96. 1,96. 1(xxsxsx C.)645. 1(lglgxxsx D.)645. 1(sx E.)645. 1(lglgxxsx 5若某人群某疾病发生的阳性数X服从二项分布,则从该人群随机抽出n个人, 阳性数X不少于k人的概率为( ) 。 A. )() 1()(nPkPkP B. )()2() 1(nPkPkP C. )() 1 ()0(kPPP D. ) 1() 1 ()0(kPPP E. )()2() 1 (kPPP 6Piosson分布的标准差和均数的关系是

9、( ) 。 A. B. C. =2 D. = E. 与无固定关系 7用计数器测得某放射性物质 5 分钟内发出的脉冲数为 330 个,据此可估计该放射性物质平均每分钟脉冲计数的 95%可信区间为( ) 。 A. 33096. 1330 B. 33058. 2330 C. 3396. 133 D. 3358. 233 E. 5/ )33096. 1330( 8Piosson分布的方差和均数分别记为2和,当满足条件( )时,Piosson 分布近似正态分布。 A. 接近 0 或 1 B. 2较小 C. 较小 D. 接近 0.5 E. 202 9二项分布的图形取决于( )的大小。二项分布的形状取决于

10、和 n 的大小,高峰在m=np 处。当 p 接近 0.5 时,图形是对称的;p 离 0.5 愈远,对称性愈差,但随着 n 的增大,分布趋4 / 46 于对称。当 n时,只要 p 不太靠近 0 或 1,特别是当 nP 和 n(1P)都大于 5 时,二项分布近似于正态分布。 A. B. n C.n与 D. E. 10 ( )小,表示用该样本均数估计总体均数的可靠性大。 A.CV B.S C. X D. R E. 四分位数间距 11在参数未知的正态总体中随机抽样,X( )的概率为 5。 A. 1.96 B. 1.96 C. 2.58 D. St, 2/05. 0 E. XSt, 2/05. 0 12

11、某地 1992 年随机抽取 100 名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为 4g/L,则其总体均数的 95%可信区间为( ) 。 A. 10458. 274 B. 10496. 174 C. 458. 274 D. 4474 E. 496. 174 13一药厂为了解其生产的某药物(同一批次)的有效成分含量是否符合国家规定的标准,随机抽取了该药 10 片,得其样本均数与标准差;估计该批药剂有效成分平均含量的 95可信区间时,应用( ) 。 A.),(, 2/05. 0, 2/05. 0XXstXstX B.)96. 1,96. 1(XXXX C. ),(, 2/05. 0,

12、 2/05. 0stXstX D.)96. 1,96. 1(XXXX E. )96. 1,96. 1(ppspsp 14在某地按人口的 1/20 随机抽取 1000 人,对其检测汉坦病毒 IgG 抗体滴度,得肾综合征出血热阴性感染率为 5.25,估计该地人群肾综合征出血热阴性感染率的 95可信区间时,应用( ) 。 A.),(, 2/05. 0, 2/05. 0XXstXstX B.)96. 1,96. 1(XXXX C. ),(, 2/05. 0, 2/05. 0stXstX D.)96. 1,96. 1(XXXX E. )96. 1,96. 1(ppspsp 15在某地采用单纯随机抽样方法

13、抽取10 万人,进行一年伤害死亡回顾调查,得伤害死亡数为 60 人;估计该地每 10 万人平均伤害死亡数的 95可信区间时,应用( ) 。 A.),(, 2/05. 0, 2/05. 0XXstXstX B.)96. 1,96. 1(XXXX C. ),(, 2/05. 0, 2/05. 0stXstX D.)96. 1,96. 1(XXXX E. )96. 1,96. 1(ppspsp 16关于以 0 为中心的t分布,错误的是( ) 。 5 / 46 A. 相同时,t越大,P越大 B. t分布是单峰分布 C. 当时,ut D. t分布以 0 为中心,左右对称 E. t分布是一簇曲线 二、简单

14、题 1、标准差与标准误的区别与联系 2、二项分布的应用条件 3、正态分布、二项分布、poisson 分布的区别和联系 三、计算分析题 1、如何用样本均数估计总体均数的可信区间 2、某市 2002 年测得 120 名 11 岁男孩的身高均数为 146.8cm,标准差为 7.6cm,同时测得 120 名 11 岁女孩的身高均数为 148.1cm,标准差为 7.1cm,试估计该地11 岁男、女童身高的总体均数,并进行评价。 3、 按人口的 1/20 在某镇随机抽取 312 人, 做血清登革热血凝抑制抗体反应检验,得阳性率为 8.81%,求该镇人群中登革热血凝抑制抗体反应阳性率的 95%可信区间。 一

15、 单选题; 1、成组设计的方差分析中,必然有: A.SS 组内SS 组间 B. MS 组间MS 组内 C. MS 总=MS 组间+MS 组内 D. SS 总=SS 组间+SS 组内 2.以下检验方法除_外,其余均属非参数法: A. t 检验 B. H 检验 C. T 检验 D. X2 检验 3.两小样本比较的假设检验,首先应考虑: A. 用 t 检验 B.用秩和检验 C.t 检验或秩和检验 D.资料符合 t 检验还是秩和检验的条件 4.等级资料比较宜用: A.t 检验 B. X2 检验 C. 秩和检验 D.F 检验 5.随机抽样的目的是; A. 消除糸统误差 B. 消除测量误差 C. 减少样本

16、偏性 D消除系统误差和测量误差 E. 消除抽样误差 6.下列抽样方法中哪一种抽样误差最小 A. 单纯随机抽样 B. 糸统抽样 C整群抽样 D. 分层抽样 7.反映一组等比数列资料的集中趋势的指标一般用; A众数 B. 几何均数 C. 中位数 D算术均数 E. 百分位数 8.显著性检验的结果 P0.01 哪个正确。 A差别无显著性 B. 差别很大 C. 两样本来自同一总体 D . 差别有高度显著性 E由抽样造成误差的机会大于 1% 9.反映偏态分布资料集中趋势的统计指标是; A . X B. G. C. M. 中位数 英语:Median D. S, E. CV. 10.描述计数资料的统计指标是;

17、常用的相对数:率、构成比 A. 平均数 B. 相对数 C. 标准差 D标准误 E. 变异系数 6 / 46 11.四个样本率作 x2 检验,x2x20.01(3),可认为; A. 各总体率不同或不全相同 B. 各总体率均不同 C. C. 各样本率不同或不全相同 D. 各样本率不相同 E以上都不对 12.已知小样本资料中经x=7.32, s=0.18, n=9,t0.05,8=2.306, U0.05=1.96,则这组资料的 95%可信区间为; A. 7.187.46 B. 6.957.89 C.7.207.44 D.7.017.63 E.7.007.50. 13. 符合 t 检验条件的计量资料

18、如果采用秩和检验,则: A.第一类错误增大 B 第二类错误增大 C. 第一类错误减小 D. 第二类错误减小 14. 两样本均数比较时,分别取以下检验水准,以下所取第二类错误最小; A. =0.05 B. =0.01 C. =0.1 D.=0.2. 15. 某病人患者 6 人,其潜伏期(天)分别为 2,3,8,5,2,20 天,则其平均潜伏期为( )天. A. 6.67 B. 6.5 C. 4 D. 5 1.完全随机设计的 SS总=SS组间+SS组内, 随机区组设计的 SS总=SS区组+SS处理+SS误差。2.A 除 t 检验属于参数检验。3.D 4.C 5.C 6.D 7.B 8.D 9.C

19、10.B 11.A 12.A 13.B 采用秩和检验会使检验效能下降,所以二类错误增大。14.D 要使二类错误减小,要增大 a。15.C 计算平均潜伏期,要先按从小到大的顺序排列。2,2,3,5,8,20 (3+5)/2=4. 第四章 数值变量资料的假设检验习题 一、选择题 1在样本均数与总体均数比较的t检验中,无效假设是( ) 。 A. 样本均数与总体均数不等 B. 样本均数与总体均数相等 C. 两总体均数不等 D. 两总体均数相等 E. 样本均数等于总体均数 2在进行成组设计的两小样本均数比较的t检验之前时,要注意两个前提条件。一要考察各样本是否来自正态分布总体,二要: A.核对数据 B.

20、作方差齐性检验 C.求均数、标准差 D.求两样本的合并方差 E.作变量变换 3两样本均数比较时,分别取以下检验水准,以( )所取第二类错误最小。最大值 A. 01. 0 B. 05. 0 C. 10. 0 D. 20. 0 E. 30. 0 4正态性检验,按10. 0检验水准,认为总体服从正态分布。若该推断有错,其错误的概率为( ) 。 A. 大于 0.10 B. 小于 0.10 C. 等于 0.10 D. 等于,而未知 E. 等于1,而未知 7 / 46 5关于假设检验,下面哪一项说法是正确的( ) 。 A. 单侧检验优于双侧检验 B. 若P,则接受0H犯错误的可能性很小 C. 采用配对t检

21、验还是两样本t检验是由实验设计方案决定的 D. 检验水准只能取 0.05 E. 用两样本u检验时,要求两总体方差齐性 6假设一组正常人的胆固醇值和血磷值均近似服从正态分布。为从不同角度来分析该两项指标间的关系,可选用: A.配对t检验和标准差 B.变异系数和相关回归分析 C.成组t检验和F检验 D.变异系数和u检验 E.配对t检验和相关回归分析 7在两样本均数比较的t检验中,得到, 2/05. 0tt ,05. 0P,按05. 0检验水准不拒绝无效假设。此时可能犯: A.第类错误 B. 第类错误 C.一般错误 D.错误较严重E.严重错误 二、简答题 1.假设检验中检验水准以及P值的意义是什么?

22、 2.t检验的应用条件是什么? 3.比较型错误和型错误的区别和联系。 4.如何恰当地应用单侧与双侧检验? 三、计算题 1.调查显示,我国农村地区三岁男童头围均数为 48.2cm,某医生记录了某乡村20 名三岁男童头围,资料如下:48.29 47.03 49.10 48.12 50.04 49.85 48.97 47.96 48.19 48.25 49.06 48.56 47.85 48.37 48.21 48.72 48.88 49.11 47.86 48.61。试问该地区三岁男童头围是否大于一般三岁男童 。 2. 分别从10例乳癌患者化疗前和化疗后1天的尿样中测得尿白蛋白 (ALb,mg/L

23、)的数据如下,试分析化疗是否对ALb 的含量有影响 病人编号 1 2 3 4 5 6 7 8 9 10 化疗前ALb 含量 3.3 11.7 9.4 6.8 2.0 3.1 5.3 3.7 21.8 17.6 化疗后ALb 含量 33.0 30.8 8.8 11.4 42.6 5.8 1.6 19.0 22.4 30.2 3.某医生进行一项新药临床试验,已知试验组 15 人,心率均数为 76.90,标准差为 8.40;对照组 16 人,心率均数为 73.10,标准差为 6.84.试问在给予新药治疗之前,试验组和对照组病人心率的总体均数是否相同? 4.测得某市 18 岁男性 20 人的腰围均值为

24、 76.5cm,标准差为 10.6cm;女性 25人的均值为 69.2cm,标准差为 6.5cm。根据这份数据可否认为该市 18 岁居民腰围有性别差异? 5 欲比较甲、乙两地儿童血浆视黄醇平均水平,调查甲地 312 岁儿童 150 名,8 / 46 血浆视黄醇均数为 1.21mol/L,标准差为 0.28mol/L;乙地 312 岁儿童 160名,血浆视黄醇均数为 0.98mol/L,标准差为 0.34mol/L.试问甲乙两地 312岁儿童血浆视黄醇平均水平有无差别? 第四章 数值变量资料的假设检验(答案) 一、选择题 1. B 2. B 3. E 4. D 5. C 6. E 7.B 二、简

25、答题 1.答 为判断拒绝或不拒绝无效假设0H的水准,也是允许犯型错误的概率。P值是指从0H规定的总体中随机抽样时,获得等于及大于(负值时为等于及小于)现有样本统计量的概率。 2.答 t检验的应用条件:当样本含量较小(5030nn或时) ,要求样本来自正态分布总体;用于成组设计的两样本均数比较时,要求两样本来自总体方差相等的总体。 3.答 型错误拒绝了实际上成立的0H,型错误不拒绝实际上不成立的0H。通常,当样本含量不变时,越小,越大;反之,越大,越小。 4.答 在一般情况下均采用双侧检验,只有在具有充足理由可以认为如果无效假设0H不成立,实际情况只能有一种方向的可能时才考虑采用单侧检验。 三、

26、计算题 1.解 检验假设 0010:,:0.05HH 这里20,48.55,0.70nXS 048.5548.22.241,120119/0.70/20XtvnSn 0.05,191.729,0.05,0.05ttP查 临界值表,单侧得在的水准上拒绝0,H可以认为该地区三岁男童头围大于一般三岁男童。 2.解 检验假设 01:0,:00.05ddHH 这里,210,120.9,3330.97,12.09nddd 222() /3330.97( 120.9) /104.56110 1dddnSn 9 / 46 012.092.653,10 19/4.56/ 10ddtvSn 查表得双侧0.05,9

27、2.262,2.262,0.05ttP,按0.05检验水准拒绝0H,可以认为化疗对乳腺癌患者 ALb 的含量有影响。 3.解 方差齐性检验 2222012112:,:0.05HH 221122228.401.51,15 114,16 1156.84SFvvS F查 界值表,0.05(14,15)2.70,F知00.05,0.05,PH在水平上不能拒绝可认为该资料方差齐。 两样本均数比较的假设检验 012112:,:0.05HH 22222112212(1)(1)(15 1)8.40(16 1)6.8458.26215 162cnSnSSnn 122121276.9073.101.385258.

28、26(1/15 1/16)(1/1/)215 16229cXXtSnnvnn 查t临界值表,0.05,2902.045,0.05,0.05.tPH知在水准上尚不能拒绝所以可以认为试验组和对照组病人心率的总体均数相同。 4.解 方差齐性检验: 2222012112:,:0.05HH 2211222210.62.66,20 119,25 1246.5SFvvS F查 界值表,0.05(19,24)1.94,F知00.05,0.05,PH在水平上拒绝可认为该资料方差不齐。 两样本均数比较的假设检验 012112:,:0.05HH 10 / 46 121212222212122222224422221

29、276.569.22.700410.66.5202510.66.5()20253010.66.511202520 125 1xxxxXXtSSnnSSvSSnn 查t临界值表,0.05,3002.042,0.05,0.05.tPH知在水准上拒绝所以根据这份数据可以认为该市 18岁居民腰围有性别差异。 5.解 检验假设 012112:,:0.05HH 这里,111222150,1.21,0.28160,0.98,0.34nXSnXS 12222211221.210.98/0.28 /1500.34 /160XXuSnSn0.82 在这里0.821.96,0.05,0.05uP按检验水准尚不能拒绝

30、0H,可以认为甲乙两地312岁儿童血浆视黄醇平均水平没有差别。 第五章 方差分析习题 一、选择题 1完全随机设计资料的方差分析中,必然有( ) 。 A. 组内组间SSSS B.组内组间MSMS C. 组内组间总SSSSSS D.组内组间总MSMSMS E. 组内组间 2当组数等于2 时,对于同一资料,方差分析结果与t检验结果( ) 。 A. 完全等价且tF B. 方差分析结果更准确 C. t检验结果更准确 D. 完全等价且Ft E. 理论上不一致 3在随机区组设计的方差分析中,若),(05. 021FF处理,则统计推论是( ) 。 A. 各处理组间的总体均数不全相等 B. 各处理组间的总体均数

31、都不相等 C. 各处理组间的样本均数都不相等 D. 处理组的各样本均数间的差别均有显著性 11 / 46 E. 各处理组间的总体方差不全相等 4随机区组设计方差分析的实例中有( ) 。 A. 处理SS不会小于区组SS B. 处理MS不会小于区组MS C. 处理F值不会小于1 D. 区组F值不会小于1 E. F值不会是负数 5完全随机设计方差分析中的组间均方是( )的统计量。 A. 表示抽样误差大小 B. 表示某处理因素的效应作用大小 C. 表示某处理因素的效应和随机误差两者综合影响的结果。 D. 表示n个数据的离散程度 E. 表示随机因素的效应大小 6完全随机设计资料,若满足正态性和方差齐性。

32、要对两小样本均数的差别做 比较,可选择( ) 。 A.完全随机设计的方差分析 B. u检验 C. 配对t检验 D.2检验 E. 秩和检验 7配对设计资料,若满足正态性和方差齐性。要对两样本均数的差别做比较, 可选择( ) 。 A. 随机区组设计的方差分析 B. u检验 C. 成组t检验 D. 2检验 E. 秩和检验 8 对k个组进行多个样本的方差齐性检验 (Bartlett 法) , 得2,05. 02,05. 0P按05. 0检验,可认为( ) 。 A. 22221,k全不相等 B. 22221,k不全相等 C. kSSS,21不全相等 D. kXXX,21不全相等 E. k,21不全相等

33、9变量变换中的对数变换(Xxlg或) 1lg(Xx) ,适用于( ) : A. 使服从 Poisson 分布的计数资料正态化 B. 使方差不齐的资料达到方差齐的要求 C. 使服从对数正态分布的资料正态化 D. 使轻度偏态的资料正态化 E. 使率较小(70%)的二分类资料达到正态的要求 二、简答题 12 / 46 1、方差分析的基本思想及应用条件 2、在完全随机设计资料的方差分析与随机区组设计资料的方差分析在试验设计和变异分解上有什么不同? 3、为何多个均数的比较不能直接做两两比较的 t 检验? 4、SNK-q 检验和 Dunnett-t 检验都可用于均数的多重比较,它们有何不同? 三、计算题

34、1、某课题研究四种衣料内棉花吸附十硼氢量。每种衣料各做五次测量,所得数据如表 5-1。试检验各种衣料棉花吸附十硼氢量有没有差异。 表 5-1 各种衣料间棉花吸附十硼氢量 衣料 1 衣料 2 衣料 3 衣料 4 2.33 2.48 3.06 4.00 2.00 2.34 3.06 5.13 2.93 2.68 3.00 4.61 2.73 2.34 2.66 2.80 2.33 2.22 3.06 3.60 2、研究中国各地区农村 3 岁儿童的血浆视黄醇水平,分成三个地区:沿海、内陆、西部,数据如下表,问三个地区农村 3 岁儿童的血浆视黄醇水平有无差异。 地区 n X S 沿海 20 1.10

35、0.37 内陆 23 0.97 0.29 西部 19 0.96 0.30 3、将同性别、体重相近的同一配伍组的 5 只大鼠,分别用 5 种方法染尘,共有6 个配伍组 30 只大鼠,测得的各鼠全肺湿重,见下表。问 5 种处理间的全肺湿重有无差别? 表 5-2. 大鼠经 5 种方法染尘后全肺湿重 区组 对照 A 组 B 组 C 组 D 组 第 1 区 1.4 3.3 1.9 1.8 2.0 第 2 区 1.5 3.6 1.9 2.3 2.3 第 3 区 1.5 4.3 2.1 2.3 2.4 第 4 区 1.8 4.1 2.4 2.5 2.6 第 5 区 1.5 4.2 1.8 1.8 2.6 第

36、 6 区 1.5 3.3 1.7 2.4 2.1 4、对第 1 题的资料进行均数间的多重比较。 第五章 方差分析(答案) 一、选择题 1.C 2.D 3.A 4.E 5.C 6.A 7.A 8.B 9.C 10.A 13 / 46 二、简单题 1、答:方差分析的基本思想就是根据试验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分, 除随机误差作用外, 每个部分的变异可由某个因素的作用 (或某几个因素的交互作用) 加以解释, 如组间变异SS组间可有处理因素的作用加以解释。 通过比较不同变异来源的均方, 借助F分布做出统计推断,从而推论各种研究因素对试验结果有无影响。 方差分

37、析的应用条件:(1)各样本是相互独立的随机样本, 均服从正态分布;(2)相互比较的各样本的总体方差相等,即具有方差齐性。 2、完全随机设计:采用完全随机化的分组方法,将全部实验对象分配到 g 个处理组(水平组) ,各组分别接受不同的处理。在分析时,SSSSSS总组间组内 随机区组设计: 随机分配的次数要重复多次, 每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。在分析时,SSSSSSSS处理总区组组内 3、多个均数的比较,如果直接做两两比较的 t 检验,每次比较允许犯第类错误的概率都是 ,这样做多次 t 检验,就增加了犯第类错误的概率。因此多个均数的比较应

38、该先做方差分析, 若多个总体均数不全相等, 再进一步进行多个样本均数间的多重比较。 4、SNK-q 检验常用于探索性的研究,适用于每两个均数的比较 Duunett-t 检验多用于证实性的研究,适用于 k-1 个实验组与对照组均数的比较。 三、计算题 1.采用完全随机设计的方差分析,计算步骤如下: Ho:各个总体均数相等 H1:各个总体均数不相等或不全相等 =0.05 表 5-1 各种衣料间棉花吸附十硼氢量 衣料 1 衣料 2 衣料 3 衣料 4 合计 ijX 2.33 2.48 3.06 4.00 2.00 2.34 3.06 5.13 2.93 2.68 3.00 4.61 2.73 2.3

39、4 2.66 2.80 2.33 2.22 3.06 3.60 in 5 5 5 5 20(N) iX 2.4640 2.4120 2.9680 4.0280 2.9680(X) iS 0.3671 0.1758 0.1741 0.9007 0.80990(S) 14 / 46 SS总=2S总*总=0.809902 *(20-1)=12.4629,总=20-1=19 2()iiiSSn XX组间=5(2.4640-2.9680 )2+5(2.4120-2.9680 )2 +5(2.9680-2.9680 )2+5(4.0280-2.9680 )2=8.4338,组间=4-1=3 SSSSSS总

40、组间组间=12.4629-8.4338=4.0292,组内=20-4=16 8.43383SSMS组间组间组间=2.8113 4.029216SSMS组内组内组内=0.2518 F=2.81130.2518=11.16 方差分析表 变异来源 SS MS F P 总 12.4629 19 组间 8.4338 3 2.8113 11.16 0.01 组内 4.0292 16 0.2518 按1=3,2=16 查 F 界值表,得0.01(2,16)F7.51,F11.167.51, 故P 0.05 组内 6.0713 59 0.1029 按1=2,2=59 查 F 界值表,得0.05(2,59)F3

41、.93,F1.203.93, 故P 0.05。 按=0.05 水准尚不能拒绝 Ho,故可以认为各组总体均数相等。 3. 处理组间: Ho: 各个处理组的总体均数相等 H1: 各个处理组的总体均数不相等或不全相等 =0.05 区组间: Ho: 各个区组的总体均数相等 H1: 各个区组的总体均数不相等或不全相等 =0.05 表 5-2. 大鼠经 5 种方法染尘后全肺湿重 区组 对照 A 组 B 组 C 组 D 组 jn jX 第1区 1.4 3.3 1.9 1.8 2.0 5 2.0800 第2区 1.5 3.6 1.9 2.3 2.3 5 2.3200 第3区 1.5 4.3 2.1 2.3 2

42、.4 5 2.5200 第4区 1.8 4.1 2.4 2.5 2.6 5 2.6800 第5区 1.5 4.2 1.8 1.8 2.6 5 2.3800 第6区 1.5 3.3 1.7 2.4 2.1 5 2.2000 16 / 46 in 6 6 6 6 6 30 (N) iX 1.5333 3.8000 1.9667 2.1833 2.3333 2.3633 (X) iS 0.1366 0.4561 0.2503 0.3061 0.2503 0.82816 (S) 22()XSSXN总 =19.8897,总=30-1=29 2()iiiSSn XX处理组=17.6613, 处理组=5-1

43、=4 2j()jjSSnXX区组=1.1697, 区组=6-1=5 SS误差=19.8897-17.6613-1.1697=1.0587 ,误差=(5-1) (6-1)=20 方差分析结果 变异来源 SS MS F P 总 19.8897 29 处理组 17.6613 4 4.4153 83.41 0.01 区组 1.1697 5 0.2339 4.42 0.01 误差 1.0587 20 0.0529 按1=4,2=20 查 F 界值表,得0.01(4,20)F5.17,F83.415.17, 故P 0.01 。 按 =0.05 水准,拒绝0H,接受1H,可以认为 5 种处理间的全肺湿重不全

44、相等。 按1=5,2=20 查 F 界值表,得0.05(5,20)F3.29,F4.423.29, 故P0.05 1与3 0.5560 3 2.4775 0.05 1 与 4 1.6160 4 7.2008 0.05 2与4 1.5640 3 6.9691 0.01 3 与 4 1.0600 2 4.7233 0.05, 按0.05的检验水准,不拒绝0H,尚不能认为该地新生儿染色体异常率低于一般。 2答: (1)建立检验假设,确定检验水准 0H:12 112:H 单侧 0.05 (2)计算统计量,做出推断结论 本例00.01,12369/4000.9225,477/5000.954,pp (3

45、69477)/(400500)0.94cp ,根据题意 12120.92250.9541.97731111(1)()0.94 0.06 ()400500ccppuppnn (3)确定 P 值,做出推断结论。 1.9773u ,P0.05,按0.05的检验水准,拒绝0H,接受1H,可以认为这两种药物的治愈率不同。 3答: (1)建立检验假设,确定检验水准 0H:12 两法总体缓解率相同 112:H 两法总体缓解率不同 双侧 0.05 (2)计算统计量,做出推断结论 本例 n=58 ,最小理论频数RC23 25T=9.914458,用四格表资料的2检验专用公式 22(15 5 18 20)587.

46、09435 23 33 25 1 (3)确定 P 值,做出推断结论。 2(0.05,1)3.84 ,P0.05, 在0.05的检验水准下,差异有统计学意义,可以认23 / 46 为两种治疗方案的总体缓解率不同。 4答: (1)建立检验假设,确定检验水准 0H:BC 两种方法的检测结果相同 1:HBC 两种方法的检测结果不同 双侧 0.05 (2)计算统计量,做出推断结论 本例 b+c=1240, 用配对四格表资料的2检验校正公式 22(1021)4.083102 1 (3)确定 P 值,做出推断结论。 24.083,P0.05, 在0.05的检验水准下,差异有统计学意义,可以认为两种方法的检测

47、结果不同。 5答: (1)建立检验假设,确定检验水准 0H: 两种检测指标间无关联 1:H 两种检测指标间有关联 双侧 0.05 (2)计算统计量,做出推断结论 本例为双向无序 RC 表,用式 22(1)RCAnn n 求得 2222222222518702055602501129.8274027 13010840108 130108 80115 130115 80()(3 1)(3 1)4 (3)确定 P 值,做出推断结论。 2129.8,P0.05, 在0.05的检验水准下,差异有统计学意义,可以认为两种检测指标有关联,进一步计算Pearson列联系数,以分析其关联密切程度。 列联系数 2

48、20.5846prn,可以认为两者关系密切。 第七章 非参数检验习题 一、 选择题 1配对比较秩和检验的基本思想是:若检验假设成立,则对样本来说( ) 。 A正秩和与负秩和的绝对值不会相差很大 B正秩和与负秩和的绝对值相等 24 / 46 C正秩和与负秩和的绝对值相差很大 D不能得出结论 E以上都不对 2设配对资料的变量值为1X和2X,则配对资料的秩和检验是( ) 。 A把1X和2X的差数从小到大排序 B分别按1X和2X从小到大排序 C把1X和2X综合从小到大排序 D把1X和2X的和数从小到大排序 E把1X和2X的差数的绝对值从小到大排序 3下列哪项不是非参数统计的优点( ) 。 A不受总体分

49、布的限制 B适用于等级资料 C适用于未知分布型资料 D适用于正态分布资料 E适用于分布呈明显偏态的资料 4等级资料的比较宜采用( ) 。 A秩和检验 BF检验 Ct检验 D2检验 Eu检验 5在进行成组设计两样本秩和检验时,以下检验假设哪种是正确的( ) 。 A两样本均数相同 B两样本的中位数相同 C两样本对应的总体均数相同 D两样本对应的总体分布相同 E两样本对应的总体均数不同 6以下检验方法中,不属于非参数检验方法的是( ) 。 AFriedman 检验 B符号检验 CKruskal-Wallis 检验 DWilcoxon 检验 Et检验 7成组设计两样本比较的秩和检验中,描述不正确的是(

50、 ) 。 A将两组数据统一由小到大编秩 B遇有相同数据,若在同一组,按顺序编秩 C遇有相同数据,若不在同一组,按顺序编秩 D遇有相同数据,若不在同一组,取其平均值 E遇有相同数据,若在同一组,取平均致词 二、简答题 1简要回答进行非参数统计检验的适用条件。 2你学过哪些设计的秩和检验,各有什么用途? 3 试写出非参数统计方法的主要有缺点。 三、计算题 1对 8 份血清分别用 HITAH7600 全自动生化分析仪(仪器一)和 OLYMPUS AU640全自动生化分析仪(仪器二)测乳酸脱氢酶(LDH) ,结果见表 7-1。问两种仪器所得结果有无差别? 表 7-1 8 份血清用原法和新法测血清乳酸脱

51、氢酶(U/L)的比较 编号 仪器一 仪器二 1 100 120 25 / 46 2 121 130 3 220 225 4 186 200 5 195 190 6 150 148 7 165 180 8 170 171 2 40 名被动吸烟者和 38 名非被动吸烟者的碳氧血红蛋白 HbCO(%)含量见表7-2。问被动吸烟者的HbCO(%)含量是否高于非被动吸烟者的HbCO(%)含量? 表 7-2 吸烟工人和不吸烟工人的 HbCO(%)含量比较 含量 被动吸烟者 非被动吸烟者 合计 很低 1 2 3 低 8 23 31 中 16 11 27 偏高 10 4 14 高 4 0 4 3 受试者 4

52、人,每人穿四种不同的防护服时的收缩压值如表,问四种防护服对收缩压的影响有无显著差别?四个受试者的收缩压值有无显著差别? 表 7-3 四种防护服与收缩压值 受试者编号 防护服 A 防护服 B 防护服 C 防护服 D 1 1 2 122 125 135 120 3 110 130 136 130 4 120 115 120 130 第七章 非参数检验(答案) 一、选择题 1A 2E 3D 4A 5D 6E 7C 二、简答题 1答: (1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知; (2)等级资料; (3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件

53、; (4) 在资料满足参数检验的要求时, 应首选参数法,以免降低检验效能。 2. 答: (1)配对设计的符号秩和检验(Wilcoxon 配对法)是推断其差值是否来自中位数为零的总体的方法, 可用于配对设计差值的比较和单一样本与总体中位数的比较; (2)成组设计两样本比较的秩和检验(Wilcoxon 两样本比较法)用于完全随机设计的两个样本的比较, 目的是推断两样本分别代表的总体分布是否26 / 46 吸纳共同。 (3)成组设计多样本比较的秩和检验(Kruskal-Wallis 检验) ,用于完全随机设计的多个样本的比较,目的是推断两样本分别代表的总体的分布有无差别。 (4)随机区组设计资料的秩

54、和检验(Friedman 检验) ,用于配伍组设计资料的比较。 3. 答:优点: (1)适用范围广,不受总体分布的限制; (2)对数据的要求不严;(3)方法简便,易于理解和掌握。 缺点:如果对符合参数检验的资料用了非参数检验,因不能充分利用资料提供的信息,会使检验效能低于非参数检验;若要使检验效能相同,往往需要更大的样本含量。 三、 计算题 1解: (1)建立检验假设,确定检验水准 0H:用方法一和方法二测得乳酸脱氢酶含量的差值的总体中位数为零,即0dM 1H:0dM 0.05 (2)计算检验统计量T值 求各对的差值 见表 7-4 第(4)栏。 编秩 见表 7-4 第(5)栏。 求秩和并确定统

55、计量T。5.5T 30.5T 取5.5T 。 (3)确定P值,做出推断结论 本例中8n,5.5T ,查附表T界值表,得双侧0.05P ;按照0.05检验水准,拒绝0H,接受1H。认为用方法一和方法二测得乳酸脱氢酶含量差别有统计学意义。 表 7-4 8 份血清用原法和新法测血清乳酸脱氢酶(U/L)的比较 编号 原法 新法 差值d 秩次 (1) (2) (3) (4) = (2) (3) (5) 1 100 120 -20 -8 2 121 130 -9 -5 3 220 225 -5 -3.5 4 186 200 -14 -6 5 195 190 5 3.5 6 150 148 2 2 7 16

56、5 180 -15 -7 8 170 171 -1 -1 5.5T 30.5T 27 / 46 2、解: (1)建立检验假设,确定检验水准 0H:被动吸烟者的 HbCO(%)与非被动吸烟者的 HbCO(%)含量总体分布相同 1H:被动吸烟者的 HbCO(%)与非被动吸烟者的 HbCO(%)含量总体分布不同 0.05 (2)计算检验统计量T值 编秩 求秩和并检验统计量 11909T ,21237.5T ,139n ,240n ,故检验统计量1909T ,因139n ,需要用u检验;又因等级资料的相同秩次过多,故: 190939(791) 20.53.41739 40(791) 12u 33333

57、333(33)(3131)(2727)(1414)(44)1() ()10.8947979jjCttNN 3.4170.8943.614cuuC (3)确定P值,做出推断结论 3.6141.96cu 0.05P ,按0.05检验水准,拒绝0H,接受1H,认为被动吸烟者的 HbCO(%)与非被动吸烟者的 HbCO(%)含量总体分布不同。 表 7-5 吸烟工人和不吸烟工人的 HbCO(%)含量比较 含量 人数 秩次范围 平均秩次 秩和 被动吸烟者 非被动吸烟者 合计 被动吸烟者 非被动吸烟者 (1) (2) (3) (4) (5) (6) (7)=(2)(6) (8)=(3)(6) 很低 1 2

58、3 13 2 2 4 低 8 23 31 434 19 152 437 中 16 11 27 3461 47.5 760 522.5 偏高 10 4 14 6275 68.5 685 274 高 4 0 4 7679 77.5 310 0 合计 39 40 79 1909 1237.5 28 / 46 3解: 关于四种防护服对收缩压的影响: (1)建立检验假设,确定检验水准 0H:穿四种防护服后收缩压总体分布相同 1H:4 个总体分布不同或不全相同 0.05 (2)计算统计量M值 编秩求秩和并计算检验统计量 6 159.59.5104T,2222(6 10)(9.5 10)(15 10)(9.

59、5 10)41.5M (3)确定P值,做出推断结论 处理组数4k ,配伍组数4b 查表,0.05(4,4)52M,41.552M ,0.05P ,按0.05检验水准不拒绝0H,尚不能认为不同防护服对收缩压影响有差别。 表 7-5 关于四种防护服对收缩压的影响 受试者编号 防护服 A 防护服 B 防护服 C 防护服 D 收缩压 秩次 收缩压 秩次 收缩压 秩次 收缩压 秩次 1 115 1 135 2.5 140 4 135 2.5 2 122 2 125 3 135 4 120 1 3 110 1 2 4 120 2 1 iT 6 9.5 15 9.5 关于四个受试者收缩压值的差别: (1)建

60、立检验假设,确定检验水准 0H:四个受试者的收缩压值没有差别 1H:四个受试者的收缩压值不同 0.05 (2)计算统计量M值 编秩求秩和并计算检验统计量 13.59 107.5104T 2222(13.510)(9 10)(1010)(7.5 10)19.5M (3)确定P值,做出推断结论 处理组数4k ,配伍组数4b 查表,0.05(4,4)52M,19.552M ,0.05P ,29 / 46 按0.05检验水准不拒绝0H,尚不能认为四个受试者的收缩压值有差别。 表 7-6 关于四个受试者收缩压值的差别 受试者编号 防护服 A 防护服 B 防护服 C 防护服 D iT 收缩压 秩次 收缩压

61、 秩次 收缩压 秩次 收缩压 秩次 1 115 2 135 3.5 140 4 135 4 13.5 2 122 4 125 2 135 2 120 1 9 3 110 1 135 3.5 136 3 130 2.5 10 4 120 3 1 .5 7.5 第八章 直线回归与相关习题 一、选择题 1直线回归中,如果自变量X乘以一个不为 0 或 1 的常数,则有( ) 。 A. 截距改变 B. 回归系数改变 C. 两者都改变 D. 两者都不改变 E. 以上情况都有可能 2如果直线相关系数1r,则一定有( ) 。 A. 残总SSSS B. 回残SSSS C. 回总SSSS D. 回总SSSS E.

62、 以上都不正确 3相关系数r与决定系数2r在含义上是有区别的,下面的几种表述,哪一种最正确?( ) 。 A. r值的大小反映了两个变量之间是否有密切的关系 B. r值接近于零,表明两变量之间没有任何关系 C. r值接近于零,表明两变量之间有曲线关系 D. 2r值接近于零,表明直线回归的贡献很小 E. 2r值大小反映了两个变量之间呈直线关系的密切程度和方向 4不同地区水中平均碘含量与地方性甲状腺肿患病率的资料如下: 地 区 编 号 1 2 3 4 17 碘含量 (单位) 10.0 2.0 2.5 3.5 24.5 患病率() 40.5 37.7 39.0 20.0 0.0 研究者欲通过碘含量来预

63、测地方性甲状腺肿的患病率,应选用( ) 。 A.相关分析 B.回归分析 C.等级相关分析 30 / 46 D.2检验 E.t检验 5直线回归中X与Y的标准差相等时,以下叙述( )正确。 A. ab B. rb C. 1b D. 1r E. 以上都不正确 6利用直线回归估计X值所对应Y值的均数可信区间时, ( )可减小区间长度。 A. 增加样本含量 B. 令X值接近其均数 C. 减小剩余标准差 D. 减小可信度 E. 以上都可以 7有两组适合于作直线相关分析的实验资料(按专业知识都应取双侧检验) ,第1 组资料:51n,857. 01r;第 2 组资料:82n,712. 02r。在没有详细资料和

64、各种统计用表的条件下,可作出的结论是( ) 。 A.缺少作出明确统计推断的依据 B.因12nn ,故2r有显著性意义 C. 因21rr ,故1r有显著性意义 D. 1r、2r都有显著性意义 E. 1r、2r都没有显著性意义 8某监测站同时用极谱法和碘量法测定了水中溶解氧的含量,结果如下。若拟用极谱法替代碘量法测定水中溶解氧的含量,应选用( ) 。 水 样 号 1 2 3 4 5 6 7 8 9 10 极谱法 (微安值) 5.3 5.2 2.1 3.0 3.3 2.8 3.4 6.8 6.3 6.5 碘量法(mg/L) 5.85 5.80 0.33 1.96 2.77 1.58 2.32 7.7

65、9 7.56 7.98 A.相关分析 B.回归分析 C.等级相关分析 D.2检验 E.t检验 9对两个数值变量同时进行相关和回归分析,r有统计学意义(0.05P ) ,则 Ab无统计学意义 B b有统计学意义 C不能肯定b有无统计学意义 D以上都不是 10某医师拟制作标准曲线,用光密度值来推测食品中亚硝酸盐的含量, 应选用的统计方法是 At检验 B回归分析 C相关分析 D2检验 11在直线回归分析中,回归系数b的绝对值越大 A所绘制散点越靠近回归线 B所绘制散点越远离回归线 C回归线对x轴越平坦 D回归线对x轴越陡 31 / 46 12根据观测结果,已建立y关于x的回归方程2.03.0yx,x

66、变化 1 个单位,y变化几个单位? A1 B2 C3 D5 13直线回归系数假设检验t,其自由度为 A 2n B1n C21n D2(1)n En 二、简答题 1详述直线回归分析的用途和分析步骤。 2直线相关与直线回归的联系和区别。 3简述直线回归分析的含义,写出直线回归分析的一般表达式,试述该方程中各个符号的名称及意义。 4写出直线回归分析的应用条件并进行简要的解释。 5什么是曲线拟合?它一般分为哪两类? 三、计算题 1某研究人员测定了 12 名健康妇女的年龄X(岁)和收缩压Y(KPa) ,测量数据见表 1, 表 8-1 12 名健康妇女年龄和收缩压的测量数据 X(岁) 59 42 72 3

67、6 63 47 55 49 38 42 68 60 Y(KPa) 19.60 16.67 21.28 15.73 19.86 17.07 19.93 19.33 15.33 18.67 20.19 20.59 631X ,234761X ,224.25Y ,24234.141Y ,12026.77XY (1)求X与Y之间的直线回归方程 . (2)用方差分析的方法检验X与Y之间的直线关系是否存在? (3)估计总体回归系数的 95%可信区间。 2用 A、B 两种放射线分别局部照射家兔的某个部位, 观察照射不同时间放射性急性皮肤损伤程度(见表 8-2)。问由此而得的两样本回归系数相差是否显著? 表

68、8-2 家兔皮肤损伤程度(评分) 时间 (分)X 皮肤损伤程度 A 1Y B 2Y 3 1.0 2.3 6 2.5 5.0 9 3.6 7.6 12 10.0 15.2 32 / 46 15 15.3 18.0 18 25.0 27.6 21 32.3 40.2 3 某学校为了调查学生学习各科目之间的能力迁移问题, 特抽取了 15 名学生的历史与语文成绩见表,请计算其相关程度并进行假设检验。 表 8-3 15 名学生历史与语文成绩 学生编号 1 2 3 4 5 6 7 8 9 1 历史X 88 95 83 93 76 78 85 84 90 8 语文Y 78 85 83 9 82 75 80

69、86 75 90 4在高血压脑出血微创外科治疗预后因素的研究中,调查了 13 例的术前 GCS值与预后,见表,试作等级相关分析。 表 8-4 高血压脑出血微创外科治疗术前GIS 值与预后评测 编号 1 2 3 4 5 6 7 8 9 10 11 12 13 术前 GSC 值 7.0 11.0 4.0 6.0 11.0 14.0 5.0 5.0 13.0 12.0 14.0 6.0 13.0 预后评测分值 6.0 7.0 2.5 5.4 8.3 9.0 3.9 4.6 8.6 7.9 9.2 5.6 8.7 第八章 直线回归与相关(答案) 一、选择题 1B 2C 3D 4B 5B 6E 7A 8

70、B 9B 10B 11D 12C 13A 二、问答题 1 答:用途:定量描述两变量之间的依存关系:对回归系数b进行假设检验时,若P,可认为两变量间存在直线回归关系。利用回归方程进行预测:把预测因子(即自变量X)代入回归方程对预测量(即因变量Y)进行估计,即可得到个体Y值的容许区间。 利用回归方程进行统计控制: 规定Y值的变化,通过控制X的范围来实现统计控制的目标。 分析步骤:首先控制散点图:若提示有直线趋势存在,可作直线回归分析;若提示无明显线性趋势,则根据散点图分布类型,选择合适的曲线模型,经数据变换后,化为线性回归来解决。若出现一些特大特小的异常点,应及时复核检查。求出直线回归方程YabX

71、,其中:XYXXlbl,aYbX对回归系数b进行假设检验: 方差分析, 基本思想是将因变量Y的总变异SS总分解为SS回归和SS剩余,然后利用F检验来判断回归方程是否成立。t 33 / 46 检验:基本思想是利用样本回归系数b与总体均数回归系数进行比较来判断回归方程是否成立,实际应用中用r的检验来代替的检验。直线回归方程的图示回归方程拟合效果评价:决定系数222()()yySSRyySS回归总,如20.9R 说明回归能解释90%,此方程较好 校正决定系数2adjR直线回归方程的区间估计:总体回归系数的区间估计;Y的区间估计;个体值Y的容许区间; 2 答:区别: (1)资料要求不同 相关要求两个变

72、量是双变量正态分布;回归要求应变量Y服从正态分布,而自变量X是能精确测量和严格控制的变量。 (2)统计意义不同 相关反映两变量间的伴随关系这种关系是相互的,对等的;不一定有因果关系;回归则反映两变量间的依存关系,有自变量与应变量之分,一般将“因”或较易测定、 变异较小者定为自变量。 这种依存关系可能是因果关系或从属关系。 (3)分析目的不同 相关分析的目的是把两变量间直线关系的密切程度及方向用一统计指标表示出来; 回归分析的目的则是把自变量与应变量间的关系用函数公式定量表达出来 联系:(1) 变量间关系的方向一致 对同一资料, 其r与b的正负号一致。 (2)假设检验等价 对同一样本,rbtt,

73、由于bt计算较复杂,实际中常以r的假设检验代替对b的检验。 (3)r与b值可相互换算 YYXXlbrl。 (4)相关和回归可以相互解释。 3 答: 直线回归是用直线回归方程表示两个数量变量间依存关系的统计分析方法,属双变量分析的范畴。 如果某一个变量随着另一个变量的变化而变化, 并且它们的变化在直角坐标系中呈直线趋势, 就可以用一个直线方程来定量地描述它们之间的数量依存关系,这就是直线回归分析。 一般表达式:iiiYX,iX和iY分别为第i个体的自变量和应变量取值。称为截矩,为回归直线或其延长线与y轴交点的纵坐标。称为回归直线的斜率。i为误差。 4 答:线性回归模型的前提条件是线性、独立、正态

74、与等方差。 (1) 线性是指任意给定的X所对应的应变量Y的总体均数与自变量X呈线性关系。 (2) 独立是指任意两个观察单位之间相互独立。 否则会使参数估计值不够准确和精确。 (3) 正态性是指对任意给定的X值,Y均服从正态分布,该正态分布的均数就是回归直线上与X值相对应的那个点的纵坐标。 (4) 等方差是指在自变量X的取值范围内,不论X取什么值,Y都有相同的方差。 5 答:曲线拟合是指选择适当的曲线类型来拟合观测数据, 并用拟合的曲线方34 / 46 程分析两变量间的关系。 曲线拟合一般分为两类:曲线直线化法和直接拟合曲线方程。 三、 计算题 1 解: (1)222()631347611580

75、.9212XXXlXn ()()631 224.2512026.77234.9612XYXYlXYn 52.58X ,18.69Y 234.960.1491580.92XYXXlbl,18.690.14952.5810.856aYbX 故所求直线回归方程为10.8560.149YX。 (2)0H:0,即认为健康妇女的年龄与收缩压之间不存在直线关系 1H:0,即认为健康妇女的年龄与收缩压之间存在直线关系 0.05 222()224.254234.14143.46912YYYSSlYn总,111vn 总 22234.9634.9201580.92XYXYXXlSSbll回归,1v回归 43.469

76、34.9208.549SSSSSS总回归剩余,210vn剩余 34.920 140.858.549 10MSFMS回归剩余。 由11v ,210v 查表得0.01P,按0.05的水准拒绝0H,接受1H。故可认为健康妇女的年龄与收缩压之间存在直线关系。 (3)8.549 100.0231580.92bXXMSSl剩余,0.05/2,102.228t,则总体回归系数的95%可信区间为(0.1492.2280.023 0.1492.2280.023)(0.098 0.200),。 2 解: (1)分别求出X与1Y、2Y之间的回归直线 1YX:11.79298.7YX,20.9277r (0.05P

77、) 35 / 46 2YX:22.01557.6286YX,20.929r (0.05P ) (2) 0H:120 1H:120 0.05 (3) 计算t值: 估计误差平方和:2221111112()()()()63.14()XX YYYYYYXX 2222222222()()()()78.25679()XX YYYYYYXX 221122212()()14.139(2)(2)cYYYYSnn 122221122110.332bbcSSXXXX 12120.6704bbbbtS (4) 查t值表,做结论 以77410v 查表得,0.5,100.700tt,故0.5P ,不拒绝0H,尚不能认为两

78、样本回归系数相差显著。 3解:由以上数据计算得: (1) 1252X ,1232Y ,2105288X ,2101532Y ,103209XY 787.73XXl,343.73YYl,378.07XYl 则相关系数0.7266XYXX YYlrll。 (2) 0H:0 1H:0 0.05 本题15n ,0.7266r , 36 / 46 得220.72663.81311 0.72662152rtrn,213vn 查t界值表,得0.005P 。按0.05的水准,拒绝0H,接受1H,认为学生的历史和语文成绩存在直线相关关系。 4解: (1) 将两个变量的观察值分别由小到大编秩 (2) 求各观察单位

79、的两变量的秩次之差d、d的平方2d及其总和2d, (3) 由13n ,25.5d 得22266 5.5110.985(1)13(131)sdrn n 。 (4) 对该相关系数进行假设检验: (5) 0H:0s 1H:0s 0.05 查表得,0.001(13)0.824sr,故0.001P,按0.05水准拒绝,接受,可以认为在高血压脑出血微创外科治疗中,术前GSC 值与预后之间存在正相关关系。 表 8-5 高血压脑出血微创外科治疗术前GIS 值与预后评测 编号 术前 GSC 值 预后评测分值 d 2d X 秩次 Y 秩次 (1) (2) (3) (4) (5) (6) = (3) - (5) (

80、7) 1 7.0 6 6.0 6 0 0 2 11.0 7.5 7.0 7 0.5 0.25 3 4.0 1 2.5 1 0 0 4 6.0 4.5 5.4 4 0.5 0.25 5 11.0 7.5 8.3 9 -1.5 2.25 6 14.0 12.5 9.0 12 0.5 0.25 7 5.0 2.5 3.9 2 0.5 0.25 8 5.0 2.5 4.6 3 -0.5 0.25 9 13.0 10.5 8.6 10 0.5 0.25 10 12.0 9 7.9 8 1 1 11 14.0 12.5 9.2 13 -0.5 0.25 12 6.0 4.5 5.6 5 -0.5 0.25

81、 13 13.0 10.5 8.7 11 -0.5 0.25 合计 5.5 第九章 协方差分析习题 问答题 37 / 46 1为什么引入协方差分析? 2协方差分析的应用条件 3协方差分析的步骤 第九章 协方差分析(答案) 问答题 1医学研究中为了比较某些处理因素的实验效应,必须在实验时保证处理因素以外的其他因素都相同, 或者用统计学方法将干扰因素的效应从总效应中分解出去。协方差分析正是利用后者的方法处理问题。其适用于:一、影响实验效应的因素不可控制或很难控制;二、组间基线的不平衡性。 2一、因变量的样本来自于方差相等的正态分布总体;二、各样本的回归系数本身有统计学意义,但各样本的回归系数间差别

82、无统计学意义;三、协变量是数值变量,而且本身不受处理因素影响。 3一、判断因变量是否服从正态总体且总体方差齐;二、分别对各处理组的因变量与协变量进行线性回归分析;三、检验各处理组的总体回归系数是否相等;四、 若满足协方差分析的应用条件, 则进一步比较各处理组因变量的总体修正均数是否相等;五、若各组的修正均数不等或不完全相等,则需进行两两比较。 第十章 实验设计概述习题 一、选择题 1某项关于某种药物的广告声称:“在服用本制剂的 1000 名上呼吸道感染的儿童中有 970 名儿童在 72 小时内症状消失。” 因此,推断此药治疗儿童的上呼吸道感染是非常有效的,可以推广应用。这项推论( ) 。 A.

83、 不正确,因所作的比较不是按率计算的 B. 不正确,因未设对照组或对比组 C. 不正确,因未作统计学假设检验 D. 正确,因为比较的是症状消失率 E. 正确,因为有效率达到 97.0% 2 某医师研究丹参预防冠心病的作用, 试验组用丹参, 对照组用无任何作用的糖丸,这属于( ) 。 A.实验对照 B.空白对照 C.安慰剂对照 D.标准对照 E.历史对照 3实验设计的三个基本要素是( ) 。 A. 处理因素、受試对象、实验效应 B. 受試对象、实验效应、观察指标 C. 随机、重复、对照 D.齐同、均衡、随机 E. 对照、重复、盲法 4实验设计中要求严格遵照四个基本原则,其目的是为了( ) 。 A

84、.便于统计处理 B.严格控制或消除随机误差的影响 C.便于进行实验 D.尽量减少或抵消非实验因素的干扰 E.尽量减少或消除抽样误差 5实验设计和调查设计的根本区别是( ) 。 38 / 46 A.实验设计以动物为对象 B.调查设计以人为对象 C.实验设计可随机分组 D.实验设计可人为设置处理因素 E.两者无区别 二、计算题 1某医院为考核某药物的治疗效果,拟进行一现场实验,该病的发病率一般为10%,治疗后降低发病率的5%以上才有推广价值, 求该实验所需例数。 (=0.05, =0.10) 2.某研究所欲研究妇女在孕期服用某药物对新生儿体重的影响,选取 100 名孕妇,服用此药后,新生儿的出生体

85、重均值为 3650g,已知该地新生儿的出生体重均值为3500g,标准差为 514g,该药物若有增加新生儿体重的作用,那么其可能性有多大。(=0.05) 第十章 实验设计概述(答案) 一、选择题 1.B 2.C 3. A 4.D 5.D 二、计算题 1. 答案:本例0=0.10,1=0.05,=0.10-0.05=0.05,单侧界值0.05=1.64,单侧0.10=1.28,因此n=0.10(1-0.10)(1.64+1.28)/0.052=306.95307(例) 2. 答案:本例=150g,=514g,单侧界值0.05=1.64,n=100,=n0.5/-=1.28=0.10,因此1-=0.

86、90,即该药物有作用的可能性为90%。 第十一章 常用实验设计方法习题 一、选择题 1为研究双酚 A 和邻苯二甲酸对大鼠生殖系统的联合毒性作用,将 32 只月龄相近的SD 雌性大鼠随机分为4 组,分别接受含双酚A 饲料、含邻苯二甲酸饲料、含双酚A邻苯二甲酸饲料、普通饲料(不含双酚 A 和邻苯二甲酸)4 种处理,观察指标为每只雌鼠所产仔鼠畸性发生率。基于实验目的,本实验属于哪种设计方法( ) 。 A.完全随机设计 B.随机区组设计 C.拉丁方设计 D. 交叉设计 E. 析因设计 2已知A、B、C 都是三水平因素,且根据预实验得知:AB、BC 不可忽视。若希望试验次数尽可能少一些,设计时最好选择(

87、 ) 。 A.正交设计 B.析因设计 C.拉丁方设计 D.裂区设计 E.交叉设计 3在某实验研究中欲考察三个因素的影响,若三个因素的水平数分别为 2、2、3,又无合适的正交表可供选用时,设计时最好选择( ) 。 A.完全随机设计 B.随机区组设计 C. 析因设计 D.拉丁方设计 E.交叉设计 39 / 46 4.以下实验设计中,相同条件下所需样本含量最少的是( ) 。 A.完全随机设计 B.随机区组设计 C. 析因设计 D.拉丁方设计 E.交叉设计 5.欲分析某抗肿瘤药物对来自中国、美国和伊朗的肿瘤患者各分期的治疗效果,应该采用何种分析方法( ) 。 A.2检验 B.秩和检验 C. 检验 D.

88、t 检验 E.反差分析 二、思考题 1. 一名医生欲研究某新药对高血压病的治疗效果较之常规药物是否有提高。 (1) 可选用何种实验设计。 (2) 若要考虑治疗阶段和受试对象的影响,应该采用那种设计,选取20 名患者,试述设计过程及如何对其进行分组。 2. 某地发生农药中毒事件,23 名中毒者被送往医院治疗,治疗前及治疗 12 天后均有测得 的血药浓度。某研究生经过配对 t 检验,得出结论:该治疗有效。请评述该生的方法及结论。如果有错误,如何改进。 第十一章 常用实验设计方法(答案) 一、选择题 1.E 2.A 3.C 4.E 5.B 二、思考题 1. 答案: (1)可采用完全随机设计,随机区组

89、设计,配对设计,交叉设计,析因实验设计。 (2)交叉设计。将条件相近的患者配对并编号,再用随机分组的方法将各对的患者分配到 A,B 两组; 其中一个患者在第一阶段接受新药处理, 在第二阶段接受常规药处理;另一个则在第一阶段接受常规药处理,在第二阶段接受新药处理。 分组过程如下:将 20 名患者按条件配对并编号(1.1,1.2;2.1,2.2;3.1,3.2;) ,在任意指定随机数字表中的任一行,并规定随机数字为奇数时,对子中的单号受试对象先用新药后用常规药,双号受试对象先用常规药后用新药。 2. 答案:因为人体自身具有解毒功能和排泄功能,所以血药浓度的下降并不一定是治疗的效果,因此,该结论并不

90、成立。不应该采用配对 t 检验。可选取该农药中毒且并未经过治疗的患者作为对照组,以治疗前后两组的血药浓度下降值做t 检验。 第十二章 动物实验设计概述习题 问答题: 1、动物实验设计中,选择实验动物的基本原则是什么? 2、欲比较甲、乙、丙、丁四种饲料对小白鼠血糖的影响,实验对象为8 窝小白鼠, 每窝四只, 应采用何种实验设计?并写出该设计方法方差分析表中的部分内容。 第十二章 动物实验设计概述(答案) 问答题 1、答: 动物实验设计中如何选择实验动物的原则应视研究目的而定: (1)选择与人的机能代谢结构及疾病特点相似的实验动物; (2)选用遗传背景明确, 具有40 / 46 已知菌丛和模型性状

91、显著且稳定的实验动物;(3)选用解剖、生理特点符合实验目的的实验动物;(4)选用存在某些特殊反应的不同种系实验动物;(5)选用人兽共患疾病的实验动物。 2、答:此情况为单处理因素实验设计,为控制非处理因素小白鼠窝别影响,应采用随机区组设计(配伍组设计)。其方差分析表的部分内容如下: 随机区组设计的方差分析表 变异来源 df SS MS S 总变异 处理组 区组间 误差 第十三章 临床试验设计概述习题 一、选择题: 1、在双盲试验中,始终处于盲态的是( ) A. 医务人员 B. 患者 C. 医务人员和患者 D. 数据分析人员 E. 以上所有人员 2、在研究药物的有效性时,研究者让对照组服入与研究

92、药物外观、性状完全相同的淀粉片,其主要目的是( )。 A. 比较两种片剂的有效性 B. 研究淀粉片的治疗作用 C. 避免患者心理因素的影响 D. 减少选择性偏倚 E. 评价试验药物的安全性 二、问答题: 1、临床试验设计的特点是什么? 2、为确定某种治疗消化性溃疡药物的起始用药剂量, 将 20 例新诊断的高血压患者按就诊的先后顺序依次分入低、中、高三个剂量组,经一段时间治疗后,通过比较三组患者的治疗后消化性溃疡的面积减少率来判断该药物的剂量。请根据以上描述回答: (1)在这项研究中,研究的三要素分别是什么? (2)请从统计学角度对此研究进行评价,并对此研究设计提出改进意见。 第十三章 临床试验

93、设计概述(答案) 一、选择题: 1、E 2、C 二、问答题: 1、答:(1)临床试验设计不能像动物实验设计那样随意对研究对象施加干预措施,且较难达到样本完全随机化,因此,难以制定完全符合统计学要求的试验设计方案。(2)开展临床试验,医德是一个很敏感的问题,应当维护病人的权益,贯彻“知情同意”的原则;(3)疾病的发生是生物、社会、心理等诸多41 / 46 因素作用的结果。因此,临床试验的观察结果除受处理因素影响外,还受许多非处理因素的影响; (4)临床试验除了随机对照试验是实验性研究外, 多数是观察性研究,难以控制复杂的非处理因素。(5)临床试验往往样本含量小,个体差异大。(6)病人的依从性是临

94、床试验成败的重要环节。(7)临床试验常采用多中心的协作研究。(8)临床试验一般按患者入院(就诊)顺序进行试验,往往存在“时间差”问题,在统计处理时应设法消除“时间差”对试验结果的影响。(9)临床试验易出现病例失访,使资料存在截尾值,分析时可用寿命表法。(10)检验效能对临床试验结果的可信度影响很大,设计时必须估算样本含量,以保证检验效能在 75%以上。(11)临床试验的资料多为非正态分布,统计分析时应注意分析方法的适用条件。 2、答:(1)本研究设计的三要素:处理因素:降压药物的剂量;受试对象:高血压患者;试验效应:舒张压下降值。 (2)评价:本设计存在的缺陷为:随机化不严格,本研究中所采取的

95、方法并非严格的随机化,可能引入其它混杂变量;样本量太少,每组 3 例不足以说明临床剂量问题。 改进意见:根据先期研究资料,重新计算样本量,对病例严格地按照随机化方法分配到各组。 第十四章 多元线性回归分析习题 一、选择题 1.可用来进行多元线性回归方程的配合适度检验是( ) A . t 检验 B. F 检验 C. 2X 检验 D.u 检验 2.多元线性回归分析中, 反应回归平方和在应变量 Y 的总离均差平方和中所占比重的统计量是: ( ) A.确定系数 B.复相关系数 C.回归系数 D.相关参数 二、简答题 1.试写出多元线性回归模型极其参数意义,并描述其用途。 2.多元线性回归模型应满足的条

96、件? 第十四章 多元线性回归分析(答案) 一、选择题 1.B 2.A 二、简答题 1.多元线性回归模型:mm110XXY 0:常数项。 m21,:待定参数,又称偏回归系数,为在其他自变量固定的条件下,自42 / 46 变量iX改变一个单位时,因变量 Y 的平均改变量。 多元线性回归的用途: (1) 、影响因素分析 (2)、估计与预测 (3) 、统计控制 (4) 、回归推断 2. (1)Y 与m21,XXX之间具有线性关系; (2)各观测值),(n21jjY之间相互独立; (3)残差服从均数为 0、方差为2的正态分布,它等价于任意一组自变量m21,XXX,应变量 Y 均服从正态分布且方差齐。 第

97、十五章 Logistic 回归分析习题 一、选择题 1. logistic 回归适用于应变量为( ) A.数值变量资料 B.分类变量资料 C.一般资料 D.正态分布资料 2.logistic 回归属于( )回归 A.概率型非线性回归 B.概率型线性回归 C.非概率型非线性回归 D.非概率型线性回归 二、简单题 1.试写出 logistic 回归中0,j的流行病学意义. 2.logistic 回归的用途有哪些? 第十五章 Logistic 回归分析(答案) 一、选择题 1.B 2.A 二、简答题 1. 常数项0的流行病学意义是:当各种暴露因素为0时,个体发病与不发病概率之比的自然对数值.偏回归系

98、数j(j=1,2,.,m)表示在其他自变量固定的条件下,第 j 个自变量每改变一个单位时logit(P)的该变量.它与比数比OR 有对应关系. 2. (1)流行病学危险因素分析 (2)临床实验数据分析 (3)分析药物或毒物的剂量反应4,预测与判别 第十六章 生存分析习题 一、选择题: 1.研究某种死因对居民生命的影响,最优方法是: 43 / 46 A 计算死因别死亡率 B 计算年龄组死因死亡率 C 计算年龄组病死率 D 编制去死因寿命表 E 计算标准化死因死亡率 2. 在人口分析和人口预测时,经常需要确定人口的死亡率。但是,由于死亡率受社会、经济、文化及医疗卫生条件等诸因素的影响,存在一定的波

99、动。同时,在一些人口资料不完整或人口数量太少的地区,也得不到有关的资料。这时,可以借助一些数理统计的方法,将世界各地的大量的寿命表汇集起来,进行分析,归纳出几种死亡模式, 对各种模式按照其不同的平均预期寿命水平编制出一组寿命表,供人们参考,这种寿命表是: A 队列寿命表 B 现时寿命表 C 简略寿命表 D 去死因寿命表 E 模型寿命表 3. 在寿命表中,用于评价居民健康水平的最优指标是: A 生存人年总数 B 生存人年数 C 预期寿命 D 死亡概率 E 尚存人数 4. 寿命表的用途,不包括下列哪一项: A 评价国家或地区居民健康水面 B 描述疾病的时间分布特征 C 进行人口预测 D 研究人口再

100、生产状况 E 研究人群的生育、发育及疾病发展规律 5.生存分析中的生存时间为 A.确诊至死亡的时间 B.出院至失访的时间 C.手术至死亡的时间 D.观察开始至观察终止的时间 E. 观察开始至失访的时间 6. 关于肝癌治疗的随访资料作生存分析,可当作截尾值处理的是 A.死于肝癌 B.死于意外死亡 C.死于其它肿瘤 D.a.c都是 E. b.c都是 二、问答题: 1、生存资料中,截尾数据的含义及其出现的原因是什么? 2、Cox 回归模型中,偏回归系数i的意义是什么? 3、Cox 回归模型与 logistic 回归模型相比有何不同? 三、计算题: 1、为研究急性淋巴细胞性白血病病人的生存时间与其预后

101、因素的关系,某研究者测得 50 例急性淋巴细胞性白血病病人的生存时间 (单位) 及有关预后因素资料,1x为入院时白细胞数(L/109),2x为淋巴结浸润度(分为 0、1、2 三级),3x为缓解出院后的巩固治疗(有巩固治疗时3x=1,否则3x=0),随访的终点事件是死于白血病,原始数据的整理格式见下表。试对此资料作 cox 回归分析。 44 / 46 表 急性淋巴细胞性白血病病人的生存时间与其预后因素数据 编号 1x 2x 3x 时间 结局 1 2.50 0.00 0.00 3.40 1.00 2 1.20 2.00 0.00 3.73 1.00 3 173.00 2.00 0.00 3.73

102、1.00 4 3.50 0.00 0.00 3.83 1.00 5 119.00 2.00 0.00 4.00 1.00 6 39.70 0.00 0.00 4.03 1.00 7 10.00 2.00 0.00 4.17 1.00 8 62.40 0.00 0.00 4.20 1.00 9 502.20 2.00 0.00 4.20 1.00 10 2.40 0.00 0.00 5.00 1.00 11 4.00 0.00 0.00 5.27 1.00 12 34.70 0.00 0.00 5.67 1.00 13 14.40 0.00 1.00 7.07 1.00 14 28.40 2.0

103、0 0.00 7.26 1.00 15 2.00 2.00 0.00 7.33 1.00 16 0.90 0.00 1.00 7.53 1.00 17 40.00 2.00 0.00 7.53 1.00 18 30.60 2.00 0.00 7.60 1.00 19 6.60 0.00 0.00 7.67 1.00 20 5.80 0.00 1.00 7.67 1.00 21 21.40 2.00 1.00 8.30 1.00 22 6.10 0.00 1.00 8.33 1.00 23 2.80 0.00 0.00 8.33 1.00 24 2.70 2.00 1.00 8.80 1.00

104、25 2.50 0.00 0.00 9.23 1.00 26 4.70 0.00 0.00 11.00 1.00 27 6.00 0.00 0.00 11.77 1.00 28 128.00 2.00 1.00 11.83 1.00 29 3.50 0.00 1.00 11.83 1.00 30 35.00 0.00 0.00 11.97 1.00 31 62.20 0.00 0.00 13.16 1.00 32 2.00 0.00 0.00 14.83 1.00 33 10.80 0.00 1.00 15.17 1.00 34 8.50 0.00 1.00 18.23 1.00 35 21.

105、60 0.00 1.00 18.23 1.00 36 2.00 2.00 1.00 19.16 0.00 37 2.00 0.00 1.00 20.17 0.00 38 2.00 0.00 1.00 20.17 0.00 39 3.40 2.00 1.00 20.17 0.00 40 4.30 0.00 1.00 20.57 1.00 41 5.10 0.00 1.00 21.00 1.00 45 / 46 42 244.80 2.00 1.00 21.87 1.00 43 2.40 0.00 0.00 23.77 1.00 44 4.00 0.00 1.00 26.00 1.00 45 1.

106、70 0.00 1.00 28.33 1.00 46 5.10 0.00 1.00 31.33 1.00 47 1.10 0.00 1.00 37.77 1.00 48 32.00 0.00 1.00 66.83 1.00 49 12.80 0.00 1.00 73.57 1.00 50 1.40 0.00 1.00 124.17 0.00 第十六章 生存分析(答案) 一、选择题 1、D 2、E 3、C 4、B 5、D 6、E 二、问答题 1、 (1)在生存资料中,截尾值指尚未观察到研究对象出现反应时,即由于某种原因停止了随访, 这时记录到的时间信息是不完整的, 这种生存资料称为截尾值。 (2

107、)出现截尾值的原因主要有以下 3 种情况:失访;退出;终止。 2、Cox 回归模型中,偏回归系数i的意义是,当其它协变量不变时,iX每变化一个单位,相对危险度的自然对数变化i个单位。 3、Cox 回归模型与 logistic 回归模型具有相似之处,即在估计出回归系数后可以得到协变量对应的相对危险度。但 Cox 回归模型不仅考虑了事件发生的结果,同时也利用了生存时间提供的信息,而 logistic 回归模型是一种概率模型,只考虑了事件是否发生,而不考虑事件发生所需要的时间长短。 三、计算题: 1、(1)Cox 回归模型参数估计和假设检验结果见下表 表 cox 回归模型计算及检验结果 (621.3

108、32, 000. 0P) 变量 偏回归系数 偏回归系数标准误 Wald P 值 OR 值 OR 值 95%可信区间 下限 上限 x1 0.001 0.002 0.360 0.548 1.001 0.997 1.005 x2 0.454 0.206 4.846 0.028 1.574 1.051 2.358 x3 -1.886 0.377 25.050 0.000 0.152 0.072 0.317 由上表可见,在05. 0检验水准上,所建立的 Cox 回归模型成立(621.332, 000. 0P);入院时白细胞数(1x)的偏回归系数无统计学意义,淋巴结浸润度(2x)和缓解出院后的巩固治疗(3

109、x)的偏回归系数均有统计学意义。Cox 回归模型为:)886. 1454. 0001. 0exp()(),(3210xxxthXthi。 46 / 46 以上结果可解释为:淋巴结浸润度(2x)和缓解出院后的巩固治疗(3x)均对急性淋巴细胞性白血病病人的生存时间产生影响。 在控制了入院时白细胞数(1x)与缓解出院后的巩固治疗(3x)的作用下,淋巴结浸润度浸润度每增加一个等级,死于白血病的危险性增加 57%;在控制了入院时白细胞数(1x)与淋巴结浸润度(2x)的作用下,接受巩固治疗者(13x)死于白血病的危险性比不接受巩固治疗者死于白血病的危险性降低 84.8%。 (2)生存曲线:根据协变量均值绘制的生存曲线见下图 图 16.3 根据协变量均值绘制的生存曲线 由上图可见, 多数病人的生存月数都不超过 20 个月, 其中位生存时间大约为12 个月。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号