生物医学研究的统计学第2、4、10章答案

上传人:lizhe****0001 文档编号:45878688 上传时间:2018-06-19 格式:DOCX 页数:19 大小:22.84KB
返回 下载 相关 举报
生物医学研究的统计学第2、4、10章答案_第1页
第1页 / 共19页
生物医学研究的统计学第2、4、10章答案_第2页
第2页 / 共19页
生物医学研究的统计学第2、4、10章答案_第3页
第3页 / 共19页
生物医学研究的统计学第2、4、10章答案_第4页
第4页 / 共19页
生物医学研究的统计学第2、4、10章答案_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《生物医学研究的统计学第2、4、10章答案》由会员分享,可在线阅读,更多相关《生物医学研究的统计学第2、4、10章答案(19页珍藏版)》请在金锄头文库上搜索。

1、第 2 章统计描述案例辨析及参考答案;案例 2-1 本章的例 2-1 中,该医生同时还观察了 1;教材表 2-141402名临产母亲生产期间的住院天;(1);135791113151719;组中值 Xi(2);2468101214161820222426;频数(3);793165592438957231991223;频率 fi(4);5.6322.5439.第 2 章 统计描述 案例辨析及参考答案案例 2-1 本章的例 2-1 中,该医生同时还观察了 1 402 名临产母亲的住院天数(教材表 2-14),并得到平均住院天数为 6.6 天。请对此发表评论。教材表 2-14 1 402 名临产母亲

2、生产期间的住院天数 组段(1)1 3 5 7 9 11 13 15 17 19 21 23 25 合计组中值 Xi (2)2 4 6 8 10 12 14 16 18 20 22 24 26 频数 (3)79 316 559 243 89 57 23 19 9 1 2 2 3 1 402频率 fi (4)5.63 22.54 39.87 17.33 6.35 4.07 1.64 1.36 0.64 0.07 0.14 0.14 0.21 1.00由加权法的计算公式(2-2)求出平均住院天数?2?0.0563?4?0.2254?24?0.0014?26?0.0021?6.6(天)案例辨析 首先观

3、察资料的分布形式,由于呈正偏峰分布,选用上述结果描述住院天数的平均水平不合适。正确做法 宜选用不受定量资料分布情况限制的中位数来描述住院天数的平均水平。本例计算结果为 M =6.1(天)。案例 2-2 某人编制了一张统计表(教材表 2-15), 你认为哪些需要改进?教材表 2-15 19761979 年吉林市各型恶性肿瘤的死亡率案例辨析 原表格存在的问题:标题不准确;线条过多,出现了斜线、竖线和多余的横线;数字区域出现了文字;小数位数不统一,小数点没有纵向对齐;量纲的标注位置有误。正确做法 将原统计表中存在的上述错误纠正过来,修改后的统计表见案例表 2-1。案例表 2-1 19761979 年

4、吉林市各年龄组人群部分恶性肿瘤死亡情况调查结果 疾 病 胃 癌 食管癌 肝 癌 肺 癌各年龄组死亡率(1/10 万)0 0.00 0.00 0.34 0.0015 1.13 0.10 1.64 0.4135 19.92 2.18 25.30 20.2155 150.00 35.20 97.51 125.1075 313.44 73.56 134.33 137.53案例 2-3 某人绘制一张统计图(教材图 2-11), 你认为哪些需要改进?教材图 2-11 1952 年与 1972 年某地肺结核、心脏病和恶性肿瘤的死亡率案例辨析 原图形存在的问题:缺标题;复式条图误用为单式条图;纵轴的量纲未注明

5、;未正确给出图例。正确做法 将原图中存在的上述错误纠正过来,重新绘图(案例图 2-1)。案例图 2-1 某地三种疾病死亡率在 1952 与 1972 年间的变化案例 2-4 以病死率为考察指标,对两所医院某病的治疗水平进行比较,结果见教材表 2-16,由合计的病死率得出结论为乙医院治疗水平优于甲医院,请评述这个结论。教材表 2-16 2000 年两所医院某病的病死率比较病情严重程度轻 中 重 合 计案例辨析 由教材表 2-16 可以看出,此表编制得不够规范,更为严重的是,虽然甲医院各种病情患者的病死率均低于乙医院,但总的病死率却是甲医院高于乙医院。这个矛盾的出现,是由于甲医院收治的重病人多,轻

6、病人少,乙医院则是重病人少,轻病人多。两家医院收治患者的病情不均衡,不宜直接比较基于各自病情状况的病死率“粗病死率”。正确做法 因各医院收治的患者在病情方面不均衡,直接进行比较是不正确的,而是要进行标准化处理后再比较。标准化(standardization)有直接标准化法和间接标准化法两种。(1)直接标准化 首先确定一个标准组,将其病情分布视作标准分布,即两家医院理甲 医 院出院人数 病死数100300 600 1 0008 36 90 134病死率/ %8.0 12.0 15.0 13.4乙 医 院出院人数 病死数 650 250 100 1 00065 40 18 123病死率/ %10.

7、0 16.0 18.0 12.3论上共同的病情分布状况。例如,某省内两家医院的对比,可以将全省、全国该类型患者入院时的病情分布作为标准组。这里,将两家医院各种程度病情的患者数对应相加,“构造”出标准组,这是在不能获得参考文献关于全省、全国情况时的做法。直接标准化计算过程见案例表 2-2。案例表 2-2 用直接标准化法对 2000 年两所医院某病的病死率作比较病情严 重程度 轻 中 重 合 计标准组人数 Ni 750 550 700 2 000原病死率 pi甲医院 8.0 12.0 15.0 13.4乙医院 10.0 16.0 18.0 12.3预期病死率数 Nipi 甲医院 60 66 105

8、 231乙医院 75 88 126 289甲医院的标准化病死率:p 甲?依照标准组的病情分布预期死亡数之和 231?100%?11.55%标准组的总人数 2000乙医院的标准化病死率:p 乙?依照标准组的病情分布预期死亡数之和 289?100%?14.45%标准组的总人数 2000经标准化,甲医院的标准化病死率低于乙医院,正确反映了两组病死率水平的对比关系。以甲医院的计算为例,粗病死率 p 甲是以甲医院实际病情分布为权重,对甲医院病死率水平的加权平均;标准化的 p 甲则是以标准组病情分布为权重,对甲医院病死率水平的加权平均。即p 甲?100?8%?300?12%?600?15%10030060

9、0?8%?12%?15%1000100010001000?13.4%p 甲?750?8%?550?12%?700?15%750550700?8%?12%?15%20002?00020002000?11.55%当进行对比的两组率为样本率时,下结论前需做假设检验,这里略去。(2)间接标准化 也需首先确定一个标准组(由文献获得),并给定标准组的各年龄别病死率及总的病死率。由案例表 2-3 求出两家医院各自收治的患者按标准组的病死率水平将发生的总的死亡数。标准组的选择依据同直接标准化法。案例表 2-3 用间接标准化法对 2000 年两所医院某病的病死率作比较病情严 重程度 轻 中 重 合 计标准组 病

10、死率 pi 9.0 14.0 16.0 13.5出院人数甲医院 100 300 600 1 000乙医院 650 250 100 1 000预期病死率数 Nipi 甲医院 9.0 42.0 96.0 147.0乙医院 58.5 35.0 16.0 109.5按标准组的病死率水平,甲医院有 147 例死亡,而实际甲医院仅有 134例死亡,甲医院实际的病死发生程度低于标准组,两者程度之比134/147=0.91 称作标化死亡比(standard mortality ratio,SMR),于是p 甲?SMR 甲?13.5%?12.31%同理,p 乙?SMR.5)?13.5%?1.12?13.5%?1

11、5.16%。 乙?13.5%?(123/109结果,认为乙医院的病死率高于甲医院。这是根据数值大小得出的直观判断结果。若希望得出两医院标准化病死率之间的差别是否具有统计学意义,应进行假设检验,此处从略。本题目是以“病死率”为例阐述了阳性率的标准化的问题,其余如死亡率、发病率、治愈率等同理。第 4 章 参数估计 案例辨析及参考答案案例 4-1 某研究者测得某地 120 名正常成人尿铅含量(mgL-1)如下:尿铅含量 0 例数144 228 2912 1816 1520 1024 628 332 236 1合计 120试据此资料估计正常成人平均尿铅含量的置信区间及正常成人尿铅含量的参考值范围。由表

12、中数据得到该例的 n?120,S?8.0031,S?0.7306,某作者将这些数据代入公式(4-20),即采用?Z?S 计算得到正常成人平均尿铅含量100(1?)%置信区间为(?,14.068 4);采用公式?Z?S 计算得到正常成人尿铅含量 100(1?)%参考值范围为(?,26.030 6)。请问这样做是否合适?为什么?应当怎么做?案例辨析 该定量资料呈偏峰分布,不适合用正态分布法计算 100(1?)%参考值范围。正确做法 可以用百分位数法求正常成人尿铅含量 100(1?)%参考值范围的单侧上限。例如,当?=0.05 时,可直接求 P95 分位数,(0,P95)就是所求的正常成人尿铅含量的

13、 95%正常值范围。欲求正常成人尿铅含量总体均数的置信区间,当样本含量 n 较大(比如说,n 大于 30 或 50)时,样本均数就较好地接近正态分布(根据数理统计上的中心极限定理)。本例, 因为 n?120 较大,不必对原始数据作对数变换就可以用?Z?S 估计总体均数的置信区间。案例 4-2 在 BiPAP 呼吸机治疗慢性阻塞性肺病的疗效研究中,某论文作者为了描述试验前的某些因素是否均衡,在教材表 4-5 中列出了试验前患者血气分析结果。由于作者觉得自己数据的标准差较大,几乎和均数一样大,将标准差放在文中显得不雅观,于是他采用“均数标准误”(?S),而不是“均数标准差”(?S)来对数据进行描述

14、。问在研究论文中以教材表 4-5 方式报告结果正确吗?为什么?教材表 4-5 试验组和对照组治疗前血气分析结果(组别 试验组 对照组例数 12 10年龄/岁pHpa(CO2)/kPa?S)Sa(O2)/% 85.12?1.73 86.45?2.25pa (O2)/kPa 9.25?0.55 9.16?0.6263.00?4.33 7.36?0.05 63.00?4.33 62.50?3.95 7.38?0.06 63.00?4.33案例辨析 描述数据的基本特征不能采用?S,因为 S 为反映抽样误差大小的指标,只表示样本均数的可靠性,而不能反映个体的离散程度。不仅如此,因 S 仅为与其对应的 S

15、 的 1/n,有时,即使 S 很大(甚至大于),用 S 表示离散度时,不易被察觉出来,因此,用?S 表达定量资料时,往往具有欺骗性。正确做法 当各组定量资料服从或近似服从正态分布时,反映个体的离散程度应该采用标准差,即描述数据的基本特征必须采用?S;否则,需要采用 M(Q1Q3)描述数据的基本特征。此处,M 为中位数、Q1 和 Q3分别为第 1 四分位数和第 3 四分位数。案例 4-3 某市往年的 12 岁男孩平均身高为 140.0 cm。现在从该市的12 岁男孩中随机抽得 120 名作为研究对象, 得到平均身高为 143.1 cm, 标准差为 6.3 cm。请估计该样本对应总体均数的 95%

16、置信区间,并确定该均数是否与往年不同。某学生的回答如下:“该例 12 岁男孩平均身高的点估计值为 143.1 cm,按公式(4-21)计算得到该点估计值的 95置信区间为141.9144.2 cm。因为往年 12 岁男孩平均身高为 140.0 cm,没有落在所计算的 95置信区间以内,所以可以认为现有男孩平均身高与往年身高有差异”。请指出学生回答中的不恰当之处。案例辨析 不恰当之处有三: “点估计值的 95置信区间”的说法不对;“以往男孩平均身高没有落在所计算的 95置信区间以内”的说法不对;“现有男孩平均身高与往年身高有差异”的说法不对。正确做法 应该说“点估计值对应总体均数的 95置信区间”; 应该说“95置信区间没有覆盖(包括)以往男孩平均身高”; 应该说“现有男孩平均身高与往年男孩平均身高的差异有统计学意义”。第 10 章 简单线性回归分析案例辨析及参考答案案例 10-1 年龄与身高预测研究。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 教育/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号