数学建模 多元统计分析引论

上传人:xzh****18 文档编号:53465411 上传时间:2018-09-01 格式:PPT 页数:58 大小:1.09MB
返回 下载 相关 举报
数学建模 多元统计分析引论_第1页
第1页 / 共58页
数学建模 多元统计分析引论_第2页
第2页 / 共58页
数学建模 多元统计分析引论_第3页
第3页 / 共58页
数学建模 多元统计分析引论_第4页
第4页 / 共58页
数学建模 多元统计分析引论_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《数学建模 多元统计分析引论》由会员分享,可在线阅读,更多相关《数学建模 多元统计分析引论(58页珍藏版)》请在金锄头文库上搜索。

1、MULTIVARIATE STATISTICS ANALYSIS 多元统计分析,SPSS,统计软件的重要作用,“计算机软件给统计学带来革命性变化”发表论文或进行科研课题时,注明统计软件和采用的统计分析方法.统计分析工具的选择: CHISS SAS, SPSS,STATA,实例携带火柴和发生肺癌间的关系的研究。人们观察发现那些携带火柴的人更有可能发生肺癌。难道这表明携带火柴可能引起肺癌?,混杂因素,这中间存在混杂因素-吸烟,客观事实,携带火柴不可能引起肺癌。,混杂因素的影响,图1.1 危险因素、混杂因素和结果的关系携带火柴 肺癌吸烟,实例解析4喝咖啡与心肌梗塞MI关系的研究。有人观察发现喝咖啡的

2、人,很多人患MI,这种现象是表象还是内在因果关系的?数据来自2000年,小儿科邀请一位美国医学及生物统计学教授来院讲学的例子。,研究者调查MI及非MI病人各150例,得到如下数据。表1.1MI NoMI % Coffee 90 60 60 No coffee 60 90 40优势比 : OR=90*90/(60*60)=2.25Pearson chi2(1) = 12.0,P = 0.001。,说明喝咖啡人MI发生的危险性是不喝的2.25倍。两组MI发生率差异有显著意义。结论:喝咖啡与心肌梗塞MI有关!对否?,研究者怀虑结论,考虑到其中可能混杂其它因素,如吸烟对喝咖啡与心肌梗塞MI间关系的影响

3、,进一步分层分析得到。 表 控制吸烟因素的干扰后结果Smoker NosmokerMI NoMI % MI NoMI % Coffee 80 40 67 10 20 33 Noffee 20 10 67 40 80 33 优势比 OR=1 , OR=1 P = 1.00, P = 1.00,表明,在吸烟组和不吸烟组中。喝咖啡与不喝咖啡的MI发生的相对危险度相同的。,喝咖啡与心肌梗塞MI关系,说明当存在混杂因素时,单因素分析结论并不科学。,案例:研究生招生与性别的关系研究,案例讨论 研究生招生与性别的关系研究,美国加州贝克莱分校1973年研究生的录取情况如上表. 结果显示,男生报考人数据2691

4、人,录取1197人,录取比例44.5%,女生报考人数据1835人,录取556人,录取比例30.3%。 有人认为该校在研究生录取中存在性别歧视。试对此进行讨论与分析。,混杂因素的定义, 当某一危险因素和结果的相关性受 第三个变量和危险因素及结果之间关系的影响,这第三个变量称为混杂因素。,上两例中,混杂因素是吸烟,排除混杂因素的两种方法,1、分层分析2、多元统计分析,分层分析是在其它影响因素保持恒定情况下,评价某一危险因素对结果的影响。例如,上面我们可以分别在吸烟者和非吸烟者之中,比较喝啡咖与和不喝啡咖的人。这可使我们在不依赖于吸烟的情况下,分析喝啡咖对MI的影响。,1 分层分析方法 -控制混杂因

5、素对结果的影响,分层分析的优缺点,优点:直观简洁。缺点:当考虑因素较多时分组数量倍增, 需要例数较多,有时无法实现。,生命在于运动。运动有利于长寿 流水不腐。这是人类长期经验的总结,但事实果真如此吗?是科学的结论,还是事物的假象呢?,实例解析 运动与寿命关系的研究,许多研究表明长期运动人的寿命比久坐型生活方式人的寿命长。 但是,如果运动者寿命长的真正原因是他不吸烟,没有家族病史,好的生活环境等,那么运动将不能改变一个人的寿命。,运动与人的寿命的关系,美国Aerobics中心的追踪研究在19701989年间,它们追踪观察25,341男性和7084女性, 研究运动和死亡率的关系。男性参加者被追踪观

6、察平均8.4年,女性平均7.5年。所有参加者接受了基线检查,这些检查包括体检、实验室检测及踏车试验评价身体适宜运动量。结果如表1.1。Blair, S.N., Kampert, J.B., Kohl, H.W., et al. ”Influences of cardiorespiratory fitness and other precursors on cardiovascular disease and all-cause mortality in men and women.” JAMA 1996;276:205-10,表1.3 Aerobics 中心追踪研究过程中生存与死亡者基线特征(

7、男性组),指标 生存 死亡(n=24,740) ( n=601)年龄(SD) 42.7 (9.7) 52.1(11.4)* 体重指数 26.0 (3.6) 26.3 ( 3.5) 收缩压 121.1(13.5) 130.4(19.1)* 总胆固醇 213.1(40.6) 228.9(45.4) 空腹血糖 100.4(16.3) 108.1(32.0),运动量(%)低 20.1 41.6中 42.0 39.1高 37.9 19.3*冠心病家族史 25.4 33.8*吸烟 26.3 36.9*异常心电图 6.9 26.3*慢性病 18.4 40.3*,分析发现,存活者和死亡者之间是有明显区别的。特

8、点是存活者较年轻,血压较低,低胆固醇,很少吸烟并且高运动量(基于他们踏车试验时间长短及程度)。但表1.1并没有回答我们的基本问题:运动是否独立地延长寿命?它并没有回答这个问题是由于虽然高运动量组很少在研究期间死亡,但他们或者较很少吸烟,或年轻,或有较低的血压。我们应排除排除混杂因素 的影响。,分层分析法 表1.4 Aerobics 中心追踪研究中全因死亡患者吸烟和体质的分层分析每万人年 分层相对危险度死亡数 (CI)吸烟低运动量 48.0 1.63(1.26-2.13)*中/高运动量 29.4 1.0(参照组)不吸烟 低运动量 44.0 2.19(1.77-2.70)*中/高运动量 20.1

9、1.0(参照组),可见低运动量组死亡率高于中/高运动量组的死亡率 ,这一分层分析表明运动的作用不依赖于吸烟状态。,但是,有可能影响运动和长寿之间关系的其它变量是怎样的?你可以层层分析每一原因,来证明运动对长寿的影响不但不依赖于吸烟状态,也不依赖于年龄、性别、高血脂、高血压等等。如果分层分析3个变量吸烟状态、年龄、体重(正常/异常),你将需要在8个组中分析运动和死亡率的关系。,如果分层分析6个变量吸烟状态、年龄、性别、体重、胆固醇水平、高血压状态(是不是),你将需要在64个组中分析运动和死亡率的关系。,多因素分析法 为判断运动是否独立地与死亡有关,研究者们运用了COX比例风险分析(proport

10、ional hazards analysis)的多元分析方法,结果如表1.2。准许引自: Blair, S.N.,et al. ”Influences of cardiorespiratory fitness and other precursors on cardiovascular disease and all-cause mortality in women.” JAMA 1996;276:205-10. Copyright 1996, American Medical Association. Additional data provided by authors.,表1.5 Aer

11、obics 中心追踪研究全死亡率危险因素的多元分析自变量 死亡率 调整相对危险度RR(百万分数) (95%CI)运动量 低 38.1 1.52(1.28-1.82)*中/高 25.0 1.0(参照组)吸烟状况 吸烟 39.4 1.65(1.39-1.97)*不吸烟 23.9 1.0(参照组),收缩压140 mmHg 35.6 1.30(1.08-1.58)* 140 mmHg 26.1 1.0(参照组) 胆固醇240 mg/dl 35.1 1.34(1.13-1.59)* 240 mg/dl 26.1 1.0(参照组) 冠心病家族史 有 29.9 1.07(0.90-1.29)无 27.8 1

12、.0(参照组) 体重指数 27 Kg/m2 28.8 1.02(0.86-1.22) 27 Kg/m2 28.2 1.0(参照组),空腹血糖120 mg/dl 34.4 1.24(0.98-1.56) 120 mg/dl 27.9 1.0(参照组) 异常心电图 有 44.4 1.64(1.34-2.01)*无 27.1 1.0(参照组)慢性疾病 有 41.2 1.63(1.37-1.95)*无 25.3 1.0(参照组),表明,如果你比较男性中每千人年死亡数,你可以看出在低运动组(38.1)比中/高运动量组(25.0)有较高的死亡数。其相对危险度为38.1/25.0=1.52。说明低运动量的人

13、死亡的危险性是高运动人的1.52倍。这显示运动与生存率有关,它并不依赖于吸烟、高血压、高胆固醇及家族史。,运动与人的寿命的关系,实例解析 吸烟和冠状血管疾病再通术后的预后间的关系,Aerobics中心的追踪研究,他们追踪了5437例冠状血管疾病并接受再通手术(用线和球打开阻塞的冠状血管)的病人,将病人分为不吸烟、以前吸烟(至少在手术前6个月戒掉)、刚戒烟(因手术后刚戒掉)、及持续吸 烟4个组。结果见表1.4. 5 Hasdai, D., Garratt, K.N., Grill, D.E., Lerman, A., Homes, D.R. “Effect of samoking status on the long-term outcome after successful percutaneous coronary revascularization.” N. Engl, J. Med. 1997;336:755-61.,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号