医学统计学 研究生课件01-绪论(2015研)

上传人:清晨86****784 文档编号:260548194 上传时间:2022-02-28 格式:PPT 页数:84 大小:2.92MB
返回 下载 相关 举报
医学统计学 研究生课件01-绪论(2015研)_第1页
第1页 / 共84页
医学统计学 研究生课件01-绪论(2015研)_第2页
第2页 / 共84页
医学统计学 研究生课件01-绪论(2015研)_第3页
第3页 / 共84页
医学统计学 研究生课件01-绪论(2015研)_第4页
第4页 / 共84页
医学统计学 研究生课件01-绪论(2015研)_第5页
第5页 / 共84页
点击查看更多>>
资源描述

《医学统计学 研究生课件01-绪论(2015研)》由会员分享,可在线阅读,更多相关《医学统计学 研究生课件01-绪论(2015研)(84页珍藏版)》请在金锄头文库上搜索。

1、医学统计学主讲:卢 洁 副教授hanyaa800 郑大公卫学院 A510室Medical Statistics第一章 绪 论 1.1 引言 .1.2 生物医学数据的来源与类型 .1.3 常用的基本概念 .1.4 统计工作贯穿医学研究的全过程1.1 什么是医学统计学?变异(variation)是社会和生物医学中的普遍现象,变异使得实验或观察的结果具有不确定性。采用同种药物治疗某病患者疗效却有好有坏?同父母所生子女为什么身高、体重各不相同?随机现象n 随机现象的描述强化化疗治疗小儿急性淋巴细胞白血病临床缓解率达80.0%。据国家统计局资料,2000年中国人口平均预期寿命是71.4岁,2004年71

2、.8岁,按此计算,平均每年提高0.1岁。. 厨房品尝菜肴的故事:抽样 临床试验纳入的20个急性淋巴细胞白血病的患儿,接受标准方案的化疗后15人缓解,请问:急性淋巴白血病患儿临床缓解率是多少? 随机性中寻找规律性随机性中寻找规律性 把复杂的问题简单化把复杂的问题简单化统计统计通过推理n 随机现象的推断:什么是医学统计学?(Definition of Medical Statictics)统 计 学 :处理医学数据中变异性的科学和艺术研究内容:搜集、整理、解释与呈现数据并作 出推断。 。研究方法:概率论和数理统计。研究目的:求得可靠结果,探索现象的本质。现实地位:论文审稿、科研合作、基金申请、 药

3、物开发与申报、药效评定、卫生决策 .统计学的起源Singularformstatisticsstatistics“ “统计学统计学” ”“ “统计数字统计数字” ”Pluralform 统计学是关于数字的学科,早期的统计数字应官方要求,为作某种决策提供依据的信息。statestateu 为什么要学习统计学?1.用统计学方法发现不确定现象背后隐藏的规律,是医学科学研究工作的基本需要。是变异还是有病?最大值=6.18, 最小值=3.29, 极差=2.89算术均数=4.72,标准差=0.57。【经典案例问题1】:北京某医院某大夫使用“乌贝散”中药冲服治疗胃溃疡病出血107例,有效101例,有效率为9

4、4.4%那么,别的医院,其他大夫也使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4%吗?答:参数估计,求置信区间【经典案例问题2】:北京某医院有位老大夫,用“冠心灵”治疗冠心病,其对照组用单纯西药,观察结果如下表:答:假设检验(test of significance), 要算值。2.用统计学思维方式,正确地理解医学相关的 问题 n“阳性”结果是否是虚假联系?某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效?n “阴性”结果是否真是阴性?有人曾对发表在Lancet,NEnglJMed,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇(93%)可能是由

5、于样本含量不足造成的假阴性检验效能低所致。多年以前统计学家也许会宣称,统计学是做数据列表的。如今的统计学家很可能说,统计学考虑的是不确定性如何做决策。chernoff和Moses(1959年)斯坦福大学教授l相当多的人忽略研究中的统计设计;l用正态分布法表达呈偏态分布分布的定量资料;l因误判资料类型而误用统计方法;l把 t 检验当成处理定量资料的万能工具;l把 2检验当作定性资料的万能工具;l脱离专业知识去做相关与回归;l用直线回归代替曲线回归;l用单因素分析代替多因素统计分析。3.目前医学科研活动中,统计学应用面临的窘境: 国际论文的统计学问题:n希腊某大学有学者对19902003年期间发表

6、在Lancet(柳叶刀),NEnglMed(新英格兰),JAMA(美国医学会)三大著名医学杂志上,且引用的次数1000次以上的文献进行调查。n49篇高引用率的原始文献中,45篇称干预有效。而结果被以后的研究结果否定7篇(15.6%),最初报告的疗效被夸大7篇,接近1/3的研究没有经住时间的考验。 国内论文的统计学问题:n国内2006年对48种高影响因子的生物医学期刊进行审查,重点审查“论著”,其中有相当高的比例是国家各类基金资助的科研课题。n截止到2007年6月,期刊23种约300篇论著。几乎所有的论著都涉及到统计分析;而在统计研究设计、统计表达和描述、分析方法的选择与实施上,都完全正确比例非

7、常低,统计误用率达90。n绝大部分是:“回顾性描述临床诊疗过程和“回归性的整理和分析临床资料”两大类。实验设计的四个基本原则(随机、对照、重复、均衡),实施过程中的质量控制都存在问题。n研究还发现:除了少量介绍新药期、期临床实验论文外,我国严重缺乏“前瞻性的完全随机对照的临床研究”。 尤其是临床研究论文:【经典案例 1】:某科研人员为研究A、B两种药物的疗效,设计了如下实验,每组用小白鼠20只,观测定量指标为血小板、白细胞等。4个组设计如下:l第1组:空白对照组l第2组:单用A药l第3组:A、B药联合应用l第4组:第3组的空白对照。正确的设计方案为:两因素析因设计(16章)设计优势:不仅反映A

8、、B单独作用的大小,也可 反映A、B之间的交互作用大小。统计推断:析因设计资料的方差分析l第1组:空白对照组l第2组:单用A药l第3组:单用A药l第4组:A、B药联合应用正确的分组方式【经典案例 2】:某杂志中一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为78,平均疗程为3周左右。由此结论,该药治疗玫瑰糠疹的确有效。答:1.玫瑰糠疹是自然治愈性疾病,一般不服药,多喝水,到3周左右绝大多数患者也会自愈,故此药的78疗效有待探讨 2.设立对照组!美国医学会(JAMA),新英格兰医学杂志(NEJM)、英国医学杂志、杂志对来稿都有统计学要求或统计学指导。国际生物医学杂志编辑协会在生物医学期刊投稿的统

9、一要求中也包含了统计学要求。4.4.统计数字造假问题统计数字造假问题统计是支持研究结论的证据之一,一些想在研究中走捷径的人,不惜抛开科学道德伪造统计数字。据1976年NewScience杂志关于科研舞弊行为调查,74的调查反映有不正当修改数据情况。其中,17拼凑实验结果,7凭空捏造数据。2故意曲解结果。国内大有人在! 历史上许多事实说明,科学来不得半点虚假,造假者一旦被揭露,背上永远洗不掉的耻辱,断送自己的学术生涯!【经典案例】:著名的美国贝尔实验室自1925年成立来,共计推出2.8万专利,所属科学家曾获6个诺贝尔物理学奖。但2002年9月,该实验室传出77年历史上最大的丑闻,某研究者至少在1

10、6篇论文中捏造或篡改了试验数据:其人的论文中描述试验结果采用的一系列不同的仪器设备,但报告的部分数据却一摸一样。众所周知,生物实验运气再好,也是随机的,相同的试验也不会得出完全一样的试验结果。这位科学家是该实验室查出首起造假人员,立即开除。综上所述针对前人“痛苦的经历。”,如何找到我们学习的东西,焕发学好医学统计学的力量,提高效率,打消心理障碍,建立信心,寻找解决问题的对策。让我们共同努力,揭开医学研究统计方法的面纱。u 研究生阶段: 该如何学习医学统计学?体会领悟统计学的思维特征(抽象思维及逻辑推断模式),充分认识所作结论的概率性;原理、概念的理解比算题重要得多 ;统计方法高级不一定好,简单

11、有效最好;应用医学统计学方法解决实际问题,学以致用是根本目的。 在潜移黙化中改良我们的思想。知识模块:基础篇应用篇专题篇u 教学内容统计描述抽样分布参数估计:点估计、区间估计定量资料算术均数、 中位数等集中趋势:离散趋势:极差、 四分位数间距、方差、标准差、变异系数定性资料:频率型指标、强度型指标、比统计表和统计图统计推断变量概率分布:正态分布假设检验实验设计分组数实验设计:三要素、四原则、实验设计方案、样本含量估算教学内容:非参数检验秩和参数检验:t 检验、方差分析等差异性定性资料定量资料多变量:多重线性回归、logistic回归、生存分析相关回归两变量:简单线性相关、回归分析教学日历:1绪

12、论、定量资料统计描述4理论课2定性资料统计描述、统计图表43正态分布、抽样分布与参数估计 44假设检验基础、两样本定量资料的假设检验45多组定量资料的假设检验随机区组设计的双因素分析46析因设计的方差分析重复测量数据的方差分析47定性资料的假设检验、两变量关联性分析48简单线性回归分析、多重线性回归分析49Logistic回归分析、生存分析410 实验设计411 统计软件使用方法4 实习课12 两样本定量资料的假设检验、方差分析413 定性资料的假设检验;相关分析414简单(多重、logistic)回归分析41.2 医学数据的来源与类型生物医学数据的来源:1.常规记录:医院信息科病案、首页等2

13、.实验记录:实验室数据,主要来源3.现场调查:根据目的进行收集资料4.其他数据:历史资料,统计年鉴等1.变量(variable):个体特性的数量描述,如身高168cm,体重56kg等。变量的类型2.变量的分类:定性变量:分类/计数qualitative定量变量:quantitative分类变量/名义变量categorical/nominativevariable有序变量/等级变量ordinalvariable数值/计量变量住院号年龄身高体重住院天数职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月202583025158

14、68.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesQuantitativedata定量资料Qualitativedata定性数据Units;elements定义:是指所分类别或属性之间无程度和顺序的差别。定义:种种可能的“取值”中自然地存在着

15、次序,即各类别之间有程度的差别。例:尿糖(、 、+、 +、 +)无症状、轻、中、重度有序变量/等级变量分类变量/名义变量多分类变量例:血型(O、A、B、AB)、职业(工、农、商、学、兵等)、种族等。通常用0、1、3、4等代表各个分类或水平例:男、女 感染、未感染 有效、无效二分类变量(0-1变量/哑变量)(一)定性变量(二)定量变量 特点:其变量值是定量的,可经测量表现为数值的大小,多有度量衡单位。 例:身高(cm)、体重(kg)血压(mmHg)、脉博(次/分)白细胞计数(109/L)例:一个月中手术病人有1020人;一年内的新生作人数等。连续型变量离散型变量定义:指数轴上的连续变动,在一区间

16、中可任意取值定义:其取值范围是有限个值,或中断的数列,如只能取整数变通:红细胞计数109个/L也可看作连续型变量变量,因为其1个、2个、3个的差别并不重要。3.变量之间的转换:变量只能由高级向低级转化,不能作相反方向转化定量变量有序变量分类变量二值变量分类标准:90低血压90-140正常血压140高血压人数162分类标准:90或140不正常90-140正常人数364.变量的编码定量数据:直接录入原始数据。定性数据:需进行编码(仅为一个数字代码,并无实际意义)后方可录入,否则不便于进一步运算。性别:女(0),男(1);血型:A(1),B(2),AB(3),O(4)化验结果:-(1),+(2),+(3),+(4)5.各类变量的计算分类编码频数(frequency)单身13已婚25离异32分居44定量数据:允许计算均数、标准差等(可采用t、F 检验等,可当做有序或定性数据处理)定性数据:编码是任意的,不能对编码执行均数标准差等计算,但可计算率或比(可采用卡方检验等) 调查14名男子的婚姻状况有序数据:允许基于顺序的计算,如计算中位数、百分位数(可当做定性数据处理)对无序变量(名义

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号