医学统计学 第一讲 绪论

上传人:n**** 文档编号:56626400 上传时间:2018-10-14 格式:PPT 页数:46 大小:354.50KB
返回 下载 相关 举报
医学统计学 第一讲 绪论_第1页
第1页 / 共46页
医学统计学 第一讲 绪论_第2页
第2页 / 共46页
医学统计学 第一讲 绪论_第3页
第3页 / 共46页
医学统计学 第一讲 绪论_第4页
第4页 / 共46页
医学统计学 第一讲 绪论_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《医学统计学 第一讲 绪论》由会员分享,可在线阅读,更多相关《医学统计学 第一讲 绪论(46页珍藏版)》请在金锄头文库上搜索。

1、第一章 绪论,教材:2003年高等教育出版社出版的医学统计学 主编:倪宗瓒,一、什么是统计学统计学(statistics)是关于数据(data)的科学,是从数据中提取信息的一门学科,包括设计、搜集、整理、分析和表达等步骤。,第一节 概述,根据研究领域和研究对象,统计学又分为:数理统计、经济统计、生物统计、 医学统计、卫生统计医学统计学(medical statistics):用概率论和数理统计的原理和方法研究医学领域中的数据收集、整理和分析的一门学科 。,1. 采用统计学方法,发现不确定现象背后隐藏的规律。变异(variation)是社会和医学中的普遍现象。变异使得实验或观察的结果具有不确定性

2、,如每个人的身高、体重、血压等各有不同。,二、为什么要学统计学?,最大值=6.18, 最小值=3.29, 极差=2.89算术均数=4.72,标准差=0.57。,2. 用统计学思维方式考虑有关医学研究中的问题 “阳性”结果是否是虚假联系?某感冒药治疗1周后,治愈率为90%,能否说该感冒药十分有效? “阴性”结果是否是样本含量不足? 有人曾对发表在Lancet, N Engl J Med,JAMA等著名医学杂志上的71篇阴性结果的论文作过分析,发现其中有62篇( 93%)可能是由于样本含量不足造成的假阴性。,3. 保证你的研究论文能通过统计学审查据国外6080年代对不同医学杂志发表论文的调查结果显

3、示,有统计错误的论文所占比例高达72%,最低也有20%。国内1984年对中华医学杂志、中华内科杂志、中华外科杂志、中华妇产科杂志、中华儿科杂志595篇论文的调查结果,相对数误用为11.2%,抽样方法误用15.9%,统计图表误用11.7%。某研究者1996年对4586篇论文统计(系列杂志仅占6.9%),数据分析方法误用达55.7%。,JAMA,新英格兰医学杂志(NEJM)、英国医学杂志、杂志对来稿都有统计学要求或统计学指导。国际生物医学杂志编辑协会在其生物医学期刊投稿的统一要求中也包含了统计学要求。Uniform Requirements for Manuscripts Submitted to

4、 Biomedical Journals http:/ www.acponline.org,4. 获得循证医学证据的主要手段“良好愿望的医学”(well-meaning medicine)转入“以证据为基础的医学” (evidence-based medicine,EBM)需要有统计学方法的支持。全世界的医学期刊每年大约刊登600万学术论文,但能作为可靠“证据”的论文并不多。,循证医学证据的例子;硝苯地平为第一代钙通道阻滞剂可以扩张动脉血管,降低血压,从而减低心脏后负荷,所以长期以来被想当然地用于急性心肌梗塞(AMI)治疗。但是临床随机对照研究(Randomized controlled tr

5、ial, RCT) 表明此类药物增加AMI病人的死亡率。大量RCT研究的惊人结论使得广大临床医生不得不接受循证医学。,马克吐温的一句名言:谎言、该死的谎言和数据。,第二节 医学统计学的主要内容 (略),一、统计研究设计 二、常用基本方法 三、临床医学中常用统计方法 四、医学人口统计和疾病统计 五、多因素分析,第三节 基本概念,变量可以测量的任何特征或属性Any characteristic or attribute that can be measured。 (不同个体结果可能不同)随机变量在概率论中称变量为随机变量,一、变量与变量值,根据观察数据之间有无缝隙(gap),常将数据分类为离散型(

6、discrete)变量(有缝隙)与连续型(continuous)变量(无缝隙)两大类。,变量(variable),统计上习惯用大写字母表示 ,如X、Y 、Z、 。变量值习惯用小写字母表示 ,如性别x11 (男) 、x2 1 (男)、x3 0 (女) 、。,举例,二、 同质与变异 homogeneity and variation,同质:指事物的性质、影响条件或背景相同或非常相近。 变异:指同质的个体之间的差异 。,同质与变异的例子,例1 调查2003年宜昌市7岁男童的身高和体重 同质:2003年、宜昌市、7岁男童 变异:身高和体重各不相同 例2 研究某降压药的疗效 同质:高血压患者、用某药治疗

7、 变异:疗效各不相同,三、 总体与样本 population and sample,总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体,样本:从总体中随机抽取的有代表性的部分研究对象,随机抽样 random sampling,为了保证样本的可靠性和代表性,需要采用随机的方法抽取样本(在总体中每个个体具有相同的机会被抽到)。,四、 参数与统计量 parameter and statistic,参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为、。固定的常数,推断inference,统计量:样本的统计指标,如样本均数、标准差,采用英文字母分别记为 。是参数附近波动

8、的随机变量 。,样本的实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现f 次,则事件A出现的频率为f/n。概率:随机事件发生的可能性大小,用大写的P 表示;取值0,1。,五、频率与概率 frequency and probability,频率与概率间的关系,样本频率总是围绕概率上下波动样本含量n越大,波动幅度越小,频率越接近概率。,必然事件 P = 1 随机事件 0 P 1 不可能事件 P = 0 P 0.05(5)或P 0.01(1)称为小概率事件(习惯),统计学上认为在一次抽样中不大可能发生。,小概率事件,Certain,Impossible,0.5,0,1,六、误差(

9、Error) 测量值=真实值+随机误差+非随机误差Xi = i + +i1随机误差(随机抽样误差):影响因素众多,变化无方向性,不可避免,但可用统计方法进行分析。2系统误差受确定因素影响,大小变化有方向性。3过失误差研究者偶然失误而造成的误差。,偏差bias,准确度与可靠度,准确度(accuracy)或真实性(validity) :观察值与真值的接近程度,受系统误差的影响。 可靠度(reliability) 也称精密度(precision)或重复性(repeatability) :重复观察时观察值与其均值的接近程度,受随机误差的影响。,七、统计资料类型,(一)、原始统计数据的来源 常规保存数据

10、 医院信息系统(HIS)、统计报表等 2. 现场调查记录 3. 实验记录 4. 其他,(二)、统计数据的分类,1. 计量资料 2. 计数资料 3. 等级资料 4. 三类资料间关系,1. 计量资料,用仪器、工具等测量(measure) 方法获得的数据,即为计量资料measurment data。也叫定量数据Quantitative data,特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(10/L),2. 计数资料,按某种属性分类,然后清点每类的数据,称计数资料(count data)或enumeration data。也叫定性数据Qualit

11、ative data,特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女),3. 等级资料 Rank data,半定性或半定量的观察结果。有大小顺序,所以也叫有序分类资料(ordinal category data)。 癌症分期:早、中、晚。 药物疗效:治愈、好转、无效、死亡。 尿蛋白: , , , +, +及以上,观察单位observations 个体individuals,Units;elements,变量variables,Quantitative data 计量资料,Qualitative data 计数资料,4. 三类资料间关系,例:一组2040岁成年

12、人的血压(舒张压),8 低血压8 正常血压 12 轻度高血压15 中度高血压17 重度高血压,等级资料,计量资料,计数资料,以12kPa(90mmHg)为界分为正常与异常两组,统计每组例数。,一、研究设计 二、搜集数据 三、整理数据 四、分析数据 五、结果呈报与解释(决策),第四节 统计工作的基本步骤,1.调查设计(survey design)对研究对象不施加任何干预,通常建立随机抽样(random sampling)方案。 2.实验设计(experiment design)对研究对象施加干预,如动物实验研究、临床试验,通常建立随机分组(random allocation)方案。,一、研究设计

13、,实验设计的三个基本原则1随机化(randomization) 2. 对照(control) 3重复(replication),Fisher 在他的著作中多次强调,统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。 “试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。 统计学家或许只能告诉你试验失败的原因。”,二、搜集数据(data collection),搜集资料要遵循准确、完整、及时三个原则。 资料搜集计划包括: 选择搜集资料的地点、人员和时间;搜集资料人员的培训方案;预调查或预实验方案拟定;资料的记录方式;调查表的拟订和印刷; 调查或实验仪器、试剂的

14、准备;调查资料的抽样复核比例和方法;搜集资料所需经费的准备等。,三、整理资料(data sorting),目的是将搜集到的原始资料系统化、条理化,便于进一步计算与分析。编码,将数据输入计算机 纠错改错、补漏等,四、分析资料(data analysis),描述统计学(descriptive statistics)是指用统计指标、统计图、统计表等方法,对数据的特征及其分布规律进行检测与描述。 推断统计学(inferential statistics)是通过随机样本信息推断总体特征的过程。区间估计( interval estimation)假设检验(hypothesis test),五、结果解释,结合专业知识对研究结果做出合理解释,并帮助相关问题的决策。,教学准备及总体安排,教材:倪宗瓒主编医学统计学, 高等教育出版社,200年8月第一版。,总学时:57学时(其中有学时学习软件),纪律要求,不影响课堂秩序 不要迟到早退 上课关掉手机或设为振动,如何学习,掌握三基(基本概念、基本知识、基本技能) 培养统计学思维能力和工作能力,灵活用于工作和科学研究中。,本章重点内容,1、统计学常用的基本概念 2、统计工作基本步骤,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号