基础医学医学统计学基础

上传人:tia****nde 文档编号:71267771 上传时间:2019-01-20 格式:PPT 页数:36 大小:265.78KB
返回 下载 相关 举报
基础医学医学统计学基础_第1页
第1页 / 共36页
基础医学医学统计学基础_第2页
第2页 / 共36页
基础医学医学统计学基础_第3页
第3页 / 共36页
基础医学医学统计学基础_第4页
第4页 / 共36页
基础医学医学统计学基础_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《基础医学医学统计学基础》由会员分享,可在线阅读,更多相关《基础医学医学统计学基础(36页珍藏版)》请在金锄头文库上搜索。

1、医学统计学基础,第二讲 第一节、医学统计学的基本概念和步骤 第二节、数值变量的统计描述及SPSS操作 第三节、数值变量的总体均数估计,第一节 统计学基本概念和步骤 一 总体和样本(population and sample) 概念:总体 - 根据研究目的确定的同质观察单位的全体。 样本-总体中随机抽取有代表性的一部分 个体,其实测值的集合。,例如: 从某地2004年7岁正常女童中,随机抽取110名女童进行身高测量。 总体是指该地2004年所有7岁正常女童的身高值的集合。样本是指所测量的这110名女童的身高值。 同质 - 同年同地7岁正常女童 变异 - 样本中的女童身高值各不相同,二、 随机抽样

2、(random sampling) 概念 : 随机抽样,就是总体中每个个体都 有均等机会被抽取进入样本。 目的 :使得样本能更好地代表总体,可以根据样本信息推断总体特征,三、 参数和统计量(parameter and statistic) 概念:- 参数是指总体指标,如总体均数(),总体标准差(), 总体率()等。 - 统计量是指样本指标,如样本均数, 样本标准差 (s), 样本率 (p) 等。 一般情况下,参数是未知的,需要用统计量去估计。,四、 误差(error) 医学科学研究中的误差通常指测量值与真值之差,其中包括系统误差 和随机测量误差;以及样本指标与总体指标之差,即抽样误差。 研究抽

3、样误差的规律,是医学统计的重要内容之一。 误差 解释 解决办法 系统误差 不是偶然机遇所致, 尽可能避免, 或通过周 (systematic 而是某种必然因素所致, 密的研究设计解决 error) 具有一定的倾向性 随机测量误差 偶然机遇所致,是不可避免的 控制在一定的允许范围 (random measurement error) 内,数据仍可以使用 抽样误差 抽样研究中,即使消除了 可以通过统计方法估计 (sampling error)系统误差,控制 了随机测量 并减小 误差,样本指标和总体参数间 仍会存在差别。这是由个体变 异造成,是抽样波动所致, 不可避免的,五、 医学统计资料的类型 医

4、学统计资料是由医学科学研究 产生的一系列观测结果组成,用于反 映观测结果的属性或标志,统计上称 为变量(variable),对变量的测量或 观察结果称为变量值(value of variable),统计资料的类型 资料类型 变量类型 例子 统计指标 计量资料 数值变量 身高 (cm),体重(kg) 平均数, 标准差等 计数资料 分类变量 治疗40个病人的效果: 率, 有效: 27例 构成比等 无效: 13例 等级资料 有序分类 治疗40个病人的效果: 可计算构成比 变量 显效: 13例 好转: 30例 无效: 27例,例1:某地某年120名20岁健康男大学生身高(cm) 它是一个样本数据(bo

5、ok1.xls ),所对应的总体是该地该年所有20岁健康男大学生身高 例2:某年某地正常成人血铅(微克/100克) 资料,第二节 数值变量的统计描述及SPSS操作 数值变量的数据分布特征 - 作频数表(frequency table) - 直方图(histogram) 根据数据分布类型计算统计指标 - 集中趋势指标(平均指标) - 离散趋势指标 (变异指标) 统计指标的应用 - 计算个体变量值的范围 (医学参考值范围),一、频数分布 数据的分布类型 - 对称分布 (正态分布) - 偏态分布 进行数据核查,发现异常值和 missng值,120名学生身高(cm)的频数表,二、 平均指标 算术均数(

6、mean) 变量值呈对称分布, 尤其正态分布 中位数(median)或称 P50 偏态分布或分布不清,一端(或 两端) 无确定值的资料 几何均数(geometric mean) 等比资料,对数正态分布,三、 变异指标 全距(range)R=最大值-最小值 四分位数间距 (Interquartile Range,偏态资料)Q = P75 -P25 方差和标准差(variance & standard deviation,对称资料) 变异系数(CV, 两种情况比较),算术均数(简称均数)的公式,未分组样本资料 总体,特点:受异常值(特大或特小值)影响,适用于对称分布,尤其正态分布的资料,中位数计算

7、公式,当n为奇数时 当n为偶数时,特点:不受异常值(特大或特小值)的影响,适用于偏态分布等资料,样本方差,样本标准差,总体方差,适用资料:对称分布尤其正态分布的资料,Descriptive statistics - frequencies - statistics,Descriptive statistics - descriptives - options,Descriptive statistics - explore - display statistics,例3:有69例类风湿关节炎(RA)患者血清EBV-VCA-IgG抗体滴度资料(book1.xls sheet3 ) ,求其平均滴度

8、 步骤:将滴度倒数和例数输入SPSS,进行数据加权(WEIGHT CASES)后,点击analyze - report - case summaries - 选入滴度倒数 - statistics里要求输出倒数第3个指标,几何均数,作业 对例2的资料进行描述统计,问 1)血铅原始值是什么分布类型的资料 2)选用何种指标反映其集中、离散趋势 3)血铅对数值是什么分布类型的资料 4)试采用几何均数反映资料的平均水平 要求:说明原因,写出计算公式和结果,三、 正态分布及其应用,正态分布及正态曲线下面积的分布规律,正态分布及其应用,正态分布及正态曲线下面积的分布规律,正态分布的特征 1)以均数为中心,

9、左右对称,钟型曲线 2)均数决定整个曲线的位置,标准差决定 曲线的胖瘦,是正态分布两个重要参数 3)均数处最高,说明变量值易在附近出现 4)正态曲线下一定区间的面积,说明变量 值在这个区间里出现的可能性,有规律 要求记住95%,99%对应的区间公式,正态分布及其应用,正态分布及正态曲线下面积的分布规律,正态分布及其应用,估计观察值所在范围 (医学参考值范围),95% 的健康成人血糖观察值所在范围:,即该地 95% 的5558岁健康健康成人血糖观察值在 3.87 5.44 ( mmol/L)范围内,标准正态分布概念和特征 均数为0,标准差为1的正态分布称为标准正态分布(z分布)。若X服从正态分布

10、,经z变换公式,所得的z值服从标准正态分布。 正态曲线有无数条,但标准正态分布曲线只有一条。标准正态分布具有正态分布的所有特征尤其要记住95%,99%对应的区间。,Descriptive statistics - descriptives - save standard value as variable,如何判断资料是否服从正态分布 对样本例数较大的资料,编频数表和绘直方图,另外还可以点击 正态Q-Q图看散点是否与直线重合,正态性检验看是否Sig值(即P值)是否大于0.10 对例数较小的资料,一般根据专业知识或着仅仅是假定,Descriptive statistics explore - d

11、isplay plots - plots: nomality plots with tests,第三节 数值变量的总体均数估计 均数的抽样误差与标准误 来自同一总体的各样本均数间存在差异,称为均数的抽样误差。标准误是反映均数的抽样误差大小的指标,它与样本含量n的平方根成反比。即适当增加n可以减少均数的抽样误差。,理论值,估计值,总体均数的估计 统计分析包括统计描述和统计推断两部分,而统计推断包括参数(如总体均数)估计和假设检验。 总体均数估计包括点估计和区间估计,常计算总体均数的95%置信区间,可以认为该区间包含总体均数的结论错误的可能性是5%,未知时的公式,未知n较大时,问题: 95%医学参考值范围和总体均数95%置信区间的区别是什么?,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号