6503编号医学统计学总复习-liufen-sms

上传人:玩*** 文档编号:145280605 上传时间:2020-09-18 格式:PPT 页数:88 大小:2.60MB
返回 下载 相关 举报
6503编号医学统计学总复习-liufen-sms_第1页
第1页 / 共88页
6503编号医学统计学总复习-liufen-sms_第2页
第2页 / 共88页
6503编号医学统计学总复习-liufen-sms_第3页
第3页 / 共88页
6503编号医学统计学总复习-liufen-sms_第4页
第4页 / 共88页
6503编号医学统计学总复习-liufen-sms_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《6503编号医学统计学总复习-liufen-sms》由会员分享,可在线阅读,更多相关《6503编号医学统计学总复习-liufen-sms(88页珍藏版)》请在金锄头文库上搜索。

1、刘芬 首都医科大学 公共卫生与家庭医学学院 流行病与卫生统计学系,医学统计学总复习,一、概述. 科研统计工作的步骤,(1)研究设计( research design): 根据研究的目的,从统计学的角度对各步提前做出的周密的计划和安排 调查设计 实验设计 (临床设计、 新药设计),科研设计,(2)收集资料(data collection ) (3)整理资料(data sorting) (4)分析资料(data analysis),一、概述. 科研统计工作的步骤,统计分析,统计推断,参数估计,假设检验,点估计,区间估计,统计描述,均数、中位数、标准差 统计量 率、构成比 相关系数、回归系数等,统计

2、表 编制规则 统计图 条图、直方图、圆图、线图等,统计描述的方法,类型、适用条件,用样本的信息来推断总体的特征叫统计推断 统计分析的主要目的是由样本推断总体,故统计学的主体是统计推断,统计推断,统计推断,参数估计,假设检验,点估计,区间估计,参数,非参,z 检验 t 检验 F 检验 直线相关与回归,卡方检验 秩和检验 等级相关,.资料类型,(1)定量资料 计量资料(measurement data): 对每个观察单位用定量方法测定某项指标的数值大小所得的资料,(2)定性资料 计数资料(enumeration data)按性质或类别进行分组,然后再清点各组数目所得的资料 等级资料(ranked

3、data)将观察单位按某项指标的等级顺序分组,再清点各组观察单位的个数所得的资料,.资料类型,二、定量资料的基本统计方法,有个模块: 统计描述 区间估计 假设检验 相关与回归,1、统计描述统计指标,平均指标和变异指标分别反映资料的不同特征,常配套使用,根据资料类型不同有不同组合, 如 正态分布: 均数、标准差 偏态分布: 中位数、四分位数间距,描述集中趋势指标: 算术均数(简称均数)( ) 几何均数(G) 中位数(M),描述离散程度指标: 极差(R) 四分位数间距(Q) 方差(S2) 标准差(S) 变异系数(CV),1、描述偏态分布集中趋势(尿氟均值)的指标:中位数 2、比较几组量纲不同的资料

4、的离散程度的指标:变异系数,统计描述,1)统计表,组合表,简单表,2)统计图,条图 圆图 线图 直方图 散点图 .,*类型、适用条件*,1、统计描述统计表与统计图,例1 现有145例粪链球菌食物中毒病人, 其潜伏期分布如表1所示,属于不对称分布 表1 粪链球菌食物中毒潜伏期 潜伏期(小时) 频数(f) 累计频数 0 18 18 6 45 63 12 40 103 18 30 133 24 6 139 30 0 139 36 4 143 42 2 145,图 1 粪链球菌食物中毒潜伏期分布,表2 某地144名正常成年男子红细胞数频数表 组 段 频数 f 4.2 2 4.4 4 4.6 7 4.8

5、 16 5.0 20 5.2 25 5.4 24 5.6 22 5.8 16 6.0 2 6.2 5 6.46.6 1,直方图,图 2 144名正常男子红细胞计数的直方图,2、区间估计,正常值(参考值)范围(p21),总体均数的可(置)信区间(p69),正态分布(normal distribution) 可信区间(confidence interval, CI),注意: 95%CI与95%正常值范围区别,(p70),单个样本(one sample) t 检验 配对资料 (paired sample)比较的t 检验 两独立样本(two independent sample)均数比较的检验 t 检

6、验(当方差不齐时),3、假设检验(hypothesis test),t 检验,亦称students t 检验,应用t检验条件: 1)单因素两水平的定量效应指标 2)要求各组正态分布 3)要求方差齐性 如不满足条件,当满足正态性而方差不齐时可进行t检验,否则需采用变换或非参数方法作统计分析,t 检验,t 检验的类型,主要用于下列三种情况: (1) 样本均数与总体均数比较; (2) 配对数值变量资料的比较; (3) 两样本均数的比较。,例2 应用克矽平治疗矽肺患者10名,治疗前、后血红蛋白的含量如表3所示,问该药是否引起血红蛋白含量的变化?,表3 克矽平治疗矽肺患者治疗前后 血红蛋白含量(g/L)

7、 编号 治疗前 治疗后 1 113 140 2 150 138 3 150 140 4 135 135 5 128 135 6 100 120 7 110 147 8 120 114 9 130 138 10 123 120,表3 克矽平治疗矽肺患者血红蛋白量(克) 编号 治疗前 治疗后 治疗前后差数 1 113 140 27 2 150 138 -12 3 150 140 -10 4 135 135 0 5 128 135 7 6 100 120 20 7 110 147 37 8 120 114 -6 9 130 138 8 10 123 120 -3,解:.建立检验假设,确定检验水准 0

8、:d=0,假设该药不影响血红蛋白的变化, 即治疗前后总体差数为0。 1:d0 ,假设该药影响血红蛋白的变化, 即治疗前后总体差数不为0。 =0.05. 计算检验统计量值,(1) 配对检验,3确定P值,做出统计推断 自由度 = n-1 = 10-1 = 9 , 查t 临界值(附表2)得: 0.883t = 1.3071.383, 0.20 0.40,按=0.05水准不拒绝H0,差异无统计学意义。 根据目前资料尚不能认为克矽平对血红蛋白含量有影响。,()两独立样本均数比较的 检验(two-independent sample t-test),其中:, = n1 + n2 -2,例3 某克山病高发区

9、测得11例急性克山病患者与该地13名健康人的血磷值(mg%) 如表4所示,判定两组均数差异有否统计学意义。,表4 急性克山病患者与健康者的血磷测定值(mg%),患者编号 X1 健康者编号 X2 1 4.73 1 2.34 2 6.40 2 2.50 3 2.60 3 1.98 4 3.24 4 1.67 5 6.53 5 1.98 6 5.18 6 3.60 7 5.58 7 2.33 8 3.73 8 3.73 9 4.32 9 4.57 10 5.78 10 4.82 11 3.73 11 5.78 12 4.17 13 4.14,解: .建立检验假设,确定检验水准 0:1= 2 ,即克山

10、病患者与当地健康者的血磷值的均数相同。 1:1 2 ,即克山病患者与当地健康者的血磷值的均数不相同。 =0.05.,计算检验统计量值,计算检验统计量值,3确定P值,做出统计推断 自由度 = n1 + n2 -2=11+13-2=22, 查t 临界值(附表2)得: t = 2.547 t0.05,22=2.047, 0.05,按=0.05水准拒绝H0,差异有统计学意义。 根据目前资料可认为克山病患者与当地健康者的血磷值的均数不相同,克山病患者的血磷值高于当地健康者。,亦称方差分析,应用F检验条件: 1)单因素或多因素定量效应指标 2)要求各组正态分布 3)要求方差齐性 如不满足条件,需采用变换或

11、非参数方法作统计分析,F 检验(analysis of variance)ANOVA,F检验的类型,(1) 完全随机设计的方差分析 (2) 配伍组设计的方差分析,三种“变异”之间的关系 离均差平方和分解:,(1) 总变异: 所有观察值之间的变异 (2) 处理间变异:处理因素随机误差 (3) 区组间变异:区组因素随机误差 (4) 误差变异: 随机误差,变异分解,4、线性相关与回归(linear correlation and regression),相关系数r (correlation coefficient) r的假设检验,线性相关,线性回归,回归方程 (regression equation

12、) 其中a为截距(intercept);b为回归系数(coefficient of regression),有个模块: 1、统计描述 2、区间估计 3、假设检验 4、相关与一致性分析,三、定性资料的基本统计方法,1、统计描述,率(rate),比(ratio),相对数,百分比(构成比),相对比,分类指标的统计量,率 用来说明随机事件发生的频率或强度大小 构成比 用来说明某一事物内部构成部分的比重 相对比 两个有关指标之比 注意应用相对数的注意事项,率与构成比的区别、率的标准化等,使用相对数应注意的问题,根据需要正确选择相对数。常见错误是以构成比代率。 计算观察单位数不等的几个率的平均率时,不能将

13、几个率直接相加求平均率。,分母应当足够大。分母小于20时可靠性较差。如果分母太小,宜用绝对数表示 要注意其内部构成是否相同。若内部构成不同的资料,应先进行率的标准化后再比 根据样本数据计算的强度相对数,要考虑抽样误差的影响,使用相对数应注意的问题,2、区间估计(interval estimation),总体率的可信区间(置信区间)(confidence bound/confidence interval,CI),四格表资料 配对四格表 行列表,3、假设检验 (hypothesis test),检验,计数资料,Chi-square test,基本公式 专用公式 校正公式 确切概率法,差异性 一致性,基本公式 专用公式 确切概率法,卡方检验方法,卡方检验在不同的条件下有不同的计算方法,常用的有Pearson卡方、校正的卡方和Fisher精确概率 当四格表中n40,但有1Tij5时,应选用校正卡方 当四格表中出现n40或Tij1两种情形之一时,需用Fisher的确切概率法,检验的基本公式,A:实际频数(actual frequency) T:理论频数(theoretical frequency) TRC : 第R 行C 列的理论频数 nR :相应的行合计

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号