548编号卫生统计学重点笔记

上传人:玩*** 文档编号:145839664 上传时间:2020-09-23 格式:PDF 页数:7 大小:279.03KB
返回 下载 相关 举报
548编号卫生统计学重点笔记_第1页
第1页 / 共7页
548编号卫生统计学重点笔记_第2页
第2页 / 共7页
548编号卫生统计学重点笔记_第3页
第3页 / 共7页
548编号卫生统计学重点笔记_第4页
第4页 / 共7页
548编号卫生统计学重点笔记_第5页
第5页 / 共7页
亲,该文档总共7页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《548编号卫生统计学重点笔记》由会员分享,可在线阅读,更多相关《548编号卫生统计学重点笔记(7页珍藏版)》请在金锄头文库上搜索。

1、医师资格考试蓝宝书医师资格考试蓝宝书-预防医学预防医学 医学统计学方法医学统计学方法 第一节 基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败) 、搜集资料、整理资料、分析资料。 总体 : 根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单 位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断 总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种 由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高 ; 反之

2、,其 精确度愈低。 某事件发生的可能性大小称为概率,用 P 表示,在 01 之间,0 和 1 为肯定不发生和 肯定发生,介于之间为偶然事件,0.05 或 0.01 为小概率事件。 二、变量的分类 变量:观察单位的特征,分数值变量和分类变量。 第二节 数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数 均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数 适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始 数据呈偏态分布,经对数变换后(用原始数据的对数值 lgX 代替 X)服从正态分布,观察值 不能为 0,同时有正和负。 3.中位数 一组按大

3、小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特 别是偏态分布资料的集中位置, 以及分布不明或分布末端无确定数据资料的中心位置。 不能 求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有 X 比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差 最为常用, 适于正态分布, 既考虑了离均差 (观察值和总体均数之差) , 又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越小, 观察值的变异度越小。 3.变异系数 多组间单位不同或均数相差较大的情况。 变异系数计算公式为 :

4、 CV=s/X 100,公式中 s 为样本标准差,为样本均数。X 三、标准差的应用 表示观察值的变异程度(或离散程度) 。 在两组(或几组)资料均数相近、度量单位相同的条件下,标准差大,表示观察值的变 异度大,即各观察值离均数较远,均数的代表性较差 ; 反之,表示各观察值多集中在均数周 围,均数的代表性较好。 (常考!) 四、医学参考值的计算方法,单双侧问题,医学为 95 医学参考值是指正常人体或动物体的各种生理常数, 由于存在变异, 各种数据不仅因人 而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其波动的范围,即正 常值范围。 医学参考值的计算公式:正态分布资料 95医学参考

5、值:1.96s(双侧) ;XX +1.645s 或-1.645s(单侧) ,s 为标准差。百分位数法 P2.5和 P97.5(双侧) ;P5或 P95(单X 侧) 。 第三节 数值变量数据的统计推断(重要考点) 一、标准误,标准误与标准差和样本含量的关系 标准差和标准误的区别。 样本标准误等于样本标准差除以根号下样本含量。标准误与标准差成正比 ; 与样本含量 的平方根成反比。因此。为减少抽样误差,应尽可能保证足够大的样本含量。 样本标准差与样本标准误是既有联系又有区别的两个统计量,二者的联系是公式 : 二者 的区别在于:样本标准差是反映样本中各观测值 X1,X2,Xn变异程度大小的一个指 标,

6、 它的大小说明了对该样本代表性的强弱。 样本标准误是样本平均数 1, 2,的标准差, 它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。 (掌握!) 二、t 分布和标准正态 u 分布关系 均以 0 为中心左右两侧完全对称的分布,只是 t 分布曲线顶端较 u 分布低,两端翘。 (v 逐渐增大,t 分布逐渐逼近 u 分布) 。 正态分布的特点:以均数为中心左右两侧完全对称分布;两个参数,均数 u(位置 参数)和 s(变异参数) ;对称均数的两侧面积相等。 三、总体均数的估计 样本统计量推算总体均数有两个重要方面 : 区间估计和假设检验。样本均数估计总体均 数称点估计。 总体均数

7、区间估计(可信区间)的概念:按一定的可信度估计未知总体均数所在范围。 其统计上习惯用 95(或 99) 可信区间表示总体均数有 95(或 99) 的可能在某一 范围。可信区间的两个要素,一为准确度,反映在可信度 1-的大小,即区间包含总体均 数的概率大小,当然愈接近 1 愈好 ; 二是精度,反映在区间的长度,当然长度愈小愈好。在 样本例数确定的情况下,二者是矛盾的,需要兼顾。 总体均数可信区间的计算方法: 1.当 n 小按 t 分布的原理用式计算可信区间为:t/2,vSXX 2.当 n 足够大 因 n 足够大时,t 分布逼近分布,按正态分布原理。用式估计可信区 间为:/2SX X 可信区间与医

8、学参考值范围的区别:二者的意义和算法不同。 四、假设检验的步骤 1.建立假设 : H0(无效, 两样本代表的总体均数相同) , H1(备择, 两样本来自不同总体) , 当拒绝 H0就接受 H1,不拒绝就不接受 H1。 2.确定显著性水平:区分大概率和小概率事件的标准,通常取=0.05。 3.计算统计量:根据资料类型和分析目的选择适当的公式计算。 4.确定概率 P 值:将计算得到的 t 值或 u 值查界值表得到 P 值和值比较。 5.做出推断结论。 t值、P 值与统计结论 t值P 值统计结论 0.050.05不拒绝 H0,差别无统计学意义 0.05t0.05(v)0.05拒绝 H0,接受 H1,

9、差别有统计学意义 0.01t0.01(v)0.01拒绝 H0,接受 H1,差别有高度统计学意义 五、两均数的假设检验(常考!) 1.样本均数与总体均数比较 u 检验和 t 检验用于样本均数与总体均数的比较。理论上 要求样本来自正态分布总体实际中,只要样本例数 n 较大,或 n 小但总体标准差已知,就 选用 u 检验。n 较小且未知时,用于 t 检验。两样本均数比较时还要求两总体方差等。 X S t X 以算得的统计量 t,按表所示关系作判断。 2.配对资料的比较 在医学研究中,常用配对设计。配对设计主要有四种情况:同一 受试对象处理前后的数据;同一受试对象两个部位的数据;同一样品用两种方法(仪

10、器 等)检验的结果 ; 配对的两个受试对象分别接受两种处理后的数据。情况的目的是推断 其处理有无作用;情况、的目的是推断两种处理(方法等)的结果有无差别。 nSS t dd / d0d v=对子数-1;如处理前后或两法无差别,则其差数 d 的总体均数应为 0,可看作样本均 数和总体均数0的比较。为差数的均数 ;为差数均数的标准误, Sd为差数的标准差 ; ndd d S 为对子数。因计算的统计量是 t,按表所示关系作判断。 3.完全随机设计的两样本均数的比较 亦称成组比较。目的是推断两样本各自代表的总 体均数1与2是否相等。根据样本含量 n 的大小,分 u 检验与 t 检验。 t 检验用于两样

11、本含量 n1、n2较小时,且要求两总体方差相等,即方差齐。若被检验的 两样本方差相差显著则需用 t检验。 u 检验:两样本量足够大,n50。 2 XX X X 21 1 S t = 21 XX S )( 21 212 C nn nn S 2- 1)-(1)-( 21 1 2 21 2 12 C nn nSnS S v=(n1-1)+(n2-1)=n1+n2-2 式中,为两样本均数之差的标准误,Sc2为合并估计方差(combined estimate 21 XX S variance) 。算得的统计量为 t,按表所示关系做出判断。 4.型错误和型错误 弃真,拒绝正确的 H0为型错误表示,若显著性

12、水平定 为 0.05,则犯型错误的概率 0.05;接受错误的 H0为型错误,概率用表示,值的大 小很难确切估计。当样本含量一定时,两者反比,增大 n,当一定时,可减少。1-称 为检验效能或把握度,其统计意义是若两总体确有差别,按水准能检出其差别的能力。 客观实际 拒绝 H0 不拒绝 H0 H0成立 型错误() 推断正确 1- H0不成立 推断正确(1-) 型错误() 5.假设检验注意事项 保证组间可比性;根据研究目的、资料类型和设计类型选用适当 的检验方法,熟悉各种检验方法的应用条件 ; “显著与否”是统计学术语,为“有无统计学 意义” ,不能理解为“差别是不是大” ;结论不能绝对化。 第四节

13、 分类变量资料的统计描述(一般考点) 相对数是两个有关联事物数据之比。常用的相对数指标有构成比、率、相对比等。 一、构成比 表示事物内部各个组成部分所占的比重,通常以 100 为例基数,故又称为百分比。其公 式如下: 构成比100 一一一一一一一一一一一一一一一 一一一一一一一一一一一一一一 该式可用符号表达如下: 构成比100 CBA A 构成比有两个特点: (1)各构成部分的相对数之和为 100. (2)某一部分所占比重增大,其他部分会相应地减少。 二、率 用以说明某种现象发生的频率或强度, 故又称频率指标, 以 100, 1000, 10000 或 100000 为比例基数(K)均可,原

14、则上以结果至少保留一位整数为宜,其计算公式为: 率和构成比不同之处:率的大小仅取决于某种现象的发生数和可能发生该现象的总数, 不受其他指标的影响,并且各率之和一般不为 1。 率K 一一一一一一一一一一 一一一一一一一一一 该式亦可用符号表达如下 阳性率K(若算阴性率则分子为 A(-) )()( )( AA A 式中 A(+)为阳性人数,A(-)为阴性人数。 三、相对比 表示有关事物指标之对比,常以百分数和倍数表示,其公式为: 相对比:甲指标/乙指标(或100) 或用符号表示为:A/BK 四、注意事项 构成比和率的不同,不能以比代率;计算相对数时,观察例数不宜过小;率的比 较注意可比性,特别是混

15、杂因素的问题,有的话,可用标准化法和分层分析消除 ; 观察单 位不同的几个率的平均率不等于几个率的算术均数;样本率或构成比的比较应做假设检 验。 第五节 分类变量资料的统计推断(非常重要) 一、率的抽样误差 用抽样方法进行研究时, 必然存在抽样误差。 率的抽样误差大小可用率的标准误来表示, 计算公式如下: p= n )(1 式中:p为率的标准误,为总体阳性率,n 为样本含量。因为实际工作中很难知道 总体阳性率,故一般采用样本率 P 来代替,而上式就变为 Sp= n P)P(1 二、总体率的可信区间 由于样本率与总体率之间存在着抽样误差, 所以也需根据样本率来推算总体率所在的范 围,根据样本含量

16、 n 和样本率 P 的大小不同,分别采用下列两种方法: (一)正态近似法(常考!) 当样本含量 n 足够大,且样本率 P 和(1-P)均不太小,如 nP 或 n(1-P)均5 时,样 本率的分布近似正态分布。则总体率的可信区间可由下列公式估计: 总体率()的 95可信区间:p1.96sp 总体率()的 99可信区间:p2.58sp (二)查表法 当样本含量 n 较小,如 n50,特别是 P 接近 0 或 1 时,则按二项分布 原理确定总体率的可信区间, 其计算较繁, 读者可根据样本含量 n 和阳性数 x 参照专用统计 学介绍的二项分布中 95可信限表。 三、u 检验(非常重要!) 当样本含量 n 足够大,且样本率 P 和(1-P)均不太小,如 nP 或 n(1-P)均5 时,样 本率的分布近似正态分布。样本率和总体率之间、两个样本率之间差异的判断可用 u 检验。 1.样本率和总体率的比较公式 u=P-/P=P-/;n)/(1 2.两样本率比较公式 u=P1-P2/Sp1-P2=P1-P2/)1/)(1/(1 21 nnpp

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号