卫生统计学重点笔记

上传人:cl****1 文档编号:512558690 上传时间:2023-12-01 格式:DOCX 页数:15 大小:31.18KB
返回 下载 相关 举报
卫生统计学重点笔记_第1页
第1页 / 共15页
卫生统计学重点笔记_第2页
第2页 / 共15页
卫生统计学重点笔记_第3页
第3页 / 共15页
卫生统计学重点笔记_第4页
第4页 / 共15页
卫生统计学重点笔记_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《卫生统计学重点笔记》由会员分享,可在线阅读,更多相关《卫生统计学重点笔记(15页珍藏版)》请在金锄头文库上搜索。

1、医师资格考试蓝宝书-预防医学之答禄夫天创作创作时间:二零二一年六月三十日医学统计学方法第一节 基本概念和基本步伐(非常重要)一、统计工作的基本步伐 设计(最关键、决定成败)、搜集资料、整理资料、分析资 料.总体:根据研究目的决定的同质研究对象的全体, 确切地说, 是性质相同的所有观察单元某一变量值的集合.总体的指标为参数 实际工作中 , 经常是从总体中随机抽取一定命量的个体 , 作 为样本, 用样本信息来推断总体特征.样本的指标为统计量.由于总体中存在个体变异 , 抽样研究中所抽取的样本 , 只包 括总体中一部份个体, 这种由抽样引起的不同称为抽样误差.抽样 误差愈小, 用样本推断总体的精确度

2、愈高;反之, 其精确度愈低.小概率事件.二、变量的分类变量:观察单元的特征, 分数值变量和分类变量.第二节 数值变量数据的统计描述(重要考点)一、描述计量资料的集中趋势的指标有1. 均数 均数是算术均数的简称 , 适用于正态或近似正态分布.2. 几何均数 适用于等比资料 , 尤其是对数正态分布的计量 资料.对数正态分布即原始数据呈偏态分布, 经对数变换后(用原 始数据的对数值lgX取代X)服从正态分布,观察值不能为0,同 时有正和负.3. 中位数 一组按年夜小顺序排列的观察值中位次居中的数 值.可用于描述任何分布, 特别是偏态分布资料的集中位置, 以及 分布不明或分布末端无确定命据资料的中心位

3、置.不能求均数和几 何均数, 但可求中位数.百分位数是个界值, 将全部观察值分为两 部份,有X%比小,剩下的比年夜,可用于计算正常值范围.二、描述计量资料的离散趋势的指标1. 全距和四分位数间距.2. 方差和标准差 最为经常使用, 适于正态分布, 既考虑了 离均差(观察值和总体均数之差) , 又考虑了观察值个数 , 方差 使原来的单元酿成了平方, 所以开方为标准差.均为数值越小, 观 察值的变异度越小.3. 变异系数 多组间单元分歧或均数相差较年夜的情况.变异 系数计算公式为:CV=s/x X 100%,公式中s为样本标准差,X为 样本均数.三、标准差的应用暗示观察值的变异水平(或离散水平).

4、 在两组(或几组)资料均数相近、怀抱单元相同的条件下 , 标准差年夜, 暗示观察值的变异度年夜, 即各观察值离均数较远, 均数的代表性较差;反之 , 暗示各观察值多集中在均数周围 , 均 创作时间:二零二一年六月三十日数的代表性较好.(常考!)四、医学参考值的计算方法, 单双侧问题,医学为95 医学参考值是指正凡人体或植物体的各种生理常数 , 由于存 在变异, 各种数据不单因人而异, 而且同一个人还会随机体内外 环境的改变而改变, 因而需要确定其摆荡的范围,即正常值范围.医学参考值的计算公式:正态分布资料95%医学参考值: X 1.96s (双侧);XX-1.645s (单侧),s为标准差.百

5、分 位数法P和P (双侧);P或P (单侧).595第三节 数值变量数据的统计推断(重要考点)一、标准误,标准误与标准差和样本含量的关系 标准差和标准误的区别.样本标准误即是样本标准差除以根号下样本含量.标准误与标 准差成正比;与样本含量的平方根成反比.因此.为减少抽样误差, 应尽可能保证足够年夜的样本含量.样本标准差与样本标准误是既有联系又有区另外两个统计量, 二者的联系是公式:二者的区别在于:样本标准差是反映样本中 各观测值X2,,X,变异水平年夜小的一个指标,它的年夜 小说明了对该样本代表性的强弱 .样本标准误是样本平均数 1, 2, 的标准差, 它是抽样误差的估计值, 其年夜小说明了样

6、本 间变异水平的年夜小及精确性的高低.(掌握!)二、t分布和标准正态u分布关系均以0为中心左右两侧完全对称的分布,只是t分布曲线顶 端较u分布低,两端翘.(V逐渐增年夜,t分布逐渐迫近u分 布).正态分布的特点:以均数为中心左右两侧完全对称分布;两个参数,均数u (位置参数)和s (变异参数);对称均数的两正面积相等.三、总体均数的估计 样本统计量推算总体均数有两个重要方面:区间估计和假设 检验.样本均数估计总体均数称点估计.总体均数区间估计(可信区间)的概念:按一定的可信度估 计未知总体均数所在范围.其统计上习惯用 95(或 99)可信 区间暗示总体均数有95%(或99%)的可能在某一范围.

7、可信 区间的两个要素,一为准确度,反映在可信度1-a的年夜小,即 区间包括总体均数的概率年夜小, 固然愈接近1愈好;二是精度, 反映在区间的长度, 固然长度愈小愈好.在样本例数确定的情况下 二者是矛盾的, 需要兼顾.总体均数可信区间的计算方法:a /21. 当 n 小按 t 分布的原理用式计算可信区间为:vS X2. 当n足够年夜 因n足够年夜时,t分布迫近口分布,按 正态分布原理用式估计可信区间为:X 土叽3x可信区间与医学参考值范围的区别:二者的意义和算法分歧四、假设检验的步伐1. 建立假设: H (无效, 两样本代表的总体均数相同) , H 01(备择,两样原本自分歧总体),当拒绝H就接

8、受H,不拒绝就 01不接受H1.2. 确定显著性水平:区分年夜概率和小概率事件的标准 , 通 常取 a =0.05.3. 计算统计量:根据资料类型和分析目的选择适当的公式计 算.4. 确定概率P值:将计算获得的t值或u值查界值表获得P 值和a值比力.5. 做出推断结论.I t丨值、P值与统计结论a丨t丨值P值统计结论tO.O5 (v)不拒绝H0,分歧无统计学意义三tO.O5 (v)wU拒绝H0,接受分歧有统计学意义三tO.Ol (v)w01、样本均数与总体均数比力 u 检验和 t 检验用于样本均数 与总体均数的比力.理论上要求样原本自正态分布总体实际中, 只 要样本例数n较年夜,或n小但总体标

9、准差。已知,就选用u检 验.n较小且。未知时,用于t检验.两样本均数比力时还要求两 总体方差等.以算得的统计量t,按表所示关系作判断. 配对资料的比力 在医学研究中, 经常使用配对设计.配对 设计主要有四种情况:同一受试对象处置前后的数据;同一 受试对象两个部位的数据;同一样品用两种方法(仪器等)检 验的结果;配对的两个受试对象分别接受两种处置后的数据.情 -per.拒绝H0.接受H,分歧有高度统计学意义五、两均数的假设检验(常考!)况的目的是推断其处置有无作用;情况、的目的是推断两种处置(方法等)的结果有无分歧.V二对子数-1 ;如处置前后或两法无分歧,则其差数d的总体 均数应为0,可看作样

10、本均数d和总体均数0的比力.d为差数的均 数;s-为差数均数的标准误,S为差数的标准差;n为对子数.因 dd计算的统计量是t,按表所示关系作判断.3. 完全随机设计的两样本均数的比力 亦称成组比力.目的是 推断两样本各自代表的总体均数口与口是否相等.根据样本含量12n的年夜小,分u检验与t检验.t检验用于两样本含量n、n较小时,且要求两总体方差相等,12即方差齐.若被检验的两样本方差相差显著则需用亡 检验.u检验:两样本量足够年夜,n50.=lc ,n + n 、SX1 -X2SC (吋)v=(n -1)+(n -1)=n +n -21 2 1 2式中s-,为两样本均数之差的标准误,SC2为合

11、并估计方差X! - X 2(combined est ima te variance).算得的统计量为t,按表所示 关系做出判断.4.1型毛病和II型毛病 弃真,拒绝正确的H为I型毛病a0暗示,若显著性水平a定为0.05,则犯I型毛病的概率0.05;接受毛病的H为II型毛病,概率用B暗示,B值的年夜小很难确切 0估计.当样本含量一按时,两者反比,增年夜n,当a按时,可减少B.1-B称为检验效能或掌控度,其统计意义是若两总体确有 分歧,按a水准能检出其差另外能力.客观实际 拒绝 H 不0拒绝 H0H成立I型毛病(a)推断正0确 1-aH不成立推断正确(1-B)II0型毛病(B)5.假设检验注意事

12、项 保证组间可比性;根据研究目的、资 料类型和设计类型选用适当的检验方法 , 熟悉各种检验方法的应 用条件;“显著与否”是统计学术语 , 为“有无统计学意义” , 不能理解为“分歧是不是年夜”;结论不能绝对化.第四节 分类变量资料的统计描述(一般考点) 相对数是两个有关联事物数据之比.经常使用的相对数指标有 构成比、率、相比较等.一、构成比暗示事物内部各个组成部份所占的比重, 通常以 100 为例基 数, 故又称为百分比.其公式如下:构成比=一 事物内部某一构成部分的个体数 x 100%事物内部各构成部分的个体数总和该式可用符号表达如下:构成比=A X100%A + B + C +构成比有两个

13、特点: (1)各构成部份的相对数之和为100%.(2)某一部份所占比重增年夜, 其他部份会相应地减少.*二、率用以说明某种现象发生的频率或强度, 故又称频率指标, 以 100, 1000, 10000或100000为比例基数(K)均可,原则上以结 果至少保管一位整数为宜,其计算公式为:率和构成比分歧之处:率的年夜小仅取决于某种现象的发生 数和可能发生该现象的总数, 不受其他指标的影响, 而且各率之 和一般不为1.率=某现象实际发生例数 x K可能发生某现象的总数该式亦可用符号表达如下阳性率=A(+) xK (若算阴性率则分子为A )A(+)+ A(_)(-)式中A 为阳性人数,A 为阴性人数.

14、(+) (-)三、相比较暗示有关事物指标之比较, 常以百分数和倍数暗示, 其公式 为:相比较:甲指标/乙指标(或X100%)或用符号暗示为:A/BXK四、注意事项构成比和率的分歧,不能以比代率;计算相对数时,观 察例数不宜过小;率的比力注意可比性,特别是混杂因素的问 题,有的话,可用标准化法和分层分析消除;观察单元分歧的 几个率的平均率不即是几个率的算术均数;样本率或构成比的 创作时间:二零二一年六月三十日比力应做假设检验.第五节 分类变量资料的统计推断(非常重要)、率的抽样误差用抽样方法进行研究时肯定存在抽样误差.率的抽样误差年夜小可用率的标准误来暗示计算公式如下:0:n(l + n)p=

15、厂n为总体阳性率,n为样本含量.因式中:。为率的标准误,p为实际工作中很难知道总体阳性率n,故一般采纳样本率P来取 代, 而上式就酿成S : P(l- P)p=n二、总体率的可信区间由于样本率与总体率之间存在着抽样误差, 所以也需根据样 本率来推算总体率所在的范围,根据样本含量n和样本率P的年 夜小分歧, 分别采纳下列两种方法:(一)正态近似法(常考!)当样本含量n足够年夜,且样本率卩和(1-P)均不太小,如nP或n (1-P)均25时,样本率的分布近似正态分布.则总体率的可信区间可由下列公式估计:总体率(n)的95%可信区间:p土p总体率(n)的99%可信区间:p土p(二)查表法 当样本含量n较小,如nW50,特别是P接 近0或1时, 则按二项分布原理确定总体率的可信区间, 其计算 较繁,读者可根据样本含量n和阳性数x参照专用统计学介绍的 二项分布中95可信限表.三、u检验(非常重要!)当样本含

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号