2021年全科主治基础知识讲义4医学统计学方法

上传人:ya****8 文档编号:333424271 上传时间:2022-09-02 格式:PDF 页数:22 大小:1.23MB
返回 下载 相关 举报
2021年全科主治基础知识讲义4医学统计学方法_第1页
第1页 / 共22页
2021年全科主治基础知识讲义4医学统计学方法_第2页
第2页 / 共22页
2021年全科主治基础知识讲义4医学统计学方法_第3页
第3页 / 共22页
亲,该文档总共22页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《2021年全科主治基础知识讲义4医学统计学方法》由会员分享,可在线阅读,更多相关《2021年全科主治基础知识讲义4医学统计学方法(22页珍藏版)》请在金锄头文库上搜索。

1、1 医学统计学方法医学统计学方法 知识点知识点 1 1统计学概述统计学概述 统计学中的基本概念 总体和样本:总体:是根据研究目的而确定的同质同质的研究对象的集合。换句话:同质的所有观察单位某一变量值的集合。分为有限总体和无限总体。样本:是指从总体中随机抽取的有代表性随机抽取的有代表性的一部分观察单位的集合。同质:指被研究指标的影响因素完全相同。是科学研究的基础,是相对的。变异:是同质基础上的个体差异。是绝对的。统计的任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律。统计数据具有变异的特征。统计数据具有变异的特征。概率:概率:随机事件发生可能性的大小,

2、P0,1。小概率事件:P P0.0.0505 或或 P P0.0.0101 为小概率为小概率。统计学认为小概率事件在一次试验中不大可能发生。小概率事件原理是统计推断的基本原理之一。参数和统计量:参数:总体的指标。,统计量:样本的指标。,p,s,t,F,M 变量及其分类 变量的概念:变量:观察单位的某种特征。也叫作观察指标。变量值:对变量观察或测量的结果。变量的分类:分析内容分类 可将变量分为因素性变量和结果性变量。如在病人生命质量调查问卷中,反映生命质量的各条目得分是结果性变量,而与生命质量有关的年龄、性别、经济收入即为因素性变量。因素性变量也常常作为分组变量。按变量性质分类 数值变量和分类变

3、量数值变量和分类变量。数值变量(或称定量变量、定量指标):变量值是连续的,通常有度量衡单位。分类变量(或称定性变量、定性指标):变量值是间断的,通常没有度量衡单位,表现为两种或多种互不相容的属性或程度上的大小。分类变量资料又可分为计数资料和等级资料。计数资料是将观察单位按事物的某种属性或类别分组,再计数各组的观察单位数,如性别;等级资料是将观察单位按事物某种属性的不同程度分组,再计数各组的观察单位数,它的分组是按等级排序的,故也称之为半定量资料,如尿蛋白检测结果。资料类型的转换:一般来说,定量的资料,即数值变量资料可转移为分类变量或等级变量的资料。资料的类型只能从定量向半定量或定性转换,或者从

4、半定量向定性转换,无法反向转换。例如:研究北京 2012 年正常成年男性的血压值。研究对象 观察单位 变量 变量值 同质 变异 有限总体 总体 样本 参数 统计量 2 统计学工作基本步骤 1.设计,最为重要 2.搜集资料 3.整理资料 4.分析资料:包括统计描述和统计推断 【例题】以下关于变量说法正确的是 A.测定 60 名正常成年女性血小板数所得资料只能是计量资料 B.分类变量也可以转化为数值变量 C.定性资料可以转换为半定量资料 D.结果性变量一般为分组变量 E.变量就是观察指标 正确答案E 【例题】以下说法不正确的是 A.变量是由变量名和变量值组成 B.统计工作步骤中最重要的是设计 C.

5、概率可描述某随机事件发生可能性大小 D.样本应该具有一定代表性 E.总体的指标称为统计量 正确答案E 知识点知识点 2 2资料特征的描述性分析资料特征的描述性分析 定量资料的统计描述 统计描述是通过图表或统计指标,对数据资料进行整理、分析,并对数据的分布状态、数字特征进行估计和描述的方法。集中趋势的描述 平均数是用于描述一组同质的数值变量集中趋势的一个指标系列,它反映一组变量值的平均水平。医学研究中常用的平均数有算术均数、几何均数、中位数算术均数、几何均数、中位数。3 120 名 12 岁健康男孩身高的频数分布 1.1.算数均数算数均数 ,适用于正态分布或近似正态分布资料 表 123 名糖尿病

6、患者餐后 2 小时血糖均数的计算(加权法)组段(g/g)(1)频数 f(2)组中值 x(3)fx(4)=(2)(3)7.0 10.0 13.0 16.0 19.0 22.0 3 7 11 17 25 26 8.5 11.5 14.5 17.5 20.5 23.5 25.5 80.5 159.5 297.5 512.5 611.0 续表 组段(g/g)(1)频数 f(2)组中值 x(3)fx(4)=(2)(3)25.0 28.0 31.0 34.037.0 15 9 6 4 26.5 29.5 32.5 35.5 397.5 265.5 195.0 142.0 合计 123 2686.5 2.2

7、.几何均数几何均数 G G 适用于对数正态分布或等比资料 4 测得 5 人的血清 IgG 抗体滴度为 1:20,1:40,1:80,1:40,1:20,求其平均抗体滴度。3.3.中位数中位数 M M 适用于偏态分布资料 151 例慢性胃炎患者住院时间的中位数(d)计算 住院天数 频数 累计频数 累计频率(%)0-70 70 46.36 15-54 124 82.12 30-16 140 92.72 45-5 145 96.03 60-4 149 98.68 75-1 150 99.34 90-0 150 99.34 105-115 1 151 100.00 4.4.百分位数百分位数 P P 以

8、 Px 表示,一个百分位数 Px 将总体或样本的全部观察值分成两部分,理论上有的观察值 x%比它小,有(100-x)%的观察值比它大。5.5.平均数指标的正确应用平均数指标的正确应用 集中趋势指标 应用条件 算数均数 正态分布或近似正态分布资料 几何均数 G 对数正态分布或等比资料 中位数 M 偏态分布资料 离散趋势的描述【例】三组同性别、同年龄儿童的体重(kg)如下,分析其集中趋势与离散趋势。5 1.极差 R R=R=最大值最大值-最小值最小值 它适用于任何分布类型的资料。但因其只受两侧极端值的影响,故反映一组观察值的变异程度时较粗糙,也不够稳定。未考虑到抽样误差。2.2.四分位数间距四分位

9、数间距 Q Q Q=P75-P25Q=P75-P25 缩小一半观察单位的极差,也未考虑到抽样误差。该指标的适用条件同中位数,而且通常与中位数结合,全面描述偏态分布或总体分布不明资料的特征。3.方差2 和标准差 实际考虑到抽样误差标准差。适用条件与均数相同,而且通常与均数结合描述正态或近似正态分布资实际考虑到抽样误差标准差。适用条件与均数相同,而且通常与均数结合描述正态或近似正态分布资料的特征。标准差越大,说明变量值越分散。料的特征。标准差越大,说明变量值越分散。【例】中甲、丙两组数据的标准差 甲组 n=5,X=26+28+30+32+34=150 X2=262+282+302+322+342=

10、4540 同理,丙组 n=5,X=150,X2=4534,s=2.92(kg)4.变异系数 CV 适用于度量衡不同或均数相差悬殊时变异的比较适用于度量衡不同或均数相差悬殊时变异的比较【例】某地 20 岁男子 100 名,其身高均数为 166.06(cm),标准差为 4.95(cm);体重均数为 53.72(kg),标准差为 3.96(kg)。欲比较身高与体重的变异度何者为大。6 身高 CV=4.95/166.06x100%=2.98%体重 CV=3.96/53.72x100%=7.37%正态分布及其应用 1.正态分布的基本概念和特征 正态分布是以均数为中心,低于均数的人数与高于均数的人数大致相

11、等,越接近均数,人数越多,离均数越远,人数逐渐减少,形成了以均数为中心两侧基本对称的钟形分布。这种资料在医学现象中很常见,称为正态分布。正态分布具有下列特征:正态分布具有下列特征:(1)正态曲线在横轴上方,均数处最高。(2)正态分布以均数为中心,左右对称。(3)正态分布有两个参数,即均数与标准差。是位置参数,是变异度参数。(4)正态曲线下的面积具有一定的分布规律。2.正态分布的面积分布规律 面积规律 正态分布正态分布 标准正态分布标准正态分布 面积(或概率)面积(或概率)7-1-1+1+1 -1-1+1+1 68.27%68.27%-1.96-1.96+1.96+1.96 -1.96-1.96

12、+1.96+1.96 95.00%95.00%-2.58-2.58+2.58+2.58 -2.58-2.58+2.58+2.58 99.00%99.00%3.正态分布的应用(1)正态分布是很多统计方法的理论基础;(2)估计医学参考值范围;正态分布法 百分位数法 P2.5P97.5 定性资料的统计描述 1.相对数(1)率率 表示某事件发生的频率或强度,例如发病率,死亡率;表示某事件发生的频率或强度,例如发病率,死亡率;(2)构成比:比较各类别可能发生的频率分布,构成比:比较各类别可能发生的频率分布,其特征之一是合计值为其特征之一是合计值为 1 1。(3)相对比相对比 表示两个有关指标之比;表示两

13、个有关指标之比;2.2.应用相对数注意事项应用相对数注意事项(1 1)计算相对数时,分母应该足够大;)计算相对数时,分母应该足够大;(2 2)正确计算合计率;)正确计算合计率;(3 3)率和构成比不要混淆;)率和构成比不要混淆;(4 4)相对数比较应该注意其可比性,或标准化后再进行比较;)相对数比较应该注意其可比性,或标准化后再进行比较;【例题】关于相对数描述错误的是 A.率是反应发生强度的指标 B.计算合计率可将分率相加除以分率个数 C.各个构成比之和肯定等于 1 D.比可以是绝对数之比,也可是率之比 E.粗率之间不宜直接比较 正确答案B 【例题】适于用中位数与四分位数间距描述的资料是 A.

14、偏态分布资料 B.对称分布资料 C.负偏态分布资料 D.正态分布资料 E.正偏态分布资料 正确答案A 8 【例题】不属于变异指标的是 A.中位数 B.标准差 C.全距 D.四分位间距 E.变异系数 正确答案A 【例题】A.算术均数表示其平均水平;B.中位数表示其平均水平;C.几何均数表示其平均水平;D.众数表示其平均水平;E.百分位数表示其平均水平 (1)食物中毒的潜伏期最常以 正确答案B (2)血红蛋白含量最常以 正确答案A (3)血清抗体滴度资料最常以 正确答案C 知识点知识点 3 3资料的统计推断资料的统计推断 抽样误差与标准误 在同一总体中做随机抽样,因抽样而造成的样本指标与总体参数之

15、差或样本指标与样本指标之差称为抽样误差。抽样误差属于随机误差,它是客观存在的、不可避免的,但可加以控制,可以用统计学方法估计其大小。描述抽样误差大小的指标是标准误。均数的标准误 由于抽样而造成的样本均数与总体均数及样本均数之间的差异。标准误含义为样本均数的标准差。用途:衡量抽样误差的大小;估计总体均数的置信区间 率的标准误 与均数的标准误类似,它可反映样本率抽样误差的大小。9 要增强样本指标对总体指标的代表性,最为有效的方法是适当增大样本含量。均数的假设检验常用方法 假设检验的基本思想和基本步骤 基本思想:反证法思想和小概率思想。【例题】为研究山区成年男子的脉搏数是否高于一般成年男子的脉搏数,

16、某医生在某山区随机调查了25 名健康成年男子,求得其脉搏均数为 74.2 次/分,标准差为 6.0 次/分。根据大量调查,已知健康成年男子脉搏的均数为 72 次/分,能否根据此调查认为山区成年男子的脉搏均数高于一般成年男子的脉搏均数?(1)建立假设和设定检验水准 H0:=0 无效假设,74.2 由于抽样误差造成 H1:0 备择假设,由于山区造成不同=0.05(2)计算统计量 (3)确定 P 值,作出推断结论 按=0.05 不拒绝 H0,尚不能认为该山区健康成年男子脉搏均数与一般健康成年男子的脉搏均数不同。均数比较的假设检验 可选择的方法有 u 检验、t 检验、方差分析等,每一类方法中又可因设计类型或分析目的的不同而有不同的检验方法,需正确选择。Z 检验 用于总体标准差已知,或大样本,两资料比较,且二者均符合正态分布。t 检验 用于总体标准差未知,或小样本,两资料比较,且二者均符合正态分布。t 检验 (1)样本均数与总体均数的比较 小样本,两者比较,正态分布【例题】为研究山区成年男子的脉搏数是否高于一般成年男子的脉搏数,某医生在某山区随机调查了25 名健康成年男子,求得其脉搏均数为 74

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号