医学统计学方法及试题分析.doc

上传人:hs****ma 文档编号:547620969 上传时间:2024-03-30 格式:DOC 页数:20 大小:72.51KB
返回 下载 相关 举报
医学统计学方法及试题分析.doc_第1页
第1页 / 共20页
医学统计学方法及试题分析.doc_第2页
第2页 / 共20页
医学统计学方法及试题分析.doc_第3页
第3页 / 共20页
医学统计学方法及试题分析.doc_第4页
第4页 / 共20页
医学统计学方法及试题分析.doc_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《医学统计学方法及试题分析.doc》由会员分享,可在线阅读,更多相关《医学统计学方法及试题分析.doc(20页珍藏版)》请在金锄头文库上搜索。

1、新阳光执业医师考试题库http:/第二单元医学统计学方法第一节基本概念和基本步骤(一)考什么?基本概念1.总体和样本2.同质和变异3.参数和统计量4.抽样误差5.概率6.变量和变量值基本步骤(二)最重点是什么?基本概念(三)最难点的是什么?抽样误差概率一、统计学中的几个基本概念1.总体:根据研究目的确定的、同质的全部研究对象(严格地讲,是某项观察值的集合)被称作总体。有限总体:总体中的个体数有限,如研究2008年中国60岁以上的老人血清总胆固醇含量,测定值的全部构成了一个总体。无限总体:总体中的个体数无限(或假设总体,或虚拟总体)。如研究糖尿病人的空腹血糖测定值,由于对时间和空间未加限制,全部

2、糖尿病人的空腹血糖测定值则是一个无限总体。2.样本:根据随机化的原则从总体中抽出的有代表性的一部分观察单位组成的子集称作样本,如从糖尿病患者中随机抽取的有代表性的一组患者构成样本。3.同质:严格地讲,除了实验因素外,影响被研究指标的非实验因素相同被称为同质。但在人群健康的研究中有些非实验因素是难以控制或未知的,如遗传、营养、心理等。因此,在实际研究工作中,对被观测指标有影响的、主要的、可控制的非实验因素达到相同或基本相同就可以认为是同质。同质是研究的前提。4.变异:在同质的基础上被观察个体之间的差异被称作变异。如同性别、同年龄、同地区、同体重儿童的肺活量有大有小,我们称之为肺活量的变异。这是统

3、计数据的特性:变异性。5.参数:总体的统计指标称为参数,一般用希腊字母表示,如:m、s、。如通过普查得到中国25岁以上的成年人高血压患病率为参数。6.统计量:样本的统计指标称为统计量,如: s、 、p。如用随机的方法抽出一部分地区25岁以上的人进行体检,计算的患病率则为样本统计量。7.误差:观察值与实际值的差别为误差。观察过程中由于不认真仔细,造成错误地判断、记录或录入计算机所致的观察值与实际值之差为过失误差;仪器若未经校准,使观察值统一的都偏低或偏高则为系统误差;由于偶然的因素使同一个样品的测定值在不同的观察者之间、相同观察者的若干次观察值之间不完全相同。则被称作随机测量误差;从同一总体中抽

4、样,得到某变量值的统计量和总体参数之间有差别,被称为抽样误差。8.概率:描述随机事件(如发病)发生可能性大小的度量为概率,常用P表示。P值的范围在0和1之间,P0.05的随机事件,通常称作小概率事件,即事件发生的可能性很小,统计学上可以认为在一次抽样是不可能发生的。9.变量及变量值:观察对象的特征或指标(如身高)称为变量。测量的结果被称为变量值(如身高值)。数值变量:变量值是定量的,表现为数值的大小,有度量衡单位。(计量资料)如:身高(cm)、体重(kg)分类变量:变量值是定性的,表现为互不相容的类别或属性。(计数资料)无序分类变量:各类别间无程度上的差别,如:性别分男女两类有序分类变量:各类

5、别间有程度上的差别,如:临床疗效可分为治愈、显效、好转、无效四级二、统计工作的基本步骤医学统计工作基本步骤有四:设计、搜集资料、整理和分析资料。这四个步骤是相互联系的。1.设计:统计工作最关键的一步,整个研究工作的基础。2.搜集资料:指选择得到资料的最佳途径和获取完整、准确、可靠资料的过程。3.整理资料:资料整理的目的是将搜集到的原始资料系统化、条理化,便于进一步计算统计指标和深入分析。4.分析资料:根据研究设计的目的、要求、资料的类型和分布特征选择正确的统计方法进行分析。常常从两个方面分析,一是进行统计描述,即计算平均值、发病率等;二是进行统计推断,即推断总体的特征,如推断总体均数等。【习题

6、】1.样本是总体的A.有价值的部分B.有意义的部分C.有代表性的部分D.任意一部分E.典型部分 答疑编号500744020101正确答案C2.在统计学中,数值变量构成A.等级资料B.计数资料C.计量资料D.分类变量E.定性因素 答疑编号500744020102正确答案C3.统计学数据具有的特性A.稳定性B.可加性C.主观性D.变异性E.可靠性 答疑编号500744020103正确答案D4.统计工作的步骤不包括A.统计设计B.搜集资料C.分析资料D.整理资料E.题目的制定 答疑编号500744020104正确答案E5.(B1型题)A.获得原始资料B.统计设计C.统计归纳,进行分组和汇总D.撰写文

7、章E.计算统计指标,选择合适的检验方法并作出恰当的结论(1)收集资料是: 答疑编号500744020105正确答案A(2)整理资料是: 答疑编号500744020106正确答案C(3)分析资料是: 答疑编号500744020107正确答案E 第二节数值变量数据的统计描述(一)考什么?(1)集中趋势指标(2)离散趋势指标(3)正态分布的特点与面积分布规律(二)最重点是什么?正态分布的集中趋势和离散趋势的指标(三)最难点的是什么?正态分布的特点与面积分布规律一、集中趋势指标平均数(average)是一类用于描述数值变量资料集中趋势(或平均水平)的指标。常用的平均数包括:算术平均数、几何平均数与中位

8、数。1.算术平均数:简称均数,它是一组变量值之和除以变量值个数所得的商。总体均数用希腊字母(读作mu)表示,样本均数用 表示。适用条件:资料呈正态或近似正态分布。大多数正常生物的生理、生化指标都宜用均数表达集中趋势。算术平均数的计算方法有直接法和加权法。2.几何均数:几何均数用G表示,是将n个观察值x的乘积再开n次方的方根(或各观察值x对数值均值的反对数)。适用条件是:当一组观察值为非对称分布、其差距较大时,用均数表示其平均水平会受少数特大或特小值影响;数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系。如抗体的平均滴度,药物的平均效价等。3.中位数与百分位数中位数(M)是把一组观察值,按

9、大小顺序排列,位置居中的变量值(n为奇数)或位置居中的两个变量值的均值(n为偶数)。中位数是一个位次上的平均指标,以中位数为界,将观察值分为左右两半。适用情况有:当资料呈明显的偏态分布;资料一端或两端无确定数值(如大于或小于某数值)资料的分布情况不清楚,在这些情况下多选用中位数。例如,某些传染病或食物中毒的潜伏期、人体的某些特殊测定指标(如发汞、尿铅等),其集中趋势多用中位数来表示。百分位数(percentile,Px):是把一组数据从小到大排列,分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数。取任意一个百分位数Px可以把全部数值分为左右两半。中位数是第50百分位数,用P5

10、0表示。第5,第25,第75,第95百分位数分别记为P25,P75,P95,是统计学上常用的指标。四分位数间距 :P25,P75用于确定非正态分布资料的医学参考值范围。习题:有8个某种传染病人,他们的潜伏期分别为:l2、11、21、8、12、5、4、13,其中位数是:A.12B.11.5C.10D.8E.9.5 答疑编号500744020108正确答案B答案解析从小到大排列:4、 5、 8、 11、 l2、 12、 13 、21位于中间位置的数是:11和 l2。中位数是11.5二、离散趋势指标描述资料离散程度的指标 ,用于说明一组同质资料的离散度大小。1.全距用R表示,是一组资料的最大与最小值

11、之差。全距越大,说明资料的离散程度越大。全距仅考虑两端数值之间的差异,未考虑其他数据的变异情况,且不稳定易受极端值大小的影响,不能全面反映一组资料的离散程度。2.四分位数间距用Q表示,若将一组资料分为四等份,上四分位数Qu(P75)和下四分位数QL(P25)之差就是Q。Q值越大,说明资料的离散程度越大。通常用于描述偏态分布资料的离散程度。采用上、下四分位数,未用两端的数值,比全距稳定,但也未考虑每个观察值,也不能全面反应资料的离散趋势。 3.方差离均差平方和(Xi一)2)的均数。总体方差用2表示,样本方差用S2表示,度量单位(如cm,mmHg 等)都变为单位的平方值,公式分别为: 4.标准差将

12、方差开平方,取平方根的正值,就是标准差。公式为: n一l和fi一1为自由度。方差和标准差都是说明资料的变异程度,其值越大,说明变异程度越大。标准差与算术均数一起使用,描述正态分布资料的集中趋势和离散趋势。标准差愈小,说明观察值的离散程度愈小,从而也说明用均数反映平均水平的代表性愈好。标准差的用途较广,概括起来有四个方面:反映一组观察值的离散程度,标准差小,离散程度小,均数的代表性好;用于计算变异系数;计算标准误;结合均值与正态分布的规律估计医学参考值的范围。5.变异系数:用CV表示,CV是将标准差转化为算术均数的倍数,以百分数的形式表示。CV常常用于比较度量单位不同或均数相差悬殊的两组(或多组

13、)资料的变异程度。公式为 例:1.全面描述正态分布资料特征的两个指标是A.均数和中位数B.均数和标准差C.均数和极差D.中位数和方差E.几何均数和标准差 答疑编号500744020201正确答案B2. 描述偏态分布资料特征的两个指标是A.均数和中位数B.均数和标准差C.均数和四分位数间距D.中位数和四分位数间距E.几何均数和标准差 答疑编号500744020202正确答案D3.两组呈正态分布的数值变量资料,但均数相差悬殊,若比较离散趋势,最好选用的指标为A.全距B.四分位数间距C.方差D.标准差E.变异系数 答疑编号500744020203正确答案E三、正态分布的特点与面积分布规律1.正态分布及其特点正态分布是一种重要的连续型分布,以均数为中心,左右两侧基本对称,靠近均数两侧频数较多,离均数愈远,频数愈少,形成一个中间多、两侧逐渐减少、基本对称的分布。正态分布曲线,用N(,2)表示。对于任何一个均数和标准差分别为与的正态分布,都可以通过变量的标准正态变换( ,称作正态差),使之成为标准正态分布,用N(0,1)表示,即值的均数为0,标准差为1。 正态分布有以下五个特征:正态曲线在横轴上方,且均数所在处最高;正态分布以均数为中心,左右对称;正态分布有两个参数,即均数与标准差(与),标准正态分布的均数和标准差分别为0和1;正态曲线在士l.96,标准正态分布在1处各有一个拐点;正态分

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号