卫生统计学考前复习材料

上传人:第*** 文档编号:31012910 上传时间:2018-02-03 格式:DOC 页数:9 大小:364KB
返回 下载 相关 举报
卫生统计学考前复习材料_第1页
第1页 / 共9页
卫生统计学考前复习材料_第2页
第2页 / 共9页
卫生统计学考前复习材料_第3页
第3页 / 共9页
卫生统计学考前复习材料_第4页
第4页 / 共9页
卫生统计学考前复习材料_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《卫生统计学考前复习材料》由会员分享,可在线阅读,更多相关《卫生统计学考前复习材料(9页珍藏版)》请在金锄头文库上搜索。

1、统计复习 第 1 页,共 9 页基本概念总体(population):根据研究目的确定同质观察单位(亦称个体)的全体。样本(sample):从总体中随机抽取部分观察单位,其实测值的集合。抽样:必须遵循随机化原则,从总体中抽取有代表性的部分观察值,使样本具有代表性。目的是为了用样本的信息(或统计量)推断总体的特征(或参数) 。同质与变异 homogeneity & variation:统计学要求研究对象具有同质性,即研究对象的观察值具有相同属性。同一总体内的个体存在差异,这种现象称为变异,变异是绝对存在的。概率(probability ):是描述随机事件发生的可能性大小的数值,常用 P 表示,范

2、围在 0 与 1 之间。P 越接近 1,标明某事件发生的可能性越大;P 越接近 0,表明某事件发生的可能性越小;P0.05的事件称为小概率事件。统计资料的类型:1 . 定量资料(measurement data)用定量方法测量观察对象的某项指标所得的数值资料。一般有度量衡单位。如身高、体重、浓度。2 . 分类资料(enumeration data )将观察单位按某种属性或类别分组所得各组的观察单位数。(1)二项分类:阳性、阴性。(2)多项分类:A、B、O、AB 血型。3 . 等级资料(ranked data)将观察单位按某种属性的不同程度分组所得各组的观察单位数。如血清反应分为,五级。资料可以

3、由高级向低级转化计量资料:个体的血红蛋白(g/dl)计数资料:正常人数、异常人数(按正常异常分组)等级资料:0,重度贫血6,中度贫血9,輕度贫血12,正常16,增高(按血红蛋白量的多少分组)统计工作的基本步骤:1 . 设计,design2 . 资料收集,collection data3 . 资料整理,sorting data4 . 资料分析,analysis data统计描述、参数估计、假设检验、统计结论。统计表:基本要求:1 . 标题概括表达中心内容,简练、确切、必要时注明资料来源、事件,位于表的上方。2 . 标目文字简明,注明单位3 . 线条力求间接,上面顶线、下面底线,纵标目下面、合计上

4、面横线,不需要竖线与斜线。4 . 数字表内数字一律用阿拉伯数字表示,同一指标的小数位数一致,位次对其,暂缺、无数据的用“”或统计复习 第 2 页,共 9 页“”表示。数字左端对齐。5 . 备注如有备注,用“*”标出,注在表外下面。统计图基本要求:1 . 根据资料性质和分析目的,正确选用图形。2 . 要有确切的标题,说明资料内容。标题位于图的下方。3 . 纵横两轴交点为起点。纵横轴尺度应等距,纵横轴长度比例 57。条图、直方图的纵坐标必须从“0”开始。4 . 同一图内比较几种不同事物时,用不同的线条或颜色表示,并附图例说明。(1)线图:适用于表现连续变量资料的趋势变化(2)直方图:以面积表示数量

5、,适用于表示连续变量的频数分布。画直方图组距一定要相等。(3)直条图:用等宽直条的长短来表示相互独立的各指标指数数值的大小。(4)构成图:圆图:各扇形面积表示全体中各部分所占的比重。百分条图:全长为 100,按构成比分段。定量资料的统计描述频数表:即频数分布表,是对样本量较大的资料进行统计描述的常用方法,通过频数表可以现实数据分布的范围与形态。编著频数表时组距可等可不等,一般取相等组距;分组数与样本量有关,应适宜,不多也不少。一、集中趋势的指标,平均数是用于描述一组同质计量资料的集中趋势或反应一组观察值的平均水平。常用的平均数有算术均数、几何均数及中位数三种。1 . 算术均数,简称均数。X 表

6、示变量 X 的样本均数,(希腊字母)表示总体均数,均数适用于对称分布资料,正态或近似正态分布资料。直接法:样本量较小时用:2.几何均数,用 G 表示,适用于对数正态分部的资料,例如抗体的滴度和平均效价。直接法:样本量较小时用:频数表法:当样本量较大时,编制频数表进行计算;例题 :某地 6 人接种某疫苗后,其抗体滴度如下:12;14;14;18;116;132,请问其平均抗体滴度是多少?统计复习 第 3 页,共 9 页平均抗体滴度是 17.13例题 :某地 102 名健康人的钩端螺旋体血清抗体滴度如表 7-2,计算平均滴度。3.中位数:将一组观察值从小到大按顺序排列,位次居中的观察值就称中位数,

7、用 M 表示。中位数适用于任何一种分布的计量数据,一般多用于描述偏态分布活数据一端无界资料的集中趋势。4.百分位数:是一种位置指标,用 Px 表示。百分位数是一个有序数列百等分的分割值。第 50 百分位数(P 50)也就是中位数,中位数是一个特定的百分位数。二、离散趋势指标描述离散趋势的常用指标有全距、四分位间距、方差和标准差等。对于描述偏态资料的离散趋势宜用四分位间距,对于正态或近似正态资料宜用标准差。标准差应用:1.表示观察值的变异程度:在两组(或几组)均数相近、单位相同的条件下,标准差大,表示变量值的变异程度法,均数的代表性较差;反之,标准差小,表示变量组变异度小,数据多集中在均数周围,

8、则均数的代表性较好。2.计算变异系数:单位不同时,不能用标准差表示变量值的离散趋势,只能用变异系数,单位相同但是均数相差较大时,用标准差不太合理,用变异系数更好,变异系数用 CV 表示。变异系数是一种相对的离散程度指标,它无单位:3.结合均数描述频数分布的特征和制定医学参考值范围。4 计算标准误例题 :某地随即抽样调查了 255 名成年女性的红细胞数和血红蛋白,红细胞均数为 4.18,标准差为0.29;血红蛋白均数为 117.6,标准差为 10.2,请问女性红细胞数与血红蛋白的变异程度何者为大?红细胞:血红蛋白:血红蛋白的变异程度大于红细胞数。正态分布:正态分布是一种连续型分布。正态分布以均数

9、为中心,左右两侧对称,靠近均数两侧的频数较多,而距离均数两个较远处,频数逐渐减少,形成钟形分布。正态曲线下的面积分布有一定的规律。正态分布的主要特征:以均数 为中心,左右对称。 2取值范围理论上没有边界。 2离 越远,函数 f(X)值越接近 0,但不会等于 0。正态分布曲线下的面积分布有一定的规律。正态分统计复习 第 4 页,共 9 页布完全由参数 和 决定。 是位置参数(即平均水平) ,决定分布曲线在横轴的偏移位置。当 一定后, 增大,曲线右移;反之 减小,曲线左移。 是变异参数,决定分布曲线的形态。 越大,曲线的形态越“矮胖” ,表示数据分布越分散; 越小,曲线的形态越“瘦高” ,表示数据

10、分布越集中。标准正态分布(standard normal distribution )标准正态分布是均数 为 0、标准差 为 1 的正态分布,即(,)(0,1) ,亦称 分布。正态曲线下面积的分布规律:曲线下横轴上的总面积为 100或 1。下面是应用较多的三个区间的面积分布规律: a.正态分布区间(-,+)下的面积,即 范围的面积占总面积为68.27。 b.正态分布区间(-1.96,+1.96) ,即 1.96 范围的面积占总面积为95.00。 c.正态分布区间(-2.58,+2.58) ,即 2.58 范围的面积占总面积为99.00。正态分布的应用(医学参考值范围的估计)正态分布或样本含量较

11、大的数据资料,95的医学参考值范围为:(-1.96S,+1.96S) 。对于偏太分布的数据资料,宜采用百分位数的方法进行确定。95的医学参考范围为:P 2.5P 97.5;单侧上界:P 95;单侧下界:P 5。均数的抽样误差:由于存在变异,样本均数往往不够于总体均数 。这种由抽样造成的样本均数与总体均数的差异或各样本均数之间的差异称为抽样误差,抽样误差是不可避免的。若要减小抽样误差,只有增加样本含量。标准误计算:标准误(理论值)是反映抽样误差大小的指标,用 X表示。用某一样本标准差 S 来代替 ,得到标准误的估计值 SX(通常也简称为标准误) ,其计算公式为:t 分布的特征:t 分布是以 0

12、为中心的左右对称分布曲线;曲线形态变化与自由度 的大小有关( 与 n 有联系,这里 n-1) 。自由度 越大,t 分布越接近于正态分布;自由度 越小,t 分布越低平,两端向外伸展。t 分布不是一条曲线,而是一簇曲线,因此,t 分布曲线下面积的 95或 99界限不是一个常量,而是随着自由度大小而变化的。为便于使用,可根据 t 值表查找。总体均数的可信区间亦称置信区间(CI) ,即按预先给定的概率(1-,可信度)估计未知总体均数的所在范围。习惯上用总体均数的 95(或 99)可信区间,表示该区间包含总体均数 的概率为95(或 99) 。用此估计范围估计总体均数,表示 100 次抽样中,有 95(9

13、9)次包含总体均数。 未知,但样本例数 n 足够大,总体均数 95的可信区间可近似的表达为:例题:测得某地 101 名 3049 岁正常成年男子血清总胆固醇(mmol/L)平均值为 4.735,标准差为0.882,求:该地健康男子血清总胆固醇的正常值范围?试估计该地健康成年男子血清总胆固醇均数。95医学参考值范围为:95均数可信区间:假设检验的一般步骤:建立假设和确定检验水准H 0:无效假设,即样本均数所代表的总体均数 与假设的总体均数统计复习 第 5 页,共 9 页 0相等,与 0的差异是抽样误差所致。H 1:被择假设,即样本均数所代表的总体均数 与 0不相等,与 0差异是本质性差异。假设检

14、验有双侧检验和单侧检验之分,一般选用双侧检验。H 0 0 ;H 1 0确定检验水准:检验水准,用 表示,是假设检验时发生的一类错误的概率。 常取 0.05选定检验方法和计算统计量要根据研究设计的类型、统计推断的目的,选择适当的统计量。如成组设计的两样本均数比较选择 t 检验,大样本时可选用近似的 u 检验。不同的检验统计量有不同的公式。确定 P 值,作出统计推论根据 P 值大小作出拒绝或者不拒绝 H0的结论。当 P0.05,则按0.05 水准不拒绝 H0, (即 H0存在的可能性是个大概率时间) 。差别无统计学意义;当 P0.05,则按0.05 水准拒绝 H0,不拒绝 H1(即 H0存在的可能

15、性时个小概率时间) ,差别具有统计学意义。t 检验一、样本均数与总体均数的比较(单样本 t 检验)总体标准差 未知且 n 较小,应选用 t 检验。建立假设:H 0 0 ;H 1 00.05计算统计量 t 值:确定临界值(t ):计算自由度 ,查 t 值表中 t0.05() ,t 0.01()以统计量(t)与临界值(t )比较,作出判断结论,按下列规则确定 P 值:若tt 0.05() ,P0.05,差别无统计学意义。tt 0.05() ,P0.05,差别有统计学意义。例题:假设肺炎病人的平均住院期为 4.4 天。25 例用某药治疗的病人住院的平均时间为 3 天,标准差为1.5 天。试以 5的水准检验此药的效果。H0 0 ;H 1 00.05=n-1=25-1=24,查 t 界值表,得 t0.05() 2.064,现t4.672.064,故 P0.05。按

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号