预防医学课件人群健康研究的统计学方法

上传人:清晨86****784 文档编号:320673784 上传时间:2022-07-01 格式:PPT 页数:92 大小:4.06MB
返回 下载 相关 举报
预防医学课件人群健康研究的统计学方法_第1页
第1页 / 共92页
预防医学课件人群健康研究的统计学方法_第2页
第2页 / 共92页
预防医学课件人群健康研究的统计学方法_第3页
第3页 / 共92页
预防医学课件人群健康研究的统计学方法_第4页
第4页 / 共92页
预防医学课件人群健康研究的统计学方法_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《预防医学课件人群健康研究的统计学方法》由会员分享,可在线阅读,更多相关《预防医学课件人群健康研究的统计学方法(92页珍藏版)》请在金锄头文库上搜索。

1、预防医学预防医学第十章第十章 人群健康研究的人群健康研究的 统计学方法统计学方法目录目录第一节第一节 统计学概述统计学概述一、统计学的意义二、统计学中的几个基本概念三、统计资料的类型四、统计工作的基本步骤第二节第二节 统计表和统计图统计表和统计图一、统计表二、统计图目录目录第三节第三节 数值变量资料的统计分析数值变量资料的统计分析一、数值变量资料的统计描述二、数值变量资料的统计推断第四节第四节 分类变量资料的统计分析分类变量资料的统计分析一、分类变量资料的统计描述二、分类变量资料的统计推断学习目标学习目标1. 掌握:总体、样本等统计学基本概念;统计资料的类型;统计表及统计图的制作;数值变量资料

2、和分类变量资料统计描述的指标、计算及适用条件;数值变量资料和分类变量资料区间估计的方法,常用的假设检验方法及应用条件。2. 熟悉:医学统计工作的基本步骤;频数表的编制方法;正态分布曲线下的面积分布规律及参考值范围的制订。3. 了解:t分布的特征;统计中两型错误。重点及难点重点及难点重点:总体和样本的概念;统计资料的类型;统计表及统计图的制作要求;数值变量资料和分类变量资料统计描述的指标、计算及适用条件;抽样误差与标准误;数值变量资料和分类变量资料区间估计的方法;常用假设检验方法及应用条件。难点:抽样误差与标准误;t分布与t界值;假设检验的基本思想;P值的含义;假设检验中的两型错误;分布与 检验

3、。 第十章第十章 第一节第一节丁可丁可 南阳医学高等专科学校南阳医学高等专科学校第一节第一节 统计学概述统计学概述统计学(statistics)是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。第十章第十章 第一节第一节(一)同质与变异同质(homogeneity)是指被研究指标的影响因素相同变异(variable)是同质基础上的各观察单位(亦称为个体)之间的差异第十章第十章 第一节第一节(二)总体与样本总体(population)是指根据

4、研究目的确定的同质观察单位的全体样本(sample)从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合第十章第十章 第一节第一节(三)变量与变量值总体(population)是指根据研究目的确定的同质观察单位的全体样本(sample)从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合第十章第十章 第一节第一节(四)参数与统计量参数(parameter)是指总体的统计指标。习惯上用希腊字母表示总体参数统计量(statistic)是指样本的统计指标。习惯上用拉丁字母表示统计量第十章第十章 第一节第一节(五)误差1. 系统误差(systematic error):测量结果又倾向性。查

5、明原因,可以避免。2.随机测量误差(random error of measurement):测量结果没有倾向性。不可避免。3. 抽样误差(sampling error):由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。变异是绝对的,抽样误差不可避免。第十章第十章 第一节第一节(六)概率概率(probability)是描述某随机事件发生可能性大小的量值,常用符号P表示。随机事件的概率在01之间,即0P1。小概率事件:P0.05或P0.01的事件。统计学上,认为小概率事件在一次抽样中几乎不可能发生。第十章第十章 第一节第一节(一)数值变量资料数值变量资料

6、(measurement data)亦称定量资料(quantitative data)或计量资料(numerical variable data)(二)分类变量资料分类变量资料(categorical variable data)又称定性资料(qualitative data)1无序分类(unordered categories)2有序分类(ordered categories)第十章第十章 第一节第一节 资料类型的划分是根据研究目的确定的,而统计分析方法的选用,则与资料类型密切相关。在资料的分析过程中,根据有关专业理论和实际需要,各类资料间可以互相转化,以满足不同统计分析方法的要求。第十章第

7、十章 第一节第一节(一)统计设计:第一步,最关键的环节(二)收集资料:经常性资料和一时性资料(三)整理资料:查漏补缺,系统化、条理化(四)分析资料 1. 统计描述 2. 统计推断第十章第十章 第一节第一节第十章第十章 第二节第二节丁可丁可 南阳医学高等专科学校南阳医学高等专科学校(一)统计表的结构和制表要求 1. 统计表主要有标题、标目(包括横标目、纵标目)、线条、数字和备注五部分构成。 2. 编制统计表主要的要求是表的中心内容要突出,一张表表达一个中心问题为宜。第十章第十章 第二节第二节第十章第十章 第二节第二节统计表的基本框架: 表序 标题 横标目名称 纵标目名称 横标目 数字 合计 (一

8、)统计表的种类 1. 简单表第十章第十章 第二节第二节 简单表:指被研究对象只按单一特征或标志分组的表格。 表10-1 某地某年咽舒康治疗急性咽喉炎疗效比较 组别 例数 有效数 有效率 (%) 试验组 107 93 86.9 对照组 108 84 77.8 (一)统计表的种类 2.复合表第十章第十章 第二节第二节 复合表:指被研究对象按两个(或两个以上)特征分组的表格。如表 3-2,将被研究对象按年龄和性别两个特征结合起来分组,故称为组合表。 表 10 - 2 某地某年不同年龄、性别的儿童青少年意外损伤情况 男 女 年龄(岁) 调查人数 损伤人数 损伤率(%) 调查人数 损伤人数 损伤率(%)

9、 3.5 447 66 14.77 424 29 6.84 6.5 1215 92 7.57 1239 53 4.28 9.5 1180 122 10.34 1070 80 7.48 12.5 1217 150 12.33 1136 66 5.81 15.818.5 622 65 10.45 582 20 3.44 合计 4681 495 10.57 4451 248 5.57 (一)统计表的类型与选择 1. 资料是连续性的,其目的是用线段升降表达事物的动态变化趋势,选择普通线图; 2. 表示变量分布的频数表资料,其目的是用直方的面积表达各组段的频数或频率分布情况,宜选择直方图; 3. 资料是

10、相互独立的,其目的是用直条的长短比较数值的大小,选择直条图;第十章第十章 第二节第二节(一)统计表的类型与选择4. 事物内部各部分的百分构成比资料,其目的是用面积大小表达各部分所占的比重大小,则应选择圆图;5. 双变量连续性资料,其目的是用点的密集程度和趋势表达两个变量的相互关系,选择散点图;6. 资料是连续性的,其目的是比较两组或多组资料的集中趋势和离散趋势,宜选择箱式图。第十章第十章 第二节第二节(二)制图通则1. 根据资料性质和分析目的正确选用适当的统计图。2. 要有标题,简明扼要地说明统计图资料的时间、地点和主要内容,一般放在图下方。3. 绘制有坐标轴的图形时,纵横两轴应有标目并注明单

11、位。一般将两轴的相交点即原点初定为0。纵横轴比例一般以57或75为宜。4. 在同一张图内比较不同事物时,须用不同线条或颜色来表示,并附图例加以说明。第十章第十章 第二节第二节(三)常用统计图及其绘制方法1. 直条图(bar graph) 直条图是以等宽直条(柱)的长短来表示各指标数值的大小。适用于指标为各自独立的分类资料。第十章第十章 第二节第二节第十章第十章 第二节第二节第十章第十章 第二节第二节(三)常用统计图及其绘制方法2.构成图(constituent ratio chart) 它是以图形的面积大小表示事物内部各组成部分所占比重或比例。适用于按性质分类、能计算构成比的资料。构成图可分为

12、圆形图和百分条图。第十章第十章 第二节第二节第十章第十章 第二节第二节图10-3 复方猪胆囊治疗单纯型老年气管炎近期疗效比较第十章第十章 第二节第二节图10-4 复方猪胆囊治疗老年性气管炎近期疗效比较(三)常用统计图及其绘制方法3.线图(line graph):用线段的升降来表示某事物(某现象)随时间或条件而变化的趋势。适用于连续性资料。第十章第十章 第二节第二节第十章第十章 第二节第二节(三)常用统计图及其绘制方法4.直方图(histogram) 直方图又称频数分布图,是以各矩形的面积表示各组段的频数,各矩形面积的总和为总频数,适用于表示连续性资料的频数分布。第十章第十章 第二节第二节第十章

13、第十章 第二节第二节图10-6 某市某年150名3岁女孩身高频数分布 (三)常用统计图及其绘制方法5. 散点图(scatter diagram) 散点图是用点的密集程度和变化趋势来表示两种现象间的相关关系。适用于双变量资料,均具有连续性变化的特征。第十章第十章 第二节第二节第十章第十章 第二节第二节 图10-7 15名8岁男孩身高与坐高散点图(三)常用统计图及其绘制方法 6.箱式图(box plot) 用于比较两组或多组资料的集中趋势和离散趋势,箱式图的中间横线表示中位数,箱子的长度表示四分位数间距,两端分别是P75和P25,箱式图最外面两端连线表示最大值和最小值。第十章第十章 第二节第二节第

14、十章第十章 第二节第二节 图10-8 抑肿瘤药不同剂量与对照组用药后小白鼠肿瘤重量的比较第三节第三节 数值变量资料的统计分析数值变量资料的统计分析刘琥刘琥 济宁医学院济宁医学院1. 频数表的编制频数表的编制编制频数表步骤流程图(一)频数分布(一)频数分布2. 2.频数分布频数分布表的用途表的用途(1 1)揭示数值变量频数分布的类型和特征)揭示数值变量频数分布的类型和特征 (2 2)作为陈述资料的形式)作为陈述资料的形式(3 3)便于发现一些特大或特小的可疑值)便于发现一些特大或特小的可疑值(4 4)便于进一步的统计分析)便于进一步的统计分析3. 3.数值变量资料频数分布的类型和特征数值变量资料

15、频数分布的类型和特征 441.算术均数(mean) 样本均数: 总体均数:(1)应用:对称分布资料,尤其是正态分布资料。(2 )计算直接法加权法(二)集中趋势指标(二)集中趋势指标452.几何均数(geometric mean):(1)应用:等比数列资料;对数正态分布资料(2) 计算:直接法 加权法463.中位数(median)(1)概念:将一组观察值从小到大按顺序排列,位次具中的观察值就是中位数。(2)应用:偏态分布;分布一端或两端无确定数据;资料的分布情况不清楚。(3)计算:直接法 频数表法离散趋势即个体值之间的变异程度,数据越分散,变异程离散趋势即个体值之间的变异程度,数据越分散,变异程

16、度越高。度越高。极差极差四分位数间距四分位数间距方差方差标准差标准差变异系数变异系数47(三)离散趋势指标(三)离散趋势指标481. 1.全距(全距(R R) 全距也称极差,是一组观察值中最大值与最小值之差。反映个体变异的范围。全距大,说明离散程度大;反之,说明离散程度小。缺点:(1)除了最大值和最小值外,不能反映组内其他数据的离散程度。(2)样本含量悬殊时不宜比较其全距。(3)即使样本含量不变,全距的抽样误差亦较大,即不够稳定。492. 2.四分位数间距(四分位数间距(Q Q) 上四分位数(P75)与下四分位数(P25)之差 Q= P75- P25 四分位数间距可看成中间一半变量值的全距。它与全距类似,数值越大,说明变异程度越大;反之,说明变异度越小。 用四分位数间距作为说明个体差异的指标,比全距稳定,但仍然未考虑到每个观察值的离散程度。 应用:与中位数结合用于说明偏态分布资料的特征。503. 3.方差方差全面地考虑每个变量值的离散程度。离均差:总和为零离均差平方和:除了与变异度有关外,还与变量值的个数有关。取其均数,即为方差。514. 4.标准差(标准差(standard devi

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号