实习一集中趋势与离散趋势ppt培训课件

上传人:aa****6 文档编号:54543054 上传时间:2018-09-14 格式:PPT 页数:34 大小:444.50KB
返回 下载 相关 举报
实习一集中趋势与离散趋势ppt培训课件_第1页
第1页 / 共34页
实习一集中趋势与离散趋势ppt培训课件_第2页
第2页 / 共34页
实习一集中趋势与离散趋势ppt培训课件_第3页
第3页 / 共34页
实习一集中趋势与离散趋势ppt培训课件_第4页
第4页 / 共34页
实习一集中趋势与离散趋势ppt培训课件_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《实习一集中趋势与离散趋势ppt培训课件》由会员分享,可在线阅读,更多相关《实习一集中趋势与离散趋势ppt培训课件(34页珍藏版)》请在金锄头文库上搜索。

1、2018/9/14,1,预防医学(医学统计学)实习,实习一:集中趋势与离散趋势,Tel:15880436478 E-mail:,邱丽君,2018/9/14,2,实习纲要,医学统计学中的基本概念;集中趋势与离散趋势的统计指标,2018/9/14,3,一、医学统计学的基本概念,同质及变异 总体与样本 变量及其分类 参数与统计量 抽样误差 概率与小概率事件,2018/9/14,4,在研究事物的形状时,同质(homogeneous)示例,在研究事物的颜色时,2018/9/14,5,变异(Variation)示例,在研究事物的颜色时,2018/9/14,6,变异(Variation)示例,2018/9/

2、14,7,总体和样本,总体(Population):根据研究目的所确定的同质观察单位的全体;样本(Sample):是从总体中按照一定的目的按照一定的原则抽取的一部分个体。请考虑如何判断样本是否有代表性;抽样研究的目的?随机、样本含量;推断总体信息,2018/9/14,8,变量与变量值,在医学研究中,根据研究目的的要求对一些观察项目或研究指标在一些研究对象中进行观察(或测量),由于这些指标存在着变异,故把这些观察项目或研究指标(属性、特征)称为随机变量,简称变量(variable),而观察结果对应的取值称为变量值或资料(value of variable) 。,2018/9/14,9,思考下列变

3、量的有哪些类型?依据?,依据有无度量衡单位,取值的属性,2018/9/14,10,变量 类型,2018/9/14,11,参数和统计量,总体参数 (Parameter ):描述总体特征的指标。 统计量( Statistic):反映样本特征的指标。 总体参数与统计量有哪些区别与联系呢? 答:1.在总体被确定之后,总体参数就是一个常数,是 不会变化的,不管你是否确切知其大小;而统计量是几乎总是随着样本而变的。2.为了区分参数与统计量通常用希腊字母表示参数;用拉丁文字母表示统计量。3.通常参数是未知的,而统计量则可以通过抽样研究得到,故统计学通常用统计量估计参数(参数估计)。,2018/9/14,12

4、,抽样误差,【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(sampling error)。各种参数都有抽样误差,这里我们以均数为研究对象,2018/9/14,13,假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了三次。,2018/9/14,14,三次抽样得到了不同的结果,原因何在?,2018/9/14,15,抽样误差的表现,2018/9/14,16,概率,概率的统计学定义:数理统计学中的大数定理表明:当观察次数n越来越大,频率f的随机波动幅度越来

5、越小,并最终趋向于一个常数p:随机事件A发生的概率 (Probability)。 概率描述了随机事件发生的可能性的大小。是一种参数。 0P 1,2018/9/14,17,小概率事件,小概率事件医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。小概率原理小概率事件并不表示不可能发生,但在某一次试验中,由于其发生的可能性十分小,近似认为是不会发生的。,2018/9/14,18,二、数值变量的集中与离散趋势,频数表与频数图的绘制与用途集中趋势的描述:算术平均数、几何平均数、中位数、众数离散趋势的描述:极差、四分位数间距、方差与标准差、变异系数,2018/9/14,19,由于个体变异的

6、存在,医学研究得到的原始数据(raw data)往往是庞大的,但也不是杂乱无章的,而是有一定规律的,呈一定的分布(distribution) 频数分布表的基本思想:将原始数据按照一定的标准划分为若干各组,合计各组数据的个数(频数),得到频数分布表;在将频数表绘制成频数分布图。通过它们探寻数据的分布规律。,2018/9/14,20,离散型定量变量的频数分布,离散型定量变量(discrete variable)通常是指取值不连续的定量变量,通常只能取数轴上的整数值。 例如受检次数、新生儿数、手术病人数等例:1998年某山区96名孕妇产前检测次数数据?,2018/9/14,21,表1 1998年某山

7、区96名孕妇产前检测次数频数分布表,2018/9/14,22,频数分布图(直条图bar chart),2018/9/14,23,连续型定量变量的频数分布,连续型定量变量(continuous variable)通常是指取值连续的定量变量,可以取数轴上的任意数值。 例如身高、体重、血压、血清胆固醇值等 例:某地120名1835岁健康男性居民血清铁含量(mmol/L)数据,2018/9/14,24,连续型定量变量频数分布表,确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。对于100余例的数据通常分为815组。或根据以下经验公式:确定组距:组距是一个组的下限与下一个组段下限之差,可根据全

8、部数据的最大值和最小值及所分的组数来确定,即组距Int ( 最大值 - 最小值) 组数 列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值半开半闭,尾数关闭 统计出各组的频数并整理成频数分布表,2018/9/14,25,表2 120名正常成年男子血清铁含量(mmol/L)频数表,2018/9/14,26,频数分布表、图所提供的信息,频数分布图用以表示数据的分布规律; 观察分布范围及有无可疑值 ; 考察分布的类型 ; 对称分布 非对称分布(偏态分布) 左偏态(负偏态) 右偏态(正偏态),2018/9/14,27,集中趋势(central tendency),1. 同质的群体中数

9、据向其中心值靠拢的倾向和程度2. 测量集中趋势就是寻找数据水平的代表值或中心值,该值通常称为:平均数3. 不同类型的数据用不同的集中趋势测量值4. 常见的平均数指标有:算术均数、几何均数、中位数、众数,2018/9/14,28,算术均数(arithmetic mean),它是一组数据的均衡点所在;集中趋势的最常用指标易受极端值的影响用于定量数据,不能用于分类数据和等级数据4. 适用于服从正态或近似正态计量资料(对称分布)的集中趋势描述,2018/9/14,29,几何均数(geometric mean),适用于呈等比级数、或呈倍数变化的数据;例如医学上的抗体滴度、人口变化速度、细菌增长率、药物效

10、价等常用于表示呈正偏态,但是经过对数转换后可以满足对称(正态)的数据的平均水平数据中不可以有0,如果有0用一个很小的正数代替;不可同时有正负数在医学之外,它常用于计算事物变化的平均速度(经济学),2018/9/14,30,1. 适用于分布呈明显偏态,数据中存在极大或极小值,分布的一端或两端无确定数值,或分布不清的资料 2. 它是位置参数,不受极端值的影响,因此较均数、几何均数都稳定 3. 对于正态分布的资料,理论上中位数与算术均数是相等的,中位数(median),2018/9/14,31,众数(mode)*,是指一系列数值中出现次数(概率)最多的数值。 在某些情况下数据中可能没有众数(全国各大

11、城市的人口数几乎不可能会有完全相同的),有时可能会有几个众数(例如:16、32、32、64、64、128);由于它的取值完全取决于频数,所以在小样本的情况下它不太稳定。,2018/9/14,32,离散趋势(disperse tendency),1. 数据分布的另一个重要特征,反映各变量值远离其中心值的程度(离散程度),也称为变异度。2. 从另一个侧面说明了集中趋势测度值的代表程度3. 不同类型的数据有不同的离散程度测量值,常用的离散趋势指标有:极差、四分位数间距、方差、标准差、变异系数。,2018/9/14,33,极差 受极端值影响,不稳定 对所有两端有确定值的数据都可适用四分位数间距 比极差稳定,但是仍然无法反映每个观察值的变异 所有的数据,特别是偏态分布,分布不明,数据的一端或两端有不确定值 常与中位数合用,综合反映资料的集中和离散趋势方差标准差 能够反映每个观察值的变异情况 只适用于正态或近似正态分布的数据 常与算术均数合用,综合反映资料的集中和离散趋势变异系数反映相对离散程度消除了数据水平高低和计量单位的影响,2018/9/14,34,补充习题,请使用合适的统计指标描述上述发汞含量的平均水平与离散程度,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号