统计-02集中趋势

上传人:热**** 文档编号:127225401 上传时间:2020-03-31 格式:PPT 页数:39 大小:1.05MB
返回 下载 相关 举报
统计-02集中趋势_第1页
第1页 / 共39页
统计-02集中趋势_第2页
第2页 / 共39页
统计-02集中趋势_第3页
第3页 / 共39页
统计-02集中趋势_第4页
第4页 / 共39页
统计-02集中趋势_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《统计-02集中趋势》由会员分享,可在线阅读,更多相关《统计-02集中趋势(39页珍藏版)》请在金锄头文库上搜索。

1、 第二章集中趋势的统计描述DescriptiveStatistics 频数分布计量资料的统计描述计数资料的统计描述 第一节频数分布 计量资料的频数分布表频数分布图频数分布表的用途 一 频数与频数分布表 频数 frequency 对一个随机事件进行重复观察 其中某变量值出现的次数频数分布表 frequencydistributiontable 是用表格的形式将各变量的取值与之相对应的频数用以表达的一种统计计算或分析表 例2 1某地用随机抽样方法检查了140名成年男子的红细胞数 检测结果如表所示 如何有效地组织 整理和表达数据的信息 频数表的编制步骤 计算极差决定组段数确定组距确定组段列表划记 1

2、 求极差 range 即最大值与最小值之差 又称为全距 本例极差 R 5 95 3 82 2 13 2 决定组数 组段和组距 根据研究目的和样本含量n确定 组距 极差 组数 通常分8 15个组 为方便计 组距参考极差的十分之一 再略加调整 本例i R 10 2 13 10 0 21 0 2 3 列出组段 第一组段的下限略小于最小值 最后一个组段上限必须包含最大值 其它组段上限值忽略 4 划记计数 用划记法将所有数据归纳到各组段 得到各组段的频数 表2 2某地140名正常男子红细胞数的频数表 频数分布表的观察 频数分布有两个重要的特征集中趋势 centraltendency 所有观察值的集中 中

3、心 位置离散趋势 tendencyofdispersion 所有观察值偏离中心位置的分布情况 图2 1140名正常男子红细胞计数的直方图 二 直方图 Histogram 直观 形象地表示频数分布的形态和特征 分布的类型 对称分布 symmetricdistribution 偏态分布 skeweddistribution 正偏态分布 skewedpositivelydistribution 负偏态分布 skewednegativelydistribution 分布的类型 负偏态分布 长尾向左侧偏斜延伸 正偏态分布 长尾向右侧偏斜延伸 对称分布 中部高 两侧低 左右对称 三 频数表和直方图的用途1

4、 作为陈述资料的形式2 便于观察数据的分布类型3 便于发现资料中含有的异常值4 可用各组段的频率作为概率的估计值 计量资料的统计描述 集中趋势的描述离散趋势的描述 一 集中趋势的描述 统计上使用平均数 average 这一指标体系来描述一组变量值的集中位置或平均水平算术均数 arithmeticmean 几何均数 geometricmean 中位数 median 众数 mode 算术均数 简称均数 mean 它是一组已知性质相同的数值之和除以数值个数所得的商数总体均数用希腊字母 表示 样本均数用表示 1 直接计算法 当观察例数不多 如样本含量n小于30 时 或观察例数虽然很多 但有计算机及统计

5、软件 均可选择直接法 公式 式中 读作sigma 为求和的符号 Xi为各观察值 n为总例数 2 加权法 当观察例数很多又缺乏计算机及统计软件时 若用直接法很容易出错 运用频数表资料 可以用加权法处理 公式 k 频数表的组段数 f 频数 X 组中值 均数 669 2 140 4 78 几何均数 表示符号 G适用对象 对数正态分布资料当一组观察值不呈正态分布 且其差距较大时 若用均数表示其平均水平会受少数特大或特小值的影响 但数值按大小顺序排列后 各观察值呈倍数关系或近似倍数关系 如抗体的平均滴度 药物的平均效价 食物中毒的平均潜伏期等 几何均数 适用对象本身呈正偏态分布 经对数转换后呈对称分布或

6、正态分布的资料 仅适用于右偏态分布 不适用于左偏态分布变量x服从对数正态分布 即表示变量lg xi 服从正态分布 对于lg xi 具有正态分布的所有特性 1 直接计算法 几何均数 变量对数值的算术均数的反对数 其他对数 如自然对数 变换获得相同的几何均数 几何均数 GeometricMean 例2 2测得10个人的血清滴度的倒数分别为2 2 4 4 8 8 8 8 32 32 求平均滴度 例有8份血清的抗体效价分别为1 5 1 10 1 20 1 40 1 80 1 160 1 320 1 640 求平均抗体效价 平均抗体效价为 1 57 2 加权法 公式 例69例类风湿关节炎 RA 患者血清

7、EBV VCA lgG抗体滴度的分布见表2 4第 1 2 栏 求其平均抗体滴度 几何均数的适用条件与实例 适用条件 呈倍数关系的等比资料或对数正态分布 正偏态 资料 如抗体滴度资料 血清的抗体效价滴度的倒数分别为 10 100 1000 10000 100000 求几何均数 此例的算术均数为22222 显然不能代表滴度的平均水平 几何均数的应用注意事项 计算几何均数时 观察值不能小于或等于零观察值不能同时有正值和负值同一组资料求得的几何均数小于算术均数 先将观察值按从小到大顺序排列 再按以下公式计算 特点 仅仅利用了中间的1 2个数据 三 中位数和百分位数 一 中位数 Median M 将一组

8、观察值从小到大按顺序排列 居中心位置的数值即为中位数 计算公式 1 原始资料如测得5个人的VLDL中的apo B的含量 mg dl 为0 84 2 85 5 46 8 58 9 60 则M 5 46 mg dl 若测量结果 0 84 2 85 8 58 9 6 则M 2 85 8 58 2 5 72 mg dl 频数表法 下限值L 上限值U i fm 中位数M 表2 4某地630名正常女性血清甘油三脂含量 mg dl L iM fM分别为M所在组段的下限 组距和频数 fL为M所在组段之前各组段的累积频数 中位数的特征 计算时只利用了位置居中的测量值优点 对极值不敏感缺点 并非考虑到每个观测值对

9、于正态分布或对称分布的资料 理论上中位数等于均数 正态分布时 均数 中位数正偏态分布时 均数 中位数负偏态分布时 均数 中位数 中位数的适用条件 适合各种类型的资料 尤其适合于 大样本偏态分布的资料 资料有不确定数值 资料分布不明等 二 百分位数 Percentile L 组段的下限 iM 组距 fx 频数 fL Px所在组段之前的累积频数 例2 5计算例2 4的百分位数P25 P75 P90 三 百分位数的应用1 中位数是百分位数的特例 其特点是不易受异常值的影响 适用于描述明显偏态分布 或两端无确定数值数据的平均水平 2 描述数据序列在某百分位置的水平 多个百分位数结合使用如P25和P75可以描述数据的分散程度 用P2 5和P97 5计算医学95 的参考值范围等 小结1 运用频数表 直方图和统计指标这些技巧能够有效地组织 整理和表达计量资料的信息 2 平均数是描述一组观察值集中位置或平均水平的统计指标 常用的有算术均数 几何均数和中位数 其中均数的应用最为广泛 几何均数则多用于血清学和微生物学中 中位数主要用于偏度较大的数据分布资料 3 百分位数可用来描述资料的观察值序列在某百分位置的水平 中位数是其中的一个特例

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号