定量资料统计描述第2次课

上传人:ap****ve 文档编号:119737332 上传时间:2020-01-24 格式:PPT 页数:65 大小:836KB
返回 下载 相关 举报
定量资料统计描述第2次课_第1页
第1页 / 共65页
定量资料统计描述第2次课_第2页
第2页 / 共65页
定量资料统计描述第2次课_第3页
第3页 / 共65页
定量资料统计描述第2次课_第4页
第4页 / 共65页
定量资料统计描述第2次课_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《定量资料统计描述第2次课》由会员分享,可在线阅读,更多相关《定量资料统计描述第2次课(65页珍藏版)》请在金锄头文库上搜索。

1、 第四章第四章 定量资料的统计分析定量资料的统计分析 2 n统计分析的内容 统计描述 是用统计表 统计图 统计指标 来描述资料的分布规律及其数量特征 把握资料的基本特征 为统计分析打下基础 统计推断 在医学科学研究中通常应用抽样 研究的方法 即对总体中随机抽取的部分观 察单位 样本 进行研究 然后用样本信息推 断总体特征 即统计推断 第一节 定量资料的统计描述 一 频数分布表和频数分布图 二 集中趋势的统计描述 三 离散趋势的统计描述 4 一 频数分布表 对一个随机事件进行重复观察 其中某变 量值出现的次数被称作频数 frequency 把变量值及相对应的频数列成表格即频数分布 表 简称频数表

2、 frequency table 在观察值个数 即样本含量n 较多时 为 了解一组同质观察值的分布规律和便于指标的 计算 可编制频数分布表 5 1 连续性变量的频数表的编制 例4 2 在某市2005年进行的小学生体质评价研究中 测定了120名9岁男孩的肺活量 L 资料如下 根据该资料制作频数表 1 706 1 326 1 632 1 876 2 161 1 684 1 533 1 175 1 867 1 676 2 091 1 847 1 213 1 277 0 989 2 235 1 665 1 289 1 724 1 548 1 608 1 890 1 733 1 796 1 203 1

3、736 1 450 1 633 1 555 1 352 1 291 1 796 1 647 1 415 1 873 0 996 1 936 1 526 1 424 1 589 1 670 1 056 1 969 1 481 2 406 2 123 1 988 1 512 1 030 1 886 1 930 1 725 1 374 1 654 1 663 1 438 1 645 1 214 1 184 1 735 你能看出资料有什么规律 6 编制步骤 确定全距 range 全部观察值中最大值与最小值之差 用符号R 表示 又称极差 本例极差 R 2 406 0 980 1 417 L 8 划分组段

4、 确定组数 根据观察单位的多少及其全距来定 组 数不宜太多或者太少 确定组距 一般采用等距分组 组距 R 组数 本 例i R 12 1 417 11 0 129 0 130 确定各组段上下限 每个组段的起点称为该组的下 限 low limit 终点称为上限 upper limit 第一组 段必须包含最小值 最后一个组段上限必须包含最 大值 并且同时写出其下限与上限 其它组段上限 值忽略 注意各组段不能重叠 9 统计各组频数 采用计算机或手工划记汇总 得到各组段相 应的频数 10 根据这些数据编制成的频数表能显示出这组数据分布的特征 11 二 频数分布图 以观测变量为横轴 频数 或频率 为纵轴所

5、 作的直方图 称为频数分布图 横轴依次以等距 标出各组段的起点 在各组段上方分别绘制宽度 等于组距 高度等于相应频数的长方形 用途与频数表类似 但更直观 形象 12 图4 1 2005年某市120名9岁男孩肺活量频数分布 13 1 频数分布的特征 集中趋势 central tendency 一组数据向某 一个位置聚集或集中的倾向 例如本例 肺活 量有大有小 但中等居多 此为集中趋势 离散程度 dispersion 一组数据的分散性或变 异度 离 中心 位置越远 频数越小 即少数 人具有较大或较小的肺活量 表现了肺活量分 布的离散趋势 14 n集中趋势 高峰组段的位置 n离散趋势 观察值的分布范

6、围 15 2 频数分布的类型 对称分布 集中位置在正中 左右两侧大体对称 偏态分布 集中位置偏向一侧 频数分布不对称 正偏态分布 分布类型不同 采用的统计方法不同 负偏态分布 频数分布高峰 集 中位置 位于中部 两边低 左右对 称 1 对称分布 实例 17 图4 2 2004年我国麻疹患者的年龄分布 2 正偏态分布 集中位置偏向数值小 的一侧 高峰偏于左 侧 长尾向右延伸 18 图4 3 某市219名乳腺癌患者术后康复期生存质量评分的分布 频 数 评分 集中位置偏向数值大 的一侧 高峰偏于右 侧 长尾向左延伸 3 负偏态分布 19 三 频数分布表和频数分布图的用途 1 反映频数分布的两个重要特

7、征 集中趋势 变量值的中心数值或中心位置所在 离散趋势 变量值围绕中心数值或中心位置的分布情况 2 揭示资料的分布类型 对称分布 频数分布高峰位于中部 偏态分布 高峰偏于一侧 3 便于发现某些特大或特小的可疑值 4 便于进一步计算指标和统计分析处理 20 二 集中趋势的描述 描述一组同质观察值的平均水平或中 心位置的常用的指标有算术均数 几 何均数 中位数等 21 1 算术均数 mean n适用条件 单峰对称分布 特别是正态或近 似正态分布的定量资料 n符号 表示样本均数 希腊字母 表示 总体均数 22 计算方法 n 1 直接法 小样本 见教材P43 例4 3 自学 23 2 频数表法 加权法

8、 当观察值个数较多时 可先把原始资料分组 列出频数表 计算均数时将各组频数乘以相应 组的组中值 逐个相加求和 除以总例数 X1 X2 Xk 频数表资料中各组段的组中值 f1 f2 fk 相应组段的频数 24 表4 2 120名9岁男孩肺活量均数的计算 肺活量组段 1 频数f 2 组中值x 3 fx 4 2 3 0 980 51 0455 225 1 110 51 1755 875 1 240 71 3109 170 1 370 141 43520 09 1 500 191 56529 735 25 均数的特性 各观察值与均数之差 离均差 的总和等于零 即 各观察值的离均差平方和最小 即 以上两

9、个特性表明均数是一组观察值最理想 的代表值 26 均数的应用范围及条件 1 均数反映一组同质观察值的平均水平 并可作 为样本的代表值与其他样本进行比较 2 均数适用于单峰对称分布 尤其是正态分布资 料 这时均数位于分布的中央 能反映观察值 的集中趋势 即其平均水平 也可用于近似正 态分布 27 n适用于数据经过对数变换后呈正态分布的资料 也可用于观察值之间呈倍数或近似倍数变化 等比关系 的资料 n如医学实验中的抗体滴度 食品中农药含量 疾病的潜伏期等 n计算方法有 直接法和频数表法 2 几何均数 geometric mean G 28 直接法 n由原始变量值直接计算几何均数 n设变量值为X1

10、X2 Xn 几何均数G为 29 n例 有5份血清的滴度为1 4 1 8 1 16 1 32 1 64 求平均滴度 n n该5份血清的平均滴度为1 16 30 2 频数表法 加权法 n当资料中出现相同观察值的个数较多时 或资料 为频数表资料 则用加权法计算几何均数 n变量及频数如下 符合几何均数的适用条件 nX1 X2 Xk n f1 f2 fk n 则几何平均数G为 31 l例4 5 某医院预预防保健科用流脑脑疫苗为为75名儿 童进进行免疫接种 1个月后测测定其抗体滴度如表 4 3所示 求平均滴度 32 其血凝抗体滴度的平均滴度为1 27 35 抗体滴度 1 滴度倒数X 2 lgX 3 人数f

11、 4 f lgX 5 1 4 1 8 4 8 0 6021 0 9031 4 9 2 4084 8 1279 1 16 1 32 1 64 1 128 1 256 16 32 64 128 256 1 2041 1 5051 1 8062 2 1072 2 4082 21 20 12 5 4 25 2861 30 1020 21 6744 10 5360 9 6328 合 计计 75107 7676 表4 3 75名儿童的平均抗体滴度计算表 33 应用注意事项 n适用资料 经对数变换后呈正态或近 似正态分布的资料 用于等比资料 n注意 根据对数的性质 零与负数没有对数 1 变量值不能有0 2

12、变量值不能同时有正值与负值 34 一组观察值从小到大排列 位次居中的观 察值即中位数 是一个位置指标 符号 P50 或M 3 中位数 median 35 中位数计算方法 1 直接法 将观察值由小到大排列 按下式计 算 36 n例某病患者9名 其发病的潜伏期 天 为 3 4 4 5 6 7 7 9 11 求中位数 n本例n 9 为奇数 按式 9 6 得 n 天 n若在该例基础上再继续观察 在第20天又发现1例患者 则 n 10 为偶数 按式 2 7 得 n X5 X6 2 6 7 2 6 5 天 37 2 频数表法 nL为P50所在下限 i 为该组的组距 fM 为该组频 数 为比该组段略小的组段

13、的累计频数 38 n 求n 2 n 计算累计频数 n 两者比较确定M所在组 n 根据公式计算 计算步骤 39 评分频数累计频数累计频率 频率范围 0 220 910 0 91 30 241 830 92 1 83 40 373 201 84 3 20 50 11188 223 21 8 22 60 304821 928 23 21 92 70 6311150 6821 93 50 68 80 6017178 0850 69 78 08 90 100 48219100 0078 09 100 00 表4 4 219名乳腺癌患者康复期生存质量评分 例4 8 为研究乳癌患者术后康复期生存质量的状况

14、某医院对219名术 后康复期乳癌患者进行了生存质量测定 结果如表4 4 求平均评分 40 nM 70 10 63 219 50 48 79 76 分 41 42 三 离散程度的描述 集中趋势是数据分布的一个重要特 征 但单有集中趋势指标还不能很好地 描述数据的分布规律 而且还要看数据 的变异散程度 盘编号 甲乙丙 1440480490 2460490495 3500500500 4540510505 5560520510 合计250025002500 均数500500500 例 采甲 乙 丙三人的耳垂血 然后进行红细胞计数 每人数5个计数盘 得结果如下 万 mm3 甲乙丙 44 离散程度 反映

15、一群变量值的变异程度或参差不齐 的程度 离散程度大 均数的代表性差 离散程度小 均数的代表性好 45 常用的指标 1 极差 range 2 四分位数间距 quartile interval 3 方差和标准差 variance and standard deviation 4 变异系数 coefficient of variation 46 1 极差 全距 range n R X max X min n优点 简单明了 n缺点 n1 只考虑最大值与最小值之差异 不能反映组内其它观 察值的变异度 n2 样本含量越大 抽到较大或较小观察值的可能性越大 则全距可能越大 因此样本含量悬殊时不宜用全距 47

16、 2 四分位数间距 inter quartile range 常用于描述偏态分布资料 两端无确切值或分布 不明确资料的离散程度 1 百分位数 percentile 是指将观察值从小到 大排列后处于第x百分位置上的数值 亦是位置 指标 用 Px 表示 Px 表示将全部观察值分为两 部分 有 x 的观察值比 Px 小 有 100 x 的观察值比 Px 大 P50 即中位数 48 n2 四分位数 quartile Q 特定的百分位数 把一 组观察值分为四等份 下四分位数 QL P25 上四分位数为 QU P75 四分位数间距 QU QL 小大 P0 P25 P50 P75 P100 Q QL L Q QU U M 49 直接法 自学 频数表法 见教材P48 例4 11 50 评分频数累计频数累计频率 频率范围 0 220 910 0 91 30 241 830 92 1 83 40 373 201 84 3 20 50 11188 223 21 8 22 60 304821 928 23 21 92 70 6311150 6821 93 50 68 80 6017178 0850 69 78

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号