医学统计学第4版 第4章 定量资料

上传人:我** 文档编号:117011930 上传时间:2019-11-18 格式:PPT 页数:112 大小:6.21MB
返回 下载 相关 举报
医学统计学第4版 第4章 定量资料_第1页
第1页 / 共112页
医学统计学第4版 第4章 定量资料_第2页
第2页 / 共112页
医学统计学第4版 第4章 定量资料_第3页
第3页 / 共112页
医学统计学第4版 第4章 定量资料_第4页
第4页 / 共112页
医学统计学第4版 第4章 定量资料_第5页
第5页 / 共112页
点击查看更多>>
资源描述

《医学统计学第4版 第4章 定量资料》由会员分享,可在线阅读,更多相关《医学统计学第4版 第4章 定量资料(112页珍藏版)》请在金锄头文库上搜索。

1、第第4 4章章 定量资料的统计描述定量资料的统计描述 卫生统计学教研室卫生统计学教研室 统计分析统计分析 统计描述:是用统计图(表)、统计指标来描 述群体的分布特征 统计推断:抽样研究中,用观察得到的样 本信息推断所代表的、未知的总体特征 ID身高年龄 父亲 身高 母亲 身高 周锻 炼次数 民族性别 户口 类别 儿时健 康状况 202565 5 17527 171. 5 155. 5 3汉男农村良好 202565 3 16022 174. 0 155. 0 5汉女城市一般 202583 0 15825 168. 0 156. 0 3藏女城市一般 202254 3 17623 169. 0 15

2、5. 0 6汉男农村一般 202246 6 16925 172. 0 151. 0 4羌男农村一般 202453 5 15727 168. 0 152. 0 4汉女城市较差 201946 4 16824 170. 5 153. 0 2汉男农村一般 202578 3 17429 167. 0 157. 0 6其它男农村一般 2010年成都市 “正常”人群身高及其影响因素调查 第一节 频数分布表和频数分布图 原始资料 以个体为对象收集的数据排列杂乱无章 很难发现、总结出群体的特征和规律 分组整理,用简明扼要的形式来全面反映 资料(群体)的特点 频数分布表 频数分布图直方图 频数表(frequenc

3、y table)的构成 分组标志:或称组段,是将资料(群体)按照某 种标准(标志)划分成不同的组别 频数:统计不同组别内发生的观察值个数 频数分布表频数分布表 性别频数频率(%) 男4040.00 女6060.00 合计100100.00 某班性别构成情况 取值为某实数范围区间的特定值 以变量取值为分组标志,并列出相应频数 离散型定量变量频数表离散型定量变量频数表 完成次数 频数f频率(%)累计频数累计频率(%) 232.9432.94 376.86109.80 41615.692625.49 53332.355957.84 62423.538381.37 71413.739795.10 84

4、3.9210199.02 910.98102100.00 合计102 100.00 表4.1 2005年某市102名高中男生引体向上完成次数的频数分布 标题 纵标目 横标目 顶线 底线 纵标目 下横线 完成次数 频 数 频率(%)累计频 数 累计频 率 (%) 232.9432.94 376.86109.80 41615.692625.49 53332.355957.84 62423.538381.37 71413.739795.10 843.9210199.02 910.98102100.00 合计10 2 100.0 0 表4.1 2005年某市102名高中男生引体向上完成次数的频数分布

5、数字区 引例引例 1.706 1.326 1.632 1.876 2.161 1.684 1.533 1.175 1.867 1.676 2.091 1.847 1.213 1.277 0.989 2.235 1.665 1.289 1.724 1.548 1.608 1.890 1.733 1.796 1.203 1.736 1.450 1.633 1.555 1.352 1.832 1.444 1.737 1.459 1.450 1.782 1.555 1.634 1.508 2.343 1.509 1.745 1.953 1.744 1.695 1.707 1.901 1.825 1.5

6、97 2.338 1.708 1.711 1.856 1.644 1.716 1.978 1.534 1.900 1.595 1.646 1.905 1.610 1.614 1.422 2.301 2.127 1.348 1.317 1.062 1.830 1.980 1.570 1.495 1.864 2.170 2.000 1.705 1.863 1.424 2.022 2.068 1.576 1.833 1.659 2.212 1.399 2.128 1.543 1.562 1.382 1.291 1.796 1.647 1.415 1.873 0.996 1.936 1.526 1.4

7、24 1.589 1.670 1.056 1.969 1.481 2.406 2.123 1.988 1.512 1.030 1.886 1.930 1.725 1.374 1.654 1.663 1.438 1.645 1.214 1.184 1.735 例4.2 在某市2005年进行的小学生体质评价研究 中,测定了120名9岁男孩的肺活量(L),资料如下 ,根据该资料制作频数表。 其值可以取在某个实数范围区间的任 意值,即在某个实数范围区间连续存 在 人为分割成若干个组段,再求频数 连续型定量变量的频数表连续型定量变量的频数表 求全距 (range / R):观察值中的最大值与最 小值的差

8、值即为全距(或极差) R=2.406-0.989=1.417(L) 。 确定组数a 公式法 经验法:一般观察对象在50以下时可分58组, 在50以上时可分915组 本例拟分a =11组 频数表的编制频数表的编制 确定组距i(class interval) :即每个组段包含 的距离 不等距划分专业意义 等距划分i=R/a 原始数据精度向上四舍五入1位 p本例i=1.417/11=0.1290.13 频数表的编制频数表的编制 确定组段:即确定各组段的上下限,明确 各组段含义 穷尽原则(不漏) 互斥原则(不重) 频数表的编制频数表的编制 确定最小组段下限 最小组段必须包含最小值 原始数据精度向上截取

9、1位 最小值0.989,取第一组段下限为0.98 根据最小组段下限和组距确定各组段范围 规定:半闭半开,含上限不含下限 第一组段0.981.11,第二组段为1.111.24 第一组段0.98,第二组段为1.11 确定最大组段上限 最大组段必须包含最大值 最大值2.406, 取2.282.41 频数表的编制频数表的编制 表4.2 2005年某市120名9岁岁男孩肺活量(L)频频数分布 组段频数( f )频率(%)累计频 数累计频 率(%) 0.9854.1754.17 1.1154.17108.33 1.2475.831714.17 1.371411.673125.83 1.501915.835

10、041.67 1.632924.177965.83 1.761512.509478.33 1.891210.0010688.33 2.0265.0011293.33 1.1543.3311696.67 2.282.4143.33120100.00 合 计120100.00 统计各组段频数,计算频率和累计频率 频数分布图频数分布图直方图直方图 图4.1 2005年某市120名9岁男孩肺活量频数分布 累计频率分布图累计频率分布图 图4.2 2005年某市120名9岁男孩肺活量累计频率分布 累计频率(%) x 频数分布类型(分布形式) 揭示频数分布特征 集中趋势集中位置 离散趋势变异性 便于进一步计

11、算指标和统计处理 便于发现某些特大或特小的可疑值 频数表和直方图的用途频数表和直方图的用途 频数的分布是否对称 对称分布:集中位置在正中,左右两侧频数分 布大致对称。 偏态分布:指频数分布不对称,集中位置偏向 一侧 正偏态分布:集中位置偏向数值小的一侧 负偏态分布:集中位置偏向数值大的一侧 频数分布形式频数分布形式 图4.1 2005年某市120名9岁男孩肺活量频数分布 某年某地一次伤寒爆发潜伏期频数表 219名乳腺癌患者康复期生存质量评分 频数分布类型(分布形式) 揭示频数分布特征 集中趋势集中位置 离散趋势变异性 便于进一步计算指标和统计处理 便于发现某些特大或特小的可疑值 频数表和直方图

12、的用途频数表和直方图的用途 图4.1 2005年某市120名9岁男孩肺活量频数分布 集中趋势(central tendency) 一组数据向某一个位置聚集或集中的倾向 该集中位置,反映一组数据的平均水平 离散趋势(dispersion tendency) 各个数据背离集中位置的倾向 反映一组数据的分散性或变异度 频数分布特征频数分布特征 一组数据向某一个位置聚集或集中的倾向 集中位置的刻画指标:平均数(Average) 均数 几何均数 中位数 统计学意义 说明集中位置的准确水平 说明数据的平均水平或中心位置 常作为群体中最有代表性的值与其它群体进行比较 第二节第二节 集中趋势的刻画指标集中趋势

13、的刻画指标 是算术均数(arithmetic mean)的简称 表示符号:总体均数用表示,样本均数用 表示 计算方法 直接法 频数表法 均数均数(Mean) (Mean) 表4.2 2005年某市120名9岁岁男孩肺活量(L)频频数分布 组段频数( f )频率(%)累计频 数 累计频率 (%) 0.98 54.1754.17 1.11 54.17108.33 1.24 75.831714.17 1.37 1411.673125.83 1.50 1915.835041.67 1.63 2924.177965.83 1.76 1512.509478.33 1.89 1210.0010688.33

14、2.02 65.0011293.33 1.15 43.3311696.67 2.282.4 1 43.33120100.00 合 计120100.00 均数的特点均数的特点 优点 计算简单、容易理解 均衡的考虑了每个个体值的信息,利用信息全 面 一组单峰对称分布资料中最有代表性的值 是正态分布的一个重要参数 缺点 受极端值的影响大 不适用于偏态分布或分布不明 不适用于开口资料集中趋势的描述 产生原因:测量工具的测量范围 表现形式:一端或两端存在不确切值 特点:在资料中所占比例不会太高 均数的特点均数的特点 适用于描述单峰对称分布资料的集中趋势 特别是正态分布或近似正态分布资料集中 趋势的描述

15、在描述正态分布特征方面具有重要意义是正 态分布的一个参数 均数的应用均数的应用 均数的应用均数的应用 均数 偏态分布 有极端值的资料 开口资料 单峰对称分布 正态分布 分布不明 例4.5 某医院预防保健科用流脑疫苗为75名 儿童进行免疫接种后,抗体滴度测定结果 如下,求平均滴度。 引例引例 抗体滴度滴度倒数x频数f 1:444 1:889 1:161621 1:323220 1:646412 1:1281285 1:2562564 合计75 表4.3 75名儿童的抗体滴度 75名儿童的抗体滴度分布 75名儿童的对数抗体滴度分布 75名儿童进行流脑疫苗免疫接种1个月后对 数抗体滴度的均数为: X

16、 正偏态分布 观察值之间 呈等比关系 (或近似) lgX 对称分布 正态分布 对数正态 分布 应用:观察值之间呈倍数或近似倍数变化(等比关 系) 资料,呈正偏态分布,但数据经过对数变换后 呈对称分布,甚至正态分布的资料(对数正态分布 ) 符号:用G表示 计算方法 几何均数几何均数(Geometric Mean) (Geometric Mean) 计算几何均数时观察值中不能有0或负数 观察值均为负数时,去掉符号进行计算,计算 结果加上负号为所求几何均数 观察值中有0或正负同时存在时,观测值同时加 上实数k,使所有值均为正数后进行计算,计算 结果减去实数k所求为几何均数 几何均数注意事项几何均数注意事项 平均数平均数 对数化后呈对称几何均数 中位数均数 偏态分布 有极端值的资料 开口资料 分布不明 中位数,用M表示 是将资料从小到大排序后位置居中的数值 使P(Xx)0.5与P(Xx)0.5同时成立的值 计算方法 直接

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号