02定量资料的统计描述

上传人:宝路 文档编号:49098882 上传时间:2018-07-23 格式:PPT 页数:57 大小:3.34MB
返回 下载 相关 举报
02定量资料的统计描述_第1页
第1页 / 共57页
02定量资料的统计描述_第2页
第2页 / 共57页
02定量资料的统计描述_第3页
第3页 / 共57页
02定量资料的统计描述_第4页
第4页 / 共57页
02定量资料的统计描述_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《02定量资料的统计描述》由会员分享,可在线阅读,更多相关《02定量资料的统计描述(57页珍藏版)》请在金锄头文库上搜索。

1、定量资料的统计描述贾 睿:成都中医药大学公共卫生与管理学院电 话:13666252064电子邮箱:学习要求掌握内容l频数分布表的编制和应用l描述数据分布平均水平的指标l掌握算术均数、几何均数、中位数的意义、用途及计算方法。l描述数据分布变异程度的指标l掌握极差、四分位数间距、方差、标准差、变异系数的意义、用途及计算方法。熟悉内容l描述数据分布平均水平的指标l熟悉百分位数、众数、调和均数的意义、用途及计算方法。l描述分布形态的特征数l偏度系数l峰度系数231.频数表的绘制某市某年120名8岁男孩的身高124.6126.2128.1130.6132.6125.4126.6128.4124.5129

2、.5124.8127.8128.3131.8125.8126.8129.6125.6127.6129.8125.5120.3122.3118.2116.7121.7116.8121.6115.2122.0121.7118.8121.8124.5121.7122.7116.3124.0119.0124.5121.8124.9130.0123.5128.1119.7126.1131.3123.8114.7122.2122.8128.6122.0132.5122.0123.5116.3126.1119.2126.4118.4121.0119.1116.9131.1120.4115.2118.0122

3、.4114.3116.9126.4114.2127.2118.3127.8123.0117.4123.2119.9122.1120.4124.8122.1114.4120.5115.0122.8116.8125.8121.1124.8122.7119.4128.2124.1127.2120.0122.7118.3127.1122.5116.3125.1124.4112.3121.3127.0113.5118.8127.6125.2121.5122.5129.1126.6134.5118.3132.84从上表可以看出:l“某市某年8岁男孩” 同质观察对象l这些男孩的身高并不完全相等 同质的基础上

4、存在变异l“120名” 样本l频数(frequency)l观察数据的个数l频数分布(frequency distribution) l观察数据在其取值范围内的分布情况l定量资料的频数分布情况可以用频数表(frequency distribution table)或直方图表示。5步骤:l计算极差134.5-112.3=22.2cml确定组数、组距和组段l通常815组l组距:极差/组数(可调整)l组段的起点叫“下限”,终点叫“上限”。l首尾组段分别包含最小值和最大值l列表划记l计算频数、频率、累计频数和累计频率120名8岁男孩身高频数表(第7页)组段频数频率 (%)累计 频数累计频 率(%)112

5、21.721.711475.897.511697.51815.01181411.73226.71201512.54739.21222117.56856.71241815.08671.71261512.510184.2128108.311192.513054.211696.713232.511999.213413610.8120100.06n同一组资料,不同的人编制的频数表,结果不尽相同,允许几个合理的结果并存。 2.频数表的应用l描述分布类型l描述分布特征l发现离群值l简化计算l陈述资料8120名8岁男孩身高频数表组段频数112211471169118141201512221124181261

6、51281013051323134136192.1描述分布类型l对称分布强调:近似正态分布(中间高、两边低,左右对称,近似钟型)本例为近似正态分布10120名8岁男孩身高频数表组段频数11214114151162111818120151221012491267128513031322134136111l不对称分布强调:偏态分布l正偏态分布:频数集中在数据小侧l负偏态分布:数据集中在数据大侧本例为正偏态分布医学资料常见偏态分布。12图 239人发汞含量的频数分布1 3 5 7 9 11 13 15 17 19 21发汞含量( mol/kg)706050403020100人 数图 某城市892名老

7、年人生存质量自评分的频数分布0 10 20 30 40 50 60 70 80 90 100自评分4003002001000人 数图 102名黑色数瘤患者的生存时间频数分布1 5 10 15 20 25 30 35 40 45生存时间(月)403020100人 数图 某地19901992年男性死亡年龄分布0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 死亡年龄(岁)250020001500100050002.2描述分布特征l平均水平:l描述频数分布集中的位置,本例数据集中在122124cm之间l变异程度:l描述数据分散状况,本例数据分布在

8、112136cm之间17120名8岁男孩身高频数表组段频数112211471169118141201512221124181261512810130513231341361120名8岁男孩身高频数表组段频数112111401160118141201512221124181261512810130013201341361182.3发现离群值l离群值为资料的特大值或特小值。193.描述平均水平l定量资料的平均水平指资料的集中位置,其大小用平均数表示。l平均数(average)是一个指标体系,包括:算术均数、几何均数、中位数、第x百分位数、众数、调和均数等。l平均数的计算必须以同质为基础。203.1

9、算术均数(简称均数mean )21l总体均数 ;样本均数 l代表每组观察值的平衡点,也就是重心。l适用于单峰对称分布资料12345678l直接法:适用于样本含量较小的未分组资料l说明:x表示变量值,表示求和,n表示样本含量22l加权法:适用于样本含量较大的频数表资料l说明:此处x表示组中值,f表示频数,表示求和l例:120名8岁男孩的身高资料120名8岁男孩身高频数 表组段组中值频数112113211411571161179118119141201211512212321124125181261271512812910130131513213331341361351233.2中位数(media

10、n,M)例:4 4 5 5 6 64 4 5 5 6 6 70x1 x2 x3 x4 x5 x6 x7l定义: 将一组观察值按从小到大的顺序进行排列,位置居中的数就是中位数。24l直接法:样本含量较小的未分组资料。ln为奇数时:ln为偶数时:4 4 5 5 6 6 1704 4 5 5 6 6 ?25加权法:适用于样本含量较大的频数表资料l公式:l说明:L表示M所在组段的下限;i表示该组段的组距;f表示该组段的频数;n表示样本含量;fL表示小于该组段的累计频数。l例:M=12+12/56(150/2-23) =23.14(小时)150例某型食物中毒患者 的频数表潜伏期 (小时)频数累计 频数累

11、计频率 (%)0232315.3312567952.67243811778.00362013791.33481014798.0060723150100.0026l适用情况:任何分布类型,尤其适 用于下列情况l偏态分布l开口资料l分布不清273.3百分位数(percentile, PX)l定义l公式l例:P50 =12+12/56(15050%-23)=23.14(小时)P25 =12+12/56(15025%-23)=15.11(小时)P75=24+12/38(15075%-79)=34.58(小时)28150例某型食物中毒患者 的频数表潜伏期 (小时)频数累计 频数累计频率 (%)0 -23

12、2315.3312 -567952.6724 -3811778.0036 -2013791.3348 -1014798.0060 -723150100.003.4几何均数(geometric mean,G )l资料A: 2 4 6 8 10l资料B:2 4 8 16 32l适用情况:l标准情况:等比级数资料l扩展情况:正偏态分布,变量值跨越多个数量级29l变量变换2 4 8 16 32lg2 lg4 lg8 lg16 lg320.30 0.60 0.90 1.20 1.51l等比级数资料可以通过对数变换,转化为正态分布30l直接法l加权法31l注意事项l几何均数常用于等比级资料或对数正态分布资

13、料。l观察值中若有0或负值,则不宜直接使用几何均数。l观察值一般同时不能有正值和负值。若全是负值,计算时可先将负号去掉,得出结果后再加上负号。323.5众数(mode)l指总体中出现机会最高的数值,样本中出现次数最高的数字。33众数、均数、中位数之间的关系l对称分布三者相等l正偏态分布众数中位数均数34众数=均数=中位数3.6调和均数(harmonica mean, H)l先求原始数据的倒数的算术均数,该算术均数的倒数即称为原始数据的调和均数。l适用于变异程度较大的资料35l你还知道哪些描述平均水平的指标?364.描述变异程度l例:两个资料如下:A:1 3 5 7 9 11 13B:6 6 6

14、 7 8 8 8l两资料均为对称分布,可选用均数描述平均水平,且均为7,但资料A的数据分布较资料B分散,7对资料的代表性相对较差。374.1平均数与变异度的关系 l平均数表示的集中性与变异度表示的离散性,是从两个不同的角度阐明计量资料的特征 l变异度越小,平均数对各变量值的代表性越好 l变异度越大,平均数对各变量值的代表性越差 l变异程度是指各观察值之间参差不齐 的程度,反映资料的变异程度。l常用指标:极差、四分位间距、离均 差平方和、方差、标准差、变异系数 等。l反映平均水平和变异程度的指标结合 起来,全面认识事物。394.2极差(range,R,又称全距)l一组观察值中最大值与最小值之差,单位与观察值相同。l极差越大,变异程度越大。如上例:A:1 3 5 7 9 11 13 R12B:6 6 6 7 8 8 8 R240l适用情况:l描述单峰对称分布小样本资料的变异程度;l初步了解资料的变异程度。41l不足之处:只考虑最大值与最小值之差异,不能反映组 内其它观察值的变异度;样本含量越大,抽到较大或较小观察值的可 能性越大,则全距可能越大,因此样本含量 悬殊时不宜用全距比较。如上例资料B改为:B:1 6 6 7 8 8 13 R12,则无法区分 与资料A的变异程度谁大。424.3方差、标准差lA:1 3 5 7 9 11 13lB:1 6 6 7 8 8 13l由于极差不

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号