第2讲定量资料的统计描述

上传人:资****亨 文档编号:477823991 上传时间:2024-05-05 格式:PPT 页数:91 大小:6.48MB
返回 下载 相关 举报
第2讲定量资料的统计描述_第1页
第1页 / 共91页
第2讲定量资料的统计描述_第2页
第2页 / 共91页
第2讲定量资料的统计描述_第3页
第3页 / 共91页
第2讲定量资料的统计描述_第4页
第4页 / 共91页
第2讲定量资料的统计描述_第5页
第5页 / 共91页
点击查看更多>>
资源描述

《第2讲定量资料的统计描述》由会员分享,可在线阅读,更多相关《第2讲定量资料的统计描述(91页珍藏版)》请在金锄头文库上搜索。

1、第二讲第二讲 定量资料的统计描述定量资料的统计描述 杨土保杨土保 教授教授 博士博士中南大学公共卫生学院中南大学公共卫生学院流行病与卫生统计学系流行病与卫生统计学系2021-03-122021-03-12编辑ppt主要内容主要内容频数分布表和频数分布图频数分布表和频数分布图集中位置的描述集中位置的描述离散程度的描述离散程度的描述正态分布及其应用正态分布及其应用 编辑ppt频数与频数分布频数与频数分布频数与频数分布频数与频数分布频数:某个测量值的个例数。频数:某个测量值的个例数。频数分布表频数分布表frequency distribution table:又:又称频数表。是将原始数据值适当分组后

2、得到各组称频数表。是将原始数据值适当分组后得到各组的频数,如表的频数,如表4-1频数分布表。频数分布表。适用样本量较大的资料进行统计描述的常用方适用样本量较大的资料进行统计描述的常用方法。通过频数表可以显示数据分布的范围与形态。法。通过频数表可以显示数据分布的范围与形态。可用手工和计算机软件如可用手工和计算机软件如SAS、SPSS等等方便制作频数表。方便制作频数表。编辑ppt 频数分布表频数分布表(frequency table)用途:用途:用于描述资料的分布特征用于描述资料的分布特征频数:在一批样本中,相同情形出现的次数称为频数:在一批样本中,相同情形出现的次数称为该情形的频数。该情形的频数

3、。资料类型资料类型组段组段频数频数计数和等级计数和等级观察结果的所有观察结果的所有分类分类相同类别出现的相同类别出现的次数次数计量计量根据观察结果重根据观察结果重新划分新划分分组统计分组统计编辑ppt表表4-3 某地某地150名正常成年男子红名正常成年男子红细胞数细胞数1012/L 编号编号红细胞数红细胞数编号编号红细胞数红细胞数1 13.983.982 24.544.541431434.674.673 34.744.741441445.405.404 45.135.131451455.295.295 54.434.431461464.774.776 64.814.811471475.385.

4、387 74.984.981481485.155.158 83.793.791491494.644.641501505.195.19编辑ppt1.频数表的编制步骤频数表的编制步骤1求极差求极差range:即最大值与最小值之差,:即最大值与最小值之差,又称为全距。又称为全距。本例极差:本例极差:R=5.883.79=2.09 1012/L2 决定组数、组段和组距:根据研究目的和决定组数、组段和组距:根据研究目的和样本含量样本含量n确定。组距确定。组距=极差极差/组数,通常分组数,通常分10-15个组,为方便计,组距参考极差的十分之一个组,为方便计,组距参考极差的十分之一,再略再略加调整。加调整。

5、本例本例i=R/10=2.09/10=0.2090.2。编辑ppt3 列出组段:第一组段的下限略列出组段:第一组段的下限略小于最小值,最后一个组段上限必须小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。包含最大值,其它组段上限值忽略。4 划记计数:用划记法将所有数划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。据归纳到各组段,得到各组段的频数。编辑ppt组段组段(1)频数,频数,f(2)组中值,组中值,X(3)fX(4)=(2)(3)3.713.83.83.944.016.04.1114.246.24.3174.474.84.5264.6119.64.7324.81

6、53.64.9265.0130.05.1185.293.65.3105.454.05.545.622.45.75.9合计合计15.85.8150719.8编辑ppt频数与频数分布频数与频数分布离散型定量变量的频数表离散型定量变量的频数表 某市某市20052005年进行学生体质评价,抽样调查了年进行学生体质评价,抽样调查了102102名高中男生引体向上完成次数的情况,根据名高中男生引体向上完成次数的情况,根据该资料制作频数表。该资料制作频数表。本次调查资料本次调查资料“引体向上完成次数是离散型引体向上完成次数是离散型定量变量,所以按变量的取值定量变量,所以按变量的取值(次数次数)为单位为单位分组

7、,再列出各组的频数,如表分组,再列出各组的频数,如表4.14.1的第的第(1)(1),(2)(2)栏,就能得到相应的频数表。将各组的栏,就能得到相应的频数表。将各组的频数除以总频数所得的值称为频率,见第频数除以总频数所得的值称为频率,见第(3)(3)栏。某组的累计频数是该组与前面各组频数栏。某组的累计频数是该组与前面各组频数之和,见第之和,见第(4)(4)栏。显然,第一组的累计频数栏。显然,第一组的累计频数等于其频数,最后一组的累计频数等于总例等于其频数,最后一组的累计频数等于总例数;累计频数除以总频数所得的值称为累计数;累计频数除以总频数所得的值称为累计频率,见第频率,见第(5)(5)栏。栏

8、。编辑ppt频数与频数分布频数与频数分布表4.12005年某市102名高中男生引体向上完成次数的频数分布完成次数频数f频率(%)累计频数累计频率(%)(1)(2)(3)(4)(5)232.9432.94376.86109.8041615.692625.4953332.355957.8462423.538381.3771413.739795.10843.9210199.02910.98102100.00合计102100.00编辑ppt频数与频数分布频数与频数分布例4.2在某市2005年进行的小学生体质评价研究中,测定了120名9岁男孩的肺活量(L),资料如下,根据该资料制作频数表。1.7061.

9、3261.6321.8762.1611.6841.5331.1751.8671.6762.0911.8471.2131.2770.9892.2351.6651.2891.7241.5481.6081.8901.7331.7961.2031.7361.4501.6331.5551.3521.8321.4441.7371.4591.4501.7821.5551.6341.5082.3431.5091.7451.9531.7441.6951.7071.9011.8251.5972.3381.7081.7111.8561.6441.7161.9781.5341.9001.5951.6461.9051.

10、6101.6141.4222.3012.1271.3481.3171.0621.8301.9801.5701.4951.8642.1702.0001.7051.8631.4242.0222.0681.5761.8331.6592.2121.3992.1281.5431.5621.3821.2911.7961.6471.4151.8730.9961.9361.5261.4241.5891.6701.0561.9691.4812.4062.1231.9881.5121.0301.8861.9301.7251.3741.6541.6631.4381.6451.2141.1841.735连续型定量变量

11、的频数表连续型定量变量的频数表编辑ppt频数与频数分布频数与频数分布手工编制表4.2步骤。1计算全距range,R,也称为极差 2确定组段数与组距:组段数一般可在1015之间选择。一般当观察值的个数n 在50以下时可分5到8组,n在50以上时可分9到15组,实际运用时应根据分析的要求,灵活确定组数。本例n为120,拟分11组。组距=上限下限=R/预计的组段数。本例如果预计取11个组段,那么组距长度可取0.130。两端的组段应分别包含最小值或最大值;3列表 做出如表4.2的表格,将选好的组段顺序地列在(1)列。按照“下限x上限 的原那么确定每一例数据x应归属的组段。编辑ppt表4.22005年某

12、市120名9岁男孩肺活量(L)频数分布组段组段频数频数(f)频率频率(%)累计频数累计频数累计频率累计频率(%)(1)(2)(3)(4)(5)0.98054.1754.171.11054.17108.331.24075.831714.171.3701411.673125.831.5001915.835041.671.6302924.177965.831.7601512.509478.331.8901210.0010688.332.02065.0011293.332.15043.3311696.672.2802.41043.33120100.00合计合计120100.00表表4.22005年某市

13、年某市120名名9岁男孩肺活量岁男孩肺活量(L)频数分布频数分布编辑ppt频数与频数分布频数与频数分布频数分布图:在表频数分布图:在表4.2的根底上,可以绘制出的根底上,可以绘制出图图4.1,称为直方图频率直方图。,称为直方图频率直方图。横轴:男孩的肺活量横轴:男孩的肺活量 纵轴:频率密度,即频率纵轴:频率密度,即频率/组距直条面积组距直条面积等于相应组段的频率。等于相应组段的频率。在组距相等时,直方图中矩形直条的高在组距相等时,直方图中矩形直条的高度与相应组段的频率成正比。度与相应组段的频率成正比。编辑ppt频数与频数分布频数与频数分布图4.12005年某市120名9岁男孩肺活量频数分布 编

14、辑ppt频数与频数分布频数与频数分布对称分布:频数最多的组段在中央,图4.1正偏峰分布:峰向左侧偏移的分布,右侧的组段数多于左侧,为右偏峰分布。图4.2负偏峰分布:峰向右侧偏移的分布,左侧的组段数多于右侧,称为左偏峰分布。图4.3编辑ppt图4.22004年我国麻疹患者的年龄分布 图图4.3某市某市219名乳腺癌患者术后康复期名乳腺癌患者术后康复期生存质量评分的分布生存质量评分的分布 编辑ppt编辑ppt频数分布表和频数分布图的主要用途频数分布表和频数分布图的主要用途1.1.揭示频数分布的特征揭示频数分布的特征 两个重要特征:集中趋势两个重要特征:集中趋势(central tendency)(

15、central tendency)和离散趋势和离散趋势(dispersion tendency)(dispersion tendency)。集中趋势是。集中趋势是指一组数据向某一个位置聚集或集中的倾向,离散指一组数据向某一个位置聚集或集中的倾向,离散程度那么反映的是一组数据的分散性或变异度程度那么反映的是一组数据的分散性或变异度2.2.揭示频数分布的类型揭示频数分布的类型 两种类型两种类型:对称型和不对称型对称型和不对称型 偏态分布偏态分布:正偏态正偏态(positive skew),(positive skew),负偏态负偏态(negative skew)(negative skew),用频

16、数分布表和频数分布图揭示频数分布的类用频数分布表和频数分布图揭示频数分布的类型和特征,便于选用适当的统计方法。型和特征,便于选用适当的统计方法。4便于进一步做统计分析和处理3便于发现一些特大或特小的可疑值*编辑ppt编辑ppt计量资料的常用统计指标计量资料的常用统计指标集中位置集中位置central tendencycentral tendency的描述的描述 平均数平均数(average)(average)是描述定量变量集中位置的特是描述定量变量集中位置的特征值,用来说明数据的平均水平,它反映了一组征值,用来说明数据的平均水平,它反映了一组资料的资料的“一般、一般、“大多数、大多数、“平常等情况。平常等情况。平均数是一类统计指标的统称,在医学领域中常平均数是一类统计指标的统称,在医学领域中常用的平均数有算术均数用的平均数有算术均数(arithmetic mean)(arithmetic mean)、几、几何均数何均数(geometric mean)(geometric mean)和中位数和中位数(median)(median)算术均数:适合描述对称分布资料的集中位置算术均数:适合描述

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号