统计学基础(第三章)

上传人:宝路 文档编号:47526398 上传时间:2018-07-02 格式:PPTX 页数:50 大小:1.09MB
返回 下载 相关 举报
统计学基础(第三章)_第1页
第1页 / 共50页
统计学基础(第三章)_第2页
第2页 / 共50页
统计学基础(第三章)_第3页
第3页 / 共50页
统计学基础(第三章)_第4页
第4页 / 共50页
统计学基础(第三章)_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《统计学基础(第三章)》由会员分享,可在线阅读,更多相关《统计学基础(第三章)(50页珍藏版)》请在金锄头文库上搜索。

1、第三章数据整理与显示statistics统计学第三章数据整理与显示本章内容第一节 数据的审核 第二节 统计分组及频数分布 第三节 统计表 第四节 统计图statistics统计学第三章数据整理与显示第一节 数据的审核statistics统计学第三章数据整理与显示数据的审核数据的检查 数据的完整性和准确性 数据的校订 对数据做进一步的补充和修正 statistics统计学第三章数据整理与显示数据检查的步骤 事先制定出检查的规则,明确规定出哪些问卷可以接 受、哪些问卷必须拒绝等,并对每一份问卷进行检查。 根据检查规则,将所有的问卷分为三个部分:可以接受 的、明显要作废的、对是否可以接受有疑问的。

2、对可以接受的问卷和有疑问的问卷作进一步的校订。 statistics统计学第三章数据整理与显示数据校订的步骤一、对每一份问卷,检查出不满意的答案哦哦, ,这些都这些都 是不满意是不满意 的答案啊的答案啊! !字迹模糊的;回答不完全的;不一致的;模棱两可的;跳答错误的; statistics统计学第三章数据整理与显示数据校订的步骤二、处理不满意答案有不满意答案的问卷数量很小 1.按缺失值处理 整份问卷中,不满意的答案所占比例很小有不满意答案的变量(问题)不是关键变量 statistics统计学第三章数据整理与显示2.整个问卷作废不满意的问卷比例很小(不超过10)样本容量很大不满意的问卷和满意的问

3、卷之间没有明显的差别每份不满意的问卷中,不满意答案的比例很大关键变量的答案缺失statistics统计学第三章数据整理与显示对二手数据的整理要求 完整性 准确性 适用性 时效性 ExcelExcelstatistics统计学第三章数据整理与显示第二节 统计分组及频数分布statistics统计学第三章数据整理与显示统计分组统计分组:根据统计总体内在的特征和统计研究的任务 需要,将统计总体按照一定的标志划分为若干组成部 分的一种统计方法。统计分组的目的:把同质总体中的具有不同性质的单位 分开,把性质相同的单位合并在一起,保持各组内统 计资料的一致性和各组之间资料的差异性,以便进一 步研究调查对象

4、的数量表现与数量关系,进而正确认识调查对象的本质及其规律性。 statistics统计学第三章数据整理与显示频数分布 在统计分组的基础上,把总体全部单位按组归类整理,汇 总出各组的总体单位数,并将其按分组顺序加以排列而形 成的统计数列频数分布 分布在各组中的总体单位数频数(次数)频数与总频数的比值比率(频率) 频数分布是对统计分组结果的表达,是进一步统计分析的 重要基础。 statistics统计学第三章数据整理与显示某单位职工文化程度分布表文化程度频数/人比例/高中 专科 本科 硕士研究生10 56 48 167.69 43.08 36.92 12.31 合计 130100.00 stati

5、stics统计学第三章数据整理与显示区分总体类型 统计分组的作用 反映总体内部结构 分析总体在数量现象之间的依存关系 穷尽原则 统计分组的原则互斥原则statistics统计学第三章数据整理与显示定性数据的分组 定类数据的分组 定序数据的分组 statistics统计学第三章数据整理与显示定类数据的分组原则 按照其各个类别的含义进行汇总,计算出相应的频数和频率 定类数据的分布数列可借助于Excel进行编制statistics统计学第三章数据整理与显示例1:某班40个同学分别来自湖北、湖南、安徽、山东。 下表是这40个同学的原始数据,试借助于Excel将其整理成频 数分布。山东湖南山东安徽安徽湖

6、北湖北山东安徽湖北湖北湖北湖南山东安徽湖北湖北山东湖北湖北山东湖南湖北山东山东湖南安徽湖南湖北湖南安徽山东山东安徽湖南安徽安徽山东湖北山东statistics统计学第三章数据整理与显示解:为方便整理,将学生籍贯合并为一列,表达在Excel工作表中的A2 :A41,并用数字代码来表示学生籍贯:设1湖北,2湖南,3安徽 ,4山东,将各学生的籍贯代码填入Excel工作表中B2:B41。Excel把 代码视为数值型数据。为建立频数分布和条形图,Excel要求将4个代码 单独作为一列,以作为“接收区域”,设将4个代码输入到工作表的C2 :C5。 statistics统计学第三章数据整理与显示具体步骤:(

7、1)打开Excel工作表中“工具”下拉菜单中的“数据分析”选项。(2)在“数据分析”对话框中选择“直方图”命令,并点击“确定”按钮。(3)在该对话框中“输入区域”一栏填入数据区域B2:B41;在“接收区域”一栏填入代码区域C2:C5;在“输出区域”一栏填入结果输出的区域;其他选项根据需要选择。点击“确定”按钮,得结果。(4)对输出结果进行还原并适当改造,即可得频数分布。statistics统计学第三章数据整理与显示定序数据的分组原则和定类数据相类似,只是进一步要求各分组按顺序排列 statistics统计学第三章数据整理与显示定序数据的累积频数和累积频率累积频数:依分组顺序将各组频数逐级累加起

8、来。累积频率(累积百分比):将各分组的频率或百分比逐级累加起来。 statistics统计学第三章数据整理与显示例2:在一项有关住房间题的研究中,研究人员在甲、乙两个城市各抽样调 查300户家庭,其中的一个问题是:“您对您家庭目前的住房状况是否满意 ?”(1)非常不满意;(2)不满意;(3)一般:(4)满意;(5)非常满意答:调查整理的结果为回答类别类别甲 城 市户户数/户户百分比/%向上累积积向下累积积户户数/ 户户百分比/%户户数/ 户户百分比/%非常不满满意 不满满意 一般 满满意 非常满满意24 108 93 45 308 36 31 15 1024 132 225 270 3008.

9、0 44.0 75.0 90.0 100.0300 276 168 75 30100 92 56 25 10合计计300100statistics统计学第三章数据整理与显示回答类别类别乙 城 市户户数/户户百分比/%向上累积积向下累积积户户数/户户百分比/%户户数/户户百分比/%非常不满满意 不满满意 一般 满满意 非常满满意21 99 78 64 387.0 33.0 26.0 21.3 12.721 120 198 262 3007.0 40.0 66.0 87.3 100.0300 279 180 102 38100.0 93.0 60.0 34.0 12.7合计计300100.0sta

10、tistics统计学第三章数据整理与显示数值数据(定距数据)的分组单项分组:每一个组中只有一个变量值,适用于离散型变量 的数据、并且数据的范围不太大情况下的分组。 组距分组:每个分组是一个数值区间。它适用于连续型变量或变动范围较大的离散型变量的数据分组。statistics统计学第三章数据整理与显示某班同学年龄分布年 龄人数/人比例/15 16 17 183 23 45 9 3.75 28.75 56.25 11.25 合计80 100.00 某班同学数学成绩分布成 绩人数/人比例/60以下 6069 7079 8089 90以上2 15 36 20 7 2.50 18.75 45.00 25

11、.00 8.75 合计80 100.00 单项数列组距数列statistics统计学第三章数据整理与显示组距分组应注意的问题1.组数(class data)与组距(class width) 组数与组距(i)的关系是:i=R/m 两者成反比变化。2.等距分组与异距分组 当客观现象的变动比较均衡时,宜采用等距分组;当客观现象的变动不均衡时,则宜采用异距分组。3.组限(class limit)和组中值(class midpoint) 组限即每个分组的区间端点(包括上限和下限)。组中值即上限与下限之间的中点数值称为组中值。 statistics统计学第三章数据整理与显示组中值的计算闭口组的组中值=(上

12、限+下限)/2 缺下限的开口组组中值=上限-邻组组距/2 缺上限的开口组组中值=下限邻组组距/2statistics统计学第三章数据整理与显示简单分组与复合分组 简单分组:按照一个分组标志对所研究的对象进行分组。复合分组:按照两个或两个以上的分组标志对所研究的对象 进行分组。(按不同标志层叠分组) statistics统计学第三章数据整理与显示第二节 统计分组及频数分布statistics统计学第三章数据整理与显示统计表定义:把经过整理的数据资料,通过表格的形式表达出来。 分类:广义统计表和狭义统计表。作用:清楚有条理地显示统计资料;直观反映统计分析的特征。statistics统计学第三章数据

13、整理与显示统计表的结构statistics统计学第三章数据整理与显示统计表的分类简单表(一览表):主词未经任何分组的统计表。 简单分组表(分组表):主词只用一个标志分组形成的统计表。 复合分组表(复合表):主词按两个或两个以上标志分组的统计表。statistics统计学第三章数据整理与显示统计表设计规则(一)(1)统计表的各类标题应十分简明,并确切地反映与概括 资料的主要内容以及所属的地区和时间。纵横各栏的排列 特别要注意表述资料的逻辑性。(2)主词各行和宾词各栏,一般先列各个项目,后列总 体。若无必要列出全部项目时,就应先列总体,后列其中 一部分重要项目。内容不宜罗列太多和过于庞杂。(3)表

14、中应有计量单位栏。当表中只有一种计量单位时 ,可在表的右上端注明。若有几个计量单位时,横行的计 量单位可专设“计量单位”一栏,纵栏的计量单位可与纵 栏标题写在一起,用小括号标明。statistics统计学第三章数据整理与显示统计表设计规则(二)(4)表中数字填写要整齐,上下位数要对齐,同栏数字的 单位,小数位要一致。如遇相同数字必须照填,不能用“ 同上”或“同左”代替。无数字的空格要用“”表示。 如遇缺乏资料的空格时,要用“”表示,以免被误认 为漏报。(5)当统计表栏数较多时,通常要加编号,并说明其相 互关系,主词栏与计量单位栏可用甲、乙、丙等文字标明 ;宾词各栏可用(1)(2)(3)等数码标

15、明。(6)统计表的表式为开口式,即表的左右两端不封闭( 不画纵线),表的上下端线通常用粗线或双线,表内如有 两个或两个以上不同的内容,也要用粗线或双线隔开。(7)借用他人数据资料时,统计表应加注解,说明资料 出处,一般在统计表的下端注明“资料来源”。statistics统计学第三章数据整理与显示第四节 统 计 图 statistics统计学第三章数据整理与显示统计图的结构 标题 一般包括图表标题、数值轴(X,Y)标题 坐标轴和网格线 坐标轴和网格线构造了绘图区的骨架, 借助坐标轴和网格线,可以更容易读懂统计图。 图表区和绘图区 统计表的所有内容都在图表区内,包括 绘图区。统计图绘制在绘图区内。 图例 用来标明图表中的数据系列。 statistics统计学第三章数据整理与显示定类数据的统计图 1.饼图饼图(pie char

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号