统计学 第3章数据的整理与显示

上传人:飞*** 文档编号:51630774 上传时间:2018-08-15 格式:PPT 页数:64 大小:2.70MB
返回 下载 相关 举报
统计学 第3章数据的整理与显示_第1页
第1页 / 共64页
统计学 第3章数据的整理与显示_第2页
第2页 / 共64页
统计学 第3章数据的整理与显示_第3页
第3页 / 共64页
统计学 第3章数据的整理与显示_第4页
第4页 / 共64页
统计学 第3章数据的整理与显示_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《统计学 第3章数据的整理与显示》由会员分享,可在线阅读,更多相关《统计学 第3章数据的整理与显示(64页珍藏版)》请在金锄头文库上搜索。

1、3 - 1统计统计 学第 3 章 数据的整理与显示统计学3 - 2统计统计 学第 3 章 数据的整理与显示3.1 数据的预处理 3.2 分类和顺序数据的整理与显示 3.3 数值型数据的整理与显示 3.4 统计表3 - 3统计统计 学学习目标了解数据预处理的内容和目的 掌握分类和顺序数据的整理与显示方法 掌握数值型数据的整理与显示方法 合理使用统计表3 - 4统计统计 学 3.13.1 数据的预处理数据的预处理一. 数据审核 二. 数据筛选 三. 数据排序3 - 5统计统计 学一、数据审核检查数据的错误,保证数据的质量, 为进一步整理分析打下基础。3 - 6统计统计 学数据审核原始数据 (raw

2、 data) 审核的内容完整性审核n检查应调查的单位或个体是否有遗漏n所有的调查项目或指标是否填写齐全 准确性审核n检查数据是否真实反映客观实际情况,内 容是否符合实际n检查数据是否有错误,计算是否正确等3 - 7统计统计 学数据的审核原始数据 (raw data) 审核数据准确性的方法 逻辑检查n从定性角度,审核数据是否符合逻辑,内容是否 合理,各项目或数字之间有无相互矛盾的现象n主要用于对分类和顺序据的审核 计算检查n检查调查表中的各项数据在计算结果和计算方法 上有无错误n主要用于对数值型数据的审核3 - 8统计统计 学数据的审核二手数据 (second hand data)适用性审核n弄

3、清楚数据的来源、数据的口径以及有关的 背景材料n确定数据是否符合自己分析研究的需要 时效性审核n尽可能使用最新的数据 确认是否必要做进一步的加工整理3 - 9统计统计 学二、数据筛选 (data filter)当数据中的错误不能予以纠正,或者有些 数据不符合调查的要求而又无法弥补时, 需要对数据进行筛选 数据筛选的内容包括 将某些不符合要求的数据或有明显错误的数 据予以剔除 将符合某种特定条件的数据筛选出来,而不 符合特定条件的数据予以剔3 - 10统计统计 学用Excel进行数据筛选8 8名学生的考试成绩数据名学生的考试成绩数据 数据筛选 (data filter)3 - 11统计统计 学三

4、、数据排序(data rank)按一定顺序将数据排列,以发现一些明显 的特征或趋势,找到解决问题的线索 排序有助于对数据检查纠错,以及为重新 归类或分组等提供依据 在某些场合,排序本身就是分析的目的之 一 排序可借助于计算机完成3 - 12统计统计 学数据排序(方法)分类数据的排序 字母型数据,排序有升序降序之分,但习惯上 用升序 汉字型数据,可按汉字的首位拼音字母排列, 也可按笔画排序,其中也有笔画多少的升序降 序之分 数值型数据的排序n递增排序:设一组数据为x1,x2,xn,递增 排序后可表示为:x(1)x(2)x(n)3 - 13统计统计 学 3.2 3.2 分类和顺序数据的整理与显示分

5、类和顺序数据的整理与显示一. 分类数据的整理与显示 二. 顺序数据的整理与显示3 - 14统计统计 学数据的整理与显示 (基本问题)要弄清所面对的数据类型,因为不同类型的 数据,所采取的处理方式和方法是不同的 对分类数据和顺序数据主要是做分类整理 对数值型数据则主要是做分组整理 适合于低层次数据的整理和显示方法也适合 于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据3 - 15统计统计 学一、分类数据的整理与图示3 - 16统计统计 学分类数据的整理 (基本过程)1. 列出各类别 2. 2. 计算各类别的频数计算各类别的频数 3. 3. 制作频数分布表制作频数分布表

6、4. 4. 用图形显示数据用图形显示数据分类类频频数比例百分比比率ABCDE3 - 17统计统计 学分类数据的整理 (可计算的统计量)频数(frequency) :落在各类别中的数据个数 比例(proportion) :某一类别数据占全部数 据的比值 百分比(percentage) :将对比的基数作为100 而计算的比值 比率(ratio) :不同类别数值的比值3 - 18统计统计 学分类数据整理频数分布表(例题分析)【例】【例】一家市场调查公司一家市场调查公司 为研究不同品牌饮料的市为研究不同品牌饮料的市 场占有率,对随机抽取的场占有率,对随机抽取的 一家超市进行了调查。调一家超市进行了调查

7、。调 查员在某天对查员在某天对5050名顾客购名顾客购 买饮料的品牌进行了记录买饮料的品牌进行了记录 ,如果一个顾客购买某一,如果一个顾客购买某一 品牌的饮料,就将这一饮品牌的饮料,就将这一饮 料的品牌名字记录一次料的品牌名字记录一次 。右。右边边就是就是记录记录 的原始的原始 数据数据用用ExcelExcel制作频数分布表制作频数分布表绿色绿色健康饮品健康饮品3 - 19统计统计 学分类数据的图示条形图 (bar Chart)用宽度相同的条形的高度或长短来表示 各类别数据的图形 有单式条形图、复式条形图等形式 主要用于反映分类数据的频数分布 绘制时,各类别可以放在纵轴,称为条 形图,也可以放

8、在横轴,称为柱形图3 - 20统计统计 学分类数据的图示柱形图(例题分析)3 - 21统计统计 学分类数据的图示饼图 (pie Chart)也称圆形图,是用圆形及圆内扇形的角度 来表示数值大小的图形 主要用于表示总体或样本中各组成部分所 占的比例,对于研究结构性问题十分有用 绘制圆形图时,总体中各部分所占的百分 比用圆内的各个扇形角度表示,这些扇形 的中心角度,是按各部分数据百分比占 3600的相应比例确定的3 - 22统计统计 学分类数据的图示饼图(例题分析)3 - 23统计统计 学二、顺序数据的整理 (可计算的指标)1. 累积频数(cumulative frequencies):各类别 频

9、数的逐级累加 2. 累积频率(cumulative percentages):各类别 频率(百分比)的逐级累加 3 - 24统计统计 学顺序数据的频数分布表 (例题分析)【例】【例】在一项城在一项城 市住房问题的研市住房问题的研 究中,研究人员究中,研究人员 在甲乙两个城市在甲乙两个城市 各抽样调查各抽样调查300300户户 ,其中的一个问,其中的一个问 题是:题是:“ “您对您家您对您家 庭目前的住房状庭目前的住房状 况是否满意?况是否满意?1 1非常不非常不 满意;满意;2 2不满意不满意 ;3 3一般;一般;4 4 满意;满意;5 5非常满非常满 意。意。 甲城市家庭对对住房状况评评价的

10、频频数分布回答类别类别甲城市户户数 (户户)百分比 (%)向上累积积 向下累积积 户户数 (户户)百分比 (%)户户数 (户户)百分比 (%)非常不满满 意不满满意一般满满意非常满满意24 108 93 45 308 36 31 15 1024 132 225 270 3008.0 44.0 75.0 90.0 100.0300 276 168 75 30100.0 92 56 25 10合计计300100.03 - 25统计统计 学顺序数据的频数分布表(例题分析)乙城市家庭对对住房状况评评价的频频数分布回答类别类别乙城市户户数 (户户)百分比 (%)向上累积积 向下累积积 户户数 (户户)百

11、分比 (%)户户数 (户户)百分比 (%)非常不满满意不满满意一般满满意非常满满意21 99 78 64 387.0 33.0 26.0 21.3 12.721 120 198 262 3007.0 40.0 66.0 87.3 100.0300 279 180 102 38100.0 93.0 60.0 34.0 12.7合计计300100.03 - 26统计统计 学顺序数据的图示累计频数分布图(例题分析)243001322252700100200300400非常不满意不满意 一般 满意 非常满意累 积 户 数(户)(a)向上累积27616830300750100200300400非常不满意

12、不满意 一般 满意 非常满意累 积 户 数(户)(b)向上累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布3 - 27统计统计 学环形图 (annular chart)环形图中间有一个“空洞”,总体中的每一部 分数据用环中的一段表示 环形图与圆形图类似,但又有区别n圆形图只能显示一个总体各部分所占的比例n环形图则可以同时绘制多个总体的数据系列, 每一个总体的数据系列为一个环 环形图可用于结构比较研究 环形图主要用于展示分类和顺序数据3 - 28统计统计 学环形图(例题分析)8%36%31%15%7%33%26%21%13%10%非常不满意不满意一般满意非常满意甲

13、乙两城市家庭对住房状况的评价3 - 29统计统计 学一、数据分组 3.3 3.3 数值型数据的整理与显示数值型数据的整理与显示3 - 30统计统计 学分组方法分组方 法等距分 组异距分 组单变单变 量值值分组组组组距分组组3 - 31统计统计 学单变量值分组 (要点)1. 将一个变量值作为一组 2. 适合于离散变量 3. 适合于变量值较少的情况 3 - 32统计统计 学组距分组(要点)将变量值的一个区间作为一组 适合于连续变量 适合于变量值较多的情况 需要遵循“不重不漏”的原则 可采用等距分组,也可采用不 等距分组 3 - 33统计统计 学组距分组 (步骤)确定组数:组数的确定应以能够显示数据

14、的分布特 征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K(需四舍五入取整数, n为数据个数)2.2. 确定组距:组距确定组距:组距( (Class Class Width)Width)是一个组的上限与下是一个组的上限与下 限之差,可根据全部数据的最大值和最小值及所分限之差,可根据全部数据的最大值和最小值及所分 的组数来确定,即的组数来确定,即组距组距( ( 最大值最大值 - - 最小值最小值) ) 组数组数 3.3. 统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表 3 - 34统计统计 学组距分组 (几个概念)1. 下限(low limi

15、t) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之 间的中点值下限值下限值+ +上限值上限值2 2组中值组中值 = =3 - 35统计统计 学频数分布表的编制 (例题分析)【例】【例】某电脑某电脑 公司公司20022002年前年前 四个月各天的四个月各天的 销售量数据销售量数据( (单单 位:台位:台) )。试对。试对 数据进行分组数据进行分组 。3 - 36统计统计 学频数分布表的编制 (步骤)确定组数:根据 Sturges 提出的经验公式得 组数K为:2.2. 确定各组的组距:确定各组的组距:组距组距( ( 237 237 - - 141) 10=9.6 141) 10=9.6 10 103.3. 用用ExcelExcel制作频数分布表制作频数分布表 3 - 37统计统计 学等距分组表 (上下组限重叠)3 - 38统计统计 学等距分组表 (上下组限间断)3 - 39统计统计 学等距分组表 (使用开口组)3 - 40统计统计 学组距分组与不等距分组 (在表现频数分布上的

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 研究报告 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号