owerpoint第三章统计数据的整理与显.ppt

上传人:桔**** 文档编号:570260631 上传时间:2024-08-03 格式:PPT 页数:75 大小:813.60KB
返回 下载 相关 举报
owerpoint第三章统计数据的整理与显.ppt_第1页
第1页 / 共75页
owerpoint第三章统计数据的整理与显.ppt_第2页
第2页 / 共75页
owerpoint第三章统计数据的整理与显.ppt_第3页
第3页 / 共75页
owerpoint第三章统计数据的整理与显.ppt_第4页
第4页 / 共75页
owerpoint第三章统计数据的整理与显.ppt_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《owerpoint第三章统计数据的整理与显.ppt》由会员分享,可在线阅读,更多相关《owerpoint第三章统计数据的整理与显.ppt(75页珍藏版)》请在金锄头文库上搜索。

1、第三章第三章 统计数据的整理与显示统计数据的整理与显示 统计学8/3/20241学习重点与难点:品质数据的整理数据的分组统计表的构成与设计用Excel作频数分布表和形图8/3/20242第一节第一节 数据的预处理数据的预处理一、数据的审核、筛选与排序1.数据的审核发现数据中的错误2.数据的筛选找出符合条件的数据3.数据排序发现数据的基本特征升序和降序8/3/20243 1、数据的审核原始数据审核的内容1完整性审核检查应调查的单位或个体是否有遗漏所有的调查项目或指标是否填写齐全2准确性审核检查数据是否真实反映客观实际情况,内容是否符合实际检查数据是否有错误,计算是否正确等8/3/20244 审核

2、数据准确性的方法1逻辑检查从定性角度,审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象主要用于对定类数据和定序数据的审核2计算检查检查调查表中的各项数据在计算结果和计算方法上有无错误主要用于对定距和定比数据的审核8/3/20245 二手数据审核的内容1适用性审核弄清楚数据的来源、数据的口径以及有关的背景材料确定这些数据是否符合自己分析研究的需要2时效性审核应尽可能使用最新的统计数据3确认是否必要做进一步的加工整理8/3/20246 2、数据的筛选1对审核过程中发现的错误应尽可能予以纠正2当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要求而又无法弥补时,需要对数据

3、进行筛选3数据筛选的内容包括:将某些不符合要求的数据或有明显错误的数据予以剔除将符合某种特定条件的数据筛选出来,而不符合特定条件的数据予以剔出8/3/20247 3、数据的排序1排序要点按一定顺序将数据排列,以发现一些明显的特征或趋势,找到解决问题的线索排序有助于对数据检查纠错,以及为重新归类或分组等提供依据在某些场合,排序本身就是分析的目的之一排序可借助于计算机完成8/3/20248 2排序的方法定类数据的排序字母型数据,排序有升序降序之分,但习惯上用升序汉字型数据,可按汉字的首位拼音字母排列,也可按笔画排序,其中也有笔画多少的升序降序之分定距和定比数据的排序递增排序:设一组数据为X1,X2

4、,XN,递增排序后可表示为:X(1)X(2)X(2)X(N)8/3/20249第二节 品质数据的整理与显示一、定类数据的整理与显示8/3/202410 1、频数(Frequency) 频数也称次数,是落在各类别中的数据个数。 把各个类别及其相应的频数全部列出来就是频数分布或次数分布( Frequency distribution)。 将频数分布用表格的形式表现出来就是频数分布表。8/3/202411定类数据整理定类数据整理频数分布表频数分布表(实例)(实例) 【例例3.13.1】为为研研究究广广告告市市场场的的状状况况,一一家家广广告告公公司司在在某某城城市市随随机机抽抽取取200200人人就

5、就广广告告问问题题做做了了邮邮寄寄问问卷卷调调查查,其其中中的的一一个个问问题题是是“您您比比较较关关心心下下列列哪哪一一类广告?类广告?”1 1. .商商品品广广告告;2 2. .服服务务广广告告;3 3. .金金融融广广告告;4 4. .房房地地产产广广告告;5 5. .招招生生招招聘聘广广告告;6 6. .其其他他广告。广告。表表3-1 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数(人人)比例比例频率频率(%) 商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告1121125

6、1519 9161610102 20.5600.5600.2550.2550.0450.0450.0800.0800.0500.0500.0100.01056.056.025.525.54.54.58.08.05.05.01.01.0合计合计20011008/3/202412 2、比例(Proportion) 比例是一个总体中各个部分的数据占总体数量的比重,通常用于反映总体的构成和结构。3、百分比(Percentage) 百分比是将比例乘以100,也叫做百分数。它是将对比的基数抽象化为100而计算出来的,用%表示,它表示每100个分母中拥有多少个分子。当分母的数值很大时,也可以用千分数表示。4

7、、比率(Ratio) 比率是各不同类别的数量的比值。它可以是一个总体中各不同部分的数量对比。为了便于理解,通常将分母化为1。8/3/202413 (二)定类数据的图示1、条形图(Bar chart)条形图是用宽度相同的条形的高度或长短来表示数据变动的图形条形图有单式、复式等形式在表示定类数据的分布时,是用条形图的高度来表示各类别数据的频数或频率绘制时,各类别可以放在纵轴,称为条形图,也可以放在横轴,称为柱形图8/3/202414由 ExcelExcel 绘制的条形图 人数(人)人数(人)5191610211204080120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告广广

8、告告类类型型 图图3-1 3-1 某城市居民关注不同类型广告的人数分布某城市居民关注不同类型广告的人数分布8/3/202415 2、圆形图(Pie chart)也称饼图,是用圆形及圆内扇形的面积来表示数值大小的图形主要用于表示总体中各组成部分所占的比例,对于研究结构性问题十分有用在绘制圆形图时,总体中各部分所占的百分比用园内的各个扇形面积表示,这些扇形的中心角度,是按各部分百分比占3600的相应比例确定的例如,关注服务广告的人数占总人数的百分比为25.5%,那么其扇形的中心角度就应为360025.5%91.80,其余类推8/3/202416由 Excel 绘制的圆形图 其他广告1.0% 房地产

9、广告8.0% 商品广告56.0% 金融广告4.5% 服务广告25.5% 招生招聘广告5.8%图图3-2 3-2 某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成8/3/202417 二、定序数据的整理与显示1、累计频数(Cumulative Frequency) 将各类别的频数逐级累加 1向上累积:从类别顺序开始的一方向类别顺序的最后一方累加频数(从小到大) 2向下累积:从类别顺序的最后一方向类别顺序开始的一方累加频数(从大到小)2. 累计频率(Cumulative percentages) 将各类别的频率(百分比)逐级累加,也有向上累积和向下累积两种方法。8/3/20

10、2418定序数据频数分布表定序数据频数分布表(实例)(实例) 表表3-2 甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲甲城市城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计合计300100.0【例3.2】在一项城市住房问题的研

11、究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意? 1非常不满意;2不满意;3一般;4满意;5非常满意。 8/3/202419 定序数据频数分布表 (实例(实例 )表表3-3 乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意212199997878646438387.07.033.033

12、.026.026.021.321.312.712.721211201201981982622623003007.07.040.040.066.066.087.387.3100.0100.03003002792791801801021023838100.0100.093.093.060.060.034.034.012.712.7合计合计300100.08/3/202420由由 ExcelExcel 绘制的累计频数分布图绘制的累计频数分布图 243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向下累积向下累积2761683030075

13、0100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向上累积向上累积图图图图3-3 3-3 甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布8/3/202421环环 形形 图图 的的 制制 作作1、环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示2、环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环3、环形图可用于进行比较研究 4、环形图可用于展示定类和定序

14、的数据8/3/202422品质数据的图示品质数据的图示环形图环形图(由(由 ExcelExcel 绘制的环形图)绘制的环形图) 8%36%31%15%7%33%26%21%13%10% 非常不满意 不满意 一般 满意 非常满意 图图3-4 3-4 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价8/3/202423第三节第三节 数值型数据的整理与显示数值型数据的整理与显示一、数据的分组1、数据分组就是根据统计研究的需要,将数据按照某种标准化(标志)分成不同的组别。2、方法1单变量值分组2组距分组8/3/202424数 据 的 分 组 方 法 等距分组等距分组异距分组异距分组8/3/

15、202425数数 据据(实(实 例)例) 【例3.3】某生产车间50名工人日加工零件数如下(单位:个)。试采用单变量值对数据进行分组。 117 122 124 129 139 107 117 130 122 125117 122 124 129 139 107 117 130 122 125108 131 125 117 122 133 126 122 118 108108 131 125 117 122 133 126 122 118 108110 118 123 126 133 134 127 123 118 112110 118 123 126 133 134 127 123 118 1

16、12112 134 127 123 119 113 120 123 127 135112 134 127 123 119 113 120 123 127 135137 114 120 128 124 115 139 128 124 121137 114 120 128 124 115 139 128 124 1218/3/202426单变量值分组1. 将一个变量值作为一组2. 适合于离散变量3. 适合于变量值较少的情况8/3/202427单 变 量 值 分 组 表(实例)表表3-4 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表零件数零件数(个个)频数频数(人人)零件数零件数

17、(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)1071081101121131141151171181212111331191201211221231241251261271214432231281291301311331341351371392111221128/3/202428组 距 分 组1、将变量值的一个区间作为一组2、适合于连续变量3、适合于变量值较多的情况4、必须遵循“不重不漏”的原则5、可采用等距分组,也可采用不等距分组 8/3/202429组距分组组距分组(步骤)(步骤)1、确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Stur

18、ges 提出的经验公式来确定组数K2 2、确确定定各各组组的的组组距距:组组距距( (Class Class Width)Width)是是一一个个组组的的上上限限与与下下限限之之差差,可可根根据据全全部部数数据据的的最最大值和最小值及所分的组数来确定,即大值和最小值及所分的组数来确定,即 组距组距组距组距( ( ( ( 最大值最大值最大值最大值 - - - - 最小值)最小值)最小值)最小值) 组数组数组数组数 3 3、根据分组整理成频数分布表、根据分组整理成频数分布表8/3/202430组组 距距 分分 组(几个概念)组(几个概念)1、下 限:一个组的最小值2、上 限:一个组的最大值3、组

19、距:上限与下限之差4、组中值:下限与上限之间的中点值下限值下限值+上限值上限值2组中值组中值8/3/202431等距分组表等距分组表(上下组限重叠)(上下组限重叠)表表3-5 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)105110110115115120120125125130130135135140358141064610162820128合计合计501008/3/202432等距分组表等距分组表(上下组限间断)(上下组限间断)表表3-6 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数

20、分组按零件数分组频数(人)频数(人)频率(频率(%)105109110114115119120124125129130134135139358141064610162820128合计合计501008/3/202433等距分组表等距分组表(使用开口组)(使用开口组)表表3-7 某车间某车间50名工人日加工零件数分组表名工人日加工零件数分组表按零件数分组按零件数分组频数(人)频数(人)频率(频率(%)110以下以下110114115119120124125129130134135以上以上358141064610162820128合计合计501008/3/202434等距分组与不等距分组等距分组与不

21、等距分组(在表现频数分布上的差异)(在表现频数分布上的差异)1、等距分组各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征和规律2、不等距分组各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况需要用频数密度(频数密度频数/组距)反映频数分布的实际状况8/3/202435 二、定距数据和定比数据的图示以下图形均由以下图形均由以下图形均由以下图形均由计算机绘制计算机绘制计算机绘制计算机绘制! !ExcelSTATISTICASTATISTICA8/3/202436分分 组组 数数 据据 直方图直方图(直方图的制作)(直方图的制作)1、用矩形的宽度和高

22、度来表示频数分布的图形,实际上是用矩形的面面积积来表示各组的频数分布2、在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数 就 形 成 了 一 个 矩 形 , 即 直 方 图(Histogram)3、直方图下的总面积等于1 18/3/202437分组数据分组数据直方图直方图(直方图的绘制)直方图的绘制) 我一眼就看出我一眼就看出来了,大多数来了,大多数人的日加工零人的日加工零件数在件数在120120125125之间之间! !151512129 9频频频频频频数数数数数数( ( (人人人人人人) ) )6 63 3105105 110110120120130130125125

23、135135115115140140日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数( (个个个个个个) )图图图图3-5 3-5 某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图某车间工人日加工零件数的直方图直方图下的面直方图下的面积之和等于积之和等于1 18/3/202438直方图与条形图的直方图与条形图的区别区别1、条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2、直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3、直方图的各

24、矩形通常是连续排列,条形图则是分开排列8/3/202439分组数据分组数据折线图折线图(折线图的制作)(折线图的制作)1、折线图也称频数多边形图(Frequency polygon)2、是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉3、折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的8/3/202440分组数据分组数据折线图折线图(折线图的绘制)(折线图的绘制) 频频频频频频数数数数数数

25、( (人人人人人人) )日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数日加工零件数( (个个个个个个) )图图图图3-6 3-6 某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图某车间工人日加工零件数的折线图折线图下的面积折线图下的面积与直方图的面积与直方图的面积相等!相等!151512129 96 63 3105105115115 1201201301301401401101101251251351358/3/202441未分组数据未分组数据茎叶图茎叶图(茎叶图的制作)(茎叶图的制作)1.1.用于显示未分组的原始数据的分布用于显示未分组

26、的原始数据的分布2.2.由由“茎茎”和和“叶叶”两两部部分分构构成成,其其图图形形是是由由数数字字组成的组成的3.3.以该组数据的高位数值作树茎,低位数字作树叶以该组数据的高位数值作树茎,低位数字作树叶4.4.对对于于n n(20(20n n300)300)个个数数据据,茎茎叶叶图图最最大大行行数数不不超过超过 L L L L = 10 log = 10 log = 10 log = 10 log 10 10 10 10 n n n n 5. 5. 茎叶图类似于横置的直方图,但又有区别茎叶图类似于横置的直方图,但又有区别 直直方方图图可可大大体体上上看看出出一一组组数数据据的的分分布布状状况况

27、,但没有给出具体的数值但没有给出具体的数值 茎茎叶叶图图既既能能给给出出数数据据的的分分布布状状况况,又又能能给给出出每一个原始数值,保留了原始数据的信息每一个原始数值,保留了原始数据的信息8/3/202442未分组数据未分组数据茎叶图茎叶图(茎叶图的制作)(茎叶图的制作) 1010111112121313树叶树叶树叶树叶7887880223477788890223477788890012222333344466777889001222233334446677788901334457990133445799茎叶图类似横置茎叶图类似横置的直方图的直方图数据个数数据个数数据个数数据个数3 3131

28、324241010图图图图3-7 3-7 某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图某车间工人日加工零件数的茎叶图树茎树茎树茎树茎8/3/202443未分组数据未分组数据茎叶图茎叶图(扩展的茎叶图)(扩展的茎叶图) 树茎树茎树茎树茎树茎树茎树叶树叶树叶树叶树叶树叶10*10*10*10.10.10.11*11*11*11.11.11.12*12*12*12.12.12.13*13*13*13.13.13.7 8 87 8 87 8 80 2 2 3 40 2 2 3 40 2 2 3 45 7 7 7 8 8 8 95 7 7 7 8 8 8 9

29、5 7 7 7 8 8 8 90 0 1 2 2 2 2 3 3 3 3 4 4 40 0 1 2 2 2 2 3 3 3 3 4 4 40 0 1 2 2 2 2 3 3 3 3 4 4 45 5 6 6 7 7 7 8 8 95 5 6 6 7 7 7 8 8 95 5 6 6 7 7 7 8 8 90 1 3 3 4 4 0 1 3 3 4 4 0 1 3 3 4 4 5 7 9 95 7 9 95 7 9 9图图图图3-8 3-8 图图图图3.73.7扩展后的茎叶图扩展后的茎叶图扩展后的茎叶图扩展后的茎叶图树茎树茎树茎树茎树茎树茎树叶树叶树叶树叶树叶树叶10s10s10s10s10s1

30、0s10.10.10.10.10.10.11*11*11*11*11*11*11t11t11t11t11t11t11f11f11f11f11f11f11s11s11s11s11s11s11.11.11.11.11.11.12*12*12*12*12*12*12t12t12t12t12t12t12f12f12f12f12f12f12s12s12s12s12s12s12.12.12.12.12.12.13*13*13*13*13*13*12t12t12t12t12t12t13f13f13f13f13f13f13s13s13s13s13s13s13.13.13.13.13.13.7 7 7 77 7

31、8 88 88 88 88 88 80 0 0 00 02 2 32 2 32 2 32 2 32 2 32 2 34 54 54 54 54 54 57 7 77 7 77 7 77 7 77 7 77 7 78 8 8 98 8 8 98 8 8 98 8 8 98 8 8 98 8 8 90 0 10 0 10 0 10 0 10 0 10 0 12 2 2 2 3 3 2 2 2 2 3 3 2 2 2 2 3 3 2 2 2 2 3 3 2 2 2 2 3 3 2 2 2 2 3 3 3 33 33 33 33 33 34 4 4 5 54 4 4 5 54 4 4 5 54 4 4

32、 5 54 4 4 5 54 4 4 5 56 6 7 7 76 6 7 7 76 6 7 7 76 6 7 7 76 6 7 7 76 6 7 7 78 8 98 8 98 8 98 8 98 8 98 8 90 10 10 10 10 10 13 33 33 33 33 33 34 4 54 4 54 4 54 4 54 4 54 4 57 7 7 77 79 99 99 99 99 99 98/3/202444未分组数据未分组数据箱线图箱线图(箱线图的制作)(箱线图的制作)1、用于显示未分组的原始数据或分组数据的分布2、箱线图由一组数据的5个特征值绘制而成,它由一个箱子和两条线段组成3、

33、其绘制方法是:首先找出一组数据的5个特征值,即最大值、最小值、中位数Me 和两个四分位数(下四分位数QL和上四分位数QU)连接两个四分(位)数画出箱子,再将两个极值点与箱子相连接 8/3/202445未分组数据未分组数据单批数据箱线图单批数据箱线图(箱线图的构成)(箱线图的构成) 中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值X X最小值最小值最小值图图图图3-9 3-9 简单箱线图简单箱线图简单箱线图简单箱线图8/3/202446未分组数据未分组数据单批数据箱线图单批数据箱线图(实例)(实例) 最小值最小值最小值107107107最大值最大值最

34、大值139139139中位数中位数中位数123123123下四分位数下四分位数下四分位数117.75117.75117.75上四分位数上四分位数上四分位数128128128105 110 115 120 125 130 135 140105 110 115 120 125 130 135 140105 110 115 120 125 130 135 140图图图图3-10 503-10 50名工人日加工零件数的箱线图名工人日加工零件数的箱线图名工人日加工零件数的箱线图名工人日加工零件数的箱线图8/3/202447分布的形状与箱线图分布的形状与箱线图 左偏分布左偏分布左偏分布左偏分布左偏分布左偏

35、分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU对称分布对称分布对称分布对称分布对称分布对称分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数中位数中位数中位数 Q QQU UU图图图图3-11 3-11 不同分布的箱线图不同分布的箱线图不同分布的箱线图不同分布的箱线图8/3/202448未分组数据未分组数据多批数据箱线图多批数据箱线图(实例)(实例)【例例3.43.4】 从某大学经济管理专业二年级学生中随机抽取 11人 , 对 8门主要课程的考试成绩进行调查,

36、所得结果 如 表 3-8。试绘制各科考试成绩的批比较箱线图,并分析各科考试成绩的分布特征表表表表3-8 113-8 11名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机应用基础766593746870558590958187757391789751768570926881717488698465739570786690737884709363798060878

37、167869183777690708283829284817069727875789188669480857186746879628181557870756871778/3/202449未分组数据未分组数据多批数据箱线图多批数据箱线图( (由由STATIATICASTATIATICA绘制的多批数据箱线图绘制的多批数据箱线图) ) 图图图图3-12 83-12 8门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图8/3/202450未分组数据未分组数据箱线图箱线图( (由由STATIATICASTATIATICA绘制的多批数据箱线图绘制的多批数据箱线图) 1

38、059585756555454图图图图3-13 113-13 11名学生名学生名学生名学生8 8门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图门课程考试成绩的箱线图学生1学生3学生2学生4学生6学生5学生7学生9学生8学生10学生11Min-Max25%-75%Median value8/3/202451时间序列数据时间序列数据线图线图(线图的制作)(线图的制作) 绘制线图时应注意以下几点1、时间一般绘在横轴,指标数据绘在纵轴2、图形的长宽比例要适当,其长宽比例大致为1010:7 73、一般情况下,纵轴数据下端应从“0 0”开始,以便于比较。数据与“0 0”之间的间距过大时

39、,可以采取折断的符号将纵轴折断8/3/202452时间序列数据时间序列数据线图线图(实例)(实例)【例【例3.53.5】已知19911998年我国城乡居民家庭的人均收入数据如表3-11。试绘制线图表表表表3-11 19913-11 199119981998年城乡居民家庭人均收入年城乡居民家庭人均收入年城乡居民家庭人均收入年城乡居民家庭人均收入年份年份城镇居民城镇居民农村居民农村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6 784.0 921.61221.01577.

40、71926.12091.12162.0表表表表3-11 19913-11 199119981998年城乡居民家庭人均收入年城乡居民家庭人均收入年城乡居民家庭人均收入年城乡居民家庭人均收入年份年份城镇居民城镇居民农村居民农村居民199119921993199419951996199719981700.62026.62577.43496.24283.04838.95160.35425.1708.6 784.0 921.61221.01577.71926.12091.12162.08/3/202453时间序列数据时间序列数据(由(由 Excel 绘制的线图)绘制的线图) 02000400060001

41、9911992199319941995199619971998城镇居民农村居民收收入入 (元)(元) 图图3-14 3-14 城乡居民家庭人均收入城乡居民家庭人均收入8/3/202454多变量数据多变量数据雷达图雷达图(要点)(要点)1、雷达图(Radar Chart)是显示多个变量的常用图示方法2、在显示或对比各变量的数值总和时十分有用3、假定各变量的取值具有相同的正负号,总的绝对值与图形所围成的区域成正比4、可用于研究多个样本之间的相似程度8/3/202455多变量数据多变量数据雷达图雷达图(雷达图的制作)(雷达图的制作) 设有n组样本S1,S2,Sn,每个样本测得P个变量X1,X2,Xp

42、,要绘制这P个变量的雷达图,其具体做法是n先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,在将这P个点与圆心连线,得到P个幅射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆心的距离表示n 再将同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图8/3/202456多变量数据多变量数据雷达图雷达图(实例)(实例)【例例3.63.6】1997年我国城乡居民家庭平均每人各项生活消费支出数据如表3-12。试绘制雷达图。表表表表3-12 19973-12 1997年城乡居民家庭平均每人生活消费支出年城乡居民家庭平均每人生活消费

43、支出年城乡居民家庭平均每人生活消费支出年城乡居民家庭平均每人生活消费支出项项 目目城镇居民城镇居民农村居民农村居民 食品食品 衣着衣着 家庭设备用品及服务家庭设备用品及服务 医疗保健医疗保健 交通通讯交通通讯 娱乐教育文化服务娱乐教育文化服务 居住居住 杂项商品与服务杂项商品与服务1942.59520.91316.89179.68232.90448.38358.64185.65 890.28 109.41 85.41 62.45 53.92 148.18 233.23 34.27合合 计计4185.641617.158/3/202457多变量数据多变量数据雷达图雷达图(由(由 Excel 绘制

44、的雷达图)绘制的雷达图) 0500100015002000 食品食品 衣着衣着 家庭设备用家庭设备用 品及服务品及服务 医疗保健医疗保健 交通通讯交通通讯 娱乐教育娱乐教育 文化服务文化服务 居住居住 杂项商品杂项商品 与服务与服务城镇居民农村居民 图图3-15 1997年城镇居民家庭消费支出年城镇居民家庭消费支出 (元)(元)8/3/202458多变量数据多变量数据雷达图雷达图(实例)(实例) 【例例3.73.7】为研究某条河流的污染程度,环保局分别在上游、中游和下游设立取样点,每个取样点化验水中的五项污染指标,所得数据如表3-13。将各指标用雷达图表示出来,并分析该河流的主要污染源。 表表

45、表表3-13 3-13 不同样本点的化验指标不同样本点的化验指标不同样本点的化验指标不同样本点的化验指标指标指标1指标指标2指标指标3指标指标4指标指标5上游上游中游中游下游下游4.520.342.175.01.46.8483 36208196 4111214 6358/3/202459多变量数据多变量数据雷达图雷达图(由(由 Excel Excel 绘制的对数坐标雷达图)绘制的对数坐标雷达图) 0.11101001000指标指标1指标指标2指标指标3指标指标4指标指标5上游中游下游图图3-16 河流污染指标雷达图河流污染指标雷达图 8/3/202460数据类型及图示数据类型及图示(小结)(小

46、结) 数据类型与显示数据类型与显示数值型数据数值型数据品质数据品质数据分组数据分组数据总计表总计表茎茎叶叶图图条条形形图图圆圆形形图图环环形形图图直直方方图图箱箱线线图图折折线线图图原始数据原始数据时序数据时序数据线线图图雷雷达达图图多元数据多元数据8/3/202461频数分布的类型频数分布的类型 对称分布对称分布对称分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布正正正J J J型分布型分布型分布反反反J J J型分布型分布型分布U UU型分布型分布型分布图图图图3-17 3-17 几种常见的频数分布几种常见的频数分布几种常见的频数分布几种常见的频数分布8/3/202462第四节第四节

47、统计表统计表一、统计表的构成一、统计表的构成表表3-14 19971998年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位1997年年 1998年年 一、调查户数一、调查户数 二、平均每户家庭人口数二、平均每户家庭人口数 三、平均每户就业人口数三、平均每户就业人口数 四、平均每人全部收入四、平均每人全部收入 五、平均每人实际支出五、平均每人实际支出 消费性支出消费性支出 非消费性支出非消费性支出 六、平均每人居住面积六、平均每人居住面积户户人人人人元元元元元元元元平方米平方米 37890 3.19 1.83 5188.54 4945.87 4185.64 755.94 11

48、.90 39080 3.16 1.80 5458.34 5322.95 4331.61 987.17 12.40资料来源:中国统计摘要1999,中国统计出版社,1999,第79页。注:1本表为城市和县城的城镇居民家庭抽样调查材料。 2消费性支出项目包括:食品、衣着、家庭设备用品及服务、医疗 保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务。8/3/202463 二、统计表的设计1、要合理安排统计表的结构2、总标题内容应满足3W要求3、数据计量单位相同时,可放在表的右上角标明,不同时应放在每个指标后或单列出一列标明4、表中的上下两条横线一般用粗线,其他线用细线5、通常情况下,统计表的左右

49、两边不封口6、表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一7、对于没有数字的表格单元,一般用“”表示8、必要时可在表的下方加上注释8/3/202464 三、统计表的种类三、统计表的种类1、广义统计表按用途分为调查表、汇总表(或整理表)、分析表。2、狭义统计表即专门用于统计整理或分析的表。按分组程度不同,分为:1简单表2简单分组表3复合分组表8/3/202465本本 章章 小小 结结数据预处理的内容和目的品质数据整理与显示方法数值型数据整理与显示方法合理使用统计表用Excel作频数分布表和图形8/3/202466习习 题题一、判 断 对 错1、对统计资料进行分组的目的

50、就是为了区分各组单位之间质的不同。( )2、组中值是根据各组上限和下限计算的平均值,所以它代表了各组的平均分配次数。 ( )3、分配数列的实质是把总体单位总量按照总体所分的组进行分配。 ( )4、某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。 ( )5、对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。( ) 6、任何一个分布都必须满足:各组的频率大于0,各组的频数总和等于1或100%。 ( ) 7、统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。 ( )8/3/202467 二、单二、单 项项 选选 择择 题题1

51、、统计整理的关键是( )A、对调查资料进行审核 B、对调查资料进行统计分组C、对调查资料进行汇总 D、编制统计表2、下列分组中属于按品质标志分组的是( )A、学生按考试分数分组 B、产品按品种分组C、企业按计划完成程度分组 D、家庭按年收入分组3、有一个学生考试成绩为80分,在统计分组中,这个变量值应归到( )组。A、6070分 B、7080分C、8090分 D、90100分4、某主管局将下属企业先按轻、重工业分组,再按规模分组,这种分组属于( )分组。A、简单分组 B、复合分组C、分析分组 D、结构分组8/3/202468 三、多项选择题部分1、下列数列属于( ) 按生产计划完成程度分组(%

52、) 企业数 8090 15 90100 30 100110 5 合 计 50、品质分配数列 、变量分配数列、组距式变量分配数列 、等距变量分配数列、次数分配数列2、在次数分配数列中( )A、总次数一定,频数和频率成反比B、各组的频数之和等于100C、各组频率大于零,频率之和等于1D、频率越小,则组的标志值所起的作用越小E、频率表明各组标志值对总体的相对作用程度8/3/202469参参 考考 答答 案案一、判断对错1. 2. 3. 4. 5. 6. 7. 7. 二、单项选择题1. 1. B B 2. 2. B B 3. 3. C C 4. 4. B B 三、多项选择题1. B C D E 2.

53、C D E8/3/202470 四、练习题1、中国人民大学工商管理学院99级本科生“统计学”考试成绩见book3.01。要求: (1) 对考试成绩按高低进行排序; (2) 对考试成绩进行适当分组,编制频数分布表,并计算累积频数和累积频率; (3) 绘制直方图和圆形图。2、1999年北京市、上海市城镇居民家庭平均每人全年消费性支出数据见book3.02。试绘制雷达图。3、1999年北京市、上海市、重庆市城市设施水平有关数据见book3.03。试绘制雷达图,并简要分析三市的城市设施水平。8/3/202471 4、我国1989-1999年底从业人员数据见book3.04。其中,在1989和1999年

54、底从业人员中,第一产业为33225和35364万人,第二产业为11976和16235万人,第三产业为10129和18987万人。要求: (1) 根据1989-1999年底从业人员数据,绘制线图和条形图; (2) 根据1989和1999年底从业人员构成数据,绘制圆形图和环形图。 5、根据1978-1999年我国财政收入数据(见book3.05)利用Excel软件绘制线图和条形图。6、根据1999年我国高等学校分科专任教师数据见book3.06,分别按教师的职称构成和分科构成绘制圆形图和环形图。8/3/202472 7、为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的

55、等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果见book3.07。 (1) 指出表中的数据属于什么类型? (2) 用Excel制作一张频数分布表; (3) 绘制一张条形图,反映服务质量的分布。8、北方某城市12月份各天气温的记录数据见book3.08。 (1) 指出表中的数据属于什么类型? (2) 对表中的数据进行适当的分组; (3) 作一个直方图,说明该城市气温分布的特点。8/3/202473 9、 已 知 1990-1999年 我 国 的 国 内 生 产 总 值 数 据 如book3.09(按当年价格计算,单位:亿元) (1) 用Excel绘制国内生产总值的线图; (2) 绘制第一、二、三产业国内生产总值的线图; (3) 根据1999年的国内生产总值及其构成数据,绘制圆形图和环形图。10、为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如book3.10。 (1) 用Excel对表中的数据进行排序; (2) 以组距为10进行等距分组,整理成频数分布表,并绘制直方图。 (3) 制做茎叶图,并与直方图作比较。8/3/202474 结结 束束 8/3/202475

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号