幻灯片 1 - 惠州学院

上传人:kms****20 文档编号:56873838 上传时间:2018-10-16 格式:PPT 页数:56 大小:524KB
返回 下载 相关 举报
幻灯片 1 - 惠州学院_第1页
第1页 / 共56页
幻灯片 1 - 惠州学院_第2页
第2页 / 共56页
幻灯片 1 - 惠州学院_第3页
第3页 / 共56页
幻灯片 1 - 惠州学院_第4页
第4页 / 共56页
幻灯片 1 - 惠州学院_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《幻灯片 1 - 惠州学院》由会员分享,可在线阅读,更多相关《幻灯片 1 - 惠州学院(56页珍藏版)》请在金锄头文库上搜索。

1、作者 贾俊平,统 计 学 (第三版),2008,2008年8月,图并没有说谎,是说谎者在画图。Benjamin Disraeli,统计名言,第 2 章 用图表展示数据,2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表,2008年8月,学习目标,定性数据的频数分布表 定性数据的图示方法 定量数据的频数分布表 定量数据的图示方法 用Excel和SPSS作频数分布表和图形 合理使用图表,2008年8月,男学生更容易逃课吗?,读完四年大学,一次课也没有逃过,这样的学生恐怕不多。2004年5月,中国人民大学财政金融学院的3名学生就逃课问题做了一次调查。调查的对象是财政金融学院

2、的大一,大二,大三本科生。样本的抽取方式是分层抽样与简单随机抽样结合,先根据年级划分层次,然后对各个班级简单随机抽样,共抽取151名学生组成一个样本,并对每个学生采用问卷调查。问卷内容包括每周逃课次数、所逃课程的类型(选修课、专业课等等)和逃课原因等。调查得到的男女学生每周平均逃课次数的汇总表如下,2008年8月,男学生更容易逃课吗?,你认为男学生更容易逃课吗?用哪些简单的统计描述支持你的看法?如果要用图形表现上面的数据,反映男女学生逃课方面的差异、逃课次数的构成以及男女学生在逃课方面是否具有相似性等等,有哪些图形可供你选择使用呢?,2.1 用图表展示定性数据2.1.1 生成频数分布表2.1.

3、2 定性数据的图示,第 2 章 用图表展示数据,2.1.1 生成频数分布表,2.1 用图表展示定性数据,2008年8月,生成频数分布表 (定性数据),1. 列出各类别,3. 生成频数分布表,2008年8月,生成频数分布表 (定性数据),【例】一家市场调查公司为研究不同类型饮料的市场占有率,对随机抽取的一家超市进行调查。下面的表是调查员随机观察的50名顾客购买的饮料类型记录。生成一张频数分布表,观察不同类型饮料的销售分布状况,用Excel制作频数分布表,2008年8月,使用Excel数据透视表数计数 (pivot table),第1步:选择【数据】菜单中的【数据透视表和数据透视图】 第2步:确定

4、数据源区域 第4步:在【向导3步骤之3】中选择数据透视表的输出位置。然后选择【布局】 第5步:在【向导布局】对话框中,依次将“分类变量“(这里是饮料品牌)连续拖放两次:一次拖至左边的“行”区域,一次拖至 “数据”区域 第6步:然后单击【确定】,自动返回【向导3步骤之3】对话框。然后单击【完成】,即可输出数据透视表,用数据透视表产生定性数据的频数分布,2008年8月,生成频数分布表 (定性数据),不同类型饮料的频数分布,2008年8月,定性数据的描述统计量,频数(frequency) :落在各类别中的数据个数 比例(proportion) :某一类别数据个数占全部数据个数的比值 百分比(perc

5、entage) :将对比的基数作为100而计算的比值 比率(ratio) :不同类别数值个数的比值,2.1.2 定性数据的图示,2.1 用图表展示定性数据,2008年8月,条形图 (bar Chart),用宽度相同的条形的高度或长短来表示各类别数据 各类别可放在纵轴,称为条形图,可以放在横轴,称为柱形图(column chart),2008年8月,帕累托图 (pareto chart),按各类别数据出现的频数多少排序后绘制的柱形图 用于展示分类数据的分布,2008年8月,饼图 (pie Chart),用圆形及圆内扇形的角度来表示数值大小的图形,主要用于表示一个样本(或总体)中各组成部分的数据占

6、全部数据的比例 用于研究结构问题,2008年8月,环形图 (doughnut chart),环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示 与饼图类似,但又有区别 饼图只能显示一个总体各部分所占的比例 环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环 用于结构比较研究,2008年8月,环形图 (doughnut chart),【例】2006年北京、上海和天津地区按收入法计算的地区生产总值(按当年价格计算)数据。绘制环形图比较三个地区的生产总值构成,2008年8月,环形图 (doughnut chart ),北京、上海和天津地区按收入法计算的

7、地区生产总值,2.2 用图表展示定量数据2.2.1 生成频数分布表2.2.2 定量数据的图示,第 2 章 用图表展示数据,2.2.1 生成频数分布表,2.1 用图表展示定性数据,2008年8月,生成频数分布表 (例题分析),【例】某电脑公司2008年前4个月各天的销售量数据(单位:台)。生成一张频数分布表观察销售额分布的特征,2008年8月,生成频数分布表 (例题分析),确定组数:组数的确定应以能够显示数据的分布特征为目的。在实际分组时,组数一般为5K 15。本例中由于数据较多,可考虑分为10组 确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及

8、所分的组数来确定,即组距( 最大值 - 最小值) 组数 例如,本例最大值为237,最小值为141,组距=(237-141)109.6。为便于计算,组距宜取5或10的倍数,且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取10 统计出各组的频数。每个组的数据满足axb(上限值不在内,2008年8月,分组中的几个概念,1. 下限(lower limit) :一个组的最小值 2. 上限(upper limit) :一个组的最大值 3. 组距(class width) :上限与下限之差 4. 组中值(class midpoint) :下限与上限之间的中点值,用Excel制作频

9、数分布,2008年8月,生成频数分布表 (例题分析),某电脑公司销售额的频数分布,2008年8月,生成频数分布表 (例题分析使用开口组),2008年8月,使用Excel频数函数 (FREQUENCY),Excel的【直方图】工具的缺陷是:频数分布及直方图没有与数据链接,当改变任何一个数据时,频数分布表和直方图不会跟着改变 使用统计函数【FREQUENCY】创建频数分布表和直方图可解决这一问题。具体步骤是 选择与接受区域相临近的单元格区域,作为频数分布表输出的区域 选择统计函数中的【FREQUENCY】函数 在对话框【Date-array】后输入数据区域,在【Bins-array】后输入接受区域

10、 同时按下“ctrl-shift-Enter”组合键,即得到频数分布,统计函数FREQUENCY,2.2.2 定量数据的图示,2.1 用图表展示定性数据,2008年8月,分组数据看分布直方图 (histogram),用于展示分组数据分布的一种图形 用矩形的宽度和高度来表示频数分布 本质上是用矩形的面积来表示频数分布 在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图 直方图下的总面积等于1,用Excel制作直方图,2008年8月,用SPSS绘制直方图,第1步:选择【Graphs】下拉菜单,并选择 【histogram】选项进入主对话框 第2步:在主

11、对话框中将变量选入【Variables】,点击【OK】,用SPSS绘制直方图,2008年8月,分组数据看分布直方图 (SPSS绘制的直方图),2008年8月,分组数据看分布直方图 (直方图与条形图的区别),条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距 由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列 条形图主要用于展示定性数据,而直方图则主要用于展示定量数据,2008年8月,未分组数据看分布茎叶图 (stem-and-leaf plot),用于显示未分组的原始数据的分布 由“茎”和“叶”两部分构成,其图形是由数字组成的 以该组数据的高

12、位数值作树茎,低位数字作树叶 树叶上只保留最后一位数字 6. 茎叶图类似于横置的直方图,但又有区别 直方图可观察一组数据的分布状况,但没有给出具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息 直方图适用于大批量数据,茎叶图适用于小批量数据,2008年8月,用SPSS绘制茎叶图和箱线图 (包括直方图),第1步:选择【Analyze】下拉菜单,并选择 【Descriptive statistics-Explore】选项进入主对话框 第2步:在主对话框中将变量选入【Variables】,点击【Plots】,在对话框中选择【Stem-and-leaf】(根据需要可

13、选【Histogram】以给出直方图)。点击【Continue】回到主对话框。点击【OK】,用SPSS绘制茎叶图,2008年8月,未分组数据看分布茎叶图 (例题分析),第一列给出每个茎上叶子的频数 第二列是“茎”,第三列是“叶” 下面标出了1个极端值237、茎的宽度10、每个叶代表一个数据(案例) SPSS自动将每个茎重复了一次,使分布的细节看的更清楚一些。当然,在数据较少时茎的数值也可以不重复,2008年8月,未分组数据看分布箱线图 (box plot),用于显示未分组的原始数据的分布 箱线图是由一组数据的最大值(maximum)、最小值(minimum)、中位数(median)、两个四分位

14、数(quartiles)这5个值绘制而成的 中位数是一组数据排序后处于中间位置上的变量值 四分位数是一组数据排序后处在数据25%位置和75%位置上的两个分位数值 绘制方法 首先找出一组数据的5个特征值,即最大值、最小值、中位数Me和两个四分位数(下四分位数QL和上四分位数QU) 连接两个四分位数画出箱子,再将两个极值点与箱子相连接,2008年8月,未分组数据看分布箱线图 (箱线图的构成),中位数,4,6,8,10,12,Median/Quart./Range箱线图,2008年8月,未分组数据看分布箱线图 (例题分析),最小值 141,最大值 237,中位数 182,25%四分位数 170.25

15、,75%四分位数 197,140 150 160 170 180 190 200 210 220 230 240,某电脑公司销售额数据的Median/Quart./Rang箱线图,2008年8月,分布的形状与箱线图,不同分布的箱线图,对称分布,Bell-shaped distribution,Left-skewed distribution,左偏分布,右偏分布,Right-skewed distribution,2008年8月,未分组数据看分布多批数据箱线图 (例题分析),【例】 从某大学经济管理专业二年级学生中随机抽取11人,对8门主要课程的考试成绩进行调查,所得结果如表。试绘制各科考试成绩

16、的批比较箱线图,并分析各科考试成绩的分布特征,2008年8月,用SPSS绘制多批数据箱线图,第1步:选择【Graphs】下拉菜单,并选择【Boxplot】 第2步:在出现的对话框中选择【Simple】,在【Data in Chat Are】中选择【Summaries of separate variables】,点击【Define】返回主对话框 第3步:在主对话框将所有变量(这里是11个学生)选入【Boxes Represent】,将“课程名称”选入【Label Cases by】。点击【OK】,用SPSS绘制箱线图,2008年8月,未分组数据多批数据箱线图 (例题分析Median/Quart./Range),

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号