excel做箱线图箱图

上传人:平*** 文档编号:14744937 上传时间:2017-11-02 格式:DOC 页数:9 大小:506.72KB
返回 下载 相关 举报
excel做箱线图箱图_第1页
第1页 / 共9页
excel做箱线图箱图_第2页
第2页 / 共9页
excel做箱线图箱图_第3页
第3页 / 共9页
excel做箱线图箱图_第4页
第4页 / 共9页
excel做箱线图箱图_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《excel做箱线图箱图》由会员分享,可在线阅读,更多相关《excel做箱线图箱图(9页珍藏版)》请在金锄头文库上搜索。

1、箱线图(Boxplot)也称箱须图(Box-whisker Plot ),它是用一组数据中的最小值、第一四分位数、中位数、第三四分位数和最大值来反映数据分布的中心位置和散布范围,可以粗略地看出数据是否具有对称性。通过将多组数据的箱线图画在同一坐标上,则可以清晰地显示各组数据的分布差异,为发现问题、改进流程提供线索。1什么是四分位数箱线图需要用到统计学的四分位数(Quartile )的概念,所谓四分位数,就是把组中所有数据由小到大排列并分成四等份,处于三个分割点位置的数字就是四分位数。 第一四分位数(Q1),又称“较小四分位数” 或“下四分位数”,等于该样本中所有数值由小到大排列后第 25%的数

2、字。 第二四分位数(Q2),又称 “中位数”,等于该样本中所有数值由小到大排列后第50%的数字。 第三四分位数(Q3),又称 “较大四分位数”或“上四分位数”,等于该样本中所有数值由小到大排列后第 75%的数字。 第三四分位数与第一四分位数的差距又称四分位间距(InterQuartile Range, IQR)。计算四分位数首先要确定 Q1、Q2 、Q3 的位置(n 表示数字的总个数): Q1 的位置=(n+1)/4 Q2 的位置=( n+1)/2 Q3 的位置=3(n+1)/4对于数字个数为奇数的,其四分位数比较容易确定。例如,数字“5、47、48、15、42、41、7、39、45、40、3

3、5”共有 11 项,由小到大排列的结果为“5、7、15、35、39、40、41、42、45、47、48”,计算结果如下: Q1 的位置=(11+1)/4=3,该位置的数字是 15。 Q2 的位置=( 11+1)/2=6 ,该位置的数字是 40。 Q3 的位置=3(11+1)/4=9,该位置的数字是 45。而对于数字个数为偶数的,其四分位数确定起来稍微繁琐一点。例如,数字“8、17、38、39、42、44”共有 6 项,位置计算结果如下: Q1 的位置=(6+1)/4=1.75 Q2 的位置=( 6+1)/2=3.5 Q3 的位置=3(6+1)/4=5.25这时的数字以数据连续为前提,由所确定位

4、置的前后两个数字共同确定。例如,Q2 的位置为 3.5,则由第 3 个数字 38 和第 4 个数字 39 共同确定,计算方法是:38+(39-38)3.5的小数部分,即 38+10.5=38.5。该结果实际上是 38 和 39 的平均数。同理,Q1、Q3 的计算结果如下: Q1 = 8+(17-8)0.75=14.75 Q3 = 42+(44-42 )0.25=42.5Excel 为计算四分位数提供了 QUARTILE(array,quart)函数,其中 array 参数用于指定要计算四分位数值的数组或数值型单元格区域,quart 指定返回哪一个四分位值,可用值如下: 0,返回最小值; 1,返

5、回第一个四分位数; 2,返回第二个四分位数,即中位数; 3,返回第三个四分位数; 4,返回最大值。2箱线图的结构箱线图包括一个矩形箱体和上下两条竖线,箱体表示数据的集中范围,上下两条竖线分别表示数据向上和向下的延伸范围,结构如图 9-51 所示。图 9-51 箱线图的结构四分位间距框的顶部线条是第三四分位数的位置,即 Q3,表示有 75%的数据小于等于此值。底部线条是第一四分位数的位置,即 Q1,表示有 25%的数据小于此值。则整个四分位间距框所代表的是数据集中 50%(即 75%-25%)的数据,四分位间距框的高度就是这些数据涉及的范围,能够表现出数据的集中程度。Q2 是数据中位数的位置。W

6、hisker 上限是延伸至距框顶部 1.5 倍框高范围内的最大数据点,Whisker 下限是延伸至距框底部 1.5 倍框高范围内的最小数据点,超出 Whisker 上限或下限的数值将使用星号“*”表示。但是,在 Excel 中绘制箱线图需要借助股价图来实现,因此无法展现异常值,Whisker 上限将延伸至数据最大值的位置, Whisker 下限将延伸至数据最小值的位置。3绘制箱线图图 9-52 中的 A2:F8 区域和 H2:M8 区域分别是华北和华南是某段时间客户订单收货天数的统计结果,C11:C15 和 J11:J15 是利用 QUARTILE 函数计算的华北、华南收货天数的四分位数结果。

7、图 9-52 收货天数的四分位数计算结果在 Excel 中绘制箱线图需要借助股价图的“开盘- 盘高-盘底-收盘”图来实现。根据 Excel绘图时放置数据系列的位置,开盘、盘高、盘底、收盘应分别对应 Q1、Q0 、Q2、Q4。下面是绘图步骤: 准备图表数据。根据对应关系,在表格的 B18:E18 区域分别输入华北客户的 Q1、 Q0、Q2、Q4 统计数字,将 Q3 输入到最后的 F18 单元格中,在 A18 中输入一个日期型数据(注意,必须为日期型),如“2013/1/1”。然后在第 19 行中输入华南客户的数据, A19 中的日期递增 1 天,最终结果如图 9-53 所示。图 9-53 准备图

8、表数据 插入图表。选定 A18:E19 区域,在“插入”功能区的“图表”模块中单击“其他图表”,选择股价图部分的“开盘-盘高-盘底-收盘图”按钮,即可看到绘制的股价图,如图 9-54 所示。图 9-54 插入股价图 添加 Q3 数据系列。由图 9-54 可以看出,四分位间距框的顶部线条使用的是 Q4(最大值)位置,而是不是箱线图要求的 Q3 位置。右击绘图区,在弹出的快捷菜单中选择“选择数据”命令,打开“选择数据源”对话框。单击“添加”按钮打开“编辑数据系列”对话框,在“系列名称”折叠框中输入“Q3”,在系列值折叠框中选择 F18:F19区域,单击“确定”按钮即可看到股价图变成了箱线图,如图

9、9-55所示。四分位间距框的高度小了很多,单击顶部线条与 Whisker 上限交汇处,可以看到使用的是 Q3 数据。图 9-55 添加 Q3 数据系列 显示中位数线。至此,四分位间距框虽然已经绘制正确了,但是还缺少中位数线,即 Q2。选择图例中的“系列 3”标签,然后单击鼠标右键,在弹出的快捷菜单中选择“设置数据系列格式”命令,打开“设置数据系列格式”对话框。在“数据标记选项”中将标记类型设置为内置的“-”形状,单击“关闭”按钮即可看到中位线显示了出来,如图 9-56 所示。图 9-56 显示中位数线 美化图表。首先要修改分类轴(横轴)标签,由于插入股价图时的限制在 A18 和 A19 单元格中输入了日期型数据,但是在图表插入后,可以将其修改为其他数据类型的值,因此在 A18 和 A19 单元格分别输入“华北”、“华南”。其次是删除图例栏,对于箱线图而言这并不需要。最后,可以为图表添加一个标题。最终美化后结果如图 9-57所示。图 9-57 美化后的图表由图 9-57 可以看出,华北和华南客户的中位数位置、四分位间距框的位置与高度基本相同,说明两区域的客户收货天数基本相同。但是,从 Whisker 上限和 Whisker 下限看,华南客户的收货天数范围小于华北客户,说明流程更加稳定。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号