数据描述分析报告

上传人:xmg****18 文档编号:116880994 上传时间:2019-11-17 格式:PPT 页数:62 大小:1.49MB
返回 下载 相关 举报
数据描述分析报告_第1页
第1页 / 共62页
数据描述分析报告_第2页
第2页 / 共62页
数据描述分析报告_第3页
第3页 / 共62页
数据描述分析报告_第4页
第4页 / 共62页
数据描述分析报告_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《数据描述分析报告》由会员分享,可在线阅读,更多相关《数据描述分析报告(62页珍藏版)》请在金锄头文库上搜索。

1、第三章 数据描述与分析1 数据描述与分析数据描述与分析 本章内容 1.集中趋势的测定与分析 2.离中趋势的测定与分析 分布形态的测定与分析 描述统计分析工具的使用 下一页返回目录 第三章 数据描述与分析2 1 1 集中趋势的测定与分析集中趋势的测定与分析 1.1 集中趋势的测定内容 1.2 用Excel函数描述集中趋势 1.3 三种平均数的特点 1.4 案例研究-网上冲浪者的年龄 上一页下一页返回本章首页 第三章 数据描述与分析3 1.1 1.1 集中趋势的测定内容集中趋势的测定内容 在上图的分布中,各个变量值与中间位置的距离越近,所出 现的次越多,与中间位置的距离越远,所出现的次数越少, 从

2、而形成了以中间值为中心的集中趋势。 集中趋势是现象共性的特征,是现象规律性的数量表现。 用均值来描述总体分布的集中趋势。 上一页下一页返回本节首页 第三章 数据描述与分析4 1.2 1.2 用用ExcelExcel工作表函数工作表函数 描述集中趋势描述集中趋势 在Excel中既可手工创建公式计算各种平均数, 也可利用Excel中的统计函数。 在“统计函数”类别中用于集中趋势测定的常用 函数有三种:均值、中位数和众数。 上一页下一页返回本节首页 第三章 数据描述与分析5 1). Excel1). Excel的平均数函数的平均数函数 (1)均值函数(AVERAGE) 均值函数是应用比较广泛的一种平

3、均数函数,它能 够计算一组数据的算术平均数。其语法结构为: AVERAGE(number1,number2, .)。其中:number1, number2, .为要计算平均数的 130 个参数。 均值的计算公式为:均值的计算公式为: 。 上一页下一页返回本节首页 第三章 数据描述与分析6 (2)中位数函数(MEDIAN) 中位数函数用于描述居于数据分布中心位置的数值。 其语法结构为:MEDIAN(number1,number2, .)。 其中:number1, number2,. 是需要找出中位数的 1 30 个数字参数。 (3)众数函数(MODE) 众数函数用于计算一组数据中出现频率最多的数

4、值。 其语法结构为:MODE(number1,number2, .)。 其中:number1, number2, .是用于众数计算的 1 30 个参数,也可以使用单一数组(即对数组区域的引 用)来代替由逗号分隔的参数。 上一页下一页返回本节首页 第三章 数据描述与分析7 (4)切尾均值函数(TRIMMEAN) 返回数据分布中心部分的算术平均值。其语法结 构为:TRIMMEAN(array,percent) 。 其中:Array为需要进行筛选并求平均值的数组或 数据区域。Percent为计算时所要除去的数据点的 比例。 上一页下一页返回本节首页 第三章 数据描述与分析8 2). 均值函数的使用

5、例 某企业的生产部门使用抽样方法检测一批新产 品的质量,该批产品的抗拉强度见“原始数据”。管 理人员希望知道这批产品的抗拉强度的平均水平, 以决定产品质量是否合格。由此需要计算抗拉强度 的均值、中位数与众数 。 上一页下一页返回本节首页 第三章 数据描述与分析9 1.3 1.3 三种平均数的特点三种平均数的特点 均值 是所有的标志值之和除以其观察值的个数。 它考虑了所有数值,因而均值的大小受总体中极端 数值的影响。 如果总体中有极大值出现,则会使均值偏于分布的 右边,如果总体中出现极小值,均值则会偏于分布 的左边。 上一页下一页返回本节首页 第三章 数据描述与分析10 众数 众数是总体中出现次

6、数最多的数值,它只 考虑总体中各数值出现频数的多少,不受极端数 值的影响,但当总体中出现多个众数时,众数便 没有意义。 中位数 中位数只是考虑各单位数值在总体中的 顺序变化,它受极端数值的影响不大。 三种平均数的这些特点通过Excel更容易理解。 下面通过修改例题中的数据来观察三种平均数的 变化。 上一页下一页返回本节首页 第三章 数据描述与分析11 1.4 1.4 案例研究:网上案例研究:网上 冲浪者的年龄冲浪者的年龄 据报道,越来越多的人热心于网上冲浪,因为它 能够打开空间的界限,带给人许多新的知识。现 随机抽取一些上网人进行调查,得知其年龄数据 如下:22、58、24、50、29、52、

7、57、31、30、 41、44、40、46、29、31、37、32、44、49、29 。 试根据此样本资料对网上冲浪者的年龄水平给以 描述。 上一页下一页返回本节首页 第三章 数据描述与分析12 2 2 离中趋势的测定与分析离中趋势的测定与分析 2.1 离中趋势的测定内容 2.2 用Excel函数计算标准差 2.3 四分位数与四分位距 2.4 案例研究:磁盘存储量质量控制 上一页下一页返回本章首页 第三章 数据描述与分析13 2.1 2.1 离中趋势的测定内容离中趋势的测定内容 如下如所示,三个不同的曲线表示三个不同的总体, 其均值相同,但离中趋势不同。 上一页下一页返回本节首页 第三章 数据

8、描述与分析14 离中趋势 用于测定数据集中各数值之间的差异程度。表 现在一个分布中各数值与均值的离差程度。它的作用主要 有以下三方面: 用于说明均值的代表性大小 反映现象的质量与风险 用于统计推断。 标准差的计算公式: 总体标准差: 样本标准差: 上一页下一页返回本节首页 第三章 数据描述与分析15 2.2 2.2 用用ExcelExcel函数计算标准差函数计算标准差 可以利用Excel来创建公式进行标准差测定,也可以 利用Excel 中的工作表函数来直接进行计算。 在Excel中用于计算标准差的函数有两个。 (1)总体标准差函数(STDEVP) 总体标准差函数用来反映相对于均值的离散程度。

9、其语法结构为:STDEVP(number1,number2,.)。 其中,number1,number2,.为对应于样本总体的 1 30 个参数。 上一页下一页返回本节首页 第三章 数据描述与分析16 (2)样本标准差函数(STDEV) 样本标准差函数用来计算样本中相对于均值的离 散程度。其语法结构为: STDEV(number1,number2,.) 其中,Number1,number2,.为对应于总体样本的 1 30 个参数。 上一页下一页返回本节首页 第三章 数据描述与分析17 操作步骤如下: 建立如前述的“网上冲浪”工作表。 单击工具栏中的“函数”快捷按钮,弹出对话框 如前述所示的“粘

10、贴 函数”的对话框。在“函 数分类”列表中选择“统计”,在“函数名”列表 中选择总体标准差函数STDEVP,对话框如 下图所示。 上一页下一页返回本节首页 第三章 数据描述与分析18 在数据区域中输入B2:B21,则计算结果便显示在对话 窗口下面,其值为10.61543687,单击“确定”按钮结束 。 样本标准差的计算方法与其相同。 上一页下一页返回本节首页 第三章 数据描述与分析19 3.2.3 3.2.3 四分位数与四分位距四分位数与四分位距 将总体分成相等的四个部分的测定数为四分位 数。 位于总体第25%位置的数值是第1四分位数Q1; 位于总体第50%位置的数值是第2四分位数Q2; 位于

11、总体第75%位置的数值是第3四分位数Q3 。 四分位数函数QUARTILE可以计算一组数据的 四分位数。其语法结构为: QUARTILE(array,quart) 其中: 上一页下一页返回本节首页 第三章 数据描述与分析20 (1)Array为计算四分位数的数组或数据区域。 (2)Quart决定返回第几个四分位数。 如果 quart 等于0,函数 QUARTILE 返回最小值; quart 等于1,函数 QUARTILE 返回第1四分位数 (第25 个百分排位);quart 等于2,函数QUARTILE 返回中位数(第 50 个百分排位);如果 quart 等于3 , 函数 QUARTILE

12、返回第3四分位数(第 75 个百分排 位);如果 quart 等于4,函数 QUARTILE 返回最大 值。 上一页下一页返回本节首页 第三章 数据描述与分析21 四分位距是总体中第3四分位数与第1四分数之差 四分位距可包括位于总体分布中心的50%,它能 集中地反映总体的特征。 例 仍以网上冲浪者年龄为例,计算数据的最小 值、第1四分位数、第2四分位数、第3四分位数 和四分位距。 上一页下一页返回本节首页 第三章 数据描述与分析22 打开打开“ “第第3 3章章 数据描述分析数据描述分析.xls”.xls”工作簿,选择工作簿,选择“ “网上冲浪网上冲浪 ” ” 工作表。工作表。 上一页下一页返

13、回本节首页 第三章 数据描述与分析23 在单元格在单元格A27A27、A28A28、A29A29、A30A30和和A31A31中分别输入中分别输入“ “最最 小值小值” ”、“ “第第1 1四分位数四分位数” ”、“ “第第2 2四分位数四分位数” ”、“ “第第3 3四分位四分位 数数” ”、“ “最大值最大值” ”和和“ “四分位距四分位距” ”。 上一页下一页返回本节首页 第三章 数据描述与分析24 在在B27B27单元格中打开单元格中打开“ “插入插入” ”菜单,单击菜单,单击“ “函数函数” ”选项,在选项,在 “ “函数类型函数类型” ”列表中选择列表中选择“ “统计统计” ”,在

14、,在“ “函数名函数名” ”列表中选择列表中选择 四分位数函数四分位数函数QUARTILEQUARTILE,单击,单击“ “确定确定” ”按钮,进入四分按钮,进入四分 位数对话框窗口。位数对话框窗口。 上一页下一页返回本节首页 第三章 数据描述与分析25 在四分位数函数QUARTILE的对话框中, 在Array中输入数据区域B2:B21; 在Quart中输入0,表示计算最小值或第0四分位 数; 单击“确定”按钮,其值便显示在单元格B27中。 在单元格B28中输入“=QUARTILE(B2:B21,1)”,计算 第1四分位数,显示29.75。 在单元格B29中输入“=QUARTILE(B2:B2

15、1,2)”,计算 第2四分位数,显示38.5。 在单元格B30中输入“=QUARTILE(B2:B21,3)”,计算 第3四分位数,显示46.75。 上一页下一页返回本节首页 第三章 数据描述与分析26 在单元格B31中输入“=QUARTILE(B2:B21,4)”,计 算最大值,显示58。 在单元格B32中输入“=B30-B28”,计算四分位距, 显示值为17。 四分位距表明整个总体中位于29.75到46.75之间的数 值有50%。换句话说,从29.75到46.75这个17岁范围 内可包括总体的50%。 上一页下一页返回本节首页 第三章 数据描述与分析27 3.2.4 案例研究:磁盘 存储量

16、质量控制 某生产磁盘公司的管理人员要监测磁盘存储量的质量。10 天为一个周期,得到如下图的数据。试根据这些样本资料 对该公司的产品进行质量控制分析。 上一页下一页返回本节首页 第三章 数据描述与分析28 操作步骤如下: (1)求样本均值 打开“第3章 数据描述分析”工作簿,选择“磁盘质 量”工作表。 在J2单元格中输入“样本均值”。 在单元格J3中输入公式“=AVERAGE(B3:I3)”,并 复制到J4:J12各单元格中 。 上一页下一页返回本节首页 第三章 数据描述与分析29 (2)制作折线图 在EXCEL“插入”菜单中选择“图表”选项,打开“ 图表向导”对话框。 在步骤1的“图表类型”列表中选择“折线图”,在“ 子图表类型”中选择“数据点折线图”,单击“下一 步”按钮。 在步骤2中确认数据源为J3:J12,单击“下一步” 按钮。 在步骤3的图表选项中,单击“标题”页面,在“图 表标题”中

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号