部分统计分析-excel

上传人:tian****1990 文档编号:75271663 上传时间:2019-01-30 格式:PPT 页数:41 大小:389KB
返回 下载 相关 举报
部分统计分析-excel_第1页
第1页 / 共41页
部分统计分析-excel_第2页
第2页 / 共41页
部分统计分析-excel_第3页
第3页 / 共41页
部分统计分析-excel_第4页
第4页 / 共41页
部分统计分析-excel_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《部分统计分析-excel》由会员分享,可在线阅读,更多相关《部分统计分析-excel(41页珍藏版)》请在金锄头文库上搜索。

1、,第三讲 EXCEL统计软件分析,常用统计分析软件,Office XP 组件 Word Excel PowerPoint Access Outlook FrontPage,企业版本附: Share Point Team Services,Excel在统计分析中,一、Excel 的图表功能 二、Excel 的函数功能 三、数据分析工具,常用统计分析软件简介,Excel 的图表功能,用图的形式表示统计结果,比一大堆数据简洁、直观,适合向领导汇报和向群众作宣传。 合并计算功能可以让报表汇总变得轻松简单; 数据透视表功能可以让数据从不同的角度得以展现。,图形功能举例: 1. 利用图表向导作图: 趋势线

2、 饼图 柱型图 2. 在图形上添加曲线等附加信息。 图表制作1 图表制作2,表格功能举例: 1. 公式复制时的相对地址与绝对地址 2. 报表汇总分两种情况 3. 作数据透视表,Excel 的函数功能,函数是Excel工作表的核心之一,对于函数只要我们输入相应的参数,就会自动地计算出所需要的函数值。Excel提供了435个内部函数进行数学、财务、统计等计算工作。函数的基本格式为: SUM(A1:A5,C1:C3),函数功能举例,1. 有关描述统计的函数 2. 次数分布表 3. 矩阵运算 投入产出分析,描述统计量,描述统计量大致可以分为三类: 集中趋势 离中趋势 分布趋势,反映集中趋势的描述统计量

3、,常用的反映集中趋势的描述统计量有五个:算术平均数、调和平均数、几何平均数、中位数和众数。前三个平均数是根据所有标志值计算的,又被称为数值平均数,后两个平均数是根据与其所处位置有关的部分标志值计算的,又被称为位置平均数。,算术平均数,算术平均数是数据集中趋势的最主要的统计描述量。计算算术平均数使用AVERAGE函数,格式为: AVERAGE(NUMBER1,NUMBER2,) NUMBER可以是具体的数值,也可以是单元地址或区域名称。,调和平均数,调和平均数 (又称倒数平均数)是数值倒数算术平均值的倒数。在实际工作中,由于所获数据不能直接代入算术平均数的公式中计算,就需要有倒数平均数的形式。计

4、算调和平均数使用HARMEAN函数,格式为: HARMEAN(NUMBER1,NUMBER2,),几何平均数,几何平均数 是N个数值的连乘积,再开N次方根,它是计算平均比率和平均发展速度最适宜的一种方法,因为其数学性质与现象发展的平均速度形成的客观过程相一致。计算几何平均数使用GEOMEAN函数,格式为: GEOMEAN(NUMBER1,NUMBER2,),中位数,中位数是将全部数值按大小顺序排列后居于中间位置的数值。换句话说,中位数把所有的数值一分为二,有一半数值比它小,另一半数值比它大。 计算中位数使用MEDIAN函数,格式为: MEDIAN(NUMBER1,NUMBER2,),众数,众数

5、是在数列或数据区域中出现频率最多的数值。 计算众数使用MODE函数,格式为: MODE(NUMBER1,NUMBER2,),反映离中趋势的描述统计量,常用的反映离中趋势的描述统计量(简称离中指标)有三个:全距、平均差和标准差(方差)。当对两组数据的差异程度进行相对比较时,往往要计算离散系数,包括全距系数、平均差系数和标准差系数,它等于相应的离中指标除以算术平均数,这样可以消除由于平均数的不同或单位的差异而造成的影响。,全距,全距(又称极差)是最大值与最小值之差,用“MAX(ARRAY)MIN(ARRAY)”求得。ARRAY是指原始资料的存放区域,并且前后应该一致。全距最显著的特点是计算简便、含

6、义清晰,实际工作中常用于产品质量的检验和控制,但全距容易受极端值的影响。,平均差,平均差是各个数据与其算术平均数离差绝对值的算术平均数。 计算平均差使用AVEDEV函数, 格式为:AVEDEV(NUMBER1,NUMBER2,) NUMBER可以是具体的数值,也可以是单元地址或区域名称。 例:AVEDEV(4, 5, 6, 7, 5, 4, 3) 1.020408,标准差,标准差用于反映相对于算术平均数的离散程度。计算标准差的函数有两个,一是STDEV函数,二是STDEVP函数。两者的参数是完全一致的,只是计算的公式略有一点不同。 格式为: STDEV (NUMBER1,NUMBER2,) S

7、TDEVP(NUMBER1,NUMBER2,),方差,方差是标准差的平方,它也是衡量离散程度的重要指标。计算方差有两个函数,前者是计算样本方差的,后者是计算总体方差的。格式为: VAR (NUMBER1,NUMBER2,) VARP(NUMBER1,NUMBER2,)。,反映分布趋势的描述统计量,常用的反映分布趋势的描述统计量有两个: 偏斜度 峰值,偏斜度,偏斜度反映以平均值为中心的分布的不对称程度 。 计算偏斜度使用SKEW函数,格式为:SKEW(NUMBER1,NUMBER2,) NUMBER可以是具体的数值,也可以是单元地址或区域名称。正偏斜度表示不对称边的分布更趋向正值。负偏斜度表示不

8、对称边的分布更趋向负值。,峰度,峰度反映与正态分布相比某一分布的尖锐度或平坦度。 计算峰度使用KURT函数,格式为:KURT(NUMBER1,NUMBER2,) NUMBER可以是具体的数值,也可以是单元地址或区域名称。峰值正峰值表示相对尖锐的分布。负峰值表示相对平坦的分布。,次数分布例题,江浦县苗圃对110株树苗的高度进行测量(单位:厘米)数据如下,要求编制次数分布表。,次数分布,编制次数分布表的步骤: 排序并求出全距(最大值最小值); 确定组数和组距; 确定组限; 归组并计算出各组的次数; 显示或打印出次数分布表。,次数分布,最简单的次数分布表有两列:第一列是分组标志;第二列是各组的次数。

9、较复杂的次数分布表还可以包含向上累计次数、向下累计次数、频率、累计频率。次数分布图就是根据次数分布表作出来的,洛伦兹曲线则是根据累计频率资料绘制的。,次数分布,编制次数分布表使用FREQENCY函数,格式为:=FREQUENCY(ARRAY, BINS) FREQENCY函数需要输入两项参数:ARRAY是指原始资料的存放区域,BINS是指统计分组的组上限构成的数值序列。 在使用FREQENCY函数之前需要做细致分析,了解数据的性质,还要计算一些基础数据,如组数、组距和各个组限,,次数分布,特别注意 FREQUENCY函数在统计次数时,将与对应上限值一样大的数也统计在内,即若规定的上限是90,而

10、原始资料中恰有90时,则该“90”被计入这一组,这样和“上限不包括原则”相违背,因此上限必须是一个略小于90的数。Excel所认定的分组标志只是每组的上限,为了能表达清楚,我们还需另外加一列分组标志。,矩阵运算、投入产出分析,矩阵函数 一、计算行列式的值(=MDETERM) 二、矩阵相乘(=MMULT) 三、矩阵转置(=TRANSPOSE) 四、逆矩阵(=MINVERSE),投入产出系数 一、直接消耗系数 二、完全消耗系数 三、影响力系数和感应度系数,数据分析工具,“数据分析”是一个外部宏(程序)模块,提供了19个数据分析的实用工具。 绘制反映数据分布的直方图;获得各种描述统计量;进行时间数列

11、分析和回归分析,做各种假设检验等等。,数据分析工具,数据分析前打开“工具”菜单,查看有没有“数据分析”命令。如果没有,表明数据分析工具库尚未安装。这时需要选择菜单“工具”“加载宏”,打开“加载宏”对话框,从其中的宏表中选定“分析工具库”和“分析工具库 - VBA函数”宏。安装了数据分析工具库后,每次启动Excel时,“分析工具库”宏就被自动加载。,数据分析举例,1、描述统计分析 2、假设检验 3、方差分析 4、回归分析 (含:时间序列分析),描述统计量,反映集中趋势的描述统计量: 数值平均数:算术平均数、调和平均数、几何平均数 位置平均数:众数、中位数,反映离中趋势的描述统计量: 全距、平均差

12、、标准差,反映分布趋势的描述统计量: 偏斜度、峰度,假设检验概述,假设检验是统计推断的一个重要方面。数理统计中的假设检验是先对研究总体作出某种假设,然后通过观察和试验来决定假设成立与否。,统计假设就是关于“总体的某个声明”或“某事是真的之叙述”。,某航空公司的代表声称该公司民航客机的平均机龄不超过10年。 一位电视台的行政主管认为绝大多数的成年人不会受电视上的暴力所影响。 一位银行行长说顾客在该行排队时间不会超过3分钟。,假设检验概述,假设检验,1.假设检验中的几个基本概念 2.假设检验的步骤 3.假设检验的方法 4. 例一 两独立样本的检验 5. 例二 两相关样本的检验,方差分析的例子,某饮

13、料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为桔黄色、粉色、绿色和无色透明。随机从五家超级市场上收集了前一期该种饮料的销售量。 问:饮料的颜色是否对销售量产生影响。,方差分析的原理,要检验各个水平的均值是否相等,实现手段是通过方差的比较。 观察值之间存在差异,其来源来自于: (1)系统性差异:是由因素中的不同水平造成的。 例子中:饮料的不同颜色带来不同的销售量。 该差异用水平之间的方差来表示,称为组间方差,记为MSA。 (2)随机差异:是由抽选样本的随机性而产生的差异。 例子中:相同颜色的饮料在不同的超市销量是不同的。 该差异用水平内部的方差来表示,称为组内方差,记为MSE。,方差分析表,回归分析,线性回归,一元线性回归,多元线性回归,可化为线性回归的非线性回归,时间序列 时间变量t 相等于自变量x,回归结果的标准表示方法,m个估计参数的t 统计量 (有时给出估计参数的标准误),给出:表示拟合程度的可决系数和调整后的可决系数 给出:表示回归方程总体显著性检验的F统计量 给出:表示有无序列相关的检验统计量D-W值,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号