南京财经大学统计学系管于华

上传人:ni****g 文档编号:568776782 上传时间:2024-07-26 格式:PPT 页数:55 大小:647.50KB
返回 下载 相关 举报
南京财经大学统计学系管于华_第1页
第1页 / 共55页
南京财经大学统计学系管于华_第2页
第2页 / 共55页
南京财经大学统计学系管于华_第3页
第3页 / 共55页
南京财经大学统计学系管于华_第4页
第4页 / 共55页
南京财经大学统计学系管于华_第5页
第5页 / 共55页
点击查看更多>>
资源描述

《南京财经大学统计学系管于华》由会员分享,可在线阅读,更多相关《南京财经大学统计学系管于华(55页珍藏版)》请在金锄头文库上搜索。

1、南京财经大学统计学系管于华Stillwatersrundeep.流静水深流静水深,人静心深人静心深Wherethereislife,thereishope。有生命必有希望。有生命必有希望管于华联系方式手机:手机:13851528207 13851528207 电话:电话:57713643(Home)57713643(Home)E-mail: E-mail: 或:或: 统计系主页统计系主页:http:/ Excel 的图表功的图表功能能二、二、Excel Excel 的函数功的函数功能能三、数据分析工具三、数据分析工具常用统计分析软件简介常用统计分析软件OfficeXP OfficeXP 组组件

2、件WordExcelPowerPointAccessOutlookFrontPage企业版本附:Share Point Team Services著名的统计软件著名的统计软件SASSPSSStatistics Package for Social ScienceStatistical Product & Service Solutions统计产品与服务解决方案 STATISTICA / STATA/ SYSTAT统计分析软件SAS研究所SASSPSS公司SPSSStatSoft公司STATISTICASAS公司网址:网址:http:/ 网址:网址:http:/ Analysis System,

3、最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS的重要组成部分和核心功能是统计分析,同时也是用于决策支持的大型集成信息系统。 SAS现在的版本为9.0版,大小约为1G。SASSAS被全世界120多个国家采用,直接用户则超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在英美等国,能熟练使用SAS进行统计分析是许多公司和科研机构选材的条件之一。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,堪称统计软件界的巨无霸。SAS SAS系统是一个组合软件系统,其基本核心部分是BASE SAS模块,承

4、担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。SAS系统具有灵活的功能扩展接口和强大的功能模块,其他模块有:SAS/STAT(统计分析模块) SAS/GRAPH(绘图模块)SAS/QC(质量控制模块)SAS/ETS(经济计量学和时间序列分析模块)SAS/OR(运筹学模块)SAS/IML(交互式矩阵程序设计语言模块)SPSS SPSS是软件英文名称的首字母缩写。原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。 SPSS公司于2000年正式将英文全称更改为Statistical Pr

5、oduct and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向的重大调整。SPSSSPSS一共由十个模块组成 其中SPSS Base为基本模块。九个模块为:Advanced Models、Regression Models、 Tables、Trends、 Categories、 Conjoint、 Exact Tests、Missing Value Analysis、Maps。SPSSSPSS最突出的特点就是操作界面极为友好,输出结果美观漂亮(从国外的角度看),使用窗口方式展示各种管理和分析数据方法的功能,使用对话框展示各种功能选项,只要掌握一

6、定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。是非专业统计人员的首选统计软件。SPSS 获奖情况获奖情况财富杂志1999年度200家最佳小型公司第70名 NASDAQ最佳赢利公司第22名 RealWare 1999世界智能商务解决方案奖 DM Review 1999最佳数据仓库第14名 Softletter 2000年100强第16名 1999美国个人电脑软件100强第23名 世界软件销售商500强第97名 STATISTICA StatSoft StatSoft公司1984年成立于美国俄克拉荷马州的塔尔萨,是世界上最大的统计分析和统计制图软件制造商之一。

7、1993年推出的Windows版本的STATISTICASTATISTICA得到使用者和评论家大量的史无前例的赞誉和好评。最新推出的STATISTICASTATISTICA6.0是统计分析软件的划时代产品。 STATISTICASTATISTICASTATISTICA通用数据分析统计应用系统通用数据分析统计应用系统基础统计基础统计、高级线性高级线性/ /非线性模型非线性模型、多变量多变量探索性分析技术探索性分析技术、效能分析效能分析、神经网神经网络络STATISTICASTATISTICA工业统计及工业统计及6 6西格玛工具西格玛工具质量控制图质量控制图、进程分析进程分析、实验设计实验设计ST

8、ATISTICASTATISTICA企业应用系统企业应用系统企业应用数据挖掘系统企业应用数据挖掘系统、企业应用数据分析企业应用数据分析系统系统、企业应用统计进程控制企业应用统计进程控制 SPC SPC系统系统Excel Excel 的图表功能的图表功能 用图的形式表示统计结果,比一大堆数据简洁、直观,适合向领导汇报和向群众作宣传。 合并计算功能可以让报表汇总变得轻松简单;数据透视表功能可以让数据从不同的角度得以展现。图表功能举例图表功能举例图形功能举例:图形功能举例:1. 利用图表向导作图:趋势线 饼图 柱型图2. 在图形上添加曲线等附加信息。表格功能举例:表格功能举例:1. 公式复制时的相对

9、地址与绝对地址2. 报表汇总分两种情况3. 作数据透视表Excel Excel 的函数功能的函数功能 函数是Excel工作表的核心之一,对于函数只要我们输入相应的参数,就会自动地计算出所需要的函数值。Excel提供了435个内部函数进行数学、财务、统计等计算工作。函数的基本格式为:SUM(A1:A5,C1:C3)函数功能举例函数功能举例1. 1. 有关有关描述统计描述统计的函数的函数2. 2. 次数分布表次数分布表3. 3. 矩阵运算矩阵运算 投入产出分析投入产出分析描述统计量描述统计量大致可以分为三类:描述统计量大致可以分为三类:集中趋势集中趋势离中趋势离中趋势分布趋势分布趋势反映集中趋势的

10、描述统计量反映集中趋势的描述统计量 常常用用的的反反映映集集中中趋趋势势的的描描述述统统计计量量有有五五个个:算算术术平平均均数数、调调和和平平均均数数、几几何何平平均均数数、中中位位数数和和众众数数。前前三三个个平平均均数数是是根根据据所所有有标标志志值值计计算算的的,又又被被称称为为数数值值平平均均数数,后后两两个个平平均均数数是是根根据据与与其其所所处处位位置置有有关关的的部部分分标标志志值值计计算算的的,又被称为位置平均数。又被称为位置平均数。算术平均数算术平均数 算术平均数是数据集中趋势的最主要的统计算术平均数是数据集中趋势的最主要的统计描述量。描述量。计算算术平均数使用计算算术平均

11、数使用AVERAGEAVERAGE函数,格函数,格式为:式为:AVERAGE(NUMBER1,NUMBER2,)AVERAGE(NUMBER1,NUMBER2,)NUMBERNUMBER可以是具体的数值,也可以是单元地址可以是具体的数值,也可以是单元地址或区域名称。或区域名称。调和平均数调和平均数 调调和和平平均均数数 ( (又又称称倒倒数数平平均均数数) )是是数数值值倒倒数数算算术术平平均均值值的的倒倒数数。在实际工作中,由于所获数据不能直接代入算术平均数的公式中计算,就需要有倒数平均数的形式。计算调和平均数使用HARMEAN函数,格式为:HARMEAN(NUMBER1,NUMBER2,)

12、HARMEAN(NUMBER1,NUMBER2,)几何平均数几何平均数 几几何何平平均均数数 是是N N个个数数值值的的连连乘乘积积,再再开开N N次次方方根根,它是计算平均比率和平均发展速度最适宜的一种方法,因为其数学性质与现象发展的平均速度形成的客观过程相一致。计算几何平均数使用GEOMEAN函数,格式为:GEOMEAN(NUMBER1,NUMBER2,)GEOMEAN(NUMBER1,NUMBER2,)中位数中位数 中中位位数数是是将将全全部部数数值值按按大大小小顺顺序序排排列列后后居居于于中中间间位位置置的的数数值值。换句话说,中位数把所有的数值一分为二,有一半数值比它小,另一半数值比

13、它大。计算中位数使用MEDIAN函数,格式为:MEDIAN(NUMBER1,NUMBER2,)众数众数 众众数数是是在在数数列列或或数数据据区区域域中中出出现现频频率率最最多多的数值。的数值。计算众数使用计算众数使用MODEMODE函数,格式为:函数,格式为:MODE(NUMBER1,NUMBER2,)MODE(NUMBER1,NUMBER2,)反映离中趋势的描述统计量反映离中趋势的描述统计量 常常用用的的反反映映离离中中趋趋势势的的描描述述统统计计量量(简简称称离离中中指指标标)有有三三个个:全全距距、平平均均差差和和标标准准差差(方方差差)。当当对对两两组组数数据据的的差差异异程程度度进进

14、行行相相对对比比较较时时,往往往往要要计计算算离离散散系系数数,包包括括全全距距系系数数、平平均均差差系系数数和和标标准准差差系系数数,它它等等于于相相应应的的离离中中指指标标除除以以算算术术平平均均数数,这这样样可可以以消消除除由由于于平平均均数数的的不不同同或或单单位位的的差差异异而而造造成成的的影响。影响。全距全距 全全距距(又又称称极极差差)是是最最大大值值与与最最小小值值之之差差,用用 “MAX(ARRAY)MIN“MAX(ARRAY)MIN( ARRAYARRAY) ”求求 得得 。ARRAYARRAY是是指指原原始始资资料料的的存存放放区区域域,并并且且前前后后应应该该一一致致。

15、全全距距最最显显著著的的特特点点是是计计算算简简便便、含含义义清清晰晰,实实际际工工作作中中常常用用于于产产品品质质量量的的检检验和控制,但全距容易受极端值的影响。验和控制,但全距容易受极端值的影响。平均差平均差 平均差是各个数据与其算术平均数离差绝对值的算术平均数。计算平均差使用AVEDEV函数,格式为:AVEDEV(NUMBER1,NUMBER2,)NUMBER可以是具体的数值,也可以是单元地址或区域名称。例:AVEDEV(4, 5, 6, 7, 5, 4, 3) 1.020408标准差标准差 标标准准差差用用于于反反映映相相对对于于算算术术平平均均数数的的离离散散程程度度。计计算算标标准

16、准差差的的函函数数有有两两个个,一一是是STDEVSTDEV函函数数,二二是是STDEVPSTDEVP函函数数。两两者者的的参参数数是是完完全全一一致的,只是计算的公式略有一点不同。致的,只是计算的公式略有一点不同。格式为:格式为:STDEV (NUMBER1,NUMBER2,)STDEV (NUMBER1,NUMBER2,)STDEVP(NUMBER1,NUMBER2,)STDEVP(NUMBER1,NUMBER2,)方差方差 方方差差是是标标准准差差的的平平方方,它它也也是是衡衡量量离离散散程程度度的的重重要要指指标标。计算方差有两个函数,前者是计算样本方差的,后者是计算总体方差的。格式为

17、:VAR (NUMBER1,NUMBER2,)VARP(NUMBER1,NUMBER2,)。 反映分布趋势的描述统计量反映分布趋势的描述统计量常用的反映分布趋势的描述统计量有两个:常用的反映分布趋势的描述统计量有两个:偏斜度偏斜度峰值峰值偏斜度偏斜度 偏偏斜斜度度反反映映以以平平均均值值为为中中心心的的分分布布的的不对称程度不对称程度 。计计 算算 偏偏 斜斜 度度 使使 用用 SKEWSKEW函函 数数 , 格格 式式 为为 :SKEW(NUMBER1,NUMBER2,)SKEW(NUMBER1,NUMBER2,)NUMBERNUMBER可可以以是是具具体体的的数数值值,也也可可以以是是单单

18、元元地地址址或或区区域域名名称称。正正偏偏斜斜度度表表示示不不对对称称边边的的分分布布更更趋趋向向正正值值。负负偏偏斜斜度度表表示示不不对对称称边边的的分分布布更更趋趋向负值。向负值。峰度峰度 峰峰度度反反映映与与正正态态分分布布相相比比某某一一分分布布的的尖尖锐度或平坦度。锐度或平坦度。计计 算算 峰峰 度度 使使 用用 KURTKURT函函 数数 , 格格 式式 为为 :KURT(NUMBER1,NUMBER2,)KURT(NUMBER1,NUMBER2,)NUMBERNUMBER可可以以是是具具体体的的数数值值,也也可可以以是是单单元元地地址址或或区区域域名名称称。峰峰值值正正峰峰值值表

19、表示示相相对对尖尖锐锐的的分分布布。负负峰值表示相对平坦的分布。峰值表示相对平坦的分布。次数分布例题 江浦县苗圃对江浦县苗圃对江浦县苗圃对江浦县苗圃对110110株树苗的高度进行测量(单位:厘株树苗的高度进行测量(单位:厘株树苗的高度进行测量(单位:厘株树苗的高度进行测量(单位:厘米)数据如下,要求编制次数分布表。米)数据如下,要求编制次数分布表。米)数据如下,要求编制次数分布表。米)数据如下,要求编制次数分布表。次数分布编制次数分布表的步骤:编制次数分布表的步骤:排序并求出全距(最大值排序并求出全距(最大值最小值);最小值);确定组数和组距;确定组数和组距;确定组限;确定组限;归组并计算出各

20、组的次数;归组并计算出各组的次数;显示或打印出次数分布表。显示或打印出次数分布表。次数分布 最简单的次数分布表有两列:第一列是分组标志;第二列是各组的次数。较复杂的次数分布表还可以包含向上累计次数、向下累计次数、频率、累计频率。次数分布图就是根据次数分布表作出来的,洛伦兹曲线则是根据累计频率资料绘制的。次数分布 编制次数分布表使用FREQENCY函数,格式为:=FREQUENCY(ARRAY, BINS)FREQENCY函数需要输入两项参数:ARRAY是指原始资料的存放区域,BINS是指统计分组的组上限构成的数值序列。 在使用FREQENCY函数之前需要做细致分析,了解数据的性质,还要计算一些

21、基础数据,如组数、组距和各个组限,次数分布特特别别注注意意 FREQUENCY函数在统计次数时,将与对应上限值一样大的数也统计在内,即若规定的上限是90,而原始资料中恰有90时,则该“90”被计入这一组,这样和“上限不包括原则”相违背,因此上限必须是一个略小于90的数。Excel所认定的分组标志只是每组的上限,为了能表达清楚,我们还需另外加一列分组标志。矩阵运算、投入产出分析矩阵函数矩阵函数一、计算行列式的值(一、计算行列式的值(=MDETERM)二、矩阵相乘(二、矩阵相乘(=MMULT)三、矩阵转置(三、矩阵转置(=TRANSPOSE)四、逆矩阵(四、逆矩阵(=MINVERSE)投入产出系数

22、投入产出系数一、一、直接消耗系数直接消耗系数二、二、完全消耗系数完全消耗系数三、三、影响力系数影响力系数和和感应度系数感应度系数数据分析工具数据分析工具 “数据分析”是一个外部宏(程序)模块,提供了19个数据分析的实用工具。 绘制反映数据分布的直方图;获得各种描述统计量;进行时间数列分析和回归分析,做各种假设检验等等。数据分析工具数据分析工具 数据分析前打开“工具”菜单,查看有没有“数据分析”命令。如果没有,表明数据分析工具库尚未安装。这时需要选择菜单“工具”“加载宏”,打开“加载宏”对话框,从其中的宏表中选定“分析工具库”和“分析工具库 - VBA函数”宏。安装了数据分析工具库后,每次启动E

23、xcel时,“分析工具库”宏就被自动加载。数据分析举例数据分析举例1 1、描述统计分析描述统计分析2 2、假设检验假设检验3 3、方差分析方差分析4 4、回归分析回归分析 ( (含:时间序列分析)含:时间序列分析)描述统计量反映集中趋势的描述统计量:反映集中趋势的描述统计量:反映集中趋势的描述统计量:反映集中趋势的描述统计量:数值平均数:算术平均数、调和平均数、几何平均数数值平均数:算术平均数、调和平均数、几何平均数位置平均数:众数、中位数位置平均数:众数、中位数反映离中趋势的描述统计量:反映离中趋势的描述统计量:反映离中趋势的描述统计量:反映离中趋势的描述统计量:全距、平均差、标准差全距、平

24、均差、标准差反映分布趋势的描述统计量:反映分布趋势的描述统计量:反映分布趋势的描述统计量:反映分布趋势的描述统计量:偏斜度、峰度偏斜度、峰度假设检验概述假设检验概述 假设检验是统计推断的一个重要方面。数理统计中的假设检验是先对研究总体作出某种假设,然后通过观察和试验来决定假设成立与否。 统计假设就是关于“总体的某个声明”或“某事是真的之叙述”。某航空公司的代表声称该公司民航客机的平均机龄不超过10年。一位电视台的行政主管认为绝大多数的成年人不会受电视上的暴力所影响。一位银行行长说顾客在该行排队时间不会超过3分钟。假设检验概述假设检验概述假设检验假设检验1.假设检验中的几个基本概念2.假设检验的

25、步骤3.假设检验的方法4. 例一 两独立样本的检验5. 例二 两相关样本的检验 方差分析的例子方差分析的例子方差分析的例子方差分析的例子 某饮料生产企业研制出一种新型饮料。饮料的颜色共某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为桔黄色、粉色、绿色和无色透明。随机从有四种,分别为桔黄色、粉色、绿色和无色透明。随机从五家超级市场上收集了前一期该种饮料的销售量。五家超级市场上收集了前一期该种饮料的销售量。 问:饮料的颜色是否对销售量产生影响。问:饮料的颜色是否对销售量产生影响。超市超市无色粉色粉色桔黄色桔黄色绿色绿色126.531.227.930.8228.728.325.129.6

26、325.130.828.532.4429.127.924.231.7527.229.626.532.8 方差分析的原理方差分析的原理要检验各个水平的均值是否相等,实现手段是通过方差的比较。要检验各个水平的均值是否相等,实现手段是通过方差的比较。要检验各个水平的均值是否相等,实现手段是通过方差的比较。要检验各个水平的均值是否相等,实现手段是通过方差的比较。观察值之间存在差异,其来源来自于:观察值之间存在差异,其来源来自于:(1)系统性差异:是由因素中的不同水平造成的。 例子中:饮料的不同颜色带来不同的销售量。 该差异用水平之间的方差来表示,称为组间方差,记为MSA。(2)随机差异:是由抽选样本的随机性而产生的差异。 例子中:相同颜色的饮料在不同的超市销量是不同的。 该差异用水平内部的方差来表示,称为组内方差,记为MSE。 方差分析表方差分析表 回归分析线性回归一元线性回归多元线性回归可化为线性回归的非线性回归时间序列 时间变量t 相等于自变量x回归结果的标准表示方法 m个估计参数的t 统计量(有时给出估计参数的标准误)给出:表示拟合程度的可决系数和调整后的可决系数给出:表示回归方程总体显著性检验的F统计量给出:表示有无序列相关的检验统计量D-W值统计学网页

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号