数据与统计:统计方法

上传人:j****9 文档编号:57414850 上传时间:2018-10-21 格式:PPT 页数:106 大小:1.32MB
返回 下载 相关 举报
数据与统计:统计方法_第1页
第1页 / 共106页
数据与统计:统计方法_第2页
第2页 / 共106页
数据与统计:统计方法_第3页
第3页 / 共106页
数据与统计:统计方法_第4页
第4页 / 共106页
数据与统计:统计方法_第5页
第5页 / 共106页
点击查看更多>>
资源描述

《数据与统计:统计方法》由会员分享,可在线阅读,更多相关《数据与统计:统计方法(106页珍藏版)》请在金锄头文库上搜索。

1、Chapter 1,概述:数据与统计,1.1统计数据数据是经过收集、分析和概括后用于表达和说明的事实和数字数据的收集、整理、分析有利于管理者理解商务经济环境,有助于正确决策统计学是收集、分析、陈示和解释数据的技术与科学应用:会计师事务所在对其客户进行审计时要使用统计抽样程序,如审计人员 从帐户中选择一个子集为样本,考察客户资产负债表上的应收帐款财务顾问利用各种各样的统计信息来指导投资建议零售结帐柜台的电子扫描数据可用于市场调研物资管理中的ABC分类,产品质量与工作质量的六西格玛管理根据大量体检数据对某地区居民的健康进行分析,以用于保健项目、医疗服务、药品的生产与研发数据的来源:统计报表(制度)

2、因特网、研究报告与出版物(如各种统计年鉴)大量的商务和经济数据可从专门搜集和维护数据的组织得到,如美国邓布拉斯公司(Dun&Bradstreet)和道琼斯公司是两个向客户提供大量商业数据服务的公司,A.C.尼尔森公司和信息资源公司已建立1亿美元的经营规模,收集和处理零售结帐柜台电子扫描数据,并向制造商出售横截面数据与时间序列数据横截面数据是在同一时点收集的数据,时间序列数据是在前后时间段内依序收集的数据,企业调研应用问题举例:,金融业数据应用实例,1)客户行为分析。 客户行为分析包括整体的行为分析和群体的行为分析。整体的行为分析用来发现企业所有客户的行为规律。群体的行为分析通过行为分组发现群体

3、客户的行为规律。基于这些理解和规律,企业管理人员可以制定相应的市场策略,同时还可以针对不同客户组进行交叉分析,帮助发现客户群体间的变化规律。 2)重点客户发现。 重点客户发现的目标是找出对企业具有重要意义的客户。这些重点客户主要包括潜在客户(有价值的新客户)、交叉销售(同一客户有更多的消费需求)、增量销售(更多地使用同一种产品或服务)和客户保持(保持客户的忠诚度)。有关研究表明,开发新客户的费用是保留老客户费用的5倍,而成功地保留老客户能使企业的利润翻番。,3)市场性能评估 市场性能评估以市场反馈为基础,使企业能够及时跟踪市场的变化,在一定时间范围内(3-6个月)给出行为分组的报告,对行为分析

4、、市场策略和重点客户发现过程进行评估,并在评估的基础上调整和改进客户关系管理活动。,1.2 描述统计:表格法与图形法频数(率)分布 直方图适当分组,确定组限、组中值编制频数分布表,重点调查:有量的概念,如利税高的企业,典型调查:选典型有主观因素,抽样调查:后面有较详细的讨论,非全面调查:,全面调查:如第五次人口普查,专门调查,调查方式,例:有50位学生的综合成绩88 90 53 69 67 86 75 78 73 64 85 82 63 92 58 76 67 82 78 80 55 68 76 79 84 78 89 92 93 54 78 62 83 68 79 75 66 78 82 9

5、566 71 73 78 90 85 77 56 74 68,例 共50人 5060 5人 6070 11人 7080 17人 8090 11人 90100 6人,-,100,50,合计,100.0,12.0,6,90100,88.0,22.0,11,8090,66.0,34.0,17,7080,32.0,22.0,11,6070,10.0,10.0,5,5060,累计频率(%),频率(%),频数(次),成绩(分),直方图,频率 (%),频数 (人),11,22,5,10,55,65,75,85,95,以后我们主要讨论关于频率的直方图,直方图给出了一种 分布的直观形式, 直观的看总体数据 经分

6、组整理后就可 看作总体的分布,成绩(分),分布特征 从直方图到分布曲线直方图给出了一种“分布”的直观形式 钟型分布如身高、体重、成绩、产品质量、工作质量U型分布如人群健康(生病),管理中的“拿来主义”:浴盆曲线 正J型,反J型,劳伦兹曲线,前例,例中不超过60分的人数占10%,其成绩之和为555,即275分,占成绩总和k的比率a1为275/k,其中K5556511956 3770 所以a17.3.注意a17.3小于对应的累计频率10%类似,与不超过70分相应的a2(5556511)/k 并由此算出a3、a4、a5,显然a5等于100%,上世纪初,劳伦兹以横坐标表示户数比率,以纵坐标表示相应的收

7、入比率(如将前例中的成绩改为收入,单位千元/年),将两种累计频率对应图示,即有下图(一般画为正方形) 按收入累计(%),0,按户数累计,(%),图中曲线称劳伦兹曲线(又称公平曲线),其对角线表示绝对公平,基尼系数:A/(A+B)此系数将劳伦兹曲线表示的公平程度予以量化,其值越小表示越公平(均匀)思考:与ABC分类法的关系?与2/8原则的关系?,A,B,茎叶图以原来50个数据为例,十位数为茎,个位数为叶作图,茎,56789,叶,3 8 5 4 6 (5),9 7 4 3 7 8 2 8 6 6 8 (11),5 8 3 6 8 6 9 8 8 9 5 8 1 3 8 7 4 (17),8 6 5

8、 2 2 0 4 9 3 2 5 (11),0 2 2 3 5 0 (6),88 90 53 69 67 86 75 78 73 64 85 82 63 92 58 76 67 82 78 80 55 68 76 79 84 78 89 92 93 54 78 62 83 68 79 75 66 78 82 95 66 71 73 78 90 85 77 56 74 68,竖过来就是一个直方图。,1.3分布的数字特征,设总体有N个数据 总体均值:(Xi)/N 表征了数据的平均水平 总体方差: 2 (Xi )2N 表征了数据的离散程度例:6,9,12,15,18均值: (6+9+12+15+18

9、)/5 12方差: 2 36+9+0+9+365=18 数据的位置数 例: 63 59 82 76 74 7485 90 88 75 78 79 77按序排列:59 63 74 74 75 76 77 78 79 82 85 88 90 Q1 Q2 Q3 Q4 Q5最小数 下四分位数 中位数 上四分位数 最大数,又称“五数描述”,1.4 从原分布(直方图)到分析型分布(直方图),原分布可以直接反映实际情况,但不便于进一步分析问题。进行一般性讨论常用的一种处理是以分布形状面积的大小度量频率,取代原分布中以高度度量频率。 如某地区高一男生的身高分布经变换后其1.5-1.7米男生的比例等于右图阴影部

10、分的面积即75%例 6,9,12,15,18本例是一种易于处理的特殊情况:宽度取为1时,所绘图形可以用面积表示频率大小一个以高度表示频率的直方图,可以经适当变换,变成以分布形状的面积大小来表示频率大小。(下页将介绍变换方法),75%,1.5,1.6,1.7,米,/米,频率 (%),频数 (人),11,22,5,10,50,60,70,80,90,100,%/分,2.2,1.0,50,60,70,80,90,100,右图是以高度而不是以面积表示频率大小,分,引入频率密度进行变换:令 频率密度频率值/该组的组间距(单位:%/分),分,此时图形的面积可以表示频率大小从直方图描述到分布描述便于 使用数

11、学工具(如积分),频率直方图,频率密度分布图,变换举例:,Chapter 2,正态分布,2.1随机变量及其概率分布 随机实验:掷硬币 随机事件:掷硬币出现正面或反面 随机变量:此处可以量化 令出现正面为1,出现反面为0。分别记为X=1,X=0。X为随机变量(常用大写字母表示)。 古典概率:基于等可能性原则度量随机事件可能性大小。如:P(出现正面)=P(X=1)=1/2,P(出现反面)=P(X=0)=1/2。(可参考p49p54 p65p80) 例:有80件产品,其中优等品为40件,任取一件,求取得优等品的概率。 解:P(X=优等品)=40/80=0. 5,可列概率表如下:,可见本例与掷硬币结果

12、类似。例:掷骰子两次,求其两次点数之和的概率。 解:显然两次点数之和最小为1+1=2,最大为6+6=12,可列概率表如下:显然 pi = 1 值得注意的是,x取两头值的概率小,取中间值的概率大。,例:前例6,9,12,15,18五张数字卡片,任取其一,则 P(X=6)=P(X=9)=P(X=18)=1/5=0.2对于随机变量,也可以绘出“直方图”。,不难看出,前面频率直方图与此处的概率“直方图”几乎一样。,频率,概率,概率,以下我们不再专门说明两者,其意自明,若适当选取度量单位,如使每个直方条的宽度为1,则可以用面积大小表示概率大小,如P(9X15)=0.6,即图中三个直方条的面积总和。于是现

13、在我们可以用函数描述与处理随机现象,如用积分求面积。概率意义上的平均值,称数学期望。X的数学期望常记为E(X):E(X)=piXi 式中pi为Xi的概率,所以数学期望又可以看作以pi为权重的加权和。,2.2二项分布,例:有80件产品,其中优等品为40件,任取三次(每次取后放回),求取得优等品的概率。 解:对任意一次而言:P(X=优等品)=p=40/80=0.5 ;P(X=非优品)=q=40/80=0.5=1-p 取三次,可得优等品0、1、2、3件,即x取值为0、1、2、3,通式: P(X=k)=C3kpkq3-k (k=0, 1, 2, 3)。该分布称为二项分布。,x,0.125,0 1 2

14、3,0.125,0.375,0.375,x,0.125,0 1 2 3,0.125,0.375,0.375,以高度表示概率,这里以宽度为1画图就可用面积表示概率,X取两端值0与3各仅有 一条“路径”;而x取中间值 1与2各有3条“路径”; 于是在等可能条件下出 现了结果的不均等现象:由于生成两端值仅一条路径而生成中间值有三条路径,就出现了“两头小,中间大”的形状,2.3正态分布,米,%/米,前例,某地区身高分布呈中间高、两头低的形状身高、体重、成绩、加工零件的尺寸等均服从这种分布,称“正态分布”,也称常态分布,意即最为常见、最为普遍的分布。总体越大分组越细图形就越近于曲线。为便于用数学手段进行分析,理论上可推导出用负指数函数表示密度函数的“理论模式”。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 初中教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号