统计数据的应用

上传人:wm****3 文档编号:52063548 上传时间:2018-08-18 格式:PPT 页数:78 大小:1,000.50KB
返回 下载 相关 举报
统计数据的应用_第1页
第1页 / 共78页
统计数据的应用_第2页
第2页 / 共78页
统计数据的应用_第3页
第3页 / 共78页
统计数据的应用_第4页
第4页 / 共78页
统计数据的应用_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《统计数据的应用》由会员分享,可在线阅读,更多相关《统计数据的应用(78页珍藏版)》请在金锄头文库上搜索。

1、统计数据的应用运营协调中心 2008年11月13日统计数据的应用目 录引言l统计的基本概念、内容集团的统计工作l统计的一些应用黑人总统,美国有种族歧视吗? 统计学案例 美国佛罗里达州的凶杀案 (摘自:茆诗松等 高等数理统计)下表是1976年-1977年美国佛罗里达州的凶杀案 件中,326个被告的肤色和死刑判决情况的分 类表。请注意死刑判决比例被告死刑合计死刑判决比例是否白人1914116011.88%11.88%黑人1714916610.24%10.24%合计363629029032632611.04%11.04%表2-1被告肤色和死刑判决情况分类表事实果真如此? 似乎白人被判死刑的可能性等于

2、黑人被判 死刑的可能性(事实上,表中白人凶手被 判死刑的比例略高) 换言之,肤色与死刑关联性不大 进一步推论,从这点上,恐怕找不到种族 (肤色)歧视的有利证据 显然与当时的美国现实不相符合改进:把被害人肤色考虑入内后,见表2表2 被告与被害人的肤色以及死刑判决情况分类类表 被告被害人死刑合计死刑判决比例是否白人白人19 132 151 12.58%12.58%黑人0 9 9 0.00%0.00%黑人白人11 52 63 17.46%17.46%黑人6 97 103 5.83%5.83%合计36 36 290 290 326 326 11.04%11.04%数据表明:种族和肤色歧视在七十年代确

3、实存在 启示 用数据说话,更能证明你的观点 不要被数据假象所迷惑 深入挖掘数据背后的事实(增加一个因素 ,结论不同)无论我们是在教室、在工作场所还是在无论我们是在教室、在工作场所还是在 家里,数据总会潮水般向我们涌来。许多人学家里,数据总会潮水般向我们涌来。许多人学 习这门课,目的是为了成为商号或公司的高层习这门课,目的是为了成为商号或公司的高层 管理人员和决策者(有的已经是这样的管理人管理人员和决策者(有的已经是这样的管理人 员和决策者),正因为如此,你必须有能力弄员和决策者),正因为如此,你必须有能力弄 懂别人向你提供的大量数据的涵义。懂别人向你提供的大量数据的涵义。什么样什么样的的 专门

4、手段能使你高效率地使用数据专门手段能使你高效率地使用数据? ?答案是答案是“ 统计学统计学”。国外工商管理硕士(国外工商管理硕士(MBAMBA )优秀教材译丛)优秀教材译丛. . 美美商务统计商务统计对统计 的认识在今天的全球商务和经济环境中,在今天的全球商务和经济环境中, 有极大数量的统计信息是可利用的,最成有极大数量的统计信息是可利用的,最成 功的管理人员和决策制定者是那些能够理功的管理人员和决策制定者是那些能够理 解信息并有效利用信息的人。解信息并有效利用信息的人。2121世纪管理经典教材系列世纪管理经典教材系列 经济教材译丛经济教材译丛. . 美美商务与经济统计商务与经济统计例一,婴儿

5、的性别比例,由人类社会例一,婴儿的性别比例,由人类社会 长期遗传和发展所形成,古今中外大致长期遗传和发展所形成,古今中外大致 相同(大约为相同(大约为107107:100100或或51.6951.69:48.3148.31 )。)。人类性别比例的研究,是统计学的起源之一人类性别比例的研究,是统计学的起源之一 ,也是统计方法探索的最早的数量规律性之一,也是统计方法探索的最早的数量规律性之一 。20002000年年11.111.1普查大陆总人口普查大陆总人口12658351265835万人,万人, 性比为性比为51.6351.63:48.3748.37,男性人口多,男性人口多2.262.26个百分

6、个百分点,多点,多41274127万人。万人。统统 计计 数数 据据 的的 内内 在在 规规 律律基本概念-概率 概率是频率的稳定值。概率非负,介于0与 一之间的一个数值,某一事件所有可能结 果的概率总和为1。 例如某种新产品畅销的可能性为80%,可 以理解成其主观概率为0.8. 例一:某公司声称所产一种感冒新药治愈 率为95%,现在十个患者服用,问至少八 个病愈的可能性有多大? 答案是98.85%基本概念-概率 直觉并不可靠。“生日问题” 某班级中有五十个学生,问至少有两个人在同 一天的概率有多大? 答案是97%。人数n102023304050概率p12%41%51%71%89%97%例例

7、投掷硬币。投掷硬币。 投掷一枚质量均匀的硬投掷一枚质量均匀的硬币,出现正面和反面的概率各为币,出现正面和反面的概率各为1/21/2;投掷;投掷 一枚骰子出现一枚骰子出现1 16 6点的概率各为点的概率各为1/61/6。大量试验结果表明频率接近于概率。大量试验结果表明频率接近于概率。频率:频率:在在n n次重复试验中,事件次重复试验中,事件A A出现了出现了k k次,次, 则则k/nk/n为事件为事件A A发生的发生的频率频率。概率:概率:如果随着试验次数的增加,事件如果随着试验次数的增加,事件A A的频率的频率 逐渐稳定于某个常数逐渐稳定于某个常数P P附近,则称附近,则称P P为事件为事件A

8、 A的的概概率率(概率是频率的稳定值,(概率是频率的稳定值,是随机事件发生可能是随机事件发生可能 性大小的度量。性大小的度量。 )1818世纪法国科学家蒲丰投掷钱币世纪法国科学家蒲丰投掷钱币40404040次,正次,正 面面20482048次,频率次,频率0.5070.507;2020世纪英国科学家皮尔逊投掷钱币世纪英国科学家皮尔逊投掷钱币1200012000次次 ,正面,正面60196019次,频率次,频率0.50160.5016;2400024000次,正面次,正面 1201212012次,频率次,频率0.50050.5005。南非数学家南非数学家John John KerrichKerr

9、ich二战时期在集中营二战时期在集中营 投掷投掷1000010000次,正面次,正面50675067次,频率次,频率0.50670.5067概念 数学期望(均值) 分赌本问题17世纪中叶,一位赌徒向法国 数学家帕斯卡提出了一个令他苦恼已久的 问题: 甲乙两人赌技相同,各出赌注50法郎,每 局无平局 规则:谁先赢三局,则得全部赌本100法郎 意外:当甲赢2局,乙赢一局,因故中断赌 博。 问题:如何分配这100元?共识:平均分对甲不公平, 全部归甲对乙 不公平。 按比例分 方案一:甲得100法郎中的2/3,乙得100法 郎中的1/3.这是基于已赌局数。 方案二:1654年帕斯卡提出:设想再赌下 去

10、,再赌两局必可结束。 后两局的结果可能是:甲甲、甲乙、乙甲、乙乙。其中“甲乙”代表甲赢第一局,乙赢第二局。 以此类推。分析甲所得X010 0 概率( 可能 性)P0. 2 50. 7 5 四种情况中三种情况甲可以获100法郎,只有一 种情况下甲获0法郎。 甲的期望所得:0X0.25+100X0.75=75(法郎) 这种分法不仅考虑已赌局数,而且包括对再赌下 去的一种“期望”。更为合理 称为“均值”更形象易懂基本概念 方差与均方差 有两个牌子的手表,各抽100只,检测走时误 差.结果发现其误差均值为0A牌 号误 差 ( 秒 )-10+1比 例10% 80% 10%B牌号误差( 秒)-2-10+1

11、+2比例10%20%40%20%10%为了比较两个牌子手表的走时好坏,计算方差与标为了比较两个牌子手表的走时好坏,计算方差与标 准差。显然准差。显然A A手表走时偏差更好手表走时偏差更好德国十马克上的高斯标准正态分布蓝色部分的面积: P(-3X3)=0.9973正态态分布密度函数(频率曲线)为正态函数(曲线)、是两个不确定常数,是正态分布的参数,不同的对应不同的正态分布。正态曲线呈钟型,两头低,中间高,左右对称,曲线与 横轴间的面积总等于1。不同的、对应的正态曲线相同,不同的情况相同, 不同的情况6与正态分布99.9937%99.999943%99.9999998%99.73%68.27%95

12、.45%规格范围LSLUSL0.001ppm 1350ppm0.001ppm1350ppm标称值=西格玛水平和对应的合格率比较图3流程与6流程的比较3流程LSLUSL合 格6流程合 格由客户决定由客户决定废品 0.001ppm废品 0.001ppm6流程比3流程好得多!废品 1350ppm废品 1350ppm什么是统计?统计工作是人们为了说明所研究对 象的某种数量特征和数量规律性,而对 该现象的数据进行收集、整理与分析的 活动过程。 统计资料是通过统计工作所获得的 能够说明现象总体某种特征的数据以及 与之相联系的文字、图表等资料的总称 ,是统计实践活动的成果。统计的多重含义:统计的多重含义:统

13、计工作,统计工作,统计资料,统计资料,统计学统计学统计的起源统计学起源于2000多年前的古希腊,主要是帝王为战 争作准备时对资源进行的调查; “统计学”一词出现在1749年的德语中,是德国学者阿亨 华尔在欧洲各国国势学纲要一书中为国势学所起的 名字,国势学是对当时欧洲各国的人口、土地、财政、 军事等方面实力的描述与比较,德国大学1660年开始 讲授此课; 现代统计学源于英国的农业生产:利用统计选择高产的 种子、肥沃的土地; 随着学术与应用的发展,英国和美国分别于1834年和 1839年成立统计学会,大约有7000和2万左右的会员; 中国现代统计学则是从数学开始的。(许宝騄 陈希儒)传统的统计学

14、主要指官方统计、工业统计和现 场统计,现代统计学则注重挖掘数据包含的信 息,用已知来预测未知,用过去预测未来。国际数理统计学会主席范剑青说:“社会活动 看似杂乱无章,对个体来说有很多不确定性, 但总体上都是服从一些统计规律的。无论医学 、经济学、社会科学、工业生产或是科学实验 得到的都是数据,统计学就是对这些数据进行 加工和提炼,找出规律、预测未知。概率统计 是描述社会活动最简洁有力的语言。”对随机现象进行观测、试验,以取得有代表性的观测值对已取得的观测值进行整理、分析,作出推断、决策,从而找出所研究的对象的规律性统 计 的 分 类描述统计学推断统计学第六章 统计方法通常可以分为描述统计和推断

15、统计方法通常可以分为描述统计和推断 统计两部分。统计两部分。 1.1.描述统计描述统计: : 主要是指在获得数据之后,通过分组、主要是指在获得数据之后,通过分组、 有关图表、统计指标等对现象加以描述有关图表、统计指标等对现象加以描述 ; 2.2.推断统计推断统计: : 指通过抽样调查等非全面调查,在获得指通过抽样调查等非全面调查,在获得 样本数据的基础上,以概率论和数理统样本数据的基础上,以概率论和数理统 计为依据,对总体的情况进行科学推断计为依据,对总体的情况进行科学推断 ; 通过建立回归模型对现象的依存关系进通过建立回归模型对现象的依存关系进 行模拟、对未来情况进行预测。行模拟、对未来情况

16、进行预测。数据的分类 1、计量数据 如人的身高、体重,产 品长度,直径,重量,股票的价格、 市盈率。它们的取值可以是某个区间 内的任意一个实数。 2、计数数据 如企业职工人数、成交股票 股数等。它们在整数范围内取值,大部分 还仅在非负整数范围内取值。3、名义数据 有的时候,观察值不是数,而是事物的属 性,如人的性别(男、女),物体的颜色 、形状。我们常用数来表示属性的分类, 如用数“1”和“2”分别表示男和女。这些数只 起一个名义的作用,只是一个代码,没有 大小关系,也不能进行运算。这里“2”与“1” 不能比较大小也,“1+2”也没有意义。这类 数据称为名义定性数据,简称名义数据。4、有序数据 有些

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号