概率、信息描述与抽样推断小结精编版

上传人:ahu****ng1 文档编号:143777410 上传时间:2020-09-02 格式:PPTX 页数:106 大小:1.03MB
返回 下载 相关 举报
概率、信息描述与抽样推断小结精编版_第1页
第1页 / 共106页
概率、信息描述与抽样推断小结精编版_第2页
第2页 / 共106页
概率、信息描述与抽样推断小结精编版_第3页
第3页 / 共106页
概率、信息描述与抽样推断小结精编版_第4页
第4页 / 共106页
概率、信息描述与抽样推断小结精编版_第5页
第5页 / 共106页
点击查看更多>>
资源描述

《概率、信息描述与抽样推断小结精编版》由会员分享,可在线阅读,更多相关《概率、信息描述与抽样推断小结精编版(106页珍藏版)》请在金锄头文库上搜索。

1、概率与正态曲线,1.研究随机性和规律性的两个例子 1)20世纪50年代,小儿麻痹症育苗的研究。,问题是:56和138之间的差别是否超过了随机性所能解释的范围。,2)1970,美国越战的征兵,问题是:73和110之间的差别是否超过了随机性所能解释的范围。,思考题 拧松水龙头,让其刚好到只有水滴下来,计算并记录15分钟内每个20秒里的水滴数。利用你的数据,请说出该水滴在什么方面是随机的?什么方面又是有规律的?,1)随机性和规律性是统计学的两个重要概念。规律性本身包含着随机性。统计可以定义为在随机性中寻找规律性,当两种规律之间的差异超出了随机性本身的影响(或者解释范围),变化趋势就发生了。 2)概率

2、为我们从数据中得出结论提供了基础,统计学家利用概率判断数据间的差异是否超出了随机性本身的影响。 3)统计很少对总体进行直接的研究,都是通过对具有代表性的样本的研究,来对总体的信息进行推断。,一、概率论发展简史,1. 概率论的起源,Pascal(16231662),Fermat, (16011665),1654年,赌金分配问题,赌金分配问题 梅雷说:有一次他与某赌友(代称为A先生)掷骰子时,各押32个金币为赌注,双方约定如果谁先赢得3局,就可以把赌金全部拿走,但因为梅雷临时有事,所以赌局不得不中途中断。此时梅雷已经赢得2局,而A先生只赢1局,如何公平分配赌金?,起点,费马:,帕斯卡尔:,1655

3、年,荷兰数学家惠更斯 (Christopher Huygens) 访问巴黎时,了解到帕斯卡尔与费马的通信研究,对这类问题产生兴趣,后来,他撰写骰子游戏(Dice Game, 1657) 来探讨机率问题的原理,其中包含许多习题,被许多人认为是机率史上第一本教科书。提出了期望的概念。 1713年,瑞士数学家伯努利(Jacob Bernoulli,1654 1705)出版了猜度术一书,提出了大数定理 。,1765年,法国数学家棣莫弗(A.DeMoivre,16671754)的机会的学说一书出版,1733年就发现了正态曲线,以及论述了不存在运气。 1933年,俄罗斯数学家科尔莫戈罗夫(19031987

4、)以德文出版的经典性著作概率论基础,标志着概率论的公理化完成,这就是我们现在看到的概率论的情形。,2. 概率论专有名词,随机实验(Random trial):满足如下三个条件就可以称之为随机实验:(1)在同一条件下可无限次重复;(2)实验结果有多个,且不确定;(3)事前不知实验结果(outcome)。抛硬币 基本事件(Elementary event):一次随机实验的可能结果,称为基本事件或者基本随机事件。 若随机实验E是“抛两次硬币”,其基本事件就是“+、”,“+、+”,“,”,“,+”。 样本空间(Sample space):所有基本事件所组成的集合,称为样本空间或基本空间。 接上例,其样

5、本空间就是集合“+、”,“+、+”,“,”,“,+”。,随机事件(Random event): 简称事件,指一些由基本事件所组成的集合。 例如,接上例,事件“两次出现相同面”,就有两个基本事件组成:+、+”,“,”。 不相容事件(Mutually exclusive events): 在随机试验中,不能同时发生或其交集为空集的几个事件,称为不相容事件。反之为相容事件 接上例,事件“两次同时出现正面”和“两次同时出现反面” 就是不相容事件。“至少出现一次正面”和“至少出现反面”就是两个相容事件,3. 概率的含义 概率(Probability)是一个0到1之间的数,描述了一个事件发生的经常程度。小

6、概率(接近于0)的事件很少发生,而大概率(接近于1)的事件则经常发生。 概率对统计的意义:对于统计,概率告诉我们,在样本数据的基础上,如果试验重复多次,各种结果发生的经常程度是多大。,.5,0,1,不可能,必然,4.获得概率的基本方法,利用机会均等法则(Equality likely approach) 使用相对频次(Relative frequency)的方法 利用主观概率(Subjective approach),4.1 利用机会均等法则 如果试验有n种可能的结果,使某特定事件出现的结果数量为k,那么(k/n)就是出现该事件的概率。 思考题:一副扑克52张(大、小王去掉),洗均匀,随机取一

7、张牌,那么该张牌是梅花的概率是多少?,k,n,要注意两点:,(1)分清楚你求解问题中什么是你的n,什么是你的k。 (2) 其实我们在这样做的时候,就已经接受了两个前提假设:a)实验的可能结果是已知的;b)由于对称性,每一个结果的可能性都是相同的。往往这两个前提假设不一定满足.,思考题 再求以下问题的概率中,以上的哪个前提假设不满足: 1)一场赛马比赛,有6匹马,求某一匹马胜出的概率。 2)求解生男孩和女孩的概率,14讲小结,一、霍桑实验中的群体实验,这个实验的目的就是要看看,当每个工人的工作情况不但与自己的报酬、而且与同伴的报酬紧密关联时,工人会如何办?怎样协作?,实验条件: (1)人员:14

8、名男职工,其中9名绕线工,3名是焊接工,2名检验工; (2)计件工作制度,但却不是按个人的产量计酬,而是按集体的总产量计酬;报酬由厂方直接支付给个人,而不是交由小组自行分配。这样,工人完成的工作数额,不但决定着自己的工资,而且直接影响着一起干活的同事们的收入。 实验结果:工人每天只完成了60006600个焊接点(标准每个工人应该完成7312个焊接点),且天天如此。为什么?,解释1:可能是这些工人的智力或者动作协调性有问题。 再做研究,研究测试结果否定了这一解释。 合理的解释: 工人们自动限制产量的理由是,如果他们过分努力地工作,就可能造成群体内同伴的失业,或者公司会制定出更高的生产定额来。所以

9、群体会迫使其中的个体进行一致限产。也就是工人会受到非正式组织的影响。 证实在工人当中存在着一种非正式的组织,而且这种非正式的组织对工人的生产率有着极其重要的影响,总结一下该研究的研究过程,二、变量(variable),变量简单的说就是事物的特征或者属性。 研究者在研究项目开始的时候,就要确定他们所要研究的变量是什么。 变量的值(value)通常是对某一个特定单位的度量,这种单位常常被视为一个个体(element)。什么是个体取决于你的研究问题。,21 变量的测量层次 1)思考题:请回答以下收集到的数据,可以进行“”,“、” ,“,”中的哪些运算? (1)五个人的性别:1,0,0,1,1(1:男

10、性;0:女性) (2)五个人的身高:170,173,165,180,161(单位:厘米) (3)七天的气温(摄氏温度):15,24,27,18,34,30,19。 (4)五个人对一项政策满意程度的评分: 5,3,3,4,2 (1:十分不满意;2:不满意;3:一般或中立;4:满意;5:十分满意),2)思考题: (1)我们用一个量表测量人们对一项法律的态度,如果1表示不赞成,2表示无所谓,3表示赞成,对于3个人我们测得的值分别为:3、1、2,这些数据为_数据。 (2)测量10个大学生所在的年级,如果用1表示大一、2表示大二、3表示大三、4表示大四、5表示其他。测量的值为:1、3、4、1、2、3、2

11、、1、1、4,这些数据为_数据。 (3)测得5个人的第一次结婚年龄(单位:周岁)为:20、22、24、30和26,这些数据为_数据。,三、频数分布数列,1.统计分组后,每个组分配的总体单位数称为频数或次数(f)。 频数/总体单位总数=频率。 2.意义 整理了杂乱无章的数据,同时显示出一批数的分布情况,是数理统计学中随机变量及其概论分布概念在实际中的应用。,例1,家庭所拥有的电视机数对于广告行业来说是一个重要的信息,下面的数据是随机抽取的50户家庭中每个家庭所拥有的电视机数。 1 1 1 2 6 3 3 4 2 4 3 2 1 5 2 1 3 6 2 2 3 1 1 4 3 2 2 2 2 3

12、0 3 1 2 1 2 3 1 1 3 3 2 1 1 3 1 5 1 你能从中发现什么?,思考题: (1)如果要让你去获取你所在楼层的家庭拥有的电视机数量的分布,你怎么去获取? (2)如果要让你去获取广州市家庭拥有的电视机数量的分布,你怎么去获取?,四、集中趋势分析,集中趋势是数据分布的中心,描述集中趋势的指标有算术平均数( )、几何平均数( )、中位数( )、众数( )等。,众数 中位数,平均数,位置平均数,数值平均数,算术平均数 调和平均数 几何平均数,1.平均数的分类,2.算术平均数的计算公式,算术平均数 1.简单算术平均数: 假定变量X有N个观察值:X1,X2,X3,XN,那么它的平

13、均数 的计算公式是: 2.加权算术平均数:,例1:应用条件:资料未分组,各组出现的次数都是1。5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为: =73(分),例2:某车间20名工人加工某种零件资料:,=,16(件),1)概念 调和平均数是变量值倒数的算术平均数的倒数,故又称倒数平均数。 调和平均数是算术平均数的一种,它是根据变量值的倒数计算的。,3.调和平均数及计算公式,原来只是计算时使用了不同的数据!,(1)简单调和平均数,2)调和平均数的计算公式,例1.某蔬菜市场三种蔬菜的日销售数据如表,计算三种蔬菜该日的平均价格。,(2)加权调和平均数,例2.设某公司下属三个部门的

14、销售资料如下表,若缺少销售额资料而有利润额资料,如下表 某公司下属三个部门销售情况,则三个部门的平均利润率可以用各部门利润额除以销售利润率得到销售额,然后用各部门利润之和除以总销售额,便可得到平均利润率。其计算公式:,【例3】水果甲级每元1公斤,乙级每元1.5公斤,丙级每元2公斤。问: (1)若各买1公斤,平均每元可买多少公斤? (2)各买6.5公斤,平均每元可买多少公斤? (3)甲级3公斤,乙级2公斤,丙级1公斤,平均每元可买多少公斤? (4)甲乙丙三级各买1元,每元可买几公斤? 【例4】自行车赛时速:甲30公里/小时,乙28公里/小时,丙20公里/小时,全程200公里,问三人平均时速是多少

15、?若甲乙丙三人各骑车2小时,平均时速是多少?,调和平均数 (例题分析),【例3】解 (1) (2),【例3】解 (3) (4),【例4】解,4. 几何平均数的计算公式,几何平均数 1.简单几何平均数: 2.加权几何平均数: ,例:1.某产品经过三个流水连续作业的车间加工生产而成,本月第一车间的产品合格率为90%,第二车间的产品合格率为80%,第三车间的产品合格率为70%。则全厂的总合格率为:,这样平均合格率为,例2:设某笔为期20年的投资按复利计算收益,前10年的年利率为10%,中间5年的利率为8%,最后5年的年利率为6%。求平均年利率。 解答:假设初始投资额为a,则20年后的本利和为A。则

16、Aa(1+10%)10(1+8%)5(1+6%)5 所谓的平均年利率,设为r,就是要使得a(1+r)20=A, 即a(1+r)20= a(1+10%)10(1+8%)5(1+6%)5,几何平均数、算术平均数和调和平均数的关系 几何平均数、算术平均数和调和平均数之间存在着一定的数量关系。这种数量关系表现在:根据同一资料所计算的三种平均数,几何平均数大于调和平均数而小于算术平均数,只有当所有变量值都相同时,三种平均数才相等。用数学公式表示,它们之间的关系为:,5.众数,1.众数的含义:总体中出现次数最多、频率最高的标志值。 2.确定众数的方法。 (1)单项数列确定众数 21(件),众数的缺点,只考虑出現次数最多的资料,忽略了其他数值大小,故较不具敏感性 除非知道全部的資料,否則

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号