二项分布、泊松分布和正态分布的区别及联系

上传人:桔**** 文档编号:506558106 上传时间:2023-12-17 格式:DOCX 页数:11 大小:18.52KB
返回 下载 相关 举报
二项分布、泊松分布和正态分布的区别及联系_第1页
第1页 / 共11页
二项分布、泊松分布和正态分布的区别及联系_第2页
第2页 / 共11页
二项分布、泊松分布和正态分布的区别及联系_第3页
第3页 / 共11页
二项分布、泊松分布和正态分布的区别及联系_第4页
第4页 / 共11页
二项分布、泊松分布和正态分布的区别及联系_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《二项分布、泊松分布和正态分布的区别及联系》由会员分享,可在线阅读,更多相关《二项分布、泊松分布和正态分布的区别及联系(11页珍藏版)》请在金锄头文库上搜索。

1、二项分布、泊松分布和正态分布的区别及联系二项分布、泊松分布和正态分布的区别及联系?被浏览 8,9732 个回答猴子微信公众号:猴子聊人物之前你已经了 解概率的基础知识(如果还不知道概率能干啥,在生活中 有哪些应用的例子,可以看我之前的投资赚钱与概 率)。 今天我们来聊聊几种特殊的概率分布。这个知识目前来 看,还没有人令我满意的答案,因为其他人多数是在举数 学推导公式。我这个人是最讨厌数学公式的,但是这并不 妨碍我用统计概率思维做很多事情。相比熟悉公式,我更 想知道学的这个知识能用到什么地方。可惜,还没有人讲 清楚。今天,就让我来当回雷锋吧。 首先,你想到的问题肯定是:1. 什么是概率分布? 2

2、. 概 率分布能当饭吃吗?学了对我有啥用?好了,我们先看 下:什么是概率分布?1. 什么是概率分布?要明白概率分布,你需要知道先两个 东东:1)数据有哪些类型 2)什么是分布数据类型(统计 学里也叫随机变量)有两种。第 1种是离散数据。离散数 据根据名称很好理解,就是数据的取值是不连续的。例如 掷硬币就是一个典型的离散数据,因为抛硬币的就 2种数 值(也就是 2种结果,要么是正面,要么是反面)。你可以 把离散数据想象成一块一块垫脚石,你可以从一个数值调 到另一个数值,同时每个数值之间都有明确的间隔。第 2 种是连续数据。连续数据正好相反,它能取任意的数 值。例如时间就是一个典型的连续数据 1.

3、25 分钟、1.251分 钟,1.2512 分钟,它能无限分割。连续数据就像一条平滑 的、连绵不断的道路,你可以沿着这条道路一直走下去。 什么是分布呢?数据在统计图中的形状,叫做它的分布。 其实我们生活中也会聊到各种分布。比如下面不同季节男 人的目光分布.。各位老铁,来一波美女,看看你的目光停在哪个分布的地 方。美女也看了,现在该专注学习了吧。现在,我们已经知道 了两件事情:1)数据类型(也叫随机变量)有 2种:离散 数据类型(例如抛硬币的结果),连续数据类型(例如时 间) 2)分布:数据在统计图中的形状现在我们来看看什 么是概率。概率分布就是将上面两个东东(数据类型+分 布)组合起来的一种表

4、现手段:概率分布就是在统计图中 表示概率,横轴是数据的值,纵轴是横轴上对应数据值的 概率。很显然的,根据数据类型的不同,概率分布分为两 种:离散概率分布,连续概率分布。那么,问题就来了。 为什么你要关心数据类型呢?因为数据类型会影响求概率 的方法。对于离散概率分布,我们关心的是取得一个特定 数值的概率。例如抛硬币正面向上的概率为:p(x二正面)=1/2 而对于连续概率分布来说,我们无法给出每一个数值的概 率,因为我们不可能列举每一个精确数值。例如,你在咖 啡馆约妹子出来,你提前到了。为了给妹子留下好印象, 你估计妹子会在5分钟之内出现,有可能是在 4分钟10秒 以后出现,或者在 4分钟10.5

5、 秒以后出现,你不可能数清 楚所有的可能时间,你更关心的是在妹子出现前的 1-5 分 钟内(范围),你把发型重新整理下(虽然你因为加班头发 已经秃顶了,但是发型不能乱),给妹子留个好印象。所 以,对于像时间这样的连续型数据,你更关心的是一个特 定范围的概率是多少。2. 概率分布能当饭吃吗?学了对我有啥用?当统计学家们 开始研究概率分布时,他们看到,有几种形状反复出现, 于是就研究他们的规律,根据这些规律来解决特定条件下 的问题。想起,当年为了备战高考,我是准备了一个自己 的“万能模板”,任何作文题目过来,我都可以套用该模板, 快速解决作文这个难题。当你,我高考的作文分数还是不 错的。(我聪明吧

6、)同样的,记住概率里这些特殊分布的好 处就是:下次遇到类似的问题,你就可以直接套用“模板” (这些特殊分布的规律)来解决问题了。酷不酷?爽不 爽?接下里,我们一起来聊聊常见的 4 种概率分布。1)3 种离散概率分布二项分布 泊松分布 几何何分布 2)1 种连 续概率分布正态分布在开始介绍之前,你先回顾下这两个 知识:期望:概率的平均值 标准差:衡量数据的波动大 小。第 1 种:二项分布我们从下面 3 个问题开聊:1. 二项分布 有啥用? 2. 如何判断是不是二项分布? 3. 二项分布如何 计算概率?1. 二项分布有啥用呢?当你遇到一个事情,如果该事情发 生次数固定,而你感兴趣的是成功的次数,那

7、么就可以用 二项分布的公式快速计算出概率来。例如你按我之前的 投资赚钱与概率买了这 5家公司的股票(谷歌,Facebook,苹果,阿里巴巴,腾讯),为了保底和计算投入 进去多少钱,你想知道只要其中 3个股票帮你赚到钱(成 功的次数)的概率多大,那么这时候就可以用二项分布计 算出来。牛掰吧?2. 如何判断是不是二项分布?首先,为 啥叫二项,不叫三项,或者二愣子呢?故明思义,二项代 表事件有 2 种可能的结果,把一种称为成功,另外一种称 为失败。生活中有很多这样 2种结果的二项情况,例如你 表白是二项的,一种成功(恭喜你表白成功,可以恋爱 了,兴奋吧?),一种是失败(被拒绝了,伤不伤心?)。 你向

8、老板提出加薪的要求,结果也有两种(二项)。一种是 成功(加薪成功,老板我爱你),一种是失败(麻蛋,不给 涨薪老子不干了,像是这种有统计概率思维的人,是很稀 缺的,明天就投简历出去) 那么,什么是二项分布呢?只要符合下面 3个特点就可以 判断某事件是二项分布了:1)做某件事的次数(也叫试验 次数)是固定的,用 n 表示。(例如抛硬币 3 次,投资 5 支 股票),2)每一次事件都有两个可能的结果(成功,或者 失败)(例如每一次抛硬币有 2个结果:正面表示成功,反 面表示失败。每一次投资美股有 2个结果:投资成功,投 资失败)。3)每一次成功的概率都是相等的,成功的概率 用 p 表示(例如每一次抛

9、硬币正面朝上的概率都是 1/2。你 投资了 5 家公司的股票,假设每一家投资盈利成功的概率 都相同)4你感兴趣的是成功x次的概率是多少。那么就 可以用二项分布的公式快速计算出来了。(你已经知道了我 前面讲的 5家美股的赚钱概率最大,所以你买了这 5家公 司的股票,假设投资的这 5家公司成功的概率都相同,那 么你关心其中只要有 3个投资成功,你就可以赚翻了,所 以想知道成功 3 次的概率)根据这 4个特点,我们就知道抛硬币是一个典型的二项分 布,还有你投资的这 5支股票也是一个典型的二项分布 (在假设每家公司投资成功的前提下)。3. 二项分布如何计算概率?怎么计算符合二项分布事件的 概率呢?也就

10、是你想知道下面的问题:你抛硬币 3次,2次 正面朝上的概率是多少? 你买了这 5家公司的股票,3支 股票赚钱的概率是多大?上面我们已经知道了二项分布的 4 个特点,并知道每个特点的表示方法:1)做某件事次数是 固定的,用 n 表示2)每一次事件都有两个可能的结果(成功,或者失败)3)每一次成功的概率都是相等的,成功的概率用 p 表示4)你感兴趣的是成功x次的概率是多少这时候,二项分布 的公式就可以发挥威力了:这里你也别害怕数学公式,每 一项的含义我前面已经讲的很清楚了。这个公式就是计算 做某件事情n次,成功x次的概率的。很多数据分析工具(Excel,Python, R)都提供工具让你带入你研究

11、问题的数 值,就能得到结果。例如,抛硬币5次(n),恰巧有3次 正面朝上(x=3,抛硬币正面朝上概率p=1/2),可以用上面 的公式计算出出概率为31.25% (用Excel的BINOM.DIST函 数Python,R都可以快速计算) 二项分布经常要计算的概率还有这样一种情况:抛硬币 5 次硬币至少有3次正面朝上(即x>=3)的概率是多 少?你能直接想到的简单方法是:将恰巧有 3次,恰巧有4 次,恰巧有5次的概率相加,结果便是至少3次,为 50%。但是如果次数很多,这样的办法简直是给自己挖了一个大 大的坑。我们用逆向思维换个思路,至少3次正面朝上的 反向思考是什么呢?反向思路就是最多 2

12、 次正面朝上。只要我们先计算出最多 2 次正面朝上的概率p(x<=2),那么至少3次正面朝上的概 率就是1-p(x<=2)。这样用逆向思维,就把一个复杂的问 题,化解为简单的问题。因为求做多 2次朝上的概率比较 简单:p(x<=2)=p(0)+p(1)+p(2) 最好提下二项分布的:期望 E(x)=np (表示某事情发生 n 次,预期成功多少次。)知道这个期望有啥用呢?做任何事 情之前,知道预期结果肯定对你后面的决策有帮助。比如 你抛硬币5次,每次概率是1/2,那么期望E(x)=5*1/2=2.5 次,也就是有大约3次你可以抛出正面。在比如你之前投 资的那5支股票,假设每支股

13、票帮你赚到钱的概率是 80%, 那么期望E(x)=5*80%=4,也就是预期会有4只股票投资成 功帮你赚到钱。第2种:几何分布其实我一直把几何分布,叫做二项分布 的孪生兄弟,因为他两太像了。只有 1点不同,就像海尔 兄弟只有内裤不同一样。我们还是从下面这个套路聊起来 起找出这个不同的“劲爆点”:1 .几何分布有啥用? 2. 如何判断是不是几何分布? 3. 几何分布如何计算概率? 1.几何分布有啥用?如果你需要知道尝试多次能取得第一次 成功的概率,则需要几何分布。2. 如何判断是不是几何分 布?只要符合下面4个特点就可以判别你做的事情是就是 几何分布了:1)做某事件次数(也叫试验次数)是固定 的

14、,用n表示(例如抛硬币 3 次,表白 5 次),2)每一次事件都有两个可能的结果(成功,或者失败) (例如每一次抛硬币有 2 个结果:正面表示成功,反面表 示失败。每一次表白有 2 个结果:表白成功,表白失败)。3)每一次“成功”的概率都是相等的,成功的概率用 p 表示 (例如每一次抛硬币正面朝上的概率都是 1/2。 假设你是初出茅庐的小伙子,还不是老油条,所以你表白 每一次成功的概率是一样的)4)你感兴趣的是,进行 x 次尝试这个事情,取得第 1 次成 功的概率是多大。(例如你在玩抛硬币的游戏,想知道抛 5次硬币,只有第 5 次(就是滴 1 次成功)正面朝上的概率是多大。你表白你 的暗恋对象

15、,你希望知道要表白 3 次,心仪对象答应和你 手牵手的概率多大。)正如你上面看到的,几何分布和二项 分布只有第 4 点,也就是解决问题目的不同。这个点够不 够劲爆?(嘻嘻)3. 几何分布如何计算概率?用下面公式 就可以了:p为成功概率,即为了在第X次尝试取得第1次 成功,首先你要失败(X-1)次。假如在表白之前,你计算 出即使你尝试表白 3 次,在最后 1 次成功的概率还是小于 50%,还没有抛硬币的概率高。那你就要考虑换个追求对 象。或者首先提升下自己,提高自己每一次表白的概率, 比如别让自己的鼻毛长出来。我之前读书的一个师兄,每 天鼻毛长出来,看的我都恶心,何况其他人呢。几何分布的期望是E

16、(x)=1/p。代表什么意思呢?假如你每次 表白的成功概率是60%,同时你也符合几何分布的特点,所 以期望 E(x)=1/p=1/0.6=1.67 所以你可以期望自己表白1.67 次(约等于 2次)会成功。这样的期望让你信息倍增,起 码你不需要努力上 100 次才能成功,2次还是能做到的,有 必要尝试下。几何分布的标准差:第 3种泊松分布还是同 样的味道,还是同样的讨论,我们一起通过下面 3个问题 了解这个泊松分布。 1. 泊松分布有啥用? 2. 如何判断是 不是泊松分布? 3. 泊松分布如何计算概率?1. 泊松分布有啥用?如果你想知道某个时间范围内,发生 某件事情x次的概率是多大。这时候就可以用泊松分布轻松 搞定。比如一天内中奖的次数,一个月内某机器损坏的次 数等。知道这些事情的概率有啥用呢?当然是根据概率的 大小来做出决策了。比如你搞了个抽奖活动,最后算出来 一天内中奖10次的概率都超过了 90%,然后你顺便算了下 期望,再和你的活动成本比一下,发现要赔不少钱。那这 个

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号