贝叶斯经典例子

上传人:ji****72 文档编号:39541728 上传时间:2018-05-17 格式:DOCX 页数:11 大小:177.77KB
返回 下载 相关 举报
贝叶斯经典例子_第1页
第1页 / 共11页
贝叶斯经典例子_第2页
第2页 / 共11页
贝叶斯经典例子_第3页
第3页 / 共11页
贝叶斯经典例子_第4页
第4页 / 共11页
贝叶斯经典例子_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《贝叶斯经典例子》由会员分享,可在线阅读,更多相关《贝叶斯经典例子(11页珍藏版)》请在金锄头文库上搜索。

1、贝叶斯经典例子贝叶斯经典例子我发现他有其他女人内衣,他出轨的可能性有多大?我发现他有其他女人内衣,他出轨的可能性有多大?2015-03-17 07:57点击标题下点击标题下大数据文摘大数据文摘可快捷关注可快捷关注大数据文摘原创文章,如要转载,务必后台留言申请。如果在男友的衣柜中发现了其他女人的内衣,你一定认为这个没良心的家伙出轨了,对不起你了,瞬间,你已经想出来 N 种对策马上跳楼?不,我先去砍了他!哦,不!我得先砍了她再砍了他!不,我还是.小编已经不敢再想了,太血腥了.庆幸吧,你看到了这篇文章!在你决定采取动作之前,请务必完整阅读,其实男友出轨的概率并没有你想象的那么高!这个问题,贝叶斯老先

2、生早就给出了答案贝叶斯定理贝叶斯定理我们在计算一个事件发生的概率时需要考虑其他事件的信息则需要用到条件概率的概念。如果事件 B 的发生要以事件 A 的发生为前提,则当然我们还可以用其他方法来计算条件概率。事件“B 与 A”与事件“A 与B”是相同的,而又有所以可得:这便是由数学家托马斯贝叶斯(Thomas Bayes)提出的著名贝叶斯法则(也称为贝叶斯定理)。这位 18 世纪英国教士留下的不起眼的公式给整个科学界和统计学界都带来了深远的影响。因为如果直接计算 P(B|A)非常简单,但是想要反向计算 P(A|B)就不是那么容易了。贝叶斯法则使得这种计算易如反掌。贝叶斯法则还有更加复杂的变形,现在

3、常见的电子邮件垃圾过滤器与互联网搜索引擎里都用到了它。分析男友出轨概率分析男友出轨概率不论你相信与否,对于这样的问题,贝叶斯定理总能给出答案假如你知道(或者有意愿预估)下列三个量:第一,你需要预测出自己伴侣在出轨的情况下,这件内衣出现的概率。(P(xP(xB)B))如果你的男友出轨了,那么很容易想象这件内衣是如何进入你的衣橱的。那么,即使他确实要做对不起你的事情,你也希望他能够小心行事。在他确实背叛了你的情况下,我们认为,这件内衣出现的概率是 50%。第二,你需要预测出自己的伴侣在没有出轨的情况下,这件内衣出现的概率。(P(xP(xB)B))如果他没有出轨,有什么理由证明那件内衣的清白呢?当然

4、有些理由会令人不快(比如这件内衣也有可能是他自己的)。或许,他把衣服搞混了,或者你的伴侣有一位红颜知己,两人之间只存在纯友谊,而你对此也深信不疑,她寄宿一晚忘了带走内衣;或者这就是你的伴侣为你准备的一件礼物,只不过忘了把它包起来。尽管这些理由有些荒谬,但也能说得通。你将这种情况出现的概率定为 5%。第三,这点最为重要,你需要预测贝叶斯定理中所说的先验概率。P(BP(B)在发现内衣之前,你认为自己伴侣出轨的概率有多大?当然,现在很难完全客观地考虑这个问题,因为你已经发现了内衣。(在理想状态下,在开始查验证据之前,你就已经算出了先验概率。)但有时我们可以依据经验推断某事件发生的概率。比如,研究发现

5、,已婚夫妇任何一年的出轨概率都在 4%左右,所以,我们可以将这个概率视为先验概率。如果我们算出了以上三个概率值,就可以依据贝叶斯定理得出后验概率。令我们感兴趣的是这样的数据:在发现内衣的情况下,男友出轨概率有多大?计算结果示例如下:先验概率先验概率事件表示事件表示概率概率数值数值男友出轨的初始概率预测P(BP(B)4%新事件:发现神秘内衣新事件:发现神秘内衣男友出轨的情况下,内衣出现的概率P(xP(xB)B)50%男友未出轨的情况下,内衣出现的概率P(xP(xB)B)5%后验概率后验概率在你发现内衣的情况下,修正对你男友出轨的预测值P(BP(Bx)=x)=P(B)*P(B)* P(xP(xB)

6、B)/P(x)/P(x)29%妹纸们,看到了吗?只有 29%,这个结果也许看似仍有悖于常理那件内衣果真是清白的么?但这一概率之所以比较低,是因为你把伴侣出轨的先验概率设定得很低。尽管一个清白的那人不能像出过轨的男人那样,能为一件陌生内衣的出现找出很多看似合理的解释,但你一开始就把他当做清白的人,这一点对方程式的影响很大。所以,我们得出所以,我们得出 3 3 点重要结论:点重要结论:1.人之初性本善 or 性本恶,非常重要2.不学习,尤其不懂数学,后果很严重3.冲动是魔鬼这里一定要注意不能因为你手上拿了一件合格产品,就说是100,实际上这个概率是要根据以下这个公式(即全概率公式)计算出来的:什么

7、意思呢,就是产品合格的概率等于机器运作良好和不良好各自情况下的加权和,权重自然是机器运作良好与否的概率。例子例子 2 2贝叶斯定理公式:P(A|B)=P(B|A)*P(A)/P(B)现在我们可以变形得到: P(A|B)*P(B)=P(B|A)*P(A)那么,他们之间有什么联系呢?P(A|B) 是 B 发生的条件下 A 发生的概率;P(AB)是 A、B 同时发生的概率P(AB)=P(A|B)P(B)在盗贼入侵时狗叫的概率:盗贼的入侵(A)使得狗叫(B),A 是因,B 是果,所以是 P(B|A),当然狗叫也有其他原因 A1、A2,即 AU A1U A 2U=S(S 为总空间,即 P(S)=1),此

8、时狗叫的概率为 P(B)=P(B|AUA1UA2U),B 只是一个原因。在盗贼入侵的同时狗叫了的概率:盗贼入侵的时候,狗恰好叫了,可能是因为入侵引起了,也可能只是随便乱叫了,概率为 P(AB)应用中,一般因果导致出某件事的概率都为条件概率,同时发生的概率则一般因果导致出某件事的概率都为条件概率,同时发生的概率则为联合概率。为联合概率。例如:一座别墅在过去的 20 年里一共发生过 2 次被盗,别墅的主人有一条狗,狗平均每周晚上叫 3 次,在盗贼入侵时狗叫的概率被估计为 0.9,问题是:在狗叫的时候发生入侵的概率是多少?原理通俗的解释 :(最终相等: (狗叫+入侵 )/ 所有事件= (入侵+狗叫)

9、/ 所有事件 )P(ABP(AB)= = P(BAP(BA)狗叫的前提条件中 入侵的概率 = 入侵/(入侵和非入侵) (前提条件:狗叫)入侵的前提条件中 狗叫的概率 = 狗叫/(狗叫和狗不叫) (前提条件:入侵)我们围绕等式计算:B 表示狗叫,A 表示入侵P(B) 狗叫的概率:狗平均每周晚上叫 3 次= 3/7P(A|B) 狗叫&入侵 :?P(A)入侵:20 年里一共发生过 2 次被盗= 2/(20*365) P(B|A) 入侵&狗叫 :入侵时狗叫的概率被估计为 0.9 = 0.9等式的推导过程: (狗叫+入侵)/ 所有事件=(入侵+狗叫)/所有事件 3/7 * ? = 2/(20*365)

10、* 0.9? = 2/(20*365) * 0.9 /(3/7)公式推论出来勒: P(A|B) = P(B|A) * P(A) /P(B)理解了吗?理解了请继续看第 2 题,没理解的可以再看一遍第 1 题,看完还是不懂,再看第 2 题,请保持多思考!2、现分别有 A,B 两个容器,在容器 A 里分别有 7 个红球和 3 个白球,在容器 B 里有 1 个红球和 9 个白球,现已知从这两个容器里任意抽出了一个球,且是红球,问这个红球是来自容器 A 的概率是多少?原理通俗的解释 :(最终相等:(红球+容器 A )/ 所有事件= (容器 A+红球)/ 所有事件 )红球的前提条件中 容器 A 的概率 =

11、 容器 A/(容器 A 和容器 B) (前提条件:红球)容器 A 的前提条件中 红球的概率 = 红球/(红球和白球) (前提条件:容器 A)我们围绕等式计算:B 表示红球 ,A 表示容器 AP(B) 红球的概率 : 红球的概率 = 8/20P(A|B) 红球&容器 A : ?P(A)容器 A 的概率:选中容器 A 的概率= 1/2 (因为就 2 个容器 A 和 B,)P(B|A)容器 A&红球 :容器 A 中的红球 = 7/10等式的推导过程: (红球+容器 A )/ 所有事件= (容器 A+红球)/ 所有事件 8/20 * ? = 1/2 * 7/10? = 1/2 * 7/10 /(8/2

12、0)公式推论出来勒: P(A|B) = P(B|A) * P(A) /P(B)例子 3:Bayes 定理,它的直观意义就是,当你获知了一个新的信息后,你对原事件的看法有什么改变。若令事件 A 等于“M 同学去开房”,事件 B 等于“M 同学有电影票”,让我们来看看公式中的各个概率的意义:P(A):M 同学昨晚去开房了的概率P(B):M 同学手中有电影票的概率P(A|B)P(A|B):M M 同学手中的电影票被发现后,他昨晚去开房了的概率同学手中的电影票被发现后,他昨晚去开房了的概率P(B|A):如果昨晚 M 同学真的去开房了,他手中会有电影票的概率其中 P(A|B)就是当事人提供了新的证据之后

13、人们对原事件发生概率的看法。利用 Bayes 定理 P(A|B) = P(B|A)P(A)/P(B),我们发现,P(A|B)与 P(A)和P(B|A)成正比,与 P(B)成反比。因此,为了让人们相信事件 A 没有发生,作为伪证的事件 B 一定要具有这样的性质:它本来很可能发生,但伴随着事件 A一起发生就很不可思议了。通宵电影票就具有这样的性质:有一张通宵电影票根并不罕见,罕见的就是昨晚开了房之后还有一张通宵电影票。为了充分利用这个伪证,让 P(A|B)变得更低,我们可以从以下三个角度入手:减小 P(B|A):不要轻易拿出证据(前文所说的策略)。故意做出没法给出证据的样子,让人越来越坚信在事件

14、A 发生后还能给出证据 B 的概率有多么小。增加 P(B):平时做好铺垫工作。长期保存电影票根,经常提起自己保留纪念物的喜好,让人们相信证据本身的存在并不是什么怪事。减小 P(A):不要长得那么猥琐。努力提高自己在别人心目中的人品。去整形医院改头换面,让自己的面容端庄善良、和蔼可亲,不致于让人一看见你就说你怎么看上去那么淫荡是不是昨晚又没干好事。例子 4:我是小学生,老师教我们遇到应用题就画线段图求解。有若干机器,其中良好的机器与故障的机器之比为 3:1,在良好的机器中,生产出合格产品的机器数与生产出不合格产品机器数之比为 9:1;在故障的机器中,生产出合格产品的机器数与生产出不合格产品机器数

15、之比为 3:7。 求:在良好的机器中生产出合格产品的机器数占生产合格产品的机器数总和的百分比。解:把总机器数看做单位把总机器数看做单位 1 1线段图如下:总机器数为单位 1,那么在良好的机器中生产出合格产品的机器数 = 生产合格产品的机器数总和生产合格产品的机器数总和 = 故 在良好的机器中生产出合格产品的机器数占生产合格产品的机器数总和的百分比 = 例子 5你在校园里面随机游走,遇到了 N 个穿长裤的人(仍然假设你无法直接观察到他们的性别),问这 N 个人里面有多少个女生多少个男生。你说,这还不简单:算出学校里面有多少穿长裤的,然后在这些人里面再算出有多少女生,不就行了?我们来算一算:假设学

16、校里面人的总数是 U 个。60% 的男生都穿长裤,于是我们得到了 U * P(Boy) * P(Pants|Boy) 个穿长裤的(男生)(其中 P(Boy) 是男生的概率 = 60%,这里可以简单的理解为男生的比例;P(Pants|Boy) 是条件概率,即在 Boy 这个条件下穿长裤的概率是多大,这里是 100% ,因为所有男生都穿长裤)。40% 的女生里面又有一半(50%)是穿长裤的,于是我们又得到了 U * P(Girl) * P(Pants|Girl) 个穿长裤的(女生)。加起来一共是 U * P(Boy) * P(Pants|Boy) + U * P(Girl) * P(Pants|Girl) 个穿长裤的,其中有 U * P(Girl) * P(Pants|Girl) 个女生。两者一比就是你要求的答案。下面我们把这个答案形式化一下:我们要求的是 P(Girl|Pants) (穿长裤的人里面有多少女生),我们计算的结果

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号