趣味小案例趣味小案例1.频率与概率.频率与概率Dewey G.统计了约 438 023 个英语单词中各字母出现的频率,发现各字母出现的频率不同:A:0.078 8B:0.015 6C:0.026 8D:0.038 9E:0.126 8F:0.025 6G:0.018 7H:0.057 3I:0.070 7J:0.001 0K:0.006 0L:0.039 4M:0.024 4N:0.070 6O:0.077 6P:0.018 6Q:0.000 9R:0.059 4S:0.063 4T:0.098 7U:0.028 0V:0.010 2W:0.021 4X:0.001 6Y:0.020 2Z:0.000 6从中我们看到字母 E 出现的频率最大而字母 Z 出现的频率最小等等结果,而且这些字母的频率可以大致看成它们出现的概率对于计算机键盘的设计和文字的研究,这些结果都有重要意义2.彩票问题.彩票问题我们知道彩票的发行数额巨大,其实质如何呢?请看一则实例:发行彩票 10 万张,每张 1 元设头奖 1 个,奖金 1 万元;二等奖 2个,奖金各 5 千元;三等奖 10 个,奖金各 1 千元;四等奖 100 个,奖金各 1 百元;五等奖 1 000 个,奖金各 10 元。
这里的分布列为:由此可以算出其获奖金额的期望值为:=0.5元,即大约能收回一半3.投资与风险.投资与风险投资总具有一定风险,因此在选择投资方向时,计算其期望收益常是可代考虑的决策方法之一现某人有 10 万元现金,想投资于某项目,预估成功的机会为 30%,可得利润 8 万元,失败的机会为70%,将损失 2 万元若存入银行,同期间的利率为 5%,问是否应作此项投资?以记投资利润,则(万元)而存入银行的利息为 10 5%=0.5(万元),因此从期望收益的角度看,应选择投资,当然这里要冒一定的风险4.保险.保险某保险公司的老年人寿保险共有 1 万人参加,每人每年交 200元若老人在该年内死亡,公司付给家属 1 万元设老年人死亡率为 0.017,试求保险公司在一年的这项保险中亏本的概率设为一年中投保老年人的死亡数,则易知,其中,所以,利用中心极限定理,有保险公司亏本的概率为:5.市场调查.市场调查麦当劳餐馆在 7 星期内抽查 49 位顾客的消费额(元)如下,求在概率 90%的保证下,顾客平均消费额的估计区间15243826304218302526344420352426344818284619303642243245362147262831424536242827323647532224324626第一步:通过 Excel 进行统计计算可得到:,=9.45,点估计:麦当劳餐馆总体顾客平均消费额为 32 元。
第二步:根据给定的置信度 F(z)=90%,查概率表得 z=1.64第三步:计算=1.64×1.35=2.2 元据此估计,总体平均消费额下限==32–2.2=29.8 元,总体平均消费额上限==32+2.2=34.2 元区间估计:以 90%的概率保证,麦当劳餐馆顾客消费额在29.8~34.2 元之间6.军事.军事在一场军事战斗中,炮火轰击敌方防御工事 100 次,每次轰击命中的炮弹数相互独立而且服从同一分布,其数学期望为 2,方差为 1.5求 100 次轰击后(1)至少命中 180 发炮弹的概率;(2)命中的炮弹数不到 200 发的概率设 Xk表示第 k 次轰击命中的炮弹数,那么相互独立,而且设 X 表示 100 次轰击命中的炮弹数,则由中心极限定理,近似地有7.爱情.爱情厦门全岛只有思明和湖里两区设分别表示两区在情人节当天出售的玫瑰花的数量,并且假定,而且相互独立那么厦门全岛在情人节当天出售的玫瑰花的数量所服从的分布是何呢?由于厦门全岛就思明和湖里两区,故又因为相互独立,故所以,8.人口估计.人口估计假定基金经理想在一个新地区启动一项金融产品他想知道对这个产品的需求如何,因而有兴趣了解该地区的人口情况。
他决定进行一次调查并在第一回合中随机会见了 1 000 个客户在会面中,发给每一位客户一个识别代码几个月后,在另一回合中,该经理又随机会见了 1 000 个客户结果发现在第二回合中有 100 个客户是在第一回合会见过的由此,关于该地区的人口数量,我们能够得出什么结论?为了回答这个问题,给出如下定义:n=未知的人口数;n1=第一回合会见的人数;r=第二回合会见的人数;k=两次都被会见的人数;qk(n)=第二回合会面中恰好包含 k 个第一回合会见过的人的概率利用超几何分布,可以看出在本例中,我们有而如果,将这些数据代入到上面这个式子中,我们得到所以,如果人口数为 1 900,第二回合又会见到第一回合会见过的同样的 100 个人其实是不可能的对任意给定的 n1,r 和 k,我们可能想去求使得概率最大的 的值因为对于这样的 ,我们观测到的数据具有最大的概率这正是似然原理的关键思想,而求出的的值 被称为最大似然估计换言之,对于给定的数据集,值 是的所有可能的、就使得似然最大化而言,和已知的数据集最为相容的那些值之一为了计算最大似然,考虑比值容易看出这意味着当 增大时,序列先升后降当 为不超过的最大整数时,它达到最大。
因此,在本例中,人口数的最大似然估计为。