大数据的统计学06资料

上传人:E**** 文档编号:99686641 上传时间:2019-09-20 格式:PDF 页数:43 大小:1.91MB
返回 下载 相关 举报
大数据的统计学06资料_第1页
第1页 / 共43页
大数据的统计学06资料_第2页
第2页 / 共43页
大数据的统计学06资料_第3页
第3页 / 共43页
大数据的统计学06资料_第4页
第4页 / 共43页
大数据的统计学06资料_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《大数据的统计学06资料》由会员分享,可在线阅读,更多相关《大数据的统计学06资料(43页珍藏版)》请在金锄头文库上搜索。

1、大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 大数据的统计学基础第6周 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 法律声明 【声明】本视频和幻灯片为炼数成金网络课程的教 学资料,所有资料只能在课程内使用,不得在课 程以外范围散播,违者将可能被追究法律和经济 责任。 课程详情访问炼数成金培训网站 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 关注炼数成金企业微信 提供全面的数据价值资讯,涵盖商业智能与数据分析、大数据、企业信息化、数字化技 术等,各种高性价比课程信息,赶紧掏出您的手机关注吧! 大数据的统计学基础 讲师 何翠仪

2、DATAGURU专业数据分析社区 赌金分配 在17世纪,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目:甲乙两个 人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,赢家可以获得100 法郎的奖励。当比赛进行到第三局的时候,甲胜了两局,乙胜了一局,这时由于某些 原因中止了比赛,那么如何分配这100法郎才比较公平? 分析:假设继续再赌下次,则有如下结果 前三局中,甲已胜了两局,乙胜了一局 第四局甲胜乙胜 第五局甲胜乙胜 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 赌金分配 所以甲最终获胜的概率是3/4,乙最终获胜的概率是1/4 根据甲乙两人的获胜概率分配赌

3、金 甲的期望所得值为100*(3/4)=75法郎;乙的期望所得值100*(1/4)=25法郎 若设X为甲最终获得的赌金,则 从而X的期望值,也就是甲最终获得的赌金的期望值为 这个故事里出现了“期望”这个词,数学期望由此而来 X1000 P3/41/4 )法郎(75 4 1 0 4 3 100 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 离散型随机变量的数学期望 设离散型随机变量X的分布律为P X = = ,k=1,2,。若级数 =1 绝对收 敛,则称 =1 为随机变量X的数学期望,记为E(X)。即E(X)= =1 例:随机变量X的分布律如下 则E(X)= =1 4 =0

4、*0.2+1*0.1+2*0.5+3*0.2=1.61 X0123 P0.20.10.50.2 就是求随机变量的取值乘 以相应的概率的和 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 运动员选拔 设某教练员有甲、乙两名射击运动员, 现需要选拔其中的一名参加运动会, 根据过去的 记录显示, 二人的技术水平如下: 试问哪个射手技术较好? 一个射击运动员的射击水平,可以通过他的平均得分来衡量 乙射手 击中环数击中环数 概率概率 1098 2 . 05 . 03 . 0 甲射手 击中环数击中环数 概率概率 1098 3 . 01 . 06 . 0 大数据的统计学基础 讲师 何翠仪

5、 DATAGURU专业数据分析社区 运动员选拔 如何计算平均得分? 假设甲乙两人每人射击了10次,那么理论上,甲乙的得分是: 那么理论上,甲的平均得分为: (8+8+8+9+10+10+10+10+10+10)/10=(8*3+9*1+10*6) /10=8*0.3+9*0.1+10*0.6=9.3(环) 乙的平均得分为: (8+8+9+9+9+9+9+10+10+10)/10=(8*2+9*5+10*3) /10=8*0.2+9*0.5+10*0.3=9.1(环) 所以甲比乙的射击技术好 甲8889101010101010 乙8899999101010 大数据的统计学基础 讲师 何翠仪 DA

6、TAGURU专业数据分析社区 运动员选拔 若用X记录甲射击一次击中的环数,用Y记录乙射击一次击中的环数,则 X的期望值:8*0.3+9*0.1+10*0.6=9.3 Y的期望值:8*0.2+9*0.5+10*0.3=9.1 随机变量的期望值=均值 X8910 P0.30.10.6 Y8910 P0.20.50.3 与理论上的平均得分相等 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 新生婴儿得分 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 候车时间 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 (0-1)分布的数学期望 若X服

7、从(0-1)分布,参数p=0.5,求E(X)。 则E(X)=0*0.5+1*0.5=0.5=p 更一般情况: E(X)=0*(1-p)+1*p=p 结论:若X服从参数为p的(0-1)分布,则E(X)=p X01 P0.50.5 X01 P1-pp 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 二项分布的数学期望 体育课中小明进行投篮练习,若小明每次投中的概率是0.6,记X为3次投篮投中的次数。 求E(X)。 解:XB(3,0.6),则 P(X=0)=0.4*0.4*0.4=0.064 P(X=1)=3*0.6*0.4*0.4=0.288 P(X=2)=3*0.6*0.6*

8、0.4=0.432 P(X=3)=0.6*0.6*0.6=0.216 故E(X)=0*0.064+1*0.288+2*0.432+3*0.216=1.8=3*0.6 X0123 P0.0640.2880.4320.216 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 二项分布的数学期望 更一般地情况,若XB(n,p),则X的分布律为 = = (1 ) npppnp ppCnp pp ini n np pp knk n np pp knk nnp pp knk kn ppCkkXPkXE n n i inii n n i ini n k knk kn n k k n k k

9、nk n k knkk n n k 1 1 0 )1( 1 1 0 )1( 1 )1()1(1 )1()1( 1 1 000 )1( )1( )1( !)1(! )!1( )1( )!1()1()!1( )!1( )1( )!1()1()!1( )!1( )1( )!(! ! 1 二项式定理:( + )= =0 令i=k-1 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 连续型随机变量的数学期望 将离散型随机变量的定义类比到连续型随机变量上 设连续型随机变量X的概率密度为f(x),若积分 ()绝对收敛,则称积分 ()的值为随机变量X的数学期望。记为E(X),即 E = (

10、) E(X)= =1 类 比 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 例子 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 均匀分布的数学期望 设XU(2,4),求E(X)。 X的概率密度为 = 1 42 = 1 2 ,2 可以推广到任意有限个随 机变量之和的情况 4.设X,是相互独立的两个随机变量,则E(XY)=E(X)E(Y) 5.设Y是随机变量X的函数:Y=g(X)(g是连续函数),则 1)X是离散型, E Y = =1 () 2)X是连续型,E = ()() 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 例子 大数据

11、的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 方差数据的离散程度 运动员选拔 设某教练员有甲、乙两名射击运动员, 现需要选拔其中的一名参加运动会, 根据过去的 记录显示, 二人的技术水平如下: 试问哪个射手技术较好? X记甲击中环数,Y记乙击中环数 E(X)=8*0.3+9*0.2+10*0.5=9.2 E(Y)=8*0.1+9*0.6+10*0.3=9.2 击中环数8910 概率甲0.30.20.5 乙0.10.60.3 平均水平相等,考察发挥 的稳定性方差 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 方差数据的离散程度 假设甲乙两人每人各射击了10次

12、,理论上击中的环数 则甲的方差为: 1 10 8 9.2 2 + 8 9.2 2 + + 10 9.2 2 = 1 10 3 8 9.2 2 + 甲888991010101010 乙8999999101010 乙的稳定性更好 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 随机变量的方差 设X施一个随机变量,若 2存在,则称EX-E(X)为X的方差,记为D(X)或 Var(X),即D(X)=Var(x)= 2 ()称为X的标准差。 若X是离散型随机变量,则 = =1 2 若X是连续型随机变量,则 = 2 = 2 = 2 2 + 2 = 2 2 + 2 = 2 2 2= D

13、X + 2 与第一周方差的化简式2= 1 =1 2 2是一样的。 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 标准化 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 (0-1)分布的方差 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 均匀分布的方差 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 方差的性质 1.设C是常数,则D(C)=0 2.设X是随机变量,C是常数,则有D CX = 2 , + = 3.设X,Y是两个随机变量,则有 + = + + 2 当X,Y相互独立时,则有D(X+Y)=D(X)+D(Y) 4. D(X)=0的充分必要条件是PX=E(X)=1 大数据的统计学基础 讲师 何翠仪 DATAGURU专业数据分析社区 二项分布的方差 设随机变量XB(n,p),求D(X) 由二项分布的定义知道,随机变量X是n重伯努利试验中试验成功的次数,且每次试验 成功的概率为p。 引入随机变量= 1,第次试验成功 0,第次试验失败 k=1,2n 则有 = 1+ 2+ + 。1,2,相互独立且都服从参数为p的(0-1)分布 故(1) = 2= = = (1 ) D(X)=D(1+ 2+ + )=np(1-p) 大数据的统计学

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号