概率论与数理统计基础(概率分布的特征)

上传人:tian****1990 文档编号:74804920 上传时间:2019-01-29 格式:PPT 页数:36 大小:929.31KB
返回 下载 相关 举报
概率论与数理统计基础(概率分布的特征)_第1页
第1页 / 共36页
概率论与数理统计基础(概率分布的特征)_第2页
第2页 / 共36页
概率论与数理统计基础(概率分布的特征)_第3页
第3页 / 共36页
概率论与数理统计基础(概率分布的特征)_第4页
第4页 / 共36页
概率论与数理统计基础(概率分布的特征)_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《概率论与数理统计基础(概率分布的特征)》由会员分享,可在线阅读,更多相关《概率论与数理统计基础(概率分布的特征)(36页珍藏版)》请在金锄头文库上搜索。

1、1,概率论与数理统计基础 (二) 概率分布的数字特征,2,一、概率分布的数字特征 1、期望 考虑这样一个例子: 设射击手甲与乙在同样条件下射击,其命中环数是一个随机变量。假设根据历史记录得到他们分别有下面的命中概率分布表。试问:如何评定甲、乙的射击水平。,3,假设甲射击手发了100颗子弹 由于他命中10环的概率为0.5,那么约有 50次命中10环,同理,约有20次命中9环, 平均命中环数为: 同理可得E(Y)=5.6,4,期望是集中趋势的度量,反映平均意义 离散型随机变量X的期望值 如果X取有限个值x1,x2,xn 如果X取无限个值x1,x2,xn,5,例 子 随机抛一个骰子,求朝上一面的点数

2、的期望值。,E(X)=1/6+2/6 +3/6+4/6 +5/6+6/6 =21/6=3.5,6,在电脑/打印机销售一例中,电脑销售量的期望值为E(X)=0*0.08+1*0.12+2*0.24+3*0.24+4*0.32=2.60 同理,可得打印机销售量的期望值为 E(Y)=0*0.11+1*0.16+2*0.23+3*0.27+4*0.23=2.35.,7,连续型随机变量X的期望值,8,随机变量函数的期望,离散型: 连续型:,9,条件期望,10,例子:,在个人电脑/打印机一例中,计算E(Y|X=2).即求每天售出2台电脑的条件下,销售打印机的条件期望。 E(Y|X=2)=0*f(Y=0|X

3、=2)+1*f(Y=1|X=2)+2*f(Y=2|X=2)+3*f(Y=3|X=2)+4*f(Y=4|X=2)=1.875(条件期望) 注:f(Y=1|X=2)= E(Y)=0*0.11+1*0.16+2*0.23+3*0.27+4*0.23=2.35(非条件期望) 结论:条件期望一般不等于非条件期望。当然,如果两个变量相互独立,那么条件期望与非条件期望相同。,11,二元随机变量函数的情况(多元概率分布的期望值),Z=XY,12,例子:,继续个人电脑/打印机销售一例。 E(XY)= =1*1*0.05+1*2*0.06+1*3*0.02+1*4*0.01+4*0*0.01+4*1*0.01+4

4、*2*0.01+4*3*0.05+4*4*0.15 =7.06 (取每一对X和Y的值,乘以它们的联合概率,然后加总),13,期望的性质,E(C)=C C为常数 E(CX)=CE(X) E(X+C)=E(X)+C E(X+Y)=E(X)+E(Y) 若X与Y相互独立,则E(XY)=E(X)E(Y),14,2、方差 期望值仅仅给出了随机变量的重心(或取值的平均程度),但没有表明单个值在均值附近是如何分布或分散的。度量这种分散程度的最常用工具就是方差(variance). 考察两组成绩 甲组:40,50,60,70,80,90,100 乙组:60,60,70,70,70,80,80 甲组平均成绩:70

5、 乙组平均成绩:70,15,方差是离散程度的度量,16,17,方差的性质,18,变异系数 由于标准差(或方差)与度量单位有关,因此如果度量单位不同,很难对两个或多个标准差进行比较。为了解决这个问题,引入变异系数。,无量纲(纯数值),例题:期中考试中,A班实行百分制,其平均分为80分,标准差为10,B班实行10分制,平均分为7.8,标准差为1.2,哪个班的成绩更好呢?,19,X,f(X),A,均值大小的图示判别,B,20,X,f(X),A,B,小方差,大方差,方差大小的图示判别,21,3、协方差,协方差是一种特殊形式的期望值,度量两个随机变量如何共同变动。如果两个变量同方向变动,则协方差为正;如

6、果两个变量反方向变动,则协方差为负;如果变量之间不存在线性关系,则协方差为0.,22,例子:,再一次回到个人电脑/打印机销售一例。计算电脑销售量(X)和打印机销售量(Y)的协方差。 COV(X,Y)= =7.06-2.60*2.35=0.95 表明电脑销售量和计算机销售量是正相关的。,23,协方差的性质,24,度量两个随机变量的线性关系,4、相关系数,25,相关系数的性质,即若两个变量的相关系数为0,并不意味这它们相互独立,它们可能存在非线性关系。如Y=X2.,26,正线性相关,负线性相关,非线性相关,不相关,典型相关关系图示,27,描述概率分布形状的数字特征,5、偏度(S)和峰度(K),对称

7、,右偏,左偏,28,低峰,尖峰,常峰,29,偏度和峰度的计算公式,S如果为正,则概率密度函数为正偏或右偏 S如果为负,则概率密度函数为负偏或左偏,K3称为高峰,K=3称为常峰,30,6、样本数据所体现的随机变量的数字特征 引例:要想了解某一时点上居住在湘潭所有居民的平均收入,显然需要知道湘潭居民总体的信息。但实际上很难收集到总体中每个成员的信息(收入水平)。实践中所能做到的是从总体中抽取一个“有代表性的”或“随机的”样本(比如抽取100名居民作为一个样本),然后计算抽取的样本的人均收入。 注:样本容量n=100 样本值=100个(即100个收入取值) 样本均值: 总体均值E(X) (未知,但客观存在),31,样本均值,样本均值是真实E(X)的一个很好的替代,32,样本方差、样本标准差,N-1 自由度,33,样本协方差,34,35,样本相关系数,36,样本偏度,样本峰度,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号