概率论与数理统计4.3协方差及相关系数.

上传人:今*** 文档编号:106797971 上传时间:2019-10-16 格式:PPT 页数:40 大小:1.45MB
返回 下载 相关 举报
概率论与数理统计4.3协方差及相关系数._第1页
第1页 / 共40页
概率论与数理统计4.3协方差及相关系数._第2页
第2页 / 共40页
概率论与数理统计4.3协方差及相关系数._第3页
第3页 / 共40页
概率论与数理统计4.3协方差及相关系数._第4页
第4页 / 共40页
概率论与数理统计4.3协方差及相关系数._第5页
第5页 / 共40页
点击查看更多>>
资源描述

《概率论与数理统计4.3协方差及相关系数.》由会员分享,可在线阅读,更多相关《概率论与数理统计4.3协方差及相关系数.(40页珍藏版)》请在金锄头文库上搜索。

1、一、协方差与相关系数的概念及性质,二、相关系数的意义,三、小结,第三节 协方差及相关系数,协方差和相关系数,1. 问题的提出,一、协方差与相关系数的概念及性质,对于二维随机向量(X,Y)来说,数学期望只反映了X与Y各自的平均值,方差只反映了X与Y各自离开均值的偏离程度,它们对X与Y之间相互关系不提供任何信息.,但二维随机向量(X,Y)的概率密度f(x,y)或分布律pij全面地描述了(X,Y)的统计规律,也包含有X与Y之间关系的信息.我们希望有一个数字特征能够在一定程度上反映这种联系.,在讨论这个问题之前,我们先看一个例子。在研究子女与父母的相象程度时,有一项是关于父亲的身高和其成年儿子身高的关

2、系。,1. 问题的提出,这里有两个变量,一个是父亲的身高,一个是成年儿子身高.为了研究二者关系,英国统计学家皮尔逊收集了1078个父亲及其成年儿子身高的数据, 画出了一张散点图。,问:父亲及其成年儿子身高存在怎样的关系呢?,1. 问题的提出,类似的问题有:,1、吸烟和患肺癌有什么关系?,1. 问题的提出,因此,方差是协方差的特例,协方差刻画两个随机变量之间的“某种”关系.,2. 定义,特别, 若X=Y,则 cov(X,X)=E(X-E(X)2=D(X),对两个随机向量(X,Y),若 存在,则称 为X和Y的协方差.,对于任意随机变量X与Y,总有,由协方差定义得,这是计算协方差的常用公式.,可见,

3、若X与Y独立,则,Cov(X,Y)= 0 .,Cov(X,Y)=E(XY)-E(X)E(Y),3. 计算,(4) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y),(2) Cov(X,X)=D(X),4.协方差的性质,(3) Cov(aX,bY)=abCov(X,Y) 其中 a、b是常数,(1) Cov(X,Y)=Cov(Y,X) (对称性) 特别的: Cov(X,c)=0 (c为常数),(5) 若X与Y独立,则,Cov(X,Y)= 0 .,协方差的数值在一定程度上反映了X与Y相互间的联系,但它受X与Y本身数值大小的影响.如令X*=kX, Y*=kY,这时X*与Y*间的相互联系

4、和X与Y的相互联系应该是一样的,但是,Cov(X*,Y*)=k2Cov(X,Y),为了克服这一缺点,在计算X与Y的协方差之前,先对X与Y进行标准化:,再来计算X*和Y*的协方差,这样就引进了相关系数的概念.,为随机变量X和Y的相关系数 (correlation confficient).,1.定义:若D(X)0, D(Y)0,且Cov(X,Y)存在时,称,在不致引起混淆时,记 为 .,二、相关系数,考虑以X的线性函数a+bX来近似表示Y.以均方误差 e=EY-(a+bX)2 =E(Y2)+b2E(X2)+a2-2bE(XY)+2abE(X)-2aE(Y) 来衡量以a+bX近似表达Y的好坏程度.

5、e的值越小表示a+bX与Y的近似程度越好.为此令,从而得,2. 相关系数的性质,性质1:随机变量X和Y的相关系数满足|XY|1.,证明 由,可知,性质2: |XY|=1 的充要条件是,存在常数a,b使得PY=a+bX=1,证明:(1)若|XY|=1,则由,(2) 若存在常数a*,b*使得PY=a*+b*X=1,则有PY-(a*+b*X)2=0=1.即得E Y-(a*+b*X)2= 0,又由,即得 |XY|=1,注意 |XY| 的大小反映了X,Y之间线性关系的密切程度: XY=0时, X,Y之间无线性关系; |XY|=1时,X,Y之间具有线性关系.,XY0,X,Y正相关 XY0,X,Y负相关,X

6、Y 0,X,Y相关 XY=0,X,Y不相关,(XY=1,X,Y完全正相关),(XY=-1,X,Y完全负相关),完全正相关 Y=aX+b a0,完全负相关 Y=aX+b a0,x,y,0,完全不相关,正相关,负相关,A:0 B:1 C:-1 D:1或-1,解:因为XYn,即PY=-X+n=1, 所以X与Y完全负相关,故,从而选C。,注:若,例1:将一枚密度均匀硬币抛n次,分别以X和Y记作正反面出现的次数,则X和Y的相关系数为,例2 (X,Y)的联合分布为:,求相关系数XY,并判断X, Y是否相关,是否独立.,解:,例2 (X,Y)的联合分布为:,求相关系数XY,并判断X, Y是否相关,是否独立.

7、,解:,从而:,另一方面:,P(X=-1,Y=-1)=1/8 P(X=-1)P(Y=-1)=(3/8)(3/8),所以X与Y不独立.,例3:设随机变量在-,上服从均匀分布,又 X=sin, Y=cos 试求X与Y的相关系数.,解:,这时有Cov(X,Y)=E(XY)-E(X)E(Y)=0,即=0.,从而X与Y不相关,没有线性关系;但是X与Y存在另一个函数关X2+Y2=1,从而X与Y是不独立的.,X , Y 不相关,X ,Y 相互独立,X , Y 不相关,不相关与相互独立的关系,结论,若 ( X , Y ) 服从二维正态分布,,X , Y 相互独立,X , Y 不相关,解,练习,1.定义,三、矩

8、,2. 协方差矩阵,这一讲我们主要介绍了协方差和相关系数,相关系数是刻划两个随机变量间线性相关程度的重要的数字特征,它取值在-1到1之间.,小 结,例4 设随机变量X和Y相互独立且XN(1,2), YN(0,1). 试求Z=2X-Y+3的概率密度.,解 X与Y的分布律分别为,于是,解,则,于是,解,所以,因此,例4 设随机变量X和Y相互独立且XN(1,2), YN(0,1). 试求Z=2X-Y+3的概率密度.,故X 和Y 的联合分布为正态分布,X 和Y 的任意线性组合是正态分布.,解: XN(1,2),YN(0,1),且 X 与Y 独立,D(Z)=4D(X)+D(Y)=8+1=9,E(Z)=2E(X)-E(Y)+3=2+3=5,即 ZN(E(Z), D(Z),故 Z 的概率密度是,ZN(5, 32),

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号