前面我们介绍了随机变量的数学期望和方差,对于多维随机变量,反映分量之 间关系的数字特征中,最重要的,就是本 讲要讨论的协方差和相关系数若Var(X), Var Y 存在,则Var(XY)= Var(X )+ Var(Y) 2E[(X-E(X))(Y-E(Y))]若随机变量X, Y相互独立,它们的方差都存在,则XY的方差也存在,且 Var(XY)= Var(X)+ Var(Y)§3 协方差、相关系数协方差设二维随机变量(X,Y),它的分量的数学期望为E(X), E(Y),Cov(X, Y ) = E[(X-E(X))(Y-E(Y))]则称它为X,Y的协方差,记为Cov (X,Y), 即若E[(X-E(X))(Y-E(Y))]存在,计算 (1) 若二维离散型随机变量(X, Y)的联合分布律为 且C o v(X,Y)存在, 则 若二维连续型随机变量(X,Y)的联合概率密度为 f(x , y ), 且C o v (X, Y)存在,则Cov(X,Y)=E(XY)-E(X)E(Y) (2)Cov(X,Y)=E(XY) -E(X)E(Y) 可见,若X与Y 独立, Cov(X,Y)= 0 .Cov(X,Y)=E{[ X-E(X)][Y-E(Y) ]}=E(XY)-E(X)E(Y)-E(Y)E(X)+E(X)E(Y) =E(XY)-E(X)E(Y)即=E{XY-XE(Y)-YE(X)+E(X)E(Y) }(2) Cov(X, Y)= Cov(Y,X)简单性质 (3) Cov(X, X)= Var(X)⑴ Cov(X, a)= 0Cov(aX, bY) = ab Cov(X,Y)a,b是常数(4)Cov(X1+X2,Y)= Cov(X1,Y) + Cov(X2,Y) (5)若X1, X2, …, Xn两两独立,,上式化为Var(X+Y)= Var(X)+ Var(Y)+ 2Cov(X,Y)(6) 随机变量和的方差与协方差的关系求 cov (X ,Y )1 0p qX P 1 0p qY P 例1 已知 X ,Y 的联合分布为X Ypij1 010p 00 q0 0, Var(Y)0,则称在不致引起混淆时,记 为 .若XY =0 则称X, Y不相关; 若XY 0 称X, Y 正相关; 若XY 0 则称X, Y负相关例4 设XN(0,4), Y(2), XY =1/2, E(X+Y)2 解:由已知条件有所以例5 设XU[0,2], Y=cos(X), 求XY 例6 设(X,Y)在圆域 上服从均匀分布,判断X,Y是否不相关,是否独 立。
解:由题意同理E(Y)=0xyor-r例7 设(X, Y)服从二维正态分布求X和Y的相关系数 X , Y 相互独立X , Y 不相关若 X , Y 服从二维正态分布,X , Y 相互独立X , Y 不相关独立与相关的关系(1)(2)X , Y 不相关相关系数的性质存在常数a, b(b≠0),使P{Y=a+bX}=1.XY = 1 的充要条件是,P(Y=a+bX)=1(b0)这时称X与Y完全正相关; XY = -1的充要条件是,P(Y= a+bX)=1(b0) 这时称X与Y完全负相关 若| |的值越接近于1, X与Y的线性相关程 度 越高它是用来刻 画X, Y线性相关程度的一个量若| |的值越接近于0, X与Y的线性相关程度越弱相关系数的意义设二维随机变量(X,Y), k , l 为非负整数若E(Xk )存在,则称它为X的k阶原点矩,记作mk, 即 mk =E(Xk ) 若E(X-E(X))k存在,则称它为X的k阶中心矩,记作ck, 即 ck = E(X-E(X))k 若E(X k Y l )存在,则称它为X和Y的(k , l )阶混合矩, 记作m k l, 即mk=E(X k Y l ) 若E[(X-E(X))k(Y-E(Y))l ]存在, 则称它为X和Y的 (k , l )阶混合中心矩,记作ck l , 即ck l = E[(X-E(X))k(Y-E(Y))l ]。
矩(1) 若E(X k )存在,则对小于k的一切非负整数l,E(X l )存在. (2) 原点矩与中心矩可相互表示关于矩有下述结论:设k为正整数例8 求标准正态分布的各阶矩.设X~N(0,1), 34作业:18 29 31 33 36稍事休息协方差Cov(X, Y ) = E[(X-E(X))(Y- E(Y))]=E(XY)-E(X)E(Y) 相关系数复习性质性质相关系数的性质考虑以X的线性函数a+bX来近似Y,近似的误差为求a,b使e最小e=E[Y-(a+bX)]2= E(Y2) + b2E(X2) +a2-2bE(XY )+2abE(X)-2aE(Y)相关系数的意义令解得将a0,b0代入e,用a0+b 0X来近似Y,则最 小误差为若| |的值越接近于1, X与Y的线性相关程 度 越高为 的严格减函数,它是用来刻 画X, Y线性相关程度的一个量用a0+b 0X来近似Y,误差e= Var(Y)(1- )若| |的值越接近于0, X与Y的线性相关程度越弱。